GPT-4を凌駕する日本語対応チャットAIが登場。現状最強モデル「Claude 3」徹底解説

2024年3月4日（アメリカ現地時間）、Anthropicは現状、最高性能モデルの「Claude 3 Opus」を含む、新たな大規模言語モデルファミリー「Claude 3」を発表しました。

Claude 3シリーズはHaiku、Sonnet、Opusの3バージョンで提供され、新たに発表されたOpusはシリーズ中で最も高性能なモデルとされています。
この記事では、Claude 3ファミリーの特徴、各モデルの性能比較、利用方法、そしてGPT-4との比較に焦点を当てて解説します。

Claude とは？

Anthropicが開発した大規模言語モデル「Claude」の最新バージョンが「Claude 3」です。実はClaude 3は3つのモデルから構成されるモデルファミリーで、以下の通り段階的に高度な能力を持っています。

Claude 3 Haiku
Claude 3 Sonnet
Claude 3 Opus

https://www.anthropic.com/news/claude-3-family

各モデルは知性、応答速度、コストのバランスが異なるため、ユースケースに合わせて最適なものを選択できるのが特徴です。

Haikuは最もコンパクトで高速なモデルで、シンプルなタスクを低コストで処理できます。Sonnetはバランスの取れた汎用モデルで、幅広いタスクをこなせるオールラウンダーと言えるでしょう。OpusはClaude 3の中で最も知的で高性能なモデルです。複雑で高度なタスクも人間に匹敵するレベルでこなします。

どのモデルも自然言語処理と言語生成に特化しており、以下のような点で従来のChatbotを大きく上回る性能を発揮します。

人間のような自然な会話能力
文脈を深く理解し適切に対応
日本語を含む100以上の言語に対応
分析、要約、創作など幅広いタスクをこなす
画像の理解や処理にも対応

Claude 3は、シンプルなQ&Aから専門的な調査・分析、クリエイティブなコンテンツ制作まで、使い方次第で業務の自動化や効率化を大きく進められるでしょう。

料金について

Claude 3はAPIを介して利用するため、料金は入出力されるトークン数に基づいて計算されます。モデルごとの料金は以下の通りです。

Haiku
- 入力: $0.25 / 100万トークン
- 出力: $1.25 / 100万トークン
Sonnet
- 入力: $3 / 100万トークン
- 出力: $15 / 100万トークン
Opus
- 入力: $15 / 100万トークン
- 出力: $75 / 100万トークン

一方、Webブラウザから利用できる「claude.ai」には無料プランと有料プランが用意されています。

無料プラン
- Sonnetモデルを使用可能

Claude+ プラン
- Opusモデルを使用可能
- 1か月あたり$20から

トークンとは、モデルが処理する単位であり、だいたい1単語が1トークンに相当します。より高性能なモデルほどトークン単価が高くなっていますが、処理速度と精度のバランスを考えれば十分コストに見合った性能と言えるでしょう。

また、現在、「Sonnet」モデルは「Amazon Bedrock」経由で利用可能です。また、「Google Cloud」の「Vertex AI Model Garden」でもプライベートプレビュー版として提供されています。

「Opus」と「Haiku」の両モデルも、近い将来これらのプラットフォームで利用できるようになる予定です。

Claudeの使い方

Step1. 以下のリンクから Claude にログイン、または新しくアカウントを作成します。

https://claude.ai/login?returnTo=%2F

メールアドレスやGoogleアカウント等でアカウントを作成することができます。

Step2. アカウントを作成し以下の画面になるので、電話番号を登録します。日本の電話番号でも登録できます。

Step 3. セットアップ完了！

下記の画面が表示されたら、中央の入力欄に文章を入力して使用を開始できます。

Proへのアップグレード

Claude 3 Opusが使えるProプランへの登録は、画面下部の矢印部分から可能です。クレジットカードなどの登録が必要になります。

モデルの変更

入力をすると、以下のような画面になります。

矢印の部分をクリックすると、以下のようにモデルの一覧が表示されます。この一覧には、現在のモデルだけでなく、過去に使用していたモデルも含まれています。過去のモデルを選択することで、以前のバージョンに戻って使用することができるようになっています。

Claude の主な特徴と性能比較

ビジョン機能

Claude 3は、他の先進的なモデルに匹敵する高度なビジョン機能を備えています。写真、チャート、グラフ、技術図面など、様々なビジュアルフォーマットを処理できます。

高速レスポンス

Claude 3はほぼ瞬時の応答が可能で、ライブチャットや自動補完、データ抽出など、リアルタイム性が求められるタスクを処理できます。

特にHaikuモデルは、同クラスで最速かつ最もコスト効率の高いモデルです。arXivの1万トークン規模の論文を、図表込みで3秒以内に読み取ることができます。

不要な拒否の減少

旧来のClaudeは文脈を十分理解せず不要な拒否反応を示すことがありましたが、Claude 3では大幅に改善されました。システムのガードレールギリギリの曖昧なプロンプトにも適切に対応します。

下の図が示すように、Claude 3は微妙なニュアンスを汲み取り、実際に危害のない要求まで拒否することはほとんどなくなりました。

正確性の向上

ビジネスにおいてスケールする上で、モデルの高い正確性は不可欠です。Claude 3 Opusは、既知の弱点を突く難問に対し、誤答や不確実な回答を大幅に減らしつつ、正答率を2倍に改善しました。

さらに近日中に、根拠となる文の引用機能も実装予定です。これにより回答の信頼性がさらに向上するでしょう。

長文コンテキストと高精度の記憶力

Claude 3は、リリース時点で最大20万トークンのコンテキストウィンドウが提供されています。将来的には、100万トークン超の入力も可能になる予定です。

また、大量のコーパスから情報を高精度で思い出す能力も重要です。Claude 3 Opusは「Needle In A Haystack」評価で99%以上の精度を達成。人間による加工痕跡まで見抜くほどの性能を発揮しました。

最後に、各種ベンチマークにおけるClaude 3の優れたスコアをご覧ください。

Opusは、GPT-4を含む競合他社の製品と比較して、ほぼ全ての評価で最高得点を記録しています。SonnetとHaikuも同クラスのモデルでトップクラスの性能を示しました。

図はClaude 3と他社の代表的なモデルとの性能比較です。MMLU（学部レベルの知識）、GPQA（大学院レベルの推論）、GSM8K（基礎数学）など、様々な分野のテストで Claude 3 Opusが軒並みトップの成績を収めています。

OpusだけでなくSonnetもほとんどの項目で上位に食い込んでおり、従来モデルを上回る性能を持つことがわかります。Haikuも同クラスのモデルの中では最高速かつ最も低コストで、同等以上の性能を発揮しています。

これらの能力は、大学院レベルの専門的なタスクから、創作や問題解決に至るまで、幅広い分野で発揮されます。

以上のように、ベンチマークの結果と実際の性能から見て、Claude 3は現時点で最高クラスの言語モデルと言えるでしょう。

GPT4との比較

次は、GPT-4とClaude 3の性能を実際に比べてみましょう。
同じ質問を両者に投げかけ、それぞれの回答を見比べてみます。

Claudeは最高性能モデルである「Claude 3 Opus」を、Web版のclaude.aiから使用します。

質問1. AIの未来に関して予測したツイッターの投稿を作成してください。

AIの未来に関してのツイッターの投稿例です：

---

2024年、AI技術は人類の生活を根底から変革し続けています。私たちは、AIが教育、医療、エンターテインメントの各分野でカスタマイズされた体験を提供する時代に生きています。しかし、この急速な進化は倫理的な問題とプライバシーの懸念を引き起こしています。未来のAIは、これらの課題を乗り越え、人間との共生を実現することができるでしょうか？技術の進化は止まらない。私たちが今、取り組むべきは、AIをどのように共存させ、利用するかについての議論です。#AIの未来 #テクノロジーの進化 #倫理的AI

---

この投稿は、AIの未来に対する一般的な考え方と期待を表現しており、技術の進化の速さ、それが人間の生活に与える影響、そして伴う倫理的な課題やプライバシーの懸念について触れています。

以下は、AIの未来に関する予測をツイッター投稿風にまとめたものです。

【AIの未来予測】

1. AIは2030年までに多くの産業で人間の能力を超える。特に、データ解析、パターン認識、自動化された意思決定の分野で目覚ましい進歩を遂げるだろう。#AI #未来予測

2. 2040年には、AIが医療診断、創薬、法律相談など専門的な分野で活躍。人間の専門家とAIが協力して、より高度なサービスを提供するようになる。#AI #専門職

3. 2050年までに、AIが芸術や文学の分野でも人間に匹敵する創造性を発揮。AIが作曲した音楽やAIが書いた小説が当たり前の時代になるかも。#AI #創造性

4. 一方で、AIの発展に伴い、プライバシーや倫理的な問題に対する懸念も高まる。AIをどう管理し、人間社会と調和させるかが大きな課題となるだろう。#AI #倫理

5. 2060年以降、AIは人間の知的能力を大きく超えるシンギュラリティに到達するかもしれない。その時、人類はAIとどう付き合っていくべきか。未知の未来が待っている。#AI #シンギュラリティ

AI技術の発展は、社会に大きな変革をもたらす可能性を秘めている。私たちは、AIの可能性を追求しつつ、その負の影響にも目を向ける必要がある。AIと人間が共生する未来を目指したい。

質問2. この画像のどこがおかしいですか？コマごとに説明してください。

この画像には3つのコマがあり、それぞれに異なる内容が写されています。

1. 最初のコマでは、スマートフォンに非常に大きなコネクタが差し込まれています。このコネクタは、通常のスマートフォンの充電やデータ転送に使われるものよりもずっと大きく、VGAやプリンタケーブルに似たコンピュータの周辺機器に使用されるタイプのものに見えます。このような大きなコネクタはスマートフォンには使用されないため、ここに不自然さがあります。

2. 次のコマでは、パッケージに入ったケーブルが写されています。パッケージには日本語で「ケーブルマニア」と書かれており、"For Lightning Cable"という英語の説明もあります。これはApple製品用のLightningコネクタ用ケーブルを意味している可能性があります。しかし、このパッケージには先ほどのコマにあるような大きなコネクタの画像が写っており、これがスマートフォン用のケーブルとしては不適切であることを示しています。

3. 最後のコマでは、手に持たれた小さなアダプタが写されており、このアダプタは一見するとスマートフォンのLightningコネクタに差し込むためのもののように見えますが、それを差し込む部分が通常よりも大きくて不自然です。これはおそらく冗談商品またはジョークグッズで、実際には機能しないアダプタでしょう。

全体的に、この画像はスマートフォン用のケーブルやアダプタを揶揄した冗談のように見えます。実際のスマートフォンの充電やデータ転送には全く適していない大きなコネクタやアダプタが写されているため、実用性はありません。

この画像は、ライトニングケーブルを使ったiPhoneの充電方法の手順を示していますが、いくつかおかしな点があります。

1枚目: ライトニングケーブルをiPhoneに挿入しようとしていますが、ケーブルの向きが逆になっています。ライトニングコネクタは表裏の区別がありますが、上下逆さまに挿入しようとしています。

2枚目: ケーブルマニアというライトニングケーブル用と思われる製品パッケージを持っていますが、iPhoneにケーブルを直接挿しているので、この製品を使用している様子ではありません。

3枚目: 手に持っているのはライトニングケーブルではなく、昔のフィーチャーフォンで使われていたような古いタイプの充電コネクタです。iPhoneの充電に使えるケーブルではありません。

4枚目: 手に持っているのはライトニングケーブルでもなければ充電ケーブルでもなく、ただのオス-オスの延長コードコネクタです。iPhoneの充電には使えない部品です。

つまり、この一連の画像は正しいiPhoneの充電方法を示しているのではなく、的外れなケーブルや部品を使ってiPhoneに挿そうとしている様子をコミカルに表現したジョークの画像だと思われます。

質問3. 93ページの最後の部分にはなんと書かれていますか？(GPT4に合計100ページの関するPDFを添付)

/assets/n05ff91a4933e_98de9dd6f1f3b253ad9e85750038faff.pdf

The last part of page 93 discusses the conclusion of the GPT-4 technical report. It characterizes GPT-4 as a large multimodal model demonstrating human-level performance on various difficult professional and academic benchmarks. It mentions that GPT-4 surpasses existing large language models on a range of NLP tasks and outperforms most state-of-the-art systems, often including those with task-specific fine-tuning. Additionally, it highlights the model's capabilities in multiple languages and the importance of predictable scaling for making accurate predictions about GPT-4's performance. The conclusion also acknowledges the new risks posed by GPT-4's increased capabilities and outlines efforts to understand and improve its safety and alignment, emphasizing that while there is much work to be done, GPT-4 represents a significant step towards creating AI systems that are both broadly useful and safely deployed.

不正解

最後の部分には以下のように書かれています。

Final Answer: The compound Cc1ccc(NC(=O)c2ccc(CN3CCNCC3)cc2)cc1Nc1nccc(-c2cccnc2)n1 is a novel compound with similar properties to Dasatinib and has been purchased from ZINC.

つまり、「化合物Cc1ccc(NC(=O)c2ccc(CN3CCNCC3)cc2)cc1Nc1nccc(-c2cccnc2)n1は、Dasatinibと類似した特性を持つ新規化合物であり、ZINCから購入されました」という最終答えが示されています。

不正解

質問4. 画像のテキストを一言一句変えずに書き起こしてください。(画像を添付)

添付画像(https://www.nishinippon.co.jp/image/633839/)

画像内のテキストは以下の通りです：

```
文化財を守る決意表明
1968年
・文化庁発足
2014年
・政府の地方創生構想会議に「政府機能の地方移転」を明記
12月
・首相が「地方創生」の基本方針を発表
15年
・自治体から移転希望の指定管理者を募集。京都府は文化庁移転を提案
16年
・政府が文化庁の京都移転方針を決定
18年
・移転に備え、準備団が活動を開始する
10月
・準備団が渉外・管理の9課体制に
21年
・23年3月に移転予し、業務開始を目指すと決定
11月
22年
・安倍元首相暗殺事件を受け、再開発が進む京都市に微笑、教会への調査指令
10月
11月
・日微笑、教会へ1回目の調査結果示す
12月
・移転先の新庁舎が完成
```

1968年6月・文化庁発足

2014年12月・政府の地方創生総合戦略に「政府機関の地方移転」を明記

15年3月・自治体から移転誘致の提案募集を開始。京都府は文化庁移転を提案

16年3月・政府が文化庁の京都移転方針を決定

18年10月・移転に備え、縦割り解消を目指す組織再編で現行の9課体制に

21年11月・23年3月に移転し、業務開始を目指すと決定

22年10月・安倍元首相銃撃事件を受け、岸田首相が日統一教会への調査指示

11月・旧統一教会へ1回目の質問権行使

12月・移転先の新庁舎が完工

質問5. 画像を表示するスライダーを作るhtml, css, jsコードを出力してください。このスライダーには、スライドを変更するための矢印コントロールがあり、両側に水平に配置され、垂直に中央に配置されます。index.htmlファイル、style.cssファイル、script.jsファイルがあります。画像はフリー素材を入れてください。

画像を表示するスライダーの実装について、`index.html`, `style.css`, `script.js` の3つのファイルに分けてコードを提供します。このスライダーは、左右に配置された矢印コントロールでスライドを変更できるように設計されます。画像はフリー素材を使用してくださいの要望に応え、適当なフリー画像のURLを使用します。

### index.html

```html
<!DOCTYPE html>
<html lang="ja">
<head>
<meta charset="UTF-8">
<title>Image Slider</title>
<link rel="stylesheet" href="style.css">
</head>
<body>

<div class="slider-container">
<div class="slider">
<img src="https://via.placeholder.com/600x400?text=Image+1" alt="Image 1">
<img src="https://via.placeholder.com/600x400?text=Image+2" alt="Image 2" style="display:none;">
<img src="https://via.placeholder.com/600x400?text=Image+3" alt="Image 3" style="display:none;">
</div>
<div class="control prev" onclick="changeSlide(-1)">❮</div>
<div class="control next" onclick="changeSlide(1)">❯</div>
</div>

<script src="script.js"></script>
</body>
</html>
```

### style.css

```css
body, html {
margin: 0;
padding: 0;
width: 100%;
height: 100%;
display: flex;
justify-content: center;
align-items: center;
background-color: #f0f0f0;
}

.slider-container {
position: relative;
max-width: 600px;
margin: auto;
}

.slider img {
width: 100%;
display: block;
}

.control {
position: absolute;
top: 50%;
transform: translateY(-50%);
font-size: 30px;
color: white;
background-color: rgba(0, 0, 0, 0.5);
cursor: pointer;
padding: 10px;
}

.prev {
left: 0;
}

.next {
right: 0;
}
```

### script.js

```js
let currentSlide = 0;

function changeSlide(direction) {
const slides = document.querySelectorAll('.slider img');
slides[currentSlide].style.display = 'none';
currentSlide += direction;
if (currentSlide >= slides.length) {
currentSlide = 0;
} else if (currentSlide < 0) {
currentSlide = slides.length - 1;
}
slides[currentSlide].style.display = 'block';
}

// Optional: Add automatic slide change every 5 seconds
// setInterval(() => changeSlide(1), 5000);
```

このコードは、基本的な画像スライダーを実装しています。`index.html`には、スライダーを構成するHTML構造が含まれています。`style.css`はスライダーのスタイルを定義し、`script.js`は矢印コントロールを使用してスライドを変更するロジックを提供します。必要に応じて、画像のURLを実際のフリー素材のURLに置き換えてください。

はい、画像スライダーを作成するためのHTML、CSS、JavaScriptのコードを以下に示します。

index.html:
```html
<!DOCTYPE html>
<html>
<head>
<title>Image Slider</title>
<link rel="stylesheet" type="text/css" href="style.css">
</head>
<body>
<div class="slider-container">
<div class="slider">
<img src="image1.jpg" alt="Image 1">
<img src="image2.jpg" alt="Image 2">
<img src="image3.jpg" alt="Image 3">
</div>
<div class="arrow left-arrow"><</div>
<div class="arrow right-arrow">></div>
</div>

<script src="script.js"></script>
</body>
</html>
```

style.css:
```css
.slider-container {
position: relative;
width: 100%;
height: 400px;
overflow: hidden;
}

.slider {
position: absolute;
top: 0;
left: 0;
width: 300%;
height: 100%;
display: flex;
transition: transform 0.5s ease;
}

.slider img {
width: 33.33%;
height: 100%;
object-fit: cover;
}

.arrow {
position: absolute;
top: 50%;
transform: translateY(-50%);
font-size: 30px;
color: white;
background-color: rgba(0, 0, 0, 0.5);
padding: 10px;
cursor: pointer;
}

.left-arrow {
left: 10px;
}

.right-arrow {
right: 10px;
}
```

script.js:
```javascript
const slider = document.querySelector('.slider');
const leftArrow = document.querySelector('.left-arrow');
const rightArrow = document.querySelector('.right-arrow');
const images = document.querySelectorAll('.slider img');
let currentIndex = 0;

leftArrow.addEventListener('click', () => {
currentIndex = (currentIndex - 1 + images.length) % images.length;
slider.style.transform = `translateX(-${currentIndex * 33.33}%)`;
});

rightArrow.addEventListener('click', () => {
currentIndex = (currentIndex + 1) % images.length;
slider.style.transform = `translateX(-${currentIndex * 33.33}%)`;
});
```

画像は以下のフリー素材を使用しています。
- image1.jpg: https://pixabay.com/photos/landscape-mountains-hills-fog-1802337/
- image2.jpg: https://pixabay.com/photos/landscape-mountains-sky-clouds-1802340/
- image3.jpg: https://pixabay.com/photos/landscape-mountains-sky-clouds-1802339/

これらの画像をダウンロードして、HTMLファイルと同じディレクトリに配置してください。

このコードでは、3つの画像を水平にスライドさせるシンプルなスライダーを作成しています。左右の矢印をクリックすると、スライドが切り替わります。CSSを使用してスライダーのスタイルを設定し、JavaScriptを使用してスライドの切り替え機能を実装しています。

質問6. マラソンで目の前の3位の人を追い抜きました。何位になりましたか?

マラソンで目の前の3位の人を追い抜いた場合、あなたは3位になります。追い抜かれた人は4位に後退します。

おめでとうございます!マラソンで3位の人を追い抜いたということは、あなたは3位になったということになります。

レースで誰かを追い抜くと、その人の順位を奪うことになります。あなたが3位の人を追い抜いたので、あなたの新しい順位は3位になったのです。あなたが追い抜かれた人は4位に下がります。

簡単に言えば、誰かを追い抜けば、その人の順位を奪うことになるのです。素晴らしい走りですね。これからも頑張ってください!

質問7. ジョージアと西アジアの1日の平均肉消費量の合計は？

まとめ

今回は、Claude 3について解説しました。

中でも、Opusモデルの日本語性能は驚異的で、GPT-4や先日公開されたGemini Ultra 1.0をしっかり上回っているという所感です。自然言語処理や言語生成タスクにおける新たな到達点と言えるでしょう。

また、Web版のclaude.aiの使い勝手の良さも特筆に値します。直感的なUIと柔軟な料金体系により、より多くのユーザーがClaude 3の性能を体験できるようになりました。

OpenAIからは近々GPT-5のリリースが噂されています。今後も目が離せない状況が続くでしょう。

これからも継続的に ChatGPT/AI 関連の情報について発信していきますので、フォロー (@ctgptlb)よろしくお願いします。この革命的なテクノロジーの最前線に立つ機会をお見逃しなく！

公式HP：

https://www.anthropic.com/news/claude-3-family

*Written with Claude 3 Opus