連日、AI大手の発表が続いています。
日本時間2025年5月23日、Anthropicは同社にとって初となる開発者向けイベントを開催。
待望のClaudeの次世代モデル「Claude Opus 4」「Claude Sonnet 4」を発表されました。
あわせて、AIエージェント開発を加速する新API群、そして開発者向けツール「Claude Code」の一般提供開始など、多岐にわたる大型アップデートを実施しました。

Claude 4モデル群
今回のアップデートの目玉は、やはり次世代のAIモデル「Claude Opus 4」および「Claude Sonnet 4」の登場です。
コーディング、高度な推論、AIエージェントの能力において、新たな業界標準を打ち立てるとしています。
Claude Opus 4:
「世界最高のコーディングモデル」と位置付け、複雑で長時間を要するタスクや、エージェントワークフローにおいて持続的な高性能を発揮。
Claude Sonnet 4:
従来のSonnet 3.7から大幅なアップグレード。コーディング能力と推論能力が向上し、ユーザーの指示に対してより精密に応答。
両モデルともに、ほぼ瞬時の応答が可能なモードと、より深い推論を行うための「Extended thinking(拡張思考)」モードを持つハイブリッドモデルとして提供。
本日より Claudeウェブ版およびAPIから即日利用可能です。

Claude 4の性能と評価:ベンチマークと実環境での声
Anthropicの発表によれば、Claude 4モデル群は特にソフトウェアエンジニアリングの分野で卓越した性能を示しています。
主要なベンチマークの一つである「SWE-bench verified」(実際のソフトウェアエンジニアリングタスクにおける性能評価)では、OpenAIのo3やCodex-1, Gemini 2.5 Proの結果を上回る記録を出しています。

その他、大学院レベルの推論能力を測る「GPQA Diamond」ではOpus 4が79.6% (pass@1, Extended thinking利用で83.3%)、多言語Q&Aの「MMLU」では88.8%、高校レベルの数学コンペティション「AIME」では75.5% (pass@1, Extended thinking利用で90.0%)など、コーディング以外の多岐にわたる分野でも非常に高い能力が確認されています。

また、発表イベントでは、アーリーテスターの声としてRakutenのYusuke Kaji氏からのコメントが紹介されました。

「Claude Opus 4はコーディングのための真に高度な推論を提供します。我々のチームが複雑なオープンソースプロジェクトに導入した際、約7時間自律的にコーディングを行いました。これはチームを驚かせたAI能力の大きな飛躍です。」
Claude 4の主な特徴と改善点
Extended thinking(拡張思考) ベータ版:
思考プロセス中に外部ツール(例:Web検索)を利用可能に。
推論とツール使用を柔軟に組み合わせることで、応答の質を向上。
新モデルケーパビリティ:
複数のツールを並列して使用する能力。
指示へのより正確な追従性。
開発者がローカルファイルへのアクセスを許可した場合、メモリ機能が大幅に向上。重要な事実の抽出・保存を通じて、長文脈での継続性維持や暗黙知の構築をサポート。
Claude Codeが一般提供開始:
開発者がClaudeと連携する方法を拡張。
GitHub Actions経由でのバックグラウンドタスク実行に対応。
VS CodeおよびJetBrainsとのネイティブ統合により、ファイル内で直接編集提案を表示。シームレスなペアプログラミング体験を提供。
ショートカット行動の削減:
特にエージェントタスクにおいて、モデルが安易な近道や抜け穴を使ってタスクを完了しようとする振る舞いを、Sonnet 3.7と比較して65%削減。
思考サマリー:
Claude 4モデルが長い思考プロセスを経た場合、より小さなモデルを用いてその思考を要約して提示。大半(約95%)は思考プロセスが短いため、全文表示。
高度なプロンプトエンジニアリングのため生の思考連鎖が必要なユーザー向けに「Developer Mode」も用意(要問い合わせ)。
安全性への取り組み:
ASL-3 (AI Safety Level 3) を含む高度なAI安全レベルの保護措置を実装し、リスク最小化と安全性最大化を図る。詳細はこちら。
APIの機能強化 | よりパワフルなAIエージェント開発が実現
Anthropic APIにおいて、開発者がより強力なAIエージェントを構築するための4つの新機能がベータ版としてリリースされました。

これらの機能は、Claude Opus 4およびSonnet 4と組み合わせることで、高度なデータ分析、外部システム連携、効率的なファイルアクセス、コスト効率の高いコンテキスト維持などをカスタムインフラなしで実現可能としています。
1. Code execution tool | Claudeによる直接的なコード実行
ClaudeがPythonコードを安全なサンドボックス環境で実行し、計算結果やデータ視覚化を生成可能。
https://youtu.be/18E6j6mo3_o?si=AN70eBm5W97i9-PI
主な特徴:
データセットのロード、探索的チャート生成、パターン特定、実行結果に基づく反復的な出力改善などを単一インタラクション内で完結。
金融モデリング、科学技術計算、ビジネスインテリジェンス、文書処理、統計分析など多岐にわたるユースケース。
Files APIと連携し、アップロードされたファイルを直接処理可能。
2. MCP connector | 外部ツール連携を簡素化
開発者がクライアントコードを記述することなく、Claudeを任意のリモートModel Context Protocol (MCP)サーバーに接続可能に。

主な特徴:
APIリクエストにリモートMCPサーバーのURLを追加するだけで、サードパーティツールにアクセス可能。
APIが接続管理、ツール発見、認証、エラー処理を自動的に実行。
ZapierやAsanaなど、成長するリモートMCPサーバーエコシステムとの連携。
3. Files API | ファイルの永続的な管理とアクセス
開発者がドキュメントを一度アップロードすれば、複数の会話やセッションをまたいで繰り返し参照できるようになるAPI。詳細はこちら。
主な特徴:
リクエストごとのファイルアップロード作業を削減し、開発ワークフローを効率化。
ナレッジベース、技術文書、データセットなど、大規模なドキュメントセットを扱うアプリケーションに特に有効。
Code execution toolと統合され、アップロードされたファイルをClaudeがコード実行中に直接アクセス・処理し、結果としてファイル(チャート、グラフ等)を生成可能。
4. 拡張プロンプトキャッシュ | 最大1時間までコンテキストを維持
標準の5分間のキャッシュ有効期限(TTL)に加え、追加コストで最大1時間まで延長可能なTTLを選択可能に。
主な特徴:
長時間のコンテキスト維持が求められるエージェントワークフローにおいて、コストを最大90%、レイテンシを最大85%削減する可能性。
複数ステップのワークフロー処理、複雑な文書分析、他システムとの連携など、従来はコスト面で困難だった長時間稼働エージェントの実用性を向上。
Web search toolの進化
既存のWeb検索ツールも、Claude 4の「Extended thinking」との連携により、その情報収集能力と応答生成の質が向上します。詳細はこちら。
主な特徴:
Claudeがプロンプトに基づいて検索タイミングを判断。
最新情報に基づいた回答と、出典の自動引用。
ドメインフィルタリングやローカライズオプションも提供。
Claude Code 一般提供開始 | ターミナル中心のAIコーディングアシスタント。IDE・GitHubとも連携
AnthropicのAIコーディングツール「Claude Code」が一般提供を開始しました。ターミナル上で動作し、コードベースを理解し、自然言語コマンドを通じて開発者のコーディング作業を高速化します。
Claude Codeの基本的な概要については、こちらの過去記事もご参照ください。今回のアップデートで何が新しくなったのか、具体的な活用方法といった詳細については、後日改めて深掘り記事をお届けする予定です。

主な特徴:
ターミナルで完結: 開発者が慣れ親しんだターミナル環境で直接動作。
コードベース理解: プロジェクト全体のコンテキストを把握し、ファイル編集やバグ修正をコードベース横断的に実行。
多機能: コードに関する質問応答、テスト実行・修正、lint適用、Git操作(コミット、PR作成、履歴検索、マージコンフリクト解決など)、Web検索によるドキュメント参照。
エンタープライズ対応: Amazon BedrockやGoogle Vertex AI経由での利用もサポートし、企業のセキュリティ・コンプライアンス要件に対応。
セキュリティとプライバシー: ユーザーのコードはAnthropicのAPIへ直接送信され、中間サーバーを経由しない設計。フィードバックはモデル訓練には使用されず、フィードバックトランスクリプトは30日間のみ保存。
また、今回の一般提供開始にあたり、注目されるのはやはり主要IDEとの連携と、GitHub上での動作です。
主要IDEとの連携:開発フローを効率化
Claude Codeは、多くの開発者が利用するIDEと直接連携し、開発作業をよりスムーズにします。
サポートIDE:
Visual Studio Code: CursorやWindsurfといった派生エディタを含む。
JetBrains IDEs: PyCharm, WebStorm, IntelliJ, GoLandなど。

主な連携内容:
クイック起動: ショートカットキー (Cmd+Esc (Mac) / Ctrl+Esc (Win/Linux)) またはUI上のボタンでエディタからClaude Codeを起動。
IDEでの差分表示: コード変更点をターミナルではなく、IDEの差分ビューアで直接確認可能 (/configで設定)。
コンテキスト共有: IDEで選択中のコード範囲やアクティブなタブの情報をClaude Codeと自動共有。
診断エラー共有: Lintエラーや構文エラーなど、IDEが検出した問題をClaude Codeがリアルタイムに認識。
ファイル参照ショートカット: ショートカットキー (Cmd+Option+K (Mac) / Alt+Ctrl+K (Win/Linux)) でファイルパスや行番号を簡単に挿入。
導入: VS Codeの場合、統合ターミナルで claude コマンドを実行すると拡張機能が自動インストールされます。
JetBrains IDEsでは、マーケットプレイスからClaude Codeプラグインをインストールし、IDEを再起動します。外部ターミナルからでも /ide コマンドでIDEと連携できます。
GitHub PR連携:プルリクエスト作業を自動化
Claude Codeは、GitHub Actionsと公開されているClaude Code SDKを使い、GitHubのプルリクエスト(PR)上で直接動作します。
https://youtu.be/L_WFEgry87M?si=8N2rrTI1WlM1JWF5
Anthropicが公開したデモ動画では、PRのコメントでClaude Codeがタグ付けされると、以下のタスクを自動で実行する様子が紹介されています。
レビュアーからのフィードバックに対応。
CI(継続的インテグレーション)のエラーを修正。
指摘に基づいてコードを直接変更(例:ローディング状態の追加、エラーハンドリングの実装)。
これにより、レビュアーは自身でコードを修正する手間を省き、Claude Codeに作業を任せることが可能になり、開発サイクルの短縮が期待できます。
プランと利用可能性・価格
2025年5月23日時点の価格体系と各サービスの提供状況を詳細にまとめました。
Claude 4モデル価格・提供状況一覧表

※ MTok = 100万トークン
新機能・ツールの価格と提供状況

Claude.ai ウェブ版プラン比較

共通仕様
200Kコンテキストウィンドウ対応(全モデル)
APIの場合、バッチ処理で50%割引適用可能
まとめ
今回のAnthropicによる一連のアップデートは、Claudeの能力を飛躍的に向上させるとともに、開発者がAIエージェントをより柔軟かつ強力に構築するための環境を大きく前進させるものと言えるでしょう。
特に「Claude 4」モデル群の登場は、コーディング支援から高度なリサーチ、複雑な問題解決に至るまで、AIの活用範囲を一層広げる可能性を秘めています。また、刷新されたAPI群と一般提供が開始された「Claude Code」は、開発者にとってAIをより身近なツールとして日々の業務に組み込むことを現実的なものにします。
これらの新機能が、今後のAIアプリケーション開発にどのような変革をもたらすのか、引き続き注目です。







