日本時間2025年9月30日、Anthropicが新モデル「Claude Sonnet 4.5」と一連の強力なアップデートを発表しました。
コーディング能力で世界最高スコアを記録した新モデルを中核に、開発ツール「Claude Code」の大幅強化、そしてAIの長期記憶を実現する新APIまで、その内容は多岐にわたります。
本記事では、この最新アップデートの全貌を、新機能から使い方まで解説します!
アップデートの要点
新モデル「Claude Sonnet 4.5」登場: コーディング、エージェント構築、PC操作で世界最高レベルの性能を達成。
Claude Codeが大幅進化: 「チェックポイント」機能やVS Code拡張を追加し、より自律的で複雑なタスクに対応。
Claude Agent SDKへの名称変更: コーディングに限らず、汎用的なAIエージェントを開発するためのツール群として再定義。
APIに新機能: 「コンテキスト編集」と「メモリツール」で、AIがコンテキスト上限を気にせず長期的なタスクを実行可能に。
ブラウザ操作とUI生成も: 「Claude for Chrome」拡張機能の提供拡大と研究プレビュー「Imagine with Claude」の発表。
新モデル「Claude Sonnet 4.5」
新モデル「Claude Sonnet 4.5」は性能向上に加え、AIエージェントの実務タスク遂行に必要な能力が大幅に強化されたとされています。
① 新モデルの性能
コーディング能力: 実際のソフトウェア開発能力を測るベンチマーク「SWE-bench Verified」で、既存のどのモデルをも上回る最高スコアを記録。Anthropic自身も「世界最高のコーディングモデル」と強調しています。

コンピュータ操作能力: 実世界のPC操作タスクを評価する「OSWorld」ベンチマークで61.4%を達成。

専門分野の知識: 金融、法律、医療といった分野の専門家からも、専門知識とリーズニング能力が劇的に向上したとの高評価を得ています。
以下のグラフは、金融分野のタスクにおける各モデルの性能を、第三者機関「Vals AI」が公開するリーダーボード上で比較したものです。
「Win Rate vs Baseline (%)」は、基準となるモデルに対する勝率を示しており、Sonnet 4.5が旧モデルや思考時間を増やした(16K thinking)バージョンも上回り、72%という高いスコアを記録。

法律分野の専門家が評価した各モデルの性能比較。金融分野と同様に、基準モデルに対する勝率(Win Rate vs Baseline %)を示す。Sonnet 4.5はここでも65%という最も高いスコアを記録しており、専門的な知識とリーズニング能力が大幅に向上。

② 提供範囲と料金
提供範囲:
Webサイト (claude.ai):
すでに全てのユーザーが claude.ai 上で利用可能です。

API:
開発者はAPIで `claude-sonnet-4-5` を指定して本日から利用を開始できます。
curl https://api.anthropic.com/v1/messages \
-H "Content-Type: application/json" \
-H "x-api-key: $ANTHROPIC_API_KEY" \
-H "anthropic-version: 2023-06-01" \
-d '{
"model": "claude-sonnet-4-5",
"max_tokens": 1000,
"messages": [
{
"role": "user",
"content": "What should I search for to find the latest developments in renewable energy?"
}
]
}'料金:
API料金は、Claude Sonnet 4 と同額の「$3 / $15 per million tokens(入出力)」に据え置かれています。

推奨事項:
Anthropicは、既存の全ての用途で Sonnet 4.5 へのアップグレードを推奨しています。
③ 安全性・アライメントへの取り組み
安全性: 「過去最もアライメントが調整されたフロンティアモデル」とされ、お世辞や欺瞞といった行動が大幅に減少したとのこと。
セキュリティ: AIエージェントの課題であるプロンプトインジェクション攻撃への耐性も向上。
安全レベル: 「AI Safety Level 3 (ASL-3)」の保護下でリリースされており、CBRN兵器(化学・生物・放射性物質・核)関連など、特に危険性の高いトピックに関する入出力を検知・ブロックする分類器を搭載しています。
その他のアップデート
今回のアップデートは新モデルだけなく、周辺ツールも複数かつ大幅にアップデートされてます。一つずつみていきます。
① Claude Code
開発AIエージェント「Claude Code」に、待望の機能が多数追加されています。

チェックポイント機能: Claude Codeがコードを変更する前に作業状態を自動で保存。もしAIの変更が意図しないものであっても、Escキーを2回押すか、/rewindコマンドでいつでも前の状態へ巻き戻せます。

ターミナルUIの改善: 動作状況の表示が分かりやすくなったほか、Ctrl+rで過去のプロンプト履歴を検索できるように。

自律動作の強化: 専門タスクを分担させる「サブエージェント」や、特定タイミングで処理を自動実行する「フック」など、より高度で自律的なタスクを任せるための機能も強化されています。
既存のClaude Codeユーザーは、ローカルのインストールを更新するだけで新機能を利用可能です。
② Claude Agent SDK
また、これまで「Claude Code SDK」として知られていた開発キットが、「Claude Agent SDK」へと名称変更されました。
これは、SDKがコーディングタスクに限定されず、Sonnet 4.5 と組み合わせることで、あらゆる目的の汎用AIエージェントを構築するための最適な方法であることを反映したものと公式で説明されています。
https://www.anthropic.com/engineering/building-agents-with-the-claude-agent-sdk
③ Claude for Chrome 拡張機能
一部ユーザー限定にロールアウトされていたChrome拡張機能が、Maxプランのウェイトリスト登録者へと対象を拡大。
それに伴い、多くの新機能が追加されました。
研究所所有のMaxプラン(月額100ドル)でも既に利用可能になっていました。

主な新機能:
複数タブ連携: 複数のタブをまとめてグループ化し、タブをまたいで情報を収集・操作可能に。

特定サイトへの最適化: Slack、Gmail、Google Calendar、GitHubといった主要サイトの操作をより賢く実行。
バックグラウンド実行と通知: タスク実行中に別の作業をしていても、Claudeは裏で作業を継続。許可が必要な時や完了時に通知してくれます。
画像・スクリーンショット対応: 指示を出す際に、画像や画面のスクリーンショットを添付して、より正確な視覚情報を伝えることができます。
実際に以下のタスクを与えてみました。
10月4日から10日までサンフランシスコに滞在します。宿泊先はフォートメイソン周辺です。その1週間の間に、近くでMeta Ray-Banのデモ予約ができる店舗があるか調べて、予約可能な候補を見せてもらえますか?各店舗の予約ページまで確認してください。
動作はまだゆっくりなものの、他の類似エージェント機能と比較して、操作の正確性は高い印象です。操作であれば、人間が作業した結果と遜色ないアウトプットが期待できそうです。検証を続けていきます。


まだウェイトリストに登録していない方はこちらのGoogleフォームからウェイトリストに登録してみてください。
また、類似の偽拡張機能も出回っているため、必ずこちらの公式ストアURLからインストールするようにしましょう。
④ VS Code 拡張機能 アップデート
バージョン2.0にアップデートされ「Visual Studio Code」にClaude Codeの全機能がネイティブ統合されます。
ターミナルを開くことなく、サイドバーでAIによるコード変更をリアルタイムに差分表示しながら開発を進められます。
セットアップと基本的な使い方
インストール
まず、VS Codeの拡張機能マーケットプレイスで「claude code」と検索し、インストールします。

インストール後ログインを求められます。お使いのClaudeアカウントで認証を済ませてください。以下の画面になったら即利用を開始できます。UIもこれまでより分かりやすくなっています。

⑤ リアルタイムの使用状況追跡機能
Webアプリと Claude Code の両方で、トークン使用状況をリアルタイムで確認できるようになりました。
アクセス方法: Webアプリでは「設定」メニュー内の「使用状況」から、Claude Code では /usage コマンドで確認できます。


レート制限: 7月に発表された週間レート制限の展開も開始されています。ただし、Sonnet 4.5 の登場により、この制限に達するユーザーは2%未満になる見込みとのことです。
Imagine with Claude
ユーザーとの対話に応じ、リアルタイムでソフトウェアをその場で生成する、実験的な研究プレビューです。claude.ai/imagineにてMaxプランユーザー向けに、5日間の期間限定で公開されています。
実際の画面:
画面下の入力欄からClaudeに指示を出せます。

実際に「吉田松陰のパソコンを想像してみてください。」と入力してみました。
すると以下のようにリアルタイムでページで出来上がっていきます。

作成されたページ:

速度は決して速くありませんが、最新のSonnet 4.5を搭載しているだけあって、生成されるUIの精度は高い印象です。
サイドバーの要素をクリックすると、そこからさらに新しいページが派生して作られていきます。

APIのアップデート
開発者向けAPIにも、より高度なAIエージェントを構築するための重要な機能が追加されました。
コンテキスト編集: AIが長時間動作すると対話履歴が長くなり、コンテキスト上限に達してしまう問題。この新機能は、トークン上限に近づくと、重要度の低い情報を自動で文脈から削除。これにより、AIは重要な会話の流れを維持したまま、より長くタスクを継続できます。

対話履歴でコンテキストが一杯になると(上)、古い情報を圧縮・要約し、新しい情報を処理するための空き容量(Available Context)を確保します
メモリツール: AIが重要な情報をファイルとして外部に永続的に保存・参照できるようにするツール。セッションをまたいで知識を蓄積し、過去の学習を次のタスクに活かす、といった人間のような記憶の使い方が可能になります。
これらの新機能は、Claude Developer Platformで利用可能。これらのツールを組み合わせることで、従来はコンテキスト上限のために実現が難しかった、数時間、あるいは数日にわたるような複雑で長期的な自律型エージェントを構築できるようになります。
こちらについては、Claude にカタンをプレイさせる例を用いて紹介する動画も公開しています。
https://www.youtube.com/watch?v=BER3EhUIyz0
まとめ
多くの開発者が待ち望んでいた Sonnet 4.5 が、ついに発表されました。
ベンチマークスコアの向上もさることながら、今回のアップデートの真価は、モデルの能力を最大限に引き出す周辺ツール(Claude Agent SDK, Claude Code)が同時に大きく進化した点にあると言えるでしょう。
Anthropic社内で、新入社員のオンボーディングが数週間から数日に短縮されたという報告もあるように、AIとツールを組み合わせることで、開発ワークフローが大きく変わる可能性を秘めています。
https://twitter.com/trq212/status/1972802330249904464
実際の開発現場でどのような変化が生まれるか、今後の動向が注目されます。







