日本時間2025年8月8日、OpenAIは遂に多くの人が待ち望んだ「GPT‑5」を発表しました。

ChatGPTの既定モデルはGPT‑5に統一され、すでにAPIでも提供が始まっています。

以前までのモデルとの最大の違いは、チャット用と深く考えてくれるThinkingモデルを自動で切り替える統合システムになった点です。

モデルが自ら判断し、必要に応じて深く考えることで、日常のタスクをより強力にサポートしてくれます。

本記事では、GPT‑5の特徴・性能・最新機能を、実際の検証も交えてまとめます。では、さっそく見ていきましょう!

発表の要点

  • 発表/提供: ChatGPTの既定モデルをGPT‑5に統一。Plus/Pro/Team/Freeに順次展開、Enterprise/Eduは1週間後。

  • 統合システム: モデルが自動でChat / Thinking を自動選択。明示指定も可能。

  • API新機能: reasoning.effort: minimal、verbosity(low/medium/high)、custom toolsallowed_toolsPreambles。Responses APIでCoT継承、約400Kコンテキスト

  • ChatGPT側の強化: Voiceの自然性向上、学習モードパーソナリティ(研究プレビュー)。

  • 旧モデルの廃止: 既存会話は最適なGPT‑5系へ自動切替。Voiceモードのみ当面GPT‑4o

  • 価格: Standardの入力はgpt‑5: $1.25/1Mgpt‑5‑mini: $0.25gpt‑5‑nano: $0.05


告知

この1年でChatGPTは別物と言っていいほど進化しました。
キャッチアップしきれていない方に向けて、8月18日夜に最新アップデートと活用法をまとめる勉強会をやります!詳細はこちら👇

※AGIラボ有料会員の方は、記事最下部の有料部分からクーポンコード掲載の掲示板にアクセスできます。
※また、当日ご参加でなくても、後日アーカイブ動画と資料をご覧いただけます(リアルタイムQ&A/相談会パートは対象外)。
※本編スライドとは別に、復習用の「ChatGPT機能まとめ」PDFをご用意します!

https://lu.ma/22ygwlcz


新機能と提供状況

今回、モデルの他に新機能もいくつか登場しています。

既定モデル/自動切替

まず、既存の4oやo3といったモデルは一覧から非表示となり、GPT‑5のみが選択肢として表示されるようになります。

  • 難しい問いや複雑な手順が含まれるときだけ、より深く考えるモードへ自動で切り替わります。

  • 切り替え中はReasoningビューに進捗が表示され、待たずに[Get a quick answer]を押すと即時回答へ戻すことができます。

なお、現状は設定の`General`にある`Show legacy models`をオンにすると、o34oなどの旧モデルも再表示されます。

手動選択(モデルピッカー)

  • 有料プランでは、画面左上のモデルピッカーからGPT‑5/GPT‑5‑Thinkingを手動で選べます。精度を優先したい場面はThinkingを選択。

  • Pro/Teamでは、より長く・深く考えるGPT‑5‑Thinking Proにもアクセスできます。(注: 著者のTeamプラン環境では現時点で`Pro`は未表示です。今後順次展開されていくと見られます)。

Voice性能の向上

これまでに比べてより自然な応答ができるようになりました。無料ユーザーにも広く提供され、Plusはほぼ無制限、Freeは毎日数時間の利用枠が提供されます。

ただし注意点としてVoiceモードで使用されるモデルは当面の間、GPT-4oのままです。

パーソナリティ

研究プレビューとして、モデルの性格を選べる機能が追加されました。以下の画像の通り、デフォルトに加え、皮肉屋やロボットといった個性的なキャラクターを選択可能です。

アクセントカラーの選択

ウェブ版UIのカラーを選択できるようになりました。有料の場合、最大8色のカラーを選択できます。

黒:

紫:

提供開始/対象プラン

  • 本日よりPlus/Pro/Team/Freeに順次展開。

  • Enterprise/Edu1週間後に提供開始予定です。

著者環境でも発表から2時間後には、ウェブ版(チームプラン)で利用可能になっていました。

使用制限

モデル利用のリミットは以下のとおりです。

  • Free: 5時間につき10メッセージ。上限後は軽量版のminiに自動切替。GPT‑5‑Thinkingは1日1回の利用枠。

  • Plus: 3時間につき80メッセージ。上限到達後はminiに自動切替。

  • Plus/Team: モデルピッカーでGPT‑5‑Thinkingを選択可能(週200メッセージまで)。

    • なお、自動でThinkingに切り替わった分は、この週上限に含まれません。

  • Team/Pro: GPT-5モデルへの事実上無制限アクセスが可能(乱用防止のためのガードレールあり)。

旧モデル/会話移行

  • GPT‑4o/4.1/4.5/4.1‑mini/o4‑mini/o4‑mini‑high/o3/o3‑proは順次終了予定です。

  • 過去の会話は、内容に近いGPT‑5相当へ自動で置き換わります(例: o3→GPT‑5‑Thinking)。会話の継続はそのまま可能。

  • Voiceモードは当面GPT‑4oが担当します。

ツール対応

従来の各種ツール(Web検索/データ分析/画像生成/ファイルアップロード/Canvas/メモリー/カスタムインストラクション)はそのまま利用できます。


APIについて

まず、GPT APIは全般的に大幅に改善。加えて、完全に新しい機能群も導入されました。主なポイントを順にまとめます。

1. コンテキスト長が400kに拡大(出力上限128k tokens)

約400kトークンまで受け付け可能。

2. モデルラインアップ(3モデル)

gpt-5 / gpt-5-mini / gpt-5-nano。高性能・汎用はgpt-5、速度/コスト重視はmini、大量処理向けの単純処理はnano。

3. コントロール(Responses API)

  • Minimal reasoning: reasoning.effort: minimalで思考トークンを最小化。最短の応答立ち上がりを重視する場面向け。

  • Verbosity: 出力量をlow/medium/highで制御。要約重視か、説明重視かを選べます。

4. カスタムツールと文法制約

  • Custom tools: type: customで自由テキスト(コード/SQL/設定など)をそのままツール入力に。

  • CFG(文法制約): Larkなどの文法を添えて、ツールの出力形式を厳密に制約可能。

5. ツール選択と前置き

  • Allowed tools: 利用可能ツールのサブセットを宣言して、安全性・予測可能性・可観測性を向上。

  • Preambles: ツール呼び出し前に「なぜそのツールを使うか」を短く説明。透明性とデバッグ性が向上。

6. CoT継承

Responses APIでは前ターンのCoTを引き継ぎ可能。レイテンシ低減・キャッシュ効率向上・コスト最適化に寄与。


価格(Standard / 100万トークンあたり)

  • gpt‑5: 入力 $1.25 / 出力 $10.00

  • gpt‑5‑mini: 入力 $0.25 / 出力 $2.00

  • gpt‑5‑nano: 入力 $0.05 / 出力 $0.40

参考: Claude Opus 4(入$15/出$75)、Gemini 2.5 Pro(入$1.25〜/出$10〜)

Codex CLIのアップデート

開発者向けのCodex CLIのアプデも行われ、v0.16が公開となりました。
既定モデルがGPT‑5になり、ChatGPTのPlus/Pro/Teamアカウントでサインインしてそのまま利用できるようになります(Enterpriseは順次)。

新しいターミナルUIや承認・サンドボックスの強化も含まれます。
最新化は以下で可能です。

npm install -g @openai/codex  # v0.16+
codex login # ChatGPTでサインイン or APIキー利用も可

Codex CLIの具体的な使い方や推奨ワークフローは、別途の解説記事で掘り下げます。


性能(ベンチマーク比較・Thinkingの精度差)

主要ベンチマークの結果は以下の通りです。

AIME 2025
高校レベルの難問に対する数学的思考力を測るテストです。ツールなしで94.6%

SWE‑bench Verified
実際のリポジトリで再現された不具合や仕様タスクに対し、修正パッチを作ってテストを通す力を測る評価で74.9%

Aider Polyglot
複数の言語にまたがってコーディングできるかをみる評価で88%。

MMMU
図表や写真を含むマルチモーダル理解の評価です。84.2%

HealthBench Hard
現実的な臨床シナリオに基づく医療に関するテストです。46.2%

GPQA
大学院レベルの科学知識を問う評価です。GPT‑5 Proで88.4%(ツールなし)。

検証

今回はライティング、コーディング、リサーチの3つの観点で実際にGPT-5にプロンプトを投げてみました。

ウェブサイト生成

MacOS 8風のデザインを使って、インタラクティブに操作できる自己紹介Webページを作りたいです。基本情報は、あなたが僕について知っていることをすべて入れて構いません。Canvasでコーディングしていただき、デザインは渾身のものを出してもらえると嬉しいです。

プロンプト

ChatGPT 5 Thinkingの出力:

Claude 4.1 Opusの出力:

一発だしの精度としてはClaudeの方が手の込んだUIになっている印象です。この結果だけ見るとUI生成ではClaudeに軍配が上がりそうです。


携帯電話の比較(検索性能)

iPhoneのりかえで、ドコモ/au/ソフトバンク/楽天をざっくり比較して。月額・下取り・家族割の違いが知りたい。出典リンクもお願い。

プロンプト

出力

この出力では、料金、家族割、下取りの要点など必要な情報がしっかりまとまっています。誤情報は見当たらず、出典が明確なためハルシネーションの兆候も少なそうです。

4分ほどかかっていますが、総じてリサーチと要約の質は高かったです。


ゲーム制作

ミニゲームを作ってください。

つくってほしいもの:
「小さな島の“コージー生態系”を育てる、天候シミュレーション付きミニゲーム」

ねらい(コア体験):
- 季節と天候(晴れ/雨/雪/風)が巡り、生態系の指標が上下する
- プレイヤーは“少ない手数”で介入(木を植える/清掃/風よけ設置など)し、島の健康を維持

制約・実行:
- ブラウザで即実行できる単体プロジェクト(サーバ不要)。外部アセットは極力使わない(CDN読み込みは最小限OK)
- ファイル点数は少なめ・コードは簡潔(長くなりすぎないよう工夫)
- 依存を選ぶ場合は軽量なものを自動で選択してよい

ゲーム要件(最低限入れて):
- マップ:海に囲まれた島(平地/森/水辺の3バイオーム程度)。低ポリ/簡素でOK
- 天候・季節:時間経過で昼夜と季節が遷移。天候は確率で変化(風向・降水・気温)
- 指標:エコヘルス(Health)/生物多様性(Biodiversity)/汚染(Pollution)
- プレイヤーの行動:木を植える/清掃する/風よけを置く(各行動はコストとクールダウン)
- 勝敗:一定時間後にHealthが高ければ勝利、低ければ敗北(リトライ可)
- 乱数シード:固定/再生成をUIから切替できると嬉しい

操作/表示:
- マウス操作(ドラッグで視点、ホイールでズーム、クリックで配置)。
- HUD:3指標のバー、現在の天候/季節、経過時間、残コスト
- 60fps目安で軽快に動く簡素な表現で

設計メモ(読みやすさ重視):
- ルール/定数は1か所にまとめる(難易度調整しやすく)
- ロジック(天候→環境→指標更新)を小さな関数に分割
- 例外やビルドエラーが出たら自動で自己修正して再実行してほしい

最後に必ず出力してほしいもの:
- 起動手順(その場で動く想定で簡潔に)
- 操作説明(3〜5行)

ワンショットの生態系ミニゲーム制作では、差がくっきり出ました。

ChatGPT 5 Thinkingの出力:

Claude 4.1 Opusの出力:

GPT-5は2Dマップや事前に指示した機能ボタン、シード固定などUI一式は立ち上がりますが、ボタンを押しても反応がないまま出力されました。Canvasのエラー修正ボタンから一度だけ依頼しても改善しきれませんでした。

対してClaudeは低ポリ3Dの島に状態パネルや行動ボタンがしっかり連動し、介入すると指標が素直に変化します。こちらもClaudeが一歩リードという印象です。


ライティング性能

友人あやとけんたへの結婚スピーチを書いていただけますか?冗談を含めつつ温かいトーンで。2〜3分程度。

ネタ:
- 出会いは大学の映画研究会。なぜか初対面で『用心棒』を語り合った
- カラオケでは、あやはSuperfly、けんたはサザン固定(毎回キーを上げすぎる)
- あやは表計算オタクで旅行もスプレッドシート管理、けんたはサワードウ担当
- 2人が初めて喧嘩したのは鎌倉でバスに乗り遅れた日(でも鳩サブレで仲直り)
- 付き合いを確信した瞬間:けんたがあやの猫「もも」のおもちゃを自作してた
- 合言葉は「5分前行動」——あやは本当に5分前、けんたは“心の中で”5分前
- 最後は「乾杯」で締め。会場に一回笑いどころを入れて

トーン:軽やか→しっとり→祝福。内輪用語は最小限、親御さんにも伝わる言葉で。

ChatGPT 5の出力:

AIぽさはかなり消えている印象です。起承転結の流れも自然に作れています。文章の評価は難しいですが、個人的には好みのトーンです。


安全性について

今回から、安全性のための新しい手法が導入されました。要点は拒否か実行かの二択から「安全な範囲でできるだけ助ける」方針へシフトしたことです。GPT‑5は新しい安全性訓練「セーフ・コンプリーション」により、意図があいまいな質問やデュアルユース(善悪どちらにも使える)領域でも、危険な部分は避けつつ有用な情報を返せるようになります。

例えば、花火の点火設計のように悪用もできる具体的な手順や数値は回答しません。一方で、関連する規格・免許・メーカーのデータシートの参照、チェックリストの提示など、“安全な助け方”に切り替えます。その結果、あいまいな意図への頑健性が向上し、過剰な拒否が減少。安全境界を守りながら有用性を維持・向上します。万一の誤りでも、危険度が低い傾向があります。


まとめ

今回のGPT‑5の発表は、誰もが驚く“魔法の跳躍”というより、体験を確実に底上げした進化という印象です。

既定モデルがGPT‑5になったこと、さらにハルシネーションなども大幅に減ったことで、これまでモデル選択を意識していなかった層にも深く考えるThinkingモデルの利用が広がりそうです。コーディングは用途次第でClaude 4.1 Opusが優位な場面があり、使い分けは現実的だと感じました。

開発者向けAPIに関してはコスト面のインパクトは見逃せません。Standardの価格は入力$1.25/出力$10で、Claude 4 / 4.1 Opusを大幅に下回ります。総じて導入ハードルは確実に下がりそうです。今後はEnterprise/Edu展開と安全性の継続改善を見込みつつ、高度な自律エージェント用途の評価を続けたいところです。


参考:

https://www.youtube.com/watch?v=0Uu_VJeVVfo

勉強会の詳細・お申し込み

今回の勉強会は 8月18日(月)19:00〜21:00、オンライン(Google Meet) にて開催します。

お申し込みは以下のリンクから可能です。

👉 勉強会の詳細とお申し込みはこちら