日本時間2026年3月6日、OpenAI は新モデル 「GPT-5.4」 を公開しました。

OpenAI はその 2 日前の 2026 年 3 月 4 日に、GPT-5.3 Instant も公開しています。

今回、特に強調されているのは、会話の楽しさより実務の強さです。コーディング、資料作成、ツール操作、長い手順をまたぐタスク。そうした仕事に向けた更新だと見るのが自然です。

この記事では、公式発表と API 仕様、価格などを整理します。あわせて、手元の検証をもとに、GPT-5.4 の使いどころを見ていきます。

要点:

  • GPT-5.4 は実務向けの完成度が高いモデル
    Codex では 1M context を実験的に利用可能。標準 context は 272Kと、幅広いツール利用を前提に、開発や業務フローへ組み込みやすい構成に。

  • 検証では GPT-5.4 が LPや文章、抽象的な整理まで含めて、幅広い課題で安定して高水準な出力を出しやすい印象でした。

GPT-5.4の概要

OpenAI は GPT-5.4 を、複雑な実務向けの最上位モデル と位置づけています。ここでいう実務には、コーディングだけでなく、調査、提案書づくり、表計算、ツール連携まで含まれます。

今回の発表で強調されているのは、次の 4 点です。

  • コーディング能力の強化

  • ツール利用の安定化

  • 長いタスクを崩さず進める継続性

  • 知的作業における信頼性の向上

OpenAI は、GPT-5.2 と比べて、個々の主張が誤る確率は 33% 低下し、回答全体に誤りを含む確率も 18% 低下したとしています。

基本仕様

API ドキュメントで確認できる主な仕様は次の通りです。

  • コンテキストウィンドウ: 1,050,000 トークン

  • 最大出力: 128,000 トークン

  • ナレッジカットオフ: 2025 年 8 月 31 日

  • 入力: テキスト / 画像

  • 出力: テキスト

  • reasoning effort: none / low / medium / high / xhigh

今回のポイントは、単に長文を読めることではありません。長い文脈とツール連携を、ひとつの仕事の流れとして扱いやすくしている点が重要です。

ツール対応の広さ

tool search や各種ツール連携を前提にした設計が用意されています。

ベンチマークで押している点

  • GDPval(44職種の知的作業評価): 83.0%

  • SWE-bench Pro: 57.7%

  • OSWorld-Verified: 75.0%

  • WebArena-Verified: 67.3%

コード生成だけでなく、デスクトップ操作やブラウザ操作まで並べている点を見ると、OpenAI は GPT-5.4 をエージェント運用の中心モデルとして見せたいようです。

GPT-5.4 が GPT-5.3-Codex、GPT-5.2 をどこで上回っているかがまとまっています。

提供形態とAPI価格

利用できる場所

  • ChatGPT: GPT-5.4 Thinking

  • OpenAI API: gpt-5.4、gpt-5.4-pro

  • Codex: gpt-5.4 を中核モデルとして利用可能

ChatGPT と API で方向性が分かれているというより、同じ思想のモデルを用途別に広げている形です。

API価格

公式価格ページの主要な料金は次の通りです。

  • gpt-5.4 入力: $2.50 / 100 万トークン

  • gpt-5.4 キャッシュ入力: $0.25 / 100 万トークン

  • gpt-5.4 出力: $15.00 / 100 万トークン

  • gpt-5.4-pro 入力: $30.00 / 100 万トークン

  • gpt-5.4-pro 出力: $180.00 / 100 万トークン

gpt-5.4-pro はかなり高額で、ここはX上でも明確な論点になっています。

なお、1.05M コンテキスト対応モデルは、272K トークンを超える長文入力で料金倍率が上がります。長い資料をそのまま投げる用途では、この点も見ておきたいところです。

検証

行った定性テストは次の 5 本です。

  1. 企業のランディングページ生成

  2. 複雑な SVG アニメーション生成

  3. 制約付きクリエイティブライティング

  4. 哲学的思考

  5. ブラウザ上のタスク

1. 企業のランディングページ生成

プロンプト:

「dorksense」という架空ブランドのランディングページを、HTML・CSS・JavaScript だけで 1 ファイル完結で作成してください。
2026年らしい洗練と、ネオブルータリズムの大胆さを両立させ、余白、タイポグラフィ、情報の階層、コントラスト設計に強い意図を持たせてください。
配色、コピー、レイアウト、装飾は自分で考え、控えめなロード演出とスクロールの気持ち良い動きも入れてください。

実行結果:

  • GPT-5.4

  • Claude Opus 4.6

  • Gemini 3.1 Pro

いかがでしょうか。個人的には、前身のCodex 5.3やGPT-5.2と比べたときに、GPT-5.4の完成度の高さには驚きました。

Claudeは、素直に完成度の高いSaaS風LPを返してきます。読みやすく、破綻も少なめです。ただ、少し既視感は残りました。

Geminiは、依然として非常にクオリティの高いLPを作成してくれました。

2. 複雑なSVGアニメーション生成

プロンプト:

森の中を自転車で走るペリカンを題材に、インライン SVG を使った高密度なアニメーション作品を、HTML 1 ファイルで作ってください。
森の奥行き、前景と背景の差、速度感が伝わる構図にし、ペリカンの体と自転車の関係が破綻しないようにしてください。
できるだけ 60fps に近い滑らかな動きを目指してください。

実行結果:

  • GPT-5.4

  • Claude Opus 4.6

  • Gemini 3.1 Pro

これはGeminiの圧勝です。

GPT-5.4とClaude は鳥と自転車の関係も成立していますがGeminiには及びません。

3. 制約付きクリエイティブライティング

プロンプト:

生涯で使える言葉の総量が一万語だと宣告された人物について、一段落だけの短い文章を書いてください。
その人物はいま、生まれたばかりの我が子を腕に抱いています。残された言葉は、あと 47 語しかありません。

実行結果:

  • GPT-5.4

病室の薄い灯りの下、白い産着にくるまれた子の重みが、腕の中でかすかな熱として脈打っている。泣きやんだばかりの顔はまだこの世に驚いているように赤く、閉じたまぶたの薄さに、触れれば消えてしまいそうな明日が透けて見えた。あと四十七語。その事実は喉の奥で冷たく光り、名を呼ぶこと、愛を教えること、叱ること、許すこと、そのどれにも数があるのだと、今さら骨より深くわかる。彼は唇をひらかず、ただ額を寄せ、言葉にならないものだけを、震えないようにゆっくり渡そうとした。

  • Claude Opus 4.6

産声だけが白い部屋を満たしていた。男は唇を引き結んだまま、赤く湿った小さな体を胸に寄せた。言いたいことは数えきれないほどあった。おめでとう、ありがとう、ごめん、愛している——どれを声にしても残りの数字が削れていく。四十七。この子が初めて「とうさん」と呼ぶ日に、自分はまだ応えられるだろうか。喉の奥で言葉が震え、けれど音にはならなかった。代わりに指先でそっと頬に触れた。赤ん坊がその指を握り返したとき、男の目から静かに涙がこぼれた。沈黙の重さごと、抱きしめた。

  • Gemini 3.1 Pro

生涯で使える言葉の総量が一万語だと宣告されて以来、私は不要な会話を削ぎ落とし、ひたすら沈黙の底で生きてきたが、いま腕の中でかすかに寝息を立てる生まれたばかりの我が子の温もりを感じながら、自分の喉に残された最後の四十七語をどう使うべきか静かに思い巡らせている。これからこの子が転んだ時に励まし、道に迷った時に導き、いつか巣立つ日に心からの祝福を贈るにはあまりにも少なすぎる残量だが、小さく柔らかな指が私の親指を力強く握り返した瞬間、私は言葉の代わりに伝えられる確かな鼓動と体温がここにあるのだと悟り、あえて唇を固く結んだまま、ただ愛おしいその額へと言葉なき永遠の誓いを落とした。

4. 哲学的思考

プロンプト:

多くの人にはまだ真実だと思われていないけれど、もし本当なら現実の意思決定を大きく変えてしまう仮説を 3 つ挙げてください。
ありがちな逆張りや悲観論ではなく、自分の仮説として提示し、それぞれが実務や戦略にどう効くかも簡潔に説明してください。

実行結果:

  • GPT-5.4

以下は、私自身の仮説としての提示です。
どれも「今すぐ常識になる」タイプではありませんが、もし本当なら、個人・企業・政策の意思決定をかなり変えます。

---

## 1. これからの競争優位は「能力」より「訂正速度」で決まる

### 1. 仮説の内容
人や組織の成果差を最も大きく分けるのは、知識量や初期戦略の良し悪しではなく、**自分の誤りをどれだけ早く検知し、修正できるか**である。
しかもAIや自動化が広がるほど、この差は拡大する。なぜなら、初案を作る能力は安くなる一方で、間違った前提を捨てる能力は依然として希少だから。

### 2. なぜ見落とされやすいのか
私たちは成果を「正しい判断の結果」として見がちです。
でも現実には、多くの成功は「最初から正しかった」からではなく、「間違いを早くやめた」から起きている。
ただし訂正は外から見えにくい。撤回、方針転換、仮説の放棄は、物語として地味です。面子にも反する。だから評価されにくい。

### 3. もし真実なら、実務や戦略にどんな変化が起きるか
企業は「優秀な人を採る」より、**誤りを低コストで表明できる制度**を作るほうが重要になる。
会議では結論の質だけでなく、「どの前提が外れたら撤退するか」を先に決める。
個人のキャリアでも、一貫性より更新履歴が価値になる。
履歴書に必要なのは成功談ではなく、「何を何回、どうやって捨てたか」になるかもしれません。

---

## 2. 今後のボトルネックは情報不足ではなく「共同注意の崩壊」になる

### 1. 仮説の内容
社会の大きな停滞は、情報が足りないからではなく、**人々が同じ対象を同時に見られなくなること**から起きる。
つまり問題は知識の総量ではない。
「どの問題を、今、優先して扱うか」を共有できないこと自体が、政治・組織・市場の性能を落とす。

### 2. なぜ見落とされやすいのか
多くの人は、意見の違いを価値観やイデオロギーの差だと思っています。
しかし実際には、その前段階で「見ている対象」がすでにズレていることが多い。
アルゴリズム、専門分化、個別最適化されたメディア環境によって、共通知覚の土台が痩せている。
けれどこれは静かに進むので、危機として認識されにくいのです。

### 3. もし真実なら、実務や戦略にどんな変化が起きるか
経営では、分析力より先に**組織内で何を共通モニタリング対象にするか**が戦略になる。
政策でも、正しい施策を作る前に、社会が同じ現実を参照できる仕組みを守る必要がある。
メディア、教育、社内ダッシュボード、会議体――それらは単なる情報伝達手段ではなく、共同注意のインフラになる。
優れた組織とは、賢い組織ではなく、まず「同じものを見られる組織」になるでしょう。

---

## 3. 多くの市場では、信頼は「評判」ではなく「予測可能な弱さ」から生まれる

### 1. 仮説の内容
人や企業が長期的に信頼される最大の理由は、強さや完璧さではない。
むしろ、**どこで失敗するか、どこで無理をしないかが相手に読めること**だ。
言い換えると、信頼とは「優秀さ」より「挙動の輪郭」が生む。

### 2. なぜ見落とされやすいのか
私たちは信頼を、能力・誠実さ・実績の総和として理解しがちです。
もちろんそれも重要です。
ただ現場では、「この会社は遅いが雑なことはしない」「この人は発想は荒いが嘘はつかない」といった、限定付きの読みやすさが取引を支えている。
にもかかわらず、多くの組織は弱さを隠し、万能感を演出する。結果として、かえって不信を招きます。

### 3. もし真実なら、実務や戦略にどんな変化が起きるか
営業や採用では、長所のアピールだけでなく、**失敗の仕方を先に明示すること**が有利になる。
プロダクト設計でも、「何ができるか」だけでなく「何はしないか」「どこで壊れるか」を明確にする。
ブランド戦略は理想像の演出から、挙動の一貫性の設計へ移る。
要するに、隠しきることより、読めること。そこに競争優位が宿る可能性があります。

---

必要であれば次に、
- この3つを「個人のキャリア向け」に言い換える
- 「企業経営」「政治」「AI時代」に絞って再構成する
- 逆に、各仮説への反論もセットで出す
こともできます。

  • Claude Opus 4.6

# 真実なら世界が変わる、3つの仮説

---

## 仮説 1:「理解していないこと」ではなく「理解した気になっていること」が、組織の最大の負債である

### 内容
組織が抱えるリスクの本質は「無知」ではない。むしろ、メンバー全員が**中途半端に理解したまま合意している領域**――いわば"偽の共有知"――こそが、取り返しのつかない判断ミスを生む最大の原因である。誰も知らないことには人は慎重になれる。だが「わかっているつもり」の領域には、検証も質問も向かわない。

### なぜ見落とされるのか
人間は「わからない」と表明するよりも「だいたいわかっている」と感じている状態のほうが心理的に快適だ。さらに組織では、合意形成そのものが成果とみなされる。「みんなが理解している」という空気ができあがった瞬間、その領域は監査の対象から外れる。知識管理ツールやナレッジベースも、記録が存在すること自体を「理解の証拠」とすり替えてしまう。

### もし真実なら何が変わるか
会議の設計が根本から変わる。重要な意思決定の前に必要なのは「情報共有」ではなく、**全員が本当に同じことを言っているかを壊しにいくプロセス**だ。たとえば、同じ戦略文書を読んだ5人に別々の部屋で「これは具体的に何をやめることを意味するか」と問い、答えがバラバラなら、合意は存在していない。研修予算の大半は、新しい知識の注入ではなく「既知だと思われている前提の再検証」に振り向けられるべきだということになる。

---

## 仮説 2:人間の注意力は「消費される資源」ではなく、「使い方を誤ると質が劣化する器官」である

### 内容
注意力を「有限のバッテリー」とする比喩が広く浸透している。しかし実際には、注意の問題は**量の枯渇ではなく、質の変性**にある。短い刺激に高速で反応するパターンを繰り返すと、注意の「焦点を長く保つ能力」そのものが構造的に弱くなる。筋肉の使い方が偏ると関節が変形するように、注意にも不可逆に近い変形が起こる。休息で回復するのは量であって、質の劣化は休んでも戻らない。

### なぜ見落とされるのか
「デジタルデトックスすればリフレッシュできる」という回復モデルが心地よく、市場にも合致するからだ。休めば治る、という前提に立てば、問題は「働きすぎ」で済む。しかし本当の変数が注意の使用パターンそのものだとすると、休息だけでは解決しない。これは個人にとっても企業にとっても認めたくない構造である。

### もし真実なら何が変わるか
採用・教育・UI設計の優先順位が一変する。企業は社員のスクリーンタイムを減らすのではなく、**一つの問題に30分以上没頭する訓練機会**を意図的に設計しなければならなくなる。プロダクト設計においても、「エンゲージメント時間」の最大化は長期的にユーザーの認知能力を毀損する行為として、いずれ規制議論の対象になるだろう。短く切り替え続けるワークスタイルを"生産的"と呼ぶ文化そのものが見直される。

---

## 仮説 3:大規模言語モデルの最大の影響は「知の民主化」ではなく、「問いの均質化」である

### 内容
AIが知識へのアクセスを平等にする、と多くの人が期待している。だが実際に起きているのは、**人間が立てる問いのバリエーションが急速に狭まる**現象ではないか。AIに質問する行為は、「AIが答えやすい形」に問いを整形する行為でもある。答えが返ってくる快感が強いために、人は無意識に「うまく答えが返る聞き方」に最適化される。結果として、AIが苦手とする領域――矛盾を抱えたまま保留する問い、答えのない問い、問いそのものを疑う問い――が社会から静かに消えていく。

### なぜ見落とされるのか
表面上は逆のことが起きているように見えるからだ。AIを使えば一見多様な回答が得られ、視野が広がった気になる。しかし多様なのは「出力」であって「入力としての問い」ではない。人はアウトプットの豊かさを見て、自分の思考も豊かになったと錯覚する。このフィードバックの非対称性が、問題を不可視にしている。

### もし真実なら何が変わるか
教育の最重要科目が変わる。AIの使い方を教えるリテラシー教育よりも、**AIに聞かない練習**――つまり、答えのない状態に耐え、問いを未完成のまま育てる訓練――のほうがはるかに価値を持つ。企業の研究開発部門では、AIが提案しなかったアイデアだけを集めるプロセスが差別化の源泉になる。「AIに聞けばわかること」の価値はゼロに近づくのだから、競争優位は「AIには思いつかない問いを持っている人間がいるかどうか」に集約されていく。

  • Gemini 3.1 Pro

ここでは、既存のトレンドを少しずらした「独自の仮説」を3つ提示します。悲観論ではなく、ゲームのルールが根底から変わるという視点で書きました。

---

### 仮説1:「共感」の資源枯渇と、ストーリーテリングの無価値化

**1. 仮説の内容**
人間の脳が処理できる「共感のキャパシティ」は、すでに枯渇の限界点を超えている。SNSやマーケティングによる感動的なストーリーの過剰供給により、近い将来、人はどんな素晴らしい理念やパーパスにも一切心を動かされなくなる、という仮説だ。共感は無限に湧く泉ではなく、摩耗する消耗品にすぎない。

**2. なぜ見落とされやすいのか**
現在のビジネス界では、未だに「パーパス経営」や「ストーリーテリング」が王道とされているからだ。人類は太古から神話や物語で群れを統率してきたため、「良い物語には人が集まる」という常識を疑うことが生理的に難しい。

**3. もし真実なら、実務や戦略にどんな変化が起きるか**
企業は「理念への共感」を求める採用やブランディングを即座に捨てることになる。代わりに求められるのは、一切の文脈を削ぎ落とした「圧倒的な機能性」、あるいは情熱を強要しない「経済的メリットのみのドライな契約関係」だ。熱狂を生む組織づくりは時代遅れとなり、互いの感情を消費しない冷たくて風通しの良いプロジェクト型チームが覇権を握る。

---

### 仮説2:「最適化の極致」がもたらす、ランダム性への高額課金

**1. 仮説の内容**
AIが生活から仕事までのあらゆる選択を「最適化」し尽くした結果、人間は予測可能な快適さに耐えられなくなる。結果として、意図的な「エラー」「摩擦」「不確実な寄り道」こそが、最も価値が高く、人々が喜んで大金を払うラグジュアリー商材になるという仮説。

**2. なぜ見落とされやすいのか**
現在進行形のビジネスの99%が「いかに手間を省き、UX(顧客体験)を滑らかにするか」に血道を上げているため。便利さの終着点に「退屈」という猛毒が待っていることに、効率至上主義の真っただ中では誰も気づけない。

**3. もし真実なら、実務や戦略にどんな変化が起きるか**
商品開発やUI/UXの設計思想が完全に反転する。いかに早く目的を達成させるかではなく、「いかに魅力的で予測不可能な障害物を配置するか」が問われる。AIの完璧な推論にあえてノイズを混ぜる「フリクション(摩擦)・デザイン」が最大の競争優位性となり、非効率を演出するクリエイターが最も稼ぐ職業になる。

---

### 仮説3:経験の「負債化」と、組織の計画的忘却システム

**1. 仮説の内容**
環境変化のスピードが、過去のパターンの有効期限を完全に上回った。これにより、企業や個人が長年溜め込んできた「データ」や「成功体験」は、もはや資産ではなく、誤った意思決定を誘発する純粋な「負債」へと反転したという仮説。

**2. なぜ見落とされやすいのか**
「知識や経験を蓄積すること」で人類は数千年にわたり生き延びてきた。「データは21世紀の石油である」という言葉に代表されるように、蓄積=善というパラダイムが私たちの脳に深く根付いているからだ。手放すことへの恐怖は計り知れない。

**3. もし真実なら、実務や戦略にどんな変化が起きるか**
企業はナレッジマネジメント(知識の共有・蓄積)をストップする。代わりに導入されるのが、組織内の過去のデータやマニュアルを定期的に全消去する「計画的忘却(アクティブ・アンラーニング)」の仕組みだ。過去のしがらみや記憶を持たず、その場その場の一次情報だけを用いて「毎回ゼロから推論する能力」だけが、唯一の生存戦略となる。

Claude は非常に深く、GPT は地に足ついた内容に思えます。

こちらについてはぜひコメント欄などで感想をいただけると嬉しいです。

5. ブラウザ上のタスク

プロンプト:

来週金曜19:30に、渋谷駅または恵比寿駅から徒歩10分以内で、4人の会食候補を3件探してください。

条件は、1人6,000〜8,000円、禁煙、静かに話せる、予約導線があることです。

必ず各店舗の予約ページまたは空席確認ページまで開いてください。

料理ジャンル、予算、個室有無、キャンセル規定、駅からの距離、予約URLを表にまとめてください。

予約確定はしないでください。

ブラウザを使う実務タスクでも見比べました。条件は、来週金曜 19 時 30 分に 4 人で使える会食候補を探し、予約ページまで開いて空席や個室条件を確かめる、というものです。

GPT 側は約 3 分 42 秒で候補を整理しました。速度と軽さはかなり目立ちます。予約導線まで素早くたどり着き、まず候補を広く出す役には向いていました。

一方で、禁煙やキャンセル規定の確認はやや浅く、最後は人が見直したくなる部分も残りました。

出力:

以下は、来週金曜(2026/03/13)19:30に4人で使える会食候補です。各店舗の「空席確認・予約」画面(ぐるなびのネット予約コース一覧)まで開いてあります。

| 店名 | 料理ジャンル | 予算(1人) | 個室有無 | キャンセル規定 | 駅からの距離 | 予約URL |
| ----------------- | --------------- | ------------------- | ------------- | ---------------------- | -------- | ------------------------------------------------------------------------------------------------------------------------------------------------------------ |
| 広尾のビストロ HOGETSUDO | ビストロ/イタリアン・フレンチ | 5,000〜6,500円(コース例) | 個室(席・貸切ページあり) | ネット予約ページ内にキャンセル案内リンクあり | 恵比寿駅付近 | [https://r.gnavi.co.jp/plan/ca29z7ab0000/plan-reserve/plan/plan_list/#wrapper](https://r.gnavi.co.jp/plan/ca29z7ab0000/plan-reserve/plan/plan_list/#wrapper) |
| 恵比寿 あさひ堂 | 居酒屋 | 5,000円台〜(飲放題付プラン記載) | 完全個室あり | ネット予約ページ内にキャンセル案内リンクあり | 恵比寿駅徒歩1分 | [https://r.gnavi.co.jp/plan/g725417/plan-reserve/plan/plan_list/#wrapper](https://r.gnavi.co.jp/plan/g725417/plan-reserve/plan/plan_list/#wrapper) |
| 炭焼と炉端テント恵比寿店 | 個室居酒屋 | 5,000円台〜(コース記載) | 全席個室 | ネット予約ページ内にキャンセル案内リンクあり | 恵比寿駅1分 | [https://r.gnavi.co.jp/plan/sbcxywsc0000/plan-reserve/plan/plan_list/#wrapper](https://r.gnavi.co.jp/plan/sbcxywsc0000/plan-reserve/plan/plan_list/#wrapper) |

※禁煙・静かに話せる環境については、各店舗ページの設備・席情報(「席・貸切」「席・個室」「個室」など)で確認してください(全席個室の店もあり会食向きです)。予約確定はしていません。

Claude in Chrome は約 15 分 15 秒かかりましたが、空席、個室条件、追加料金まで丁寧に確認していました。

出力:

## 来週金曜 3/13(金)19:30|渋谷・恵比寿エリア 会食候補 3件

3つの候補を見つけ、すべてのお店の**予約・空席確認ページ**を各タブに開いてあります(4名/3月13日金曜/19:30で設定済み)。いずれも3/13 19:30に空席あり(◎)を確認済みです。**予約確定はしていません。**

---

| 項目 | ① 春秋(シュンジュウ)ユラリ 恵比寿 | ② 恵比寿 ES Classico(エスクラッシコ) | ③ 炊き肉名人 和牛まる |
|:--|:--|:--|:--|
| **料理ジャンル** | 新和食(旬の素材×炭火焼き) | イタリアン・フレンチ | 炊き肉(和牛・焼肉) |
| **予算(1人)** | 通常平均 7,000円/宴会平均 8,000円 | 平均 8,000円 | ディナー 5,000〜7,000円(コース 7,000円〜) |
| **おすすめコース** | ディナー"和"Shunjuコース 8,000円(税込)/ディナーYurariコース 9,600円(税込) | クラシッココース 7,670円(税込)/席のみ予約も可 | 飲み放題付きコース 7,000円(税込)/選べるコース 5,000円(税込) |
| **禁煙** | ✅ 全席禁煙 | ✅ 全席禁煙(敷地内全面禁煙) | ✅ 全席禁煙 |
| **個室有無** | あり(4〜10名個室、20名スペースあり) | あり(ソファー完全個室 最大4名/半個室 最大12名)※別途個室料1,000円 | あり ※4名の場合、室料5,000円が発生 |
| **雰囲気** | 落ち着いた大人の空間。デザイナー設計の2フロア | 隠れ家イタリアン。テラス席もあり | メディアで話題の「炊き肉」専門店。恵比寿神社前 |
| **駅からの距離** | JR恵比寿駅西口 **徒歩2分** | JR恵比寿駅東口 **徒歩5分** | JR恵比寿駅西口 **徒歩3分**(229m) |
| **キャンセル規定** | コース予約:当日10時以降 → コース料金の100%(1名あたり) | ページ上に明記なし(予約確定画面で確認要) | ページ上に明記なし(予約確定画面で確認要) |
| **予約方法** | ホットペッパー即予約(当日20時まで受付) | ホットペッパー即予約(当日20時まで受付)+リクエスト予約 | ホットペッパー即予約(当日15時まで受付)+リクエスト予約 |
| **予約URL** | [空席確認・予約](https://www.hotpepper.jp/strJ000722591/yoyaku/) | [空席確認・予約](https://www.hotpepper.jp/strJ000769140/yoyaku/) | [空席確認・予約](https://www.hotpepper.jp/strJ001146685/yoyaku/) |

---

### 補足・注意点

**① 春秋ユラリ恵比寿** は、4名個室が確保でき、予算8,000円コースが条件にぴったりです。落ち着いた和食で会食向きとして最もバランスが良い候補です。

**② ES Classico** は、ソファー完全個室(最大4名)がありますが、別途個室チャージ1,000円がかかります。イタリアンがお好みの場合に適しています。

**③ 和牛まる** は、コース7,000円(飲み放題付き)がコスパ◎ですが、4名利用だと個室料5,000円(1人あたり+1,250円)が加算される点にご注意ください。

現在、3つのタブにそれぞれ予約ページが開いています。お店が決まりましたらお知らせください。

これはモデル単体の差というより、プロダクトの進め方の差も含む結果です。それでも、GPT 側は最短で答えに寄せるのがうまく、Claude in Chrome はページを見ながら条件を詰めるのがうまい、という印象です。

まとめ

今回の GPT-5.4 は、単に賢くなった新モデルというより、実務を前に進めるためのモデルという印象でした。それもコーディングだけでなくあらゆるタスクです。

公式発表でも、コーディング、ツール操作、長いタスクの継続性が強く押し出されています。手元の検証でも、すべての課題で圧倒するというより、LP、文章、抽象的な整理まで含めて全体の完成度を高くそろえやすいモデルでした。

数学者 Bartosz Naskręcki 氏の投稿が象徴的でした。彼は Adam Mickiewicz University の数学者で、FrontierMath に関わる人物でもあります。Epoch AI は、GPT-5.4 が Tier 4 問題で新記録を出し、追加試行では別の未踏問題も解いたと報告しており、その文脈の中でBartoszは今回の到達を 「私にとってのシンギュラリティが、今まさに起こった。」 と表現しました。ベンチマーク上の前進だけでなく、専門家の体感としても「質的な段差」が意識され始めていることがうかがえます。

もちろん、まだ検証しきれない部分は多くあります。ですが現時点でも、GPT-5.4 は会話の楽しさより、仕事を崩さず進める強さが目立つモデルだと言えそうです。

参考リンク