2025年1月が早くも過ぎ去りました。しかし、AI領域の動きはますます加速しているようで、毎日新たな発表や話題が絶えません。新しいモデルのリリースから大型投資の発表、さらには自動化技術や政府向けの導入事例まで、多様なトピックが日々登場しています。
こうした情報量の多さに「すべてを把握するのは難しい」と感じる方も多いのではないでしょうか。
「ChatGPT研究所」では、そんな膨大なAI関連の情報を整理し、より分かりやすい形でお届けしたいと考え、毎週、主要ニュースをまとめた記事を投稿していくことに決めました。
今週は特に注目度の高い発表や投資のニュースが重なりましたので、その内容をかいつまんでご紹介していきます。
1. OpenAIが「o3-mini」をリリース

OpenAIは日本時間2月1日、小型推論モデル「o3-mini」をChatGPTおよびAPIで正式公開しました。主にSTEM(科学・数学・コーディング)分野の推論性能を高めながら、応答速度やコスト面も大幅に最適化している点が特徴です。既存のo1モデルと比較し、1トークンあたりの価格は約63〜93%ほど低減されています。
新機能とベンチマーク:
Reasoning Effortの3段階設定(low / medium / high)
low: 迅速に答えを返す代わりに、推論の深さはやや抑えめ
medium: 速度と正確性のバランスを重視(ChatGPT標準設定)
high: 時間をかけて深く検証するため、科学や数学の複雑な問題でも正答率が向上
たとえば、数学テスト(AIME 2024)やPhDレベルの問題集(GPQA Diamond)において、高設定を使うと正答率が上がる傾向が確認されています。

STEM領域の主な評価結果
AIME 2024: 高精度モードで87.3%の正答率
Codeforces: コーディングタスクでEloスコア2130を記録

API提供
tiers 3–5 の開発者向けにChat Completions APIやBatch APIを公開し、大規模運用でも導入しやすい仕組みを整えています。
入力トークンは100万トークンあたり0.55ドル~、出力トークンは4.40ドル~で、従来のo1-miniよりも大幅なコスト削減が見込まれます。

提供範囲と活用のポイント:
ChatGPT Plus / Teamユーザー: 1日あたりの利用上限が150メッセージに拡大され、即日からo3-miniおよびo3-mini-highを利用できます。
Freeユーザー: “Reason”ボタンからo3-miniを試用可能ですが、上限や一部機能に制限があります。
Enterpriseプラン: 約1週間以内に利用開始見込み。
o3モデルから推論の「深さ」を指定できることで、用途に応じた応答品質や処理速度のカスタマイズが可能になります。たとえば、素因数分解や物理シミュレーションなど計算負荷の高いタスクではhigh設定を用いて精度を上げ、日常的なQAにはmedium以下を使うといった運用が想定されます。
DeepSeekなど他社の類似モデルやウェブ版で提供されているo1 Proモデルと比較すると、すべてのベンチマークや精度で上回るわけではないものの、コストや応答速度面で優位性があるという点が評価され始めています。
o3 miniについてはこちらで詳しく解説しています:
https://agi-labo.com/articles/n6ca9d85b47d1
2. OpenAIのAIエージェント「Operator」が登場
OpenAIは日本時間1月24日、ウェブブラウザを自動操作するAIエージェント「Operator」を公開しました。現在はアメリカのChatGPT Pro(約200ドル/月)ユーザー向けの研究プレビュー版として提供されており、近い将来PlusやTeam、Enterpriseユーザーにも段階的に拡大するとされています。
ブラウザ上のボタンやフォームを人間が操作するかのように扱い、多様なウェブタスクを自動化できる点が特徴です。
https://drive.google.com/file/d/1J1AjThQRnhOYcl2Tsm7lNhrYoqW5GHVE/view?usp=sharing
主な特徴と仕組み:
① Computer-Using Agent(CUA)
GPT-4oの視覚認識と強化学習による推論能力を組み合わせた新モデル。
ウェブページのGUIを読み取り、マウスやキーボードの動きをエミュレートすることでAPI非対応サイトでも操作可能です。

②タスク自動化の事例
オンライン予約: レストラン予約サイトを開き、空き枠を確認したうえでユーザーに提案する。
ネットショッピング: 商品ページを検索し、カートへの追加や注文確定を自動で実行。
情報収集: SNSや検索エンジンなどを横断し、調べものをまとめて行う。

③ 操作のモニタリングと引き継ぎ
エージェントが誤操作した場合や詰まった場合、「Take over」機能でユーザーが手動操作を引き継げます。
複数タスクを並行して進められますが、銀行取引など機密性の高い操作は一部制限があります。
ベンチマークと現状の成功率:
WebArena(模擬サイト操作): 成功率58.1%
WebVoyager(AmazonやGitHubなど実サイト操作): 成功率87%
OSWorld(各種OS環境の操作): 成功率38.1%
いずれも既存モデルより改善傾向にあるものの、まだ人間の操作を完全に置き換えられる水準ではないとされています。

安全性と今後の展望:
海外展開の課題:
EUなどの厳格な規制下では提供開始が遅れる見込み。
今後のロードマップ:
エージェントを複数追加し、特定の業務領域に特化した機能を拡張する計画。
CUA自体をAPIとして開放し、開発者が独自に高度な自動化ツールを構築できるようにする方針。
Operatorは、「人間の画面操作をそのまま再現できる」点が従来のAPI連携型RPAとは異なります。多様なウェブサービスを横断的に扱える半面、完全自動化には安全性や技術的課題が残っているのも事実です。
今後、特定領域に特化したエージェントやCUAのAPI化によって、自社専用の自動化ソリューションを開発する流れが加速する可能性があります。企業や個人が日常的なタスクをAIに任せられる時代へ、さらに一歩近づいたと言えそうです。
Operatorについてはこちらで詳しく解説しています:
https://agi-labo.com/articles/nd95edba8b8a3
https://agi-labo.com/articles/n9b662e2f95ac
3. ソフトバンクがOpenAIに最大で $25B 投資か ― 時価総額は 最大で$300B に
ソフトバンクが、OpenAIへの大型出資を検討中であると複数メディアが報じています。投資額は $15B~$25B 規模で調整されており、他投資家の出資を含め 最大$40B の資金調達につながる可能性があります。
もし実現すれば、OpenAIの時価総額は 最大で$300B に達する見込みです。当初は $340B という報道もありましたが、最近の交渉で下方修正されたとの情報も出ています。
背景と資金の使途
① Stargateプロジェクトへのコミット
ソフトバンク、Oracleなどと共同で進める大規模データセンター計画「Stargate」への拠出として、OpenAIは 約$18B を割り当てる義務があるとされています。
同プロジェクト全体で $100B を投資し、最終的には $500B 規模に拡大する構想も報じられています。
https://twitter.com/ctgptlb/status/1881875516061610103
②事業運営の赤字補填
OpenAIは2024年の売上を $3.7B と見込む一方で、約 $5B の赤字を出したとされています。
新たに調達する資金は、赤字の補填や高額なAI開発コストの確保に充てられる見込みです。

投資の規模と評価額の推移
OpenAIは2025年1月に $6.6B を調達し、評価額が $157B と報じられたばかりです。
今回の 最大$40B 規模の調達が実現すれば、評価額は 最大$300B に上昇し、SpaceXに次ぐ世界第2位のスタートアップとなる可能性があります。
ソフトバンクは最大で $25B を拠出する計画とされ、残額は他の投資家が出資する見通しです。

ソフトバンクとの連携強化
ソフトバンクCEOの孫正義氏とOpenAIのサム・アルトマンCEOは、2025年1月下旬にホワイトハウスで共同会見を行い、AIインフラへの投資を発表しました。
2024年末には、ソフトバンクがOpenAIの従業員株約 $1.5B 分を買い取る「テンダーオファー」を提示したとの報道もあり、両社のパートナーシップは急速に進んでいるとみられます。
最大$40B に及ぶラウンドは、シリコンバレー史上でも極めて大規模な資金調達となります。OpenAIが一気に追加資金を確保することで、データセンターの増強や研究開発の加速が期待される一方、競合との競争も激化しそうです。マイクロソフトに次ぐ主要投資家としてソフトバンクが位置づけられることで、OpenAIの事業戦略や技術ロードマップにも大きな影響を与えると考えられます。

4. OpenAI、アメリカ政府機関向けに「ChatGPT Gov」を発表
OpenAIは1月28日、アメリカの連邦・州・地方機関向けに「ChatGPT Gov」を公開しました。これは主に、マイクロソフトAzure上で独自に構築できるChatGPTの新バージョンで、機密情報の取扱いやサイバーセキュリティ基準への適合を重視した設計が特徴です。すでに3,500以上の政府関連機関がChatGPTを利用しているとされ、今回の発表によりさらなるAI活用の拡大が見込まれます。

主な特徴と機能:
① 政府専用環境での運用
各機関がAzureの商用クラウドまたは政府専用クラウド上にChatGPT Govをホスティングし、セキュリティやプライバシー要件を独自に管理できます。
FedRAMP HighやITARなど高度な政府規格への準拠を想定し、機密度の高いデータも扱いやすいとされています。
② ChatGPT Enterprise相当の機能
GPT-4oモデルによる文章生成・要約・画像解析などに対応。
カスタムGPTの作成や社内ユーザー間での会話共有機能、シングルサインオン(SSO)などの管理コンソールが含まれます。
③ 利用事例と実績
Air Force Research Laboratory: コーディング支援やAI教育への活用
Los Alamos National Laboratory: 科学研究支援やバイオ系分野への応用可能性を評価中
州政府の翻訳部門: 多言語翻訳コストを削減し、応答速度を向上
ペンシルベニア州: パイロットプログラムで1日の業務時間を平均105分短縮との報告
2024年以降、90,000人以上の政府関係者がChatGPTを利用して 累計1,800万件 以上のメッセージをやり取りしていると推定されています。
OpenAIは今後、ChatGPT Govをより高いセキュリティ水準(FedRAMP Moderate/High)に対応させる方針を示しており、機密性の高い分野への適用範囲がさらに広がると期待されています。国防・公共分野での事例が増えることで、AIの社会実装がいっそう加速するかもしれません。
5. GoogleがAnthropicに追加で $1B を投資

アルファベット(Google)は、Claude開発のAnthropicに対して追加で$1B の投資を行いました。同社はすでに $2B 以上をAnthropicに出資しているとされています。
主なポイント
① Googleの継続的支援
既存の $2B 投資に加え、今回追加で $1B を投資。
AnthropicはGoogleのクラウドやツールを活用し、AIの研究・開発を進めています。
② 競合他社との資金競争
AnthropicはLightspeed Venture Partners主導のラウンドで $2B 規模の追加調達を交渉中と報じられており、評価額は $60B に達する可能性があります。
OpenAIや他のAI企業と同様、大規模コンピューティング環境を拡充するために多額の資金が必要です。
③ Amazonなど他企業の関与
AmazonもAnthropicの大口出資者の一つであり、大手テック企業がこぞってAnthropicの成長を後押ししています。
6. MicrosoftがOpenAIの「o1」推論モデルを無料化、Copilotユーザー全員が利用可能に
Microsoftは1月31日、Copilotに統合しているOpenAIの「o1」推論モデルを、すべての利用者向けに無料開放すると発表しました。当初は「Copilot Pro」ユーザー($20/月)限定の機能として提供されていた「Think Deeper」機能ですが、今後はプランに関係なく、どのCopilotユーザーでも利用できます。

主なポイント
① Think Deeper機能の無料開放
o1モデルを活用した詳細な思考プロセスを実行し、複雑な質問や比較検討に対してステップバイステップの解答を生成できます。
30秒ほどかけて「あらゆる角度と視点から考慮」するため、より正確かつ深い回答が期待されます。
② 従来の提供形態
2024年10月に一部の利用者向けプレビューとしてリリースされ、Copilot LabsやCopilot Proプランで先行利用されていました。
ChatGPT Plusのように高度な推論機能が有料だったものが、今回の方針転換で無償化される形となります。
③ Microsoft AI CEOによるアナウンス
Mustafa Suleyman氏がLinkedInで正式発表し、「数千万人に上るCopilotユーザーがこの機能を利用できる」とコメント。
今後の追加機能も予告されており、Copilotのさらなる強化が見込まれます。

7. DeepSeekがアプリストアでChatGPTを抜きトップに、米中対立や輸出規制にも波紋
中国のAIスタートアップDeepSeekがリリースした「V3」「R1」モデルが大きな話題となり、同社のアプリはアメリカを含む世界52カ国でApp Storeの無料アプリ1位を獲得しました。
競合他社に比べ低コストで高い性能を実現したと主張され、業界では「AIモデル開発のコスト曲線が変わったのか?」と論争が起きています。一方で、アメリカ政府の輸出規制強化論や、中国企業への警戒感も高まっており、世界的なAI覇権争いの一端が浮き彫りになりました。
主なポイント
① App Storeトップを獲得
DeepSeekのモバイルアプリは過去1週間で急激にダウンロード数が伸び、アメリカをはじめ合計52カ国で無料アプリ1位を記録。
ユーザー数は短期間で倍増し、累計約260万件 のダウンロードに到達しました。
② “低コスト高性能”の衝撃
DeepSeekは、アメリカの大手モデルと同等レベルの推論性能を、比較的安価なGPUと 約$5.6M のトレーニング費用で達成したと主張。

特に「Mixture of Experts(MoE)」や「MLA(Multi-head Latent Attention)」による効率化が大きな話題です。
ただし、研究開発費やアーキテクチャ設計のコストが含まれていないため、実際の総費用は不透明という指摘もあります。
④ 米中対立と輸出規制の焦点
DeepSeekが高性能モデルを開発できた背景に、中国企業への高性能GPU供給(合法・違法問わず)があるのではと疑われています。
Scale AI CEOのAlexandr Wangが、DeepSeekが約5万台のNVIDIA H100を保有しているが、アメリカの輸出規制により公表していないと発言:
https://twitter.com/kimmonismus/status/1882824571281436713
アメリカではH100など最先端AIチップの輸出が規制されており、今後さらなる規制強化が予想されています。
一部専門家は、「DeepSeekが示した技術革新こそ、輸出規制をより厳しくすべき根拠になる」 と主張しています。
⑤ 他社への影響
OpenAIやAnthropic: 巨額投資による大型モデル開発を進める両社にとって、低コストで類似性能を出すDeepSeekの存在は脅威とみられています。
NvidiaやGoogle: AIチップ需要が想定と異なる形で変化する可能性があり、株価が大きく変動。

スタートアップやVC: より安価なモデルが増えれば、AIアプリ開発がさらに活性化し、既存のクローズド路線を打破する動きが加速する見込みです。
こうした状況は、単なる「安いコストでの高性能モデル」という一面にとどまらず、世界規模のAI産業構造や国際的な輸出規制、そして消費者の使用環境に大きな影響を与えはじめています。
今後、中国企業の技術的イノベーションがどこまでアメリカ勢に迫るのか、そしてアメリカの政策がどう変わるかが注目されます。
DeepSeekに関してはこちらでも解説しています:
https://agi-labo.com/articles/na86f0609382d
https://agi-labo.com/articles/naa4ce8391345
今週はOpenAIやMicrosoft、Google、そして中国企業のDeepSeekなど、多方面から興味深いトピックが一斉に発表される一週間でした。新モデルのリリースや巨額の投資、そして自動タスク実行エージェントの台頭など、いずれもAI業界の今後を大きく左右しそうな動きばかりです。さらに、各社が進める「AIをどのように社会やビジネスに適用するか」という方向性も、競合他社やスタートアップの動きを刺激しているように感じます。
引き続き、AI分野は急速な進化を遂げていくと予想されます。次回も新たなニュースを厳選してお伝えしますので、ぜひチェックしてみてください。
記事を気に入って頂けたら、いいねでXで共有していただけると励みになります。







