今週のAI業界では、中国企業が高性能で低価格なモデルを相次いで発表しており、特にBaiduの「ERNIE X1」は、DeepSeek R1に匹敵する性能を約半分のコストで提供すると発表しました。
一方、OpenAIは、中国製AIモデルの使用禁止を政府に提言。これは中国勢の勢いへの警戒感の高まりを示しています。
Googleも今週、AIモデル「Gemini」や「Gemma」に大規模なアップデートを行い、AIエージェント「Deep Research」の無料提供や、誰でも使えるカスタムAI「Gems」を公開しています。
今回もChatGPT研究所では、先週のAI業界の重要ニュースを厳選し、分かりやすくお伝えしていきます。
記事で紹介した注目ニュースの一部を、研究所メンバーがPodcastでも深掘りしています!
気になる方はこちらからチェックしてみてください👇
https://spotifycreators-web.app.link/e/V9iv6w4uPRb
OpenAI、最新API「Responses API」と新ツールを発表
2025年3月12日、OpenAIはデベロッパー向けライブイベントで、新しい統合API「Responses API」と複数の新ツールを発表しました。Responses APIは従来のChat CompletionsやAssistants APIを一つに統合し、より自由度の高いエージェント開発が可能になります。
あわせて、「Agents SDK」の正式リリースも発表され、今後の開発環境が大きく進化します。

主な特徴とポイント:
Responses APIの登場
Chat CompletionsとAssistants APIを一本化。
1回のリクエストで複数ステップの処理や画像入力、外部ツール呼び出しに対応。
新たな3つのツールが利用可能に
① Web Search:インターネットの最新情報を取得可能。
② File Search:アップロード済みドキュメント内から効率的に情報を抽出。
③ Computer Use:ブラウザ操作やPC上の作業をAIが自動化(限定プレビュー)。

Agents SDKの正式公開
複数エージェントの連携・切替が可能(ハンドオフ機能)。
エージェントの挙動を可視化・制御するガードレールやトレーシング機能を標準装備。
Assistants APIの終了予定
Assistants APIは2026年に終了予定。Responses APIへの早期移行を推奨。
このアップデートにより、エージェントの高度化やマルチエージェント連携がより手軽になり、企業や開発者の活用幅が大きく広がりそうです。一方で、料金体系やAPIの変更に伴い、ユーザーは今後のプラットフォーム移行戦略を検討する必要があるでしょう。
発表についてはこちらで詳しく解説しています:
https://agi-labo.com/articles/n0977ac4d6281
https://agi-labo.com/articles/n93babbe7d066
Google、Gemini 2.0 Flash Experimentalに「画像生成」「YouTube動画解析」機能を追加
2025年3月12日、Googleは最新のAIモデル「Gemini 2.0 Flash Experimental」に画像生成とYouTube動画解析の新機能を追加しました。テキスト生成に加えて、画像や動画を使ったマルチモーダルな情報処理が可能になり、開発者が簡単に高度なアプリケーションを作れる環境が整いました。

主な特徴とポイント:
画像生成機能を公開プレビュー
Gemini API経由でテキストから画像を生成可能に。
自動で電子透かし「SynthID」を付与し、AI生成画像を識別可能に。

YouTube動画のURL解析対応
モデルにYouTubeのURLを渡すだけで、動画内容の要約や質問への回答が可能。
公開設定の動画のみ対応、長い動画は解析に時間がかかることも。

コンテキスト処理能力の拡張
長文や複数画像・動画の同時解析がより効率的に。
従来モデルより扱えるトークン数(Context Window)が大幅に拡大。
Gemini 1.xモデルのサポート終了
Gemini 1.x系(例: Gemini 1.0 Pro)は終了予定で、Gemini 2.0系への移行が必要。
今回のアップデートで、Gemini APIを活用した開発の幅は大きく広がります。テキストだけでなく画像や動画を組み合わせたサービスやアプリケーションが増えると見込まれ、GoogleのAIエコシステムがさらに拡大しそうです。
Gemini 2.0 Flash Experimentalのアップデートはこちらで詳しく解説しています:
https://agi-labo.com/articles/n6e63dda8458e
Google、Geminiアプリを大幅アップデート──「Deep Research」の無料化、カスタムAI「Gems」公開も開始
2025年3月13日、GoogleはGeminiアプリを大きくアップデートしました。目玉機能として、強化された高性能リサーチツール「Deep Research」が誰でも無料で試せるようになったほか、自分専用のカスタムAI「Gems」が一般公開されました。

主な特徴とポイント:
リサーチ機能「Deep Research」を強化・無料化
最新の「2.0 Flash Thinking Experimental」と統合し、調査・分析からレポート作成まで高度化。
毎月数回、世界中どのユーザーでも無料で試せる(45言語以上に対応)。

自分専用AI「Gems」が誰でも利用可能に
ユーザーが自分専用のAIアシスタント(翻訳、料理計画、数学コーチなど)を簡単に作成可能。
ファイルをアップロードしてより細かなカスタマイズも可能。
パーソナライズ機能でユーザーに最適化
Google検索履歴をもとに個人に合わせた回答を生成(食の好み、旅行先の提案など)。
データ連携はユーザー自身が自由にコントロール可能。

主要Googleアプリとの連携が拡大
Calendar、Notes、Tasks、Photosなど複数のGoogleアプリとの連携が可能に。
例えば「YouTubeでレシピ検索→買い物リスト作成→近所のスーパー検索」まで1回の指示で完結。
今回のアップデートでは、特に無料公開された「Deep Research」は、個人やビジネスのリサーチ効率を大きく改善する可能性があり、今後のユーザー数拡大や新規ユーザーの獲得にも注目です。
Baidu、新たなマルチモーダルAI「ERNIE 4.5」と「ERNIE X1」を発表
2025年3月、Baiduが新たなマルチモーダルAIモデル「ERNIE 4.5」と「ERNIE X1」を発表しました。ERNIE X1は高度な推論能力を持つ新モデルで、中国の競合モデルDeepSeek R1に匹敵する性能を約半分のコストで実現。ERNIE 4.5は最新の基盤モデルとして、理解力・生成能力・論理的推論力が大幅に向上しています。

主な特徴とポイント:
ERNIE X1の高コスパ性能
DeepSeek R1と同レベルの高い推論能力を、約半分の価格で提供。
「ERNIE 4.5」でマルチモーダル対応強化
理解・生成・推論・記憶能力が総合的に向上。
ハルシネーション抑制や論理的推論、コード生成精度を改善。
利用可能時期
Baidu AI Cloudのプラットフォーム「Qianfan」から、API経由で利用可能に。
ERNIE X1は近日公開予定、ERNIE 4.5は既に公開済で yiyan.baidu.com からアカウントを作成することで無料で利用できます。

今回の発表により、Baiduは中国国内のみならずグローバル市場でも競争力を高めることになりそうです。特に高性能で低価格なERNIE X1が市場を動かす可能性があり、今後のAI開発競争への影響が注目されます。








