【週刊AI】中国Baidu、コスパ最強モデルで米国勢に対抗 × Geminiに大型新機能 | #7 2025年3月10日~3月16日

今週のAI業界では、中国企業が高性能で低価格なモデルを相次いで発表しており、特にBaiduの「ERNIE X1」は、DeepSeek R1に匹敵する性能を約半分のコストで提供すると発表しました。

一方、OpenAIは、中国製AIモデルの使用禁止を政府に提言。これは中国勢の勢いへの警戒感の高まりを示しています。

Googleも今週、AIモデル「Gemini」や「Gemma」に大規模なアップデートを行い、AIエージェント「Deep Research」の無料提供や、誰でも使えるカスタムAI「Gems」を公開しています。

今回もChatGPT研究所では、先週のAI業界の重要ニュースを厳選し、分かりやすくお伝えしていきます。

記事で紹介した注目ニュースの一部を、研究所メンバーがPodcastでも深掘りしています！
気になる方はこちらからチェックしてみてください👇

https://spotifycreators-web.app.link/e/V9iv6w4uPRb

OpenAI、最新API「Responses API」と新ツールを発表

2025年3月12日、OpenAIはデベロッパー向けライブイベントで、新しい統合API「Responses API」と複数の新ツールを発表しました。Responses APIは従来のChat CompletionsやAssistants APIを一つに統合し、より自由度の高いエージェント開発が可能になります。

あわせて、「Agents SDK」の正式リリースも発表され、今後の開発環境が大きく進化します。

主な特徴とポイント:

Responses APIの登場
- Chat CompletionsとAssistants APIを一本化。
- 1回のリクエストで複数ステップの処理や画像入力、外部ツール呼び出しに対応。
新たな3つのツールが利用可能に
① Web Search：インターネットの最新情報を取得可能。
② File Search：アップロード済みドキュメント内から効率的に情報を抽出。
③ Computer Use：ブラウザ操作やPC上の作業をAIが自動化（限定プレビュー）。

Agents SDKの正式公開
- 複数エージェントの連携・切替が可能（ハンドオフ機能）。
- エージェントの挙動を可視化・制御するガードレールやトレーシング機能を標準装備。
Assistants APIの終了予定
- Assistants APIは2026年に終了予定。Responses APIへの早期移行を推奨。

このアップデートにより、エージェントの高度化やマルチエージェント連携がより手軽になり、企業や開発者の活用幅が大きく広がりそうです。一方で、料金体系やAPIの変更に伴い、ユーザーは今後のプラットフォーム移行戦略を検討する必要があるでしょう。

発表についてはこちらで詳しく解説しています：

https://agi-labo.com/articles/n0977ac4d6281

https://agi-labo.com/articles/n93babbe7d066

Google、Gemini 2.0 Flash Experimentalに「画像生成」「YouTube動画解析」機能を追加

2025年3月12日、Googleは最新のAIモデル「Gemini 2.0 Flash Experimental」に画像生成とYouTube動画解析の新機能を追加しました。テキスト生成に加えて、画像や動画を使ったマルチモーダルな情報処理が可能になり、開発者が簡単に高度なアプリケーションを作れる環境が整いました。

主な特徴とポイント:

画像生成機能を公開プレビュー
- Gemini API経由でテキストから画像を生成可能に。
- 自動で電子透かし「SynthID」を付与し、AI生成画像を識別可能に。

YouTube動画のURL解析対応
- モデルにYouTubeのURLを渡すだけで、動画内容の要約や質問への回答が可能。
- 公開設定の動画のみ対応、長い動画は解析に時間がかかることも。

コンテキスト処理能力の拡張
- 長文や複数画像・動画の同時解析がより効率的に。
- 従来モデルより扱えるトークン数（Context Window）が大幅に拡大。
Gemini 1.xモデルのサポート終了
- Gemini 1.x系（例: Gemini 1.0 Pro）は終了予定で、Gemini 2.0系への移行が必要。

今回のアップデートで、Gemini APIを活用した開発の幅は大きく広がります。テキストだけでなく画像や動画を組み合わせたサービスやアプリケーションが増えると見込まれ、GoogleのAIエコシステムがさらに拡大しそうです。

Gemini 2.0 Flash Experimentalのアップデートはこちらで詳しく解説しています：

https://agi-labo.com/articles/n6e63dda8458e

Google、Geminiアプリを大幅アップデート──「Deep Research」の無料化、カスタムAI「Gems」公開も開始

2025年3月13日、GoogleはGeminiアプリを大きくアップデートしました。目玉機能として、強化された高性能リサーチツール「Deep Research」が誰でも無料で試せるようになったほか、自分専用のカスタムAI「Gems」が一般公開されました。

主な特徴とポイント:

リサーチ機能「Deep Research」を強化・無料化
- 最新の「2.0 Flash Thinking Experimental」と統合し、調査・分析からレポート作成まで高度化。
- 毎月数回、世界中どのユーザーでも無料で試せる（45言語以上に対応）。

自分専用AI「Gems」が誰でも利用可能に
- ユーザーが自分専用のAIアシスタント（翻訳、料理計画、数学コーチなど）を簡単に作成可能。
- ファイルをアップロードしてより細かなカスタマイズも可能。
パーソナライズ機能でユーザーに最適化
- Google検索履歴をもとに個人に合わせた回答を生成（食の好み、旅行先の提案など）。
- データ連携はユーザー自身が自由にコントロール可能。

主要Googleアプリとの連携が拡大
- Calendar、Notes、Tasks、Photosなど複数のGoogleアプリとの連携が可能に。
- 例えば「YouTubeでレシピ検索→買い物リスト作成→近所のスーパー検索」まで1回の指示で完結。

今回のアップデートでは、特に無料公開された「Deep Research」は、個人やビジネスのリサーチ効率を大きく改善する可能性があり、今後のユーザー数拡大や新規ユーザーの獲得にも注目です。

Baidu、新たなマルチモーダルAI「ERNIE 4.5」と「ERNIE X1」を発表

2025年3月、Baiduが新たなマルチモーダルAIモデル「ERNIE 4.5」と「ERNIE X1」を発表しました。ERNIE X1は高度な推論能力を持つ新モデルで、中国の競合モデルDeepSeek R1に匹敵する性能を約半分のコストで実現。ERNIE 4.5は最新の基盤モデルとして、理解力・生成能力・論理的推論力が大幅に向上しています。

主な特徴とポイント:

ERNIE X1の高コスパ性能
- DeepSeek R1と同レベルの高い推論能力を、約半分の価格で提供。
「ERNIE 4.5」でマルチモーダル対応強化
- 理解・生成・推論・記憶能力が総合的に向上。
- ハルシネーション抑制や論理的推論、コード生成精度を改善。
利用可能時期
- Baidu AI Cloudのプラットフォーム「Qianfan」から、API経由で利用可能に。
- ERNIE X1は近日公開予定、ERNIE 4.5は既に公開済で yiyan.baidu.com からアカウントを作成することで無料で利用できます。

今回の発表により、Baiduは中国国内のみならずグローバル市場でも競争力を高めることになりそうです。特に高性能で低価格なERNIE X1が市場を動かす可能性があり、今後のAI開発競争への影響が注目されます。

【週刊AI】中国Baidu、コスパ最強モデルで米国勢に対抗 × Geminiに大型新機能 | #7 2025年3月10日~3月16日

OpenAI、最新API「Responses API」と新ツールを発表

Google、Gemini 2.0 Flash Experimentalに「画像生成」「YouTube動画解析」機能を追加

Google、Geminiアプリを大幅アップデート──「Deep Research」の無料化、カスタムAI「Gems」公開も開始

Baidu、新たなマルチモーダルAI「ERNIE 4.5」と「ERNIE X1」を発表

Related Articles

【週刊AI】Anthropic未公開モデルMythos流出で"step change"確認、Sora終了でDisney 10億ドル白紙、Gemini 3.1 Flash Liveが音声AI基盤に | #60

【週刊AI】ChatGPTで愛犬の癌50〜75%縮小、Gemini Embedding 2が5モダリティ統合で業界初、Anthropic国防総省を提訴 | #58

【週刊AI】AI自律稼働が14.5時間に到達、Gemini 3.1 Pro推論77%超、GPT-5.2が物理学で新発見 | #55

【週刊AI】Gemini「広告なし」宣言、Anthropic憲法公開、OpenAI中東で500億ドル調達協議 | #51 2026年1月19日〜1月25日

【週刊AI】AppleがSiri刷新にGemini採用、OpenAIはChatGPTに広告導入へ | #50 2026年1月12日〜1月18日

【週刊AI】Google「Gemini 3 Flash」を公開。OpenAI「GPT-5.2」とNVIDIAのオープンモデル| #47 2025年12月15日〜12月21日

Related Articles

【週刊AI】Anthropic未公開モデルMythos流出で"step change"確認、Sora終了でDisney 10億ドル白紙、Gemini 3.1 Flash Liveが音声AI基盤に | #60
2026-03-29

【週刊AI】ChatGPTで愛犬の癌50〜75%縮小、Gemini Embedding 2が5モダリティ統合で業界初、Anthropic国防総省を提訴 | #58
2026-03-15

【週刊AI】AI自律稼働が14.5時間に到達、Gemini 3.1 Pro推論77%超、GPT-5.2が物理学で新発見 | #55
2026-02-22

【週刊AI】Gemini「広告なし」宣言、Anthropic憲法公開、OpenAI中東で500億ドル調達協議 | #51 2026年1月19日〜1月25日
2026-01-25

【週刊AI】AppleがSiri刷新にGemini採用、OpenAIはChatGPTに広告導入へ | #50 2026年1月12日〜1月18日
2026-01-18

【週刊AI】Google「Gemini 3 Flash」を公開。OpenAI「GPT-5.2」とNVIDIAのオープンモデル| #47 2025年12月15日〜12月21日
2025-12-21

【週刊AI】 中国Baidu、コスパ最強モデルで米国勢に対抗 × Geminiに大型新機能 | #7 2025年3月10日~3月16日

OpenAI、最新API「Responses API」と新ツールを発表

Google、Gemini 2.0 Flash Experimentalに「画像生成」「YouTube動画解析」機能を追加

Google、Geminiアプリを大幅アップデート──「Deep Research」の無料化、カスタムAI「Gems」公開も開始

Baidu、新たなマルチモーダルAI「ERNIE 4.5」と「ERNIE X1」を発表

Related Articles

【週刊AI】Anthropic未公開モデルMythos流出で"step change"確認、Sora終了でDisney 10億ドル白紙、Gemini 3.1 Flash Liveが音声AI基盤に | #60

【週刊AI】ChatGPTで愛犬の癌50〜75%縮小、Gemini Embedding 2が5モダリティ統合で業界初、Anthropic国防総省を提訴 | #58

【週刊AI】AI自律稼働が14.5時間に到達、Gemini 3.1 Pro推論77%超、GPT-5.2が物理学で新発見 | #55

【週刊AI】Gemini「広告なし」宣言、Anthropic憲法公開、OpenAI中東で500億ドル調達協議 | #51 2026年1月19日〜1月25日

【週刊AI】AppleがSiri刷新にGemini採用、OpenAIはChatGPTに広告導入へ | #50 2026年1月12日〜1月18日

【週刊AI】Google「Gemini 3 Flash」を公開。OpenAI「GPT-5.2」とNVIDIAのオープンモデル| #47 2025年12月15日〜12月21日

【週刊AI】中国Baidu、コスパ最強モデルで米国勢に対抗 × Geminiに大型新機能 | #7 2025年3月10日~3月16日