今週のAI業界では、中国企業が高性能で低価格なモデルを相次いで発表しており、特にBaiduの「ERNIE X1」は、DeepSeek R1に匹敵する性能を約半分のコストで提供すると発表しました。

一方、OpenAIは、中国製AIモデルの使用禁止を政府に提言。これは中国勢の勢いへの警戒感の高まりを示しています。

Googleも今週、AIモデル「Gemini」や「Gemma」に大規模なアップデートを行い、AIエージェント「Deep Research」の無料提供や、誰でも使えるカスタムAI「Gems」を公開しています。

今回もChatGPT研究所では、先週のAI業界の重要ニュースを厳選し、分かりやすくお伝えしていきます。


記事で紹介した注目ニュースの一部を、研究所メンバーがPodcastでも深掘りしています!
気になる方はこちらからチェックしてみてください👇

https://spotifycreators-web.app.link/e/V9iv6w4uPRb

https://youtu.be/BHdWRbl9USU

OpenAI、最新API「Responses API」と新ツールを発表

2025年3月12日、OpenAIはデベロッパー向けライブイベントで、新しい統合API「Responses API」と複数の新ツールを発表しました。Responses APIは従来のChat CompletionsやAssistants APIを一つに統合し、より自由度の高いエージェント開発が可能になります。

あわせて、「Agents SDK」の正式リリースも発表され、今後の開発環境が大きく進化します。

OpenAI

主な特徴とポイント:

  • Responses APIの登場

    • Chat CompletionsとAssistants APIを一本化。

    • 1回のリクエストで複数ステップの処理や画像入力、外部ツール呼び出しに対応。

  • 新たな3つのツールが利用可能に
    Web Search:インターネットの最新情報を取得可能。
    File Search:アップロード済みドキュメント内から効率的に情報を抽出。
    Computer Use:ブラウザ操作やPC上の作業をAIが自動化(限定プレビュー)。

  • Agents SDKの正式公開

    • 複数エージェントの連携・切替が可能(ハンドオフ機能)。

    • エージェントの挙動を可視化・制御するガードレールやトレーシング機能を標準装備。

  • Assistants APIの終了予定

    • Assistants APIは2026年に終了予定。Responses APIへの早期移行を推奨。

このアップデートにより、エージェントの高度化やマルチエージェント連携がより手軽になり、企業や開発者の活用幅が大きく広がりそうです。一方で、料金体系やAPIの変更に伴い、ユーザーは今後のプラットフォーム移行戦略を検討する必要があるでしょう。

発表についてはこちらで詳しく解説しています:

https://agi-labo.com/articles/n0977ac4d6281

https://agi-labo.com/articles/n93babbe7d066


Google、Gemini 2.0 Flash Experimentalに「画像生成」「YouTube動画解析」機能を追加

2025年3月12日、Googleは最新のAIモデル「Gemini 2.0 Flash Experimental」に画像生成とYouTube動画解析の新機能を追加しました。テキスト生成に加えて、画像や動画を使ったマルチモーダルな情報処理が可能になり、開発者が簡単に高度なアプリケーションを作れる環境が整いました。

Gemini

主な特徴とポイント:

  • 画像生成機能を公開プレビュー

    • Gemini API経由でテキストから画像を生成可能に。

    • 自動で電子透かし「SynthID」を付与し、AI生成画像を識別可能に。

Google AI Studio
  • YouTube動画のURL解析対応

    • モデルにYouTubeのURLを渡すだけで、動画内容の要約や質問への回答が可能。

    • 公開設定の動画のみ対応、長い動画は解析に時間がかかることも。

Google AI Studio
  • コンテキスト処理能力の拡張

    • 長文や複数画像・動画の同時解析がより効率的に。

    • 従来モデルより扱えるトークン数(Context Window)が大幅に拡大。

  • Gemini 1.xモデルのサポート終了

    • Gemini 1.x系(例: Gemini 1.0 Pro)は終了予定で、Gemini 2.0系への移行が必要。

今回のアップデートで、Gemini APIを活用した開発の幅は大きく広がります。テキストだけでなく画像や動画を組み合わせたサービスやアプリケーションが増えると見込まれ、GoogleのAIエコシステムがさらに拡大しそうです。

Gemini 2.0 Flash Experimentalのアップデートはこちらで詳しく解説しています:

https://agi-labo.com/articles/n6e63dda8458e



Google、Geminiアプリを大幅アップデート──「Deep Research」の無料化、カスタムAI「Gems」公開も開始

2025年3月13日、GoogleはGeminiアプリを大きくアップデートしました。目玉機能として、強化された高性能リサーチツール「Deep Research」が誰でも無料で試せるようになったほか、自分専用のカスタムAI「Gems」が一般公開されました。

Google

主な特徴とポイント:

  • リサーチ機能「Deep Research」を強化・無料化

    • 最新の「2.0 Flash Thinking Experimental」と統合し、調査・分析からレポート作成まで高度化。

    • 毎月数回、世界中どのユーザーでも無料で試せる(45言語以上に対応)。

Deep Research
  • 自分専用AI「Gems」が誰でも利用可能に

    • ユーザーが自分専用のAIアシスタント(翻訳、料理計画、数学コーチなど)を簡単に作成可能。

    • ファイルをアップロードしてより細かなカスタマイズも可能。

  • パーソナライズ機能でユーザーに最適化

    • Google検索履歴をもとに個人に合わせた回答を生成(食の好み、旅行先の提案など)。

    • データ連携はユーザー自身が自由にコントロール可能。

  • 主要Googleアプリとの連携が拡大

    • Calendar、Notes、Tasks、Photosなど複数のGoogleアプリとの連携が可能に。

    • 例えば「YouTubeでレシピ検索→買い物リスト作成→近所のスーパー検索」まで1回の指示で完結。

今回のアップデートでは、特に無料公開された「Deep Research」は、個人やビジネスのリサーチ効率を大きく改善する可能性があり、今後のユーザー数拡大や新規ユーザーの獲得にも注目です。


Baidu、新たなマルチモーダルAI「ERNIE 4.5」と「ERNIE X1」を発表

2025年3月、Baiduが新たなマルチモーダルAIモデル「ERNIE 4.5」と「ERNIE X1」を発表しました。ERNIE X1は高度な推論能力を持つ新モデルで、中国の競合モデルDeepSeek R1に匹敵する性能を約半分のコストで実現。ERNIE 4.5は最新の基盤モデルとして、理解力・生成能力・論理的推論力が大幅に向上しています。

主な特徴とポイント:

  • ERNIE X1の高コスパ性能

    • DeepSeek R1と同レベルの高い推論能力を、約半分の価格で提供。

  • 「ERNIE 4.5」でマルチモーダル対応強化

    • 理解・生成・推論・記憶能力が総合的に向上。

    • ハルシネーション抑制や論理的推論、コード生成精度を改善。

  • 利用可能時期

    • Baidu AI Cloudのプラットフォーム「Qianfan」から、API経由で利用可能に。

    • ERNIE X1は近日公開予定、ERNIE 4.5は既に公開済で yiyan.baidu.com からアカウントを作成することで無料で利用できます。

Baidu

今回の発表により、Baiduは中国国内のみならずグローバル市場でも競争力を高めることになりそうです。特に高性能で低価格なERNIE X1が市場を動かす可能性があり、今後のAI開発競争への影響が注目されます。