2025年3月12日、OpenAIはXでの告知から約2時間後、日本時間の深夜にデベロッパー向けのライブ発表を実施しました。

今回のアップデートは、ChatGPTや既存APIに新機能を加え、より自由度の高いエージェント開発を可能にするとしています。ライブでは、新APIや新ツールの概要が解説されました。

Responses API

OpenAIは、従来のChat Completions APIやAssistants APIを拡張する新しい仕組みを発表しました。主なポイントは、APIを一本化した「Responses API」と、複数のエージェントを扱うための「Agents SDK」です。

さらに、エージェントが活用できる3つの新ツール(Web Search、File Search、Computer Use)も新たに発表されています。

Responses APIのポイント

Responses APIは、Chat CompletionsとAssistantsの機能を包括した形で設計されており、必要に応じて画像入力やツール呼び出しを行い、1回のリクエストで複数ステップを実行できます。

3つの新ツール

1. Web Search
モデルがインターネット上の情報にアクセスし、最新データを含む応答を生成できます。

Web Searchの例:

from openai import OpenAI
client = OpenAI()

response = client.responses.create(
    model="gpt-4o",
    tools=[{"type": "web_search_preview"}],
    input="What was a positive news story from today?"
)

print(response.output_text)

2. File Search
アップロードしたドキュメントや埋め込みベクトルストアを検索し、必要な内容だけを抽出します。メタデータフィルタリングや直接検索エンドポイントを利用し、FAQやマニュアルなどの検索に活用できます。

File Searchの例:

from openai import OpenAI
client = OpenAI()

response = client.responses.create(
    model="gpt-4o-mini",
    input="What is deep research by OpenAI?",
    tools=[{
        "type": "file_search",
        "vector_store_ids": ["<vector_store_id>"]
    }]
)
print(response)

3. Computer Use
Operatorの仕組みをAPI化したもので、ブラウザ操作やPCのGUI操作を自動化します。実行環境の画面を取得しながら、モデルが実行コマンドを送る形です。現時点、プレビュー段階のためtier3-5に達しているユーザーのみが利用できます。

Computer Useを使ったサンプルアプリ:

https://github.com/openai/openai-cua-sample-app


Agents SDKの正式公開

OpenAIは、従来の「Swarm」を正式版として拡張し、「Agents SDK」という名称で公開しました。

複数のエージェントを組み合わせて運用し、必要に応じてエージェントを切り替える“ハンドオフ”が可能です。

ハンドオフの例:

from agents import Agent, Runner
import asyncio

spanish_agent = Agent(
    name="スペイン語エージェント",
    instructions="あなたはスペイン語だけを話します。",
)

english_agent = Agent(
    name="英語エージェント",
    instructions="あなたは英語だけを話します。",
)

triage_agent = Agent(
    name="トリアージエージェント",
    instructions="リクエストの言語に応じて適切なエージェントに引き継ぎます。",
    handoffs=[spanish_agent, english_agent],
)


async def main():
    result = await Runner.run(triage_agent, input="Hola, ¿cómo estás?")
    print(result.final_output)
    # ¡Hola! Estoy bien, gracias por preguntar. ¿Y tú, cómo estás?


if __name__ == "__main__":
    asyncio.run(main())

ガードレール機能やトレーシング機能が標準搭載され、エージェントの挙動を可視化しながら運用できます。Pythonでの利用に対応し、今後JavaScript版も提供される見通しです。

https://github.com/openai/openai-agents-python

今後のAPIロードマップと価格体系

Chat Completions APIは従来どおりサポートされますが、Responses APIでのみ使える機能も増えています。
Assistants APIは2026年に提供終了が予定されており、早めにResponses APIへの移行を検討する必要がありそうです。

新ツールの利用料金は以下のとおりです。

  • Web Search:1,000クエリあたり30ドル~(GPT-4o)/25ドル~(GPT-4o-mini)
    ※ 検索のコンテキストサイズによって変動

  • File Search:1,000クエリあたり2.50ドル、ストレージは1GBあたり1日0.10ドル(1GBまでは無料)

  • Computer Use:入力トークン100万あたり3ドル、出力トークン100万あたり12ドル

ライブデモでの事例

ライブ発表では、複数ツールとResponses APIを組み合わせたエージェントの実装例が紹介されました。個人向けのスタイリング支援エージェントでは、File Searchでユーザー情報を参照しながらWeb Searchで周辺店舗を探し、最適なコーディネートを提案。

顧客サポートエージェントの例では、複数の専用エージェントをハンドオフで切り替え、注文情報の確認から返金処理までを自動化していました。

まとめ

今回のアップデートによって、開発者はより柔軟にエージェントを作成できるようになりました。Responses APIが中心となり、Web SearchやFile Search、Computer Useといったツールを組み合わせることで、多段階のタスクや最新情報を取り込んだ高度なワークフローを実装しやすくなります。

Agents SDKを使えば複数エージェントを連携させ、ガードレールやトレーシングで安全に運用できます。既存のAssistants APIは2026年に提供終了となる見通しのため、移行を視野に入れながら今後のプラットフォーム強化を注視するとよさそうです。

公式ドキュメント・参考リンク