日本時間2025年10月1日、OpenAIが新たなフラッグシップ動画・音声生成モデル「Sora 2」を発表しました。同時に、同モデルを搭載したiOS向けソーシャルアプリ「Sora」も公開。物理シミュレーションの精度向上に加え、自分自身を動画に登場させられる新機能「Cameo」を特徴としています。

本記事では、この「Sora 2」と「Sora」アプリの概要を、公式情報に基づき速報で解説します。

【Sora 2 招待コードリレー企画のお知らせ】

この記事で解説している「Sora 2」ですが、当研究所で運良く招待コードを入手できました。そこで皆様にも体験の機会を広げるべく、コミュニティ内で「招待コードリレー」企画を開始しました。以下のリンクから掲示板にご参加いただき、ぜひ招待リレーにご参加ください。



※ 現在、Sora 2の利用にはVPN接続が必要です。あらかじめご準備ください。

要点:

  • Sora 2発表: 物理法則や音声同期の精度が向上した、OpenAIの新たなフラッグシップ動画・音声生成モデル。

  • 新アプリ「Sora」: Sora 2を搭載したiOS向けソーシャルアプリ。動画の生成・リミックス・共有が可能。

  • 新機能「Cameo」: ユーザー自身や友人を動画内に忠実に再現して登場させられる機能。

  • 安全性と責任: AI生成コンテンツの明示、同意に基づく肖像利用、未成年者保護など、安全性を重視した設計。

  • 提供方法: iOSアプリは招待制で米国・カナダから提供開始。各ユーザーに4つの招待コードを配布。

Sora 2とは? 「動画におけるGPT-3.5モーメント」

Sora 2は、2024年2月発表の旧Soraモデルに続く、OpenAIの最新動画・音声生成モデルです。OpenAIが「動画におけるGPT-3.5モーメント」と表現するほどの進化を遂げました。

進化した性能

  • 物理シミュレーション: 物体の変形やワープが減り、より現実に即した物理演算を実現。従来の動画生成モデルが苦手としてきた体操の複雑な動きなども、Sora 2は正確に表現します。

https://twitter.com/OpenAI/status/1973143639200243959

  • リアリズムと操作性: より写実的で、複数ショットにまたがる複雑な指示にも対応。映画やアニメ調のスタイルも得意としています。

https://twitter.com/OpenAI/status/1973143647945375842

  • 音声同期: シーンに合わせた環境音、効果音、複数話者によるセリフなどを動画と同時に生成。リップシンクも自然です。

https://twitter.com/ctgptlb/status/1973088029939212380

  • 多言語対応の強化: 特に日本語の音声生成とリップシンクが非常に自然であることも大きな特徴です。流暢な日本語を話す人物の動画が公開されています。

https://twitter.com/ctgptlb/status/1973088017725452568

https://twitter.com/ctgptlb/status/1973088033915216304


提供プラットフォーム

Sora 2は、以下の3つの形で提供される予定です。

  • 新しいiOSアプリ「Sora」

  • Webサイト:sora.com

  • API(数週間以内に提供予定)

提供時期

提供は2025年9月30日から、まずは米国とカナダで招待制にて開始。しかし、日本からのアクセスは現時点ではまだできません(記事執筆時点)。

利用するには招待コードが必須ですが、このコードはOpenAIの社員などがXでランダムに配布している模様で、入手は非常に困難です。招待コードを得てアクセスできたユーザーは、新たに4人の友人を招待するためのコードを受け取れる仕組みです。

なお、筆者もまだ招待コードを入手できておらず、Soraアプリを試せていません。VPNなどを利用すればアクセスできる可能性はありますが、公式の日本展開が待たれるところです。

料金

料金については、Sora 2は当面の間、無料で利用できるとのこと。ただし、計算資源の制約に応じて制限が設けられる可能性があります。さらに、ChatGPT Proユーザー向けには、より高品質な「Sora 2 Pro」モデルがsora.com(将来的にはSoraアプリ内でも)で提供される予定です。


新アプリ「Sora」の登場

今回の発表では、Sora 2を搭載したiOS向けソーシャルアプリ「Sora」も登場。単なるツールではなく、「創造し、リミックスし、発見する」という一連の体験を提供するプラットフォームです。
※07:00時点では、日本からはアクセスできませんでした。

https://apps.apple.com/us/app/sora-by-openai/id6744034028

主な機能:

  • テキストからの動画生成、他のユーザーの作品を元に新たな動画を創作する「リミックス機能」

  • 自分や友人を動画に登場させる「Cameo機能」、

  • そしてパーソナライズされたフィードで他の作品を発見するフィード機能

提供方法と展開:
まずはアメリカとカナダで招待制にて開始。友人と一緒に体験することを重視しており、招待されたユーザーは新たに4人の友人を招待するためのコードを受け取ります。

Android版も現在、開発中とのこと。

新機能「Cameo」で誰もが動画の主役に

Sora 2とSoraアプリの大きな特徴が「Cameo」機能です。
ユーザーが自分自身や友人、さらにはペットやモノまで、Soraが生成したあらゆる動画シーンに忠実に登場させることができます。

https://twitter.com/ctgptlb/status/1973092209894568234

  • 仕組み: 1回限りの短い動画と音声の記録を行うだけで、本人のアピアランスと声を再現したデジタルな「Cameo」が作成されます。

以下の動画 7:50~あたりからCameoの実際の操作画面がみれます。

https://www.youtube.com/live/gzneGhpXwjU?si=2Mv5S_uvV5mMfz0F&t=470

  • ユーザーによる完全なコントロール: OpenAIはこの機能における個人の肖像権管理を重視し、Cameoを「自分のみ」「承認した人のみ」など、誰が使えるかをユーザー自身が細かく設定できます。また、自分のCameoが使われた動画はいつでも閲覧・削除でき、ユーザーは自身のアイデンティティの所有者として扱われます。

  • 新しいコミュニケーション: OpenAIはこれを、テキストや絵文字の次にくる「新しいコミュニケーションの形」と位置づけ、友人との繋がりを深める新たな手段となることを目指しています。

物理世界で機能する汎用的なシミュレーションとAIシステムへ向かう道のりの中で、私たちが開発しているモデルは、その過程でも人々に大きな楽しさを届けられると考えています。

Soraチームでは数か月前から「自分をアップロードする」機能で遊び始め、皆で夢中になって楽しんでいました。コミュニケーションが、テキストメッセージから絵文字、ボイスメッセージ、そしてこの形へと、自然に進化してきたように感じられたのです。

公式ブログより

安全性への多角的なアプローチ

Sora 2のリアルさとCameo機能がもたらす新たなリスクを考慮し、OpenAIは多角的な安全対策を講じています。

  • AIコンテンツの明示: 生成された動画には、目に見えるウォーターマークと、業界標準の電子署名であるC2PAメタデータが埋め込まれ、AIによる生成物であることが常に判別可能です。

  • 同意に基づく肖像利用: Cameo機能は、ユーザーが自身の肖像権をエンドツーエンドで管理できるように設計。他人が許可なく個人のCameoを生成することはできません。

  • 有害コンテンツのフィルタリング: プロンプトと出力(動画フレーム、音声)の両方をスキャンし、性的コンテンツ、暴力的、テロ、自傷行為などを助長する内容をブロックします。

  • 未成年者保護: 10代のユーザー向けに、不適切なコンテンツの制限や連続スクロール時間の制限、保護者によるDM設定管理など、より厳しい保護措置を適用しています。

Soraフィードの哲学

今回の発表に合わせ、OpenAIはフィードの設計思想を解説するドキュメント「The Sora feed philosophy」も公開。単に時間を消費させるのではなく、創造性を刺激することが目的だと強調しています。ドキュメントの冒頭では、その目的が次のように語られています。

Our aim with the Sora feed is simple: help people learn what’s possible, and inspire them to create.
(Soraフィードの目的はシンプルです。人々ができることを学び、創造するきっかけを与えることです。)

  • 創造性の最適化: 受動的な閲覧時間ではなく、ユーザーの創造的な参加を促すようにランキングを設計。

  • ユーザーによるコントロール: 「リラックスしたい」「動物が見たい」など、自然言語でフィードの内容を指示できる「ステアラブル・ランキング」機能を提供。

  • つながりの優先: グローバルなトレンドよりも、友人やフォローしている人との繋がりから生まれるコンテンツを重視。

まとめ

GoogleのVeo 3や中国発モデルの競合モデルも高い技術力を示していますが、OpenAIは単なるモデルの性能競争に留まらない点が印象的です。新機能「Cameo」を核に、ソーシャルアプリとして提供することで、AIを介した自己表現とコミュニケーションの新たな形を提案しています。

公式デモでアニメ調の作例が多用されている点も、グローバルなクリエイティブ市場、特に日本を意識しているようで興味深い点です。

現在、日本からの利用は招待コードが必要で、アクセスは困難な状況です。筆者もまだアクセスできていませんが、招待コードが入手でき次第、より詳細なレビュー記事をお届けする予定です。この新しいプラットフォームが、私たちの創造性に何をもたらすのか、引き続き注目していきたいと思います。

公式の発表