OpenAI Codex vs Claude Code vs Gemini CLI vs Cursor

AIの登場により、エンジニアの開発スタイルは大きな変革期を迎えています。その中心にあるのが、AIと対話しながら開発を進める「バイブコーディング」という新しいアプローチと、それを実現する「コーディングエージェント」です。

OpenAI(Codex), Anthropic(Claude Code), Google(Gemini CLI), Cursor と各社からコーディングエージェントが登場しています。

そこで今回は、上記に挙げたコーディングエージェントを実際に使い比べ、それぞれの特徴や使い勝手を徹底的に比較していきます。

同じプロジェクトを各ツールで実装することで、リアルな違いを明らかにしていきましょう!

コーディングエージェント・バイブコーディングとは?

バイブコーディングって何?

バイブコーディング(Vibe Coding)とは、AIと対話しながら「雰囲気」や「アイデア」を伝えるだけでコードを生成していく新しい開発スタイルです。

従来の開発では、エンジニアが一行一行コードを書いていましたが、バイブコーディングでは

  • 「こんな感じのアプリを作って」と自然言語で指示

  • AIがコードを生成・提案

  • 必要に応じて修正を依頼

  • 短時間で動くアプリが完成

という流れで開発を進めていきます。

なぜ今バイブコーディングが注目されているのか

この記事を読んでいる方は、すでにバイブコーディングに興味をお持ちだと思います。改めて、なぜ今バイブコーディングが注目されているのか整理してみましょう。

  1. 開発速度の劇的な向上 - プロトタイプが短い時間で作れる

  2. アイデアを即座に実現 - 思いついたらすぐ形にできる

  3. 学習コストの低下 - プログラミング初心者でも高度なアプリが作れる
    →といっても実際に手を動かしながらAIに技術解説をしてもらい、学習を進めることをお勧めします。

  4. 創造的な時間の増加 - 実装の詳細よりもアイデアに集中できる
    →良いアイデアだと確信できれば、それを基により高度なアプリケーションとして、あるいはより多くの人に届けるために、エンジニアに引き継ぐこともできます。

今回の比較プロジェクト

テーマ:マークダウンメモアプリ

今回は定番のTodoアプリなんてものは作りません。定番のアプリをAIに作らせても出来るのは分かりきっているので、最近話題のObsidianのようなマークダウンエディタを作ってもらいましょう。

各ツールの実力を公平に比較するため、同じ仕様のアプリを実装してもらいます。

実装要件

技術スタック:React + Tailwind CSS
- マークダウンエディタ(リアルタイムプレビュー)
- メモの作成・編集・削除
- タグ機能でメモを分類
- 検索機能(タイトル・内容・タグ)
- ダークモード対応
- ローカルストレージ保存
- HTML/PDFエクスポート機能

※ 今回はフロントエンド(画面回り)のみの実装が前提です

前提として、各AIに伝えるのは上記の簡潔な実装要件のみとし、質問をされた場合は「お任せ」とだけ回答します。

今回はあえて最低限の情報のみを伝え、プロジェクトの背景などをプロンプトに含めませんでした。この条件で、各エージェントがどこまで実装してくれるか見ていきましょう。

それでは、各ツールでの実装過程と成果物を見ていきましょう!

OpenAI Codex

それでは、まずCodexから開始していきましょう。
使い方などの解説はこちらの記事で行っています。

https://agi-labo.com/articles/nf7a356a356f9

リリースから2か月近くたっていますが、性能はいかほどでしょうか。

最初の第一歩

Reactですらなく、index.htmlを出してきました。
開いてみても何も表示されないです…

何往復か試してみましたが、動くものは出てこなかったので後ほどアプローチを変えて性能を見てみようと思います。

OpenAI Codexの結果

用意されているリモートの環境にもかかわらず、工程の大半をコマンドの実行ミスへの対処に追われているのが目立ち、特に今回のような0→1のプロジェクトは適していないかつ想定されていない使い方のように感じます。

実際に、ほかのコーディングエージェントとは違うプロジェクトの探索の仕方をしているようには見えました。(コマンドのミスは目立ちますが)

念のため最後に、ほかのコーディングエージェントが作ったプロジェクトでCodexが想定しているとされる既存プロジェクトの明確な機能追加のみを試してみるのでお楽しみに。