今号から、週刊AIはAIエージェント特化に生まれ変わります。
最初のエッセイでその理由を書きました。主要ニュースは末尾に短くまとめています。
今週のエッセイ:AIは、確信を持って間違えてくる
18日間の停止を経てFable 5が戻ってきた日の夜更け、時計は午前3時を回っていました。僕は寝る前に、Fableへひとつ頼みごとをしました。
プロンプト:
「実際のデータに基づいた、美しく洗練された、世界文学の探索マップを作ってほしいです。世界地図とタイムラインビューを使って、世界中の著作権が切れた古典作品を発見できるWebサイトにしたいです。
ユーザーは、国・地域・時代・ジャンル・言語などから作品を探すことができ、日本語や英語など、自分の好きな言語で読めるようにしたいです。将来的には僕だけがトークンをまかなわなくていいように全世界の人がこのサイトに寄付したりしてLLMトークンを使って翻訳できると良さそうです。自分の言語で分かりやすく現代語訳で読めるというのが大事だと思います。たとえば、地図上でフランスを選ぶと、フランス文学の古典作品が時代順に表示され、タイムライン上では同じ時代に世界各地でどんな作品が生まれていたのかを比較できるようにします。ジャンルごとに分けるのも重要です。小説、詩、戯曲、哲学、宗教、神話、歴史、政治思想、科学、児童文学などで絞り込めると、ユーザーが自分の関心に沿って古典を探索できます。
データはリアルタイムである必要はありませんが、Project Gutenberg、青空文庫、Internet Archive、Wikisource、国立国会図書館など、実際に参照可能な信頼できるデータソースに基づいて構築してください。
デザインは単なる本の検索サイトではなく、世界史・文学史・思想史を旅しているように感じられる、独創的で美しい体験にしたいです。
最初は数カ国・数ジャンル・代表的な古典作品から始めても構いませんが、将来的には世界中のパブリックドメイン作品を横断的に探索できる、汎用的なプラットフォームを目指したいです。
これは既存プロジェクトの改修ではなく、まったく新しいプロジェクトとしてゼロから構築してください。
僕は世界中の古典・書籍から多くを学んでみたいし良書に出会いたいです。純粋に楽しそうだし美しいアイディアのウェブサイトだとおもうので構築したいです。
朝起きると、MVPが完成していました。僕が行ったやり取りはせいぜい4ターンほどです。最初に出てきたUIがあまり好みではなかったので、紙の地図の画像を1枚アップロードし、「修正してデプロイして」と伝え、最後に「主要なものを翻訳して」と指示しただけです。

『World Lit Atlas』とFableが名付けた世界地図とタイムラインの上から、パブリックドメインになった世界中の古典を選んで、現代語の日本語でそのまま読み始められるサイトです。紀元前の叙事詩から近代文学まで、地図を旅するように良書を探せます。できあがったものを最初に開いたとき、正直「こいつ、すごいな……」という、畏れに近い感覚がありました。速度にも驚いたのですが、それ以上のことがあります。これは数ヶ月前からAGIラボの運営で話してきたアイディアでした。現在執筆中で9月頃に出版予定の書籍とFableの登場がきっかけで制作に取り掛かりましたが、思いついたことは、起きたらもうできている、その世界線に自分が立っていることに、興奮しました。ぜひ world-lit-atlas.pages.dev から触ってみてください。
午前3時に制作が始まり朝9時にはDiscordに共有しました。

この勢いのまま、週の後半には月200ドルのMaxプランを使い切ってしまったほどです。
今週ほど、良いセンスとジャッジメントの必要性を感じた週はありませんでした。Fableに経理サービス(freee)のデータを読ませて事業分析を頼んだところ、緻密で説得力のある分析が返ってきました。
ところが数字に違和感があり、確認すると、人間側が更新していない古いデータを「実データ」として拾っていました。別の日には、ブラウザ操作でアカウントの切り替えに失敗したまま、別アカウントの売上を堂々と報告してきました。これまでのモデルを凌駕する鋭い分析を見れば、その知能の高さは疑いようもありません。だからこそ、間違った前提の上に、ものすごく精巧な計画が立ってしまうとそれを見抜くのは困難です。その計画のミスを見抜き採用するかどうかを最後に決めるジャッジメントは、まだ人間の側にあります。
3年前、AIは嘘をつくものでした。ハルシネーションをどう抑えるかが論点だった。今のAIは嘘をつきません。その代わり、確信を持って間違えてきます。
NotionのGeoffrey Litt氏は「Understanding is the new bottleneck(理解こそが新しいボトルネック)」と名付け、Anthropicのメンバーが書いた「A Field Guide to Fable」は180万インプレッション近くまで読まれ、Simon Willison氏はFableの判断をどこまで信じるかを論じています。
モデルの出力はもう十分に速くて賢い。人間側の理解の速さが、成果の上限になり始めています。まるで、Fableのトークンよりも先に人間のトークンが底をついてしまうような状況です。理解していないものに、良いジャッジメントは下せません。そして冒頭のアトラスの依頼文に「なぜ作りたいか」を1段落添えたのは、何を良しとするかという基準ごと渡すためでした。センスも、これからは渡す側の仕事です。
だから今号から、週刊AIを作り直すことにしました。AIでも書ける網羅的なニュースまとめをやめて、AIエージェントに特化します。僕たちが実際に手を動かして確かめたことと、AGIラボのコミュニティでその週に起きたことを書きていきます。約束はひとつだけ。日曜夜にこれを読むと、月曜からの自分のエージェント環境・使い方が1つ良くなる。それができない号は出しません。
ここから先は有料です。
現在、note の AGIラボ メンバーシップでは、新規加入の受付を一時的に停止しています。
これから参加される方は、新サイト agi-labo.com からお申し込みください。(詳細)
※ 新サイトの詳細はこちらです。(Emailを設定するとnoteラボメンバーも新サイトにログイン可能です)







