はじめに

2025年8月19日、AIデータ抽出の分野に大きなニュースが飛び込んできました。Firecrawlが1,450万ドルのシリーズA資金調達を発表し、同時に最新版となるv2 APIをリリースしました。

さらに注目すべきは、FirecrawlチームがオープンソースのAI検索エンジン「Fireplexity」を公開したこと。これは話題のPerplexityのクローンとして開発され、誰でも自由にカスタマイズして利用できる画期的なツールです。

本記事では、これらの最新動向を詳しく解説し、Googleが提供するGemini URL contextとの比較も交えながら、AIリサーチツールの今後の可能性について探っていきます。

そもそもFirecrawlとは?

Webデータ抽出の課題を解決するAI時代のインフラ

Firecrawlは、Webサイトのコンテンツを構造化されたデータやMarkdown形式に変換し、AIアプリケーションで利用可能にするAPIです。

開発元のMendable AI社は、もともとドキュメント向けのAIチャットソリューションを提供していましたが、その開発過程で「クリーンで構造化されたWebデータを取得することの難しさ」という共通の課題に直面しました。

従来、AIエンジニアは以下のような作業を個別に実装する必要がありました。

  • JavaScriptレンダリングへの対応

  • 複雑なHTML構造の解析

  • レート制限への対処

  • 動的コンテンツの取得

  • 複数ページにわたるデータの収集

Firecrawlは、これらの課題を一度に解決する「AIとWebの間の欠けていたレイヤー」として開発されました。

このサイトから実際に試すことができます。

https://www.firecrawl.dev/playground

このように、URLを入れることでサイトをスクレイピングしたり、検索した結果を様々な形式でまとめたりサイトマップを作成したりできます。

出力フォーマットも多くあり、AIに優しいMarkdown形式やJSON形式もサポートされているのが良い点ですね。

急成長中の開発者コミュニティ

Firecrawlの成長は目覚ましく、35万人以上の開発者が利用し、GitHubでは約5万スターを獲得しています。Shopify、Replit、Zapierといった大手企業から、トップクラスのヘッジファンドまで幅広い顧客が採用しており、その信頼性と実用性が証明されています。

Firecrawl v2のアップデート概要

10倍高速化を実現した革新的な技術

v2の最大の特徴は、インテリジェントキャッシングという技術により10倍の高速化を実現したことです。独自開発のFire-Engine技術により、従来のソリューションと比較して33%高速で、40%高い成功率を達成しています。

実際にFireplexityと併用して使ってみた感想としては、早すぎて実際に検索しているのか不安に思ってしまうほどでした。

セマンティック・クローリングの実装

v2では、自然言語でクロール内容を記述できるセマンティック・クローリング機能が追加されました。これにより、開発者は技術的な詳細を気にすることなく、「製品価格を抽出して」「記事の要点をまとめて」といった自然な言葉で指示できるようになりました。

新しいデータフォーマットと機能拡張

v2では以下の新機能が追加されています。

  1. サマリー形式の追加
    ページコンテンツの簡潔な要約を直接受け取れる新しい「summary」フォーマット

  2. ニュースと画像検索
    Web検索に加えて、ニュースと画像のソース検索に対応

  3. 強化されたJSON抽出
    JSON抽出と変更追跡がオブジェクト形式({ type: "json", prompt, schema })を使用するように更新

  4. 改良されたスクリーンショット機能
    フルページキャプチャ、品質設定、ビューポート指定などの詳細なオプション

パフォーマンスの大幅向上

デフォルトで2日間のキャッシュ(maxAge)が有効になり、広告ブロック、TLS検証スキップ、Base64画像の削除などの実用的なデフォルト設定により、開発者はより効率的にデータを取得できるようになりました。


ここまで、Firecrawl v2が持つWebデータ抽出機能について詳しく見てきました。しかし、その真価は実際のアプリケーションに組み込んでこそ発揮されます。

ここからの有料セクションでは、その具体的な実践例として、オープンソースのAI検索エンジン「Fireplexity」を実際に動かしていく方法を紹介します。これにより、AI検索のコア技術を手元で再現し、その仕組みを深く理解することができます。

さらに、競合技術としてGoogleのGemini URL contextとも比較を行い、最新のAIリサーチツールをどう選択し活用すべきか考察していきます。

Fireplexityとは?オープンソース版Perplexityの可能性

5分でデプロイ可能なAI検索エンジン

Fireplexityは、開発者が独自のAI検索体験を構築できるオープンソースのPerplexityクローンです。その最大の特徴は、その導入の手軽さと柔軟性にあります。