Webからナレッジを作成する方法

公式ドキュメントやマニュアル、技術ブログなど、Web上の情報をチャットボットの知識として活用したいと思ったことありませんか？

このセクションでは、FirecrawlというWebクローラーを使って、それを実現する方法を説明します。

1. 準備：Firecrawlの設定

まず、知識を作成するところから始めましょう。

Untitled

ここで重要なのが、FirecrawlのAPI登録です。まだ済んでいない方は、別途案内されている手順でAPI Keyを取得してください。

API Keyをお持ちでない場合：

Untitled

Firecrawlがアクティブになったら、いよいよWebコンテンツの取得です。

読み込みたいURLを入力
オプションの設定
- Crawl sub-pages: サブページも取得するかどうか
- Limit: 取得するページ数の制限
- Max depth: クロール深度の制限
- Exclude/Include paths: 除外/含めるパスの指定
「次へ」ボタンをクリック

Untitled

すると、指定したURLからコンテンツを読み込んできます。取得したページの一覧が表示されるので、必要な項目にチェックを入れましょう。全部取り込みたい場合は「Select All」でOKです。

Untitled

コンテンツを選択したら、次はRAG（Retrieval Augmented Generation）の設定です。