RAGFlow

RAGFlow

TokenMix の LLM と Embedding モデルでナレッジ Q&A を構築します。

必要情報

設定手順

  1. モデルプロバイダー設定で OpenAI / OpenAI-compatible を追加します。
  2. LLM の Base URL と API Key を TokenMix にします。
  3. Chat モデル ID を入力して保存します。
  4. Embedding provider も同じ Base URL と Key にします。
  5. Embedding モデル ID を入力します。
  6. 小さな PDF または Markdown を 1 つだけアップロードしてテストします。

テスト:

Summarize the uploaded document in five bullet points.

文書処理が止まる場合は embedding 設定を最初に確認してください。

設定時の注意

RAGFlow は通常のチャットツールより設定項目が多いです。Chat モデル、Embedding モデル、Dataset、Chunk Template、解析状態を分けて確認します。

初心者向け手順

  1. まず Chat モデルだけ設定して通常質問を送ります。
  2. 次に Embedding モデルを設定します。Chat モデルを embedding に入れないでください。
  3. テスト Dataset を作り、小さなファイルを 1 つだけアップロードします。
  4. parsing 完了後に Chat Assistant を作成します。
  5. アップロード文書に基づく具体的な質問をします。

モデル選択

Dataset 解析後に embedding モデルを変えるのは避け、新しい Dataset を作り直す方が安全です。

実用メモ

RAGFlow は「モデルを設定して終わり」ではありません。Chat モデル、Embedding モデル、Dataset、Chunk Template、Parsing 状態の 5 つを順番に確認します。

初心者向けの確認リスト:

  1. Model providers で OpenAI-API-Compatible を追加します。
  2. Chat モデルで通常の質問が返るか確認します。
  3. Embedding モデルを別途追加します。
  4. Dataset を新規作成し、小さなファイルを 1 つだけアップロードします。
  5. Parsing が完了したことを確認してから Chat Assistant を作ります。
  6. 文書に書かれている固有情報を質問します。

Embedding モデルは Dataset 作成後の検索品質に直結します。公式 quickstart が示すように、ファイル解析後に embedding モデルを切り替えるのは避けてください。モデルを変えたい場合は新しい Dataset を作成し直す方が安全です。

小白向けには「まず 1 ファイル、1 Dataset、1 Chat Assistant」で検証すると説明してください。大量 PDF を最初に入れると、失敗時の原因が API、embedding、chunk、ファイル形式のどれか分かりにくくなります。