RAGFlow
TokenMix の LLM と Embedding モデルでナレッジ Q&A を構築します。
必要情報
- Chat Model ID: 回答生成用
- Embedding Model ID: 文書検索用
- API Key: TokenMix Key
- Base URL:
https://api.tokenmix.ai/v1
設定手順
- モデルプロバイダー設定で OpenAI / OpenAI-compatible を追加します。
- LLM の Base URL と API Key を TokenMix にします。
- Chat モデル ID を入力して保存します。
- Embedding provider も同じ Base URL と Key にします。
- Embedding モデル ID を入力します。
- 小さな PDF または Markdown を 1 つだけアップロードしてテストします。
テスト:
Summarize the uploaded document in five bullet points.
文書処理が止まる場合は embedding 設定を最初に確認してください。
設定時の注意
RAGFlow は通常のチャットツールより設定項目が多いです。Chat モデル、Embedding モデル、Dataset、Chunk Template、解析状態を分けて確認します。
初心者向け手順
- まず Chat モデルだけ設定して通常質問を送ります。
- 次に Embedding モデルを設定します。Chat モデルを embedding に入れないでください。
- テスト Dataset を作り、小さなファイルを 1 つだけアップロードします。
- parsing 完了後に Chat Assistant を作成します。
- アップロード文書に基づく具体的な質問をします。
モデル選択
- Chat: 指示追従が得意な TokenMix テキストモデル。
- Embedding: TokenMix embedding モデル。
- 大きな文書: 小さなファイルで先に検証。
- 多言語文書: 対象言語に合う embedding を選びます。
Dataset 解析後に embedding モデルを変えるのは避け、新しい Dataset を作り直す方が安全です。
実用メモ
RAGFlow は「モデルを設定して終わり」ではありません。Chat モデル、Embedding モデル、Dataset、Chunk Template、Parsing 状態の 5 つを順番に確認します。
初心者向けの確認リスト:
- Model providers で OpenAI-API-Compatible を追加します。
- Chat モデルで通常の質問が返るか確認します。
- Embedding モデルを別途追加します。
- Dataset を新規作成し、小さなファイルを 1 つだけアップロードします。
- Parsing が完了したことを確認してから Chat Assistant を作ります。
- 文書に書かれている固有情報を質問します。
Embedding モデルは Dataset 作成後の検索品質に直結します。公式 quickstart が示すように、ファイル解析後に embedding モデルを切り替えるのは避けてください。モデルを変えたい場合は新しい Dataset を作成し直す方が安全です。
小白向けには「まず 1 ファイル、1 Dataset、1 Chat Assistant」で検証すると説明してください。大量 PDF を最初に入れると、失敗時の原因が API、embedding、chunk、ファイル形式のどれか分かりにくくなります。