RAGFlow

TokenMix の LLM と Embedding モデルでナレッジ Q&A を構築します。

必要情報

Chat Model ID: 回答生成用
Embedding Model ID: 文書検索用
API Key: TokenMix Key
Base URL: https://api.tokenmix.ai/v1

設定手順

モデルプロバイダー設定で OpenAI / OpenAI-compatible を追加します。
LLM の Base URL と API Key を TokenMix にします。
Chat モデル ID を入力して保存します。
Embedding provider も同じ Base URL と Key にします。
Embedding モデル ID を入力します。
小さな PDF または Markdown を 1 つだけアップロードしてテストします。

テスト:

Summarize the uploaded document in five bullet points.

文書処理が止まる場合は embedding 設定を最初に確認してください。

設定時の注意

RAGFlow は通常のチャットツールより設定項目が多いです。Chat モデル、Embedding モデル、Dataset、Chunk Template、解析状態を分けて確認します。

初心者向け手順

まず Chat モデルだけ設定して通常質問を送ります。
次に Embedding モデルを設定します。Chat モデルを embedding に入れないでください。
テスト Dataset を作り、小さなファイルを 1 つだけアップロードします。
parsing 完了後に Chat Assistant を作成します。
アップロード文書に基づく具体的な質問をします。

モデル選択

Chat: 指示追従が得意な TokenMix テキストモデル。
Embedding: TokenMix embedding モデル。
大きな文書: 小さなファイルで先に検証。
多言語文書: 対象言語に合う embedding を選びます。

Dataset 解析後に embedding モデルを変えるのは避け、新しい Dataset を作り直す方が安全です。

実用メモ

RAGFlow は「モデルを設定して終わり」ではありません。Chat モデル、Embedding モデル、Dataset、Chunk Template、Parsing 状態の 5 つを順番に確認します。

初心者向けの確認リスト:

Model providers で OpenAI-API-Compatible を追加します。
Chat モデルで通常の質問が返るか確認します。
Embedding モデルを別途追加します。
Dataset を新規作成し、小さなファイルを 1 つだけアップロードします。
Parsing が完了したことを確認してから Chat Assistant を作ります。
文書に書かれている固有情報を質問します。

Embedding モデルは Dataset 作成後の検索品質に直結します。公式 quickstart が示すように、ファイル解析後に embedding モデルを切り替えるのは避けてください。モデルを変えたい場合は新しい Dataset を作成し直す方が安全です。

小白向けには「まず 1 ファイル、1 Dataset、1 Chat Assistant」で検証すると説明してください。大量 PDF を最初に入れると、失敗時の原因が API、embedding、chunk、ファイル形式のどれか分かりにくくなります。