RAGFlow
用 TokenMix 的 LLM 与 Embedding 模型搭建知识库问答。
准备 TokenMix 信息
RAGFlow 一般需要两类模型:
- Chat 模型 ID: 用来生成回答。
- Embedding 模型 ID: 用来解析文档和检索。
- API Key: TokenMix API Key。
- Base URL: https://api.tokenmix.ai/v1。
方式一:登录后在页面配置
- 启动 RAGFlow 并登录。
- 打开 Model providers。
- 选择 OpenAI-API-Compatible。
- Base URL 填 https://api.tokenmix.ai/v1。
- API Key 填 TokenMix Key。
- Model 填 TokenMix chat 模型 ID。
- 再添加 embedding 模型,模型 ID 填 TokenMix embedding 模型。
方式二:启动前配置默认模型
如果你希望新用户登录后默认看到 TokenMix 模型,可以在 Docker 配置里的 service_conf.yaml.template 找到 user_default_llm:
user_default_llm:
factory: "OpenAI-API-Compatible"
api_key: "<your-tokenmix-key>"
base_url: "https://api.tokenmix.ai/v1"
改完后重启 RAGFlow。
建知识库测试
- 新建 dataset。
- 选择 TokenMix embedding 模型和 chunk template。
- 先上传一个小 PDF 或 Markdown。
- 等解析完成后创建 Chat Assistant。
- 测试:
Summarize the uploaded document in five bullet points.
RAGFlow 官方快速开始提醒:一个 dataset 解析文件后,embedding 模型不应随意更换,因为已解析内容需要保持同一向量空间。新手先用小文档测试,确认模型选对后再批量上传。
常见问题
- 文件一直 parsing: 先检查 embedding 模型和 API Key。
- 能聊天但不能查文档: Chat 模型通了,但 embedding 没通或 dataset 没解析完成。
- 404/model not found: Chat 或 embedding 模型 ID 写错。
- 检索效果差: 换 chunk template,或重新建 dataset 后换 embedding 模型。
实用建议
RAGFlow 教程需要比普通聊天工具更详细,因为它涉及 Chat 模型、Embedding 模型、Dataset、Chunk Template 和解析状态。用户最容易误以为“聊天模型通了,知识库就一定通了”,但 RAGFlow 需要 embedding 也配置正确。
推荐的小白流程
- 先只配置 Chat 模型,发一条普通问题确认能回答。
- 再配置 Embedding 模型,不要把 Chat 模型填进 embedding。
- 新建一个测试 Dataset,只上传 1 个小文件。
- 等文件状态变成解析完成,再创建 Chat Assistant。
- 让 assistant 回答文档里的具体问题,而不是问泛泛问题。
选择模型的建议
- Chat 模型: 选一个指令理解能力好的 TokenMix 文本模型。
- Embedding 模型: 选 TokenMix embedding 模型,维度和模型说明保持一致。
- 大文档场景: 先用小文件测试,再批量导入。
- 多语言文档: 选支持目标语言语义检索的 embedding 模型。
重新配置 embedding 的注意事项
RAGFlow 官方 quickstart 提醒:Dataset 已经解析文件后,不建议随意切换 embedding 模型。要换模型时,新手更稳妥的做法是新建 Dataset,重新上传文件。