RAGFlow

RAGFlow

用 TokenMix 的 LLM 与 Embedding 模型搭建知识库问答。

准备 TokenMix 信息

RAGFlow 一般需要两类模型:

方式一:登录后在页面配置

  1. 启动 RAGFlow 并登录。
  2. 打开 Model providers。
  3. 选择 OpenAI-API-Compatible。
  4. Base URL 填 https://api.tokenmix.ai/v1。
  5. API Key 填 TokenMix Key。
  6. Model 填 TokenMix chat 模型 ID。
  7. 再添加 embedding 模型,模型 ID 填 TokenMix embedding 模型。

方式二:启动前配置默认模型

如果你希望新用户登录后默认看到 TokenMix 模型,可以在 Docker 配置里的 service_conf.yaml.template 找到 user_default_llm:

user_default_llm:
  factory: "OpenAI-API-Compatible"
  api_key: "<your-tokenmix-key>"
  base_url: "https://api.tokenmix.ai/v1"

改完后重启 RAGFlow。

建知识库测试

  1. 新建 dataset。
  2. 选择 TokenMix embedding 模型和 chunk template。
  3. 先上传一个小 PDF 或 Markdown。
  4. 等解析完成后创建 Chat Assistant。
  5. 测试:
Summarize the uploaded document in five bullet points.

RAGFlow 官方快速开始提醒:一个 dataset 解析文件后,embedding 模型不应随意更换,因为已解析内容需要保持同一向量空间。新手先用小文档测试,确认模型选对后再批量上传。

常见问题

实用建议

RAGFlow 教程需要比普通聊天工具更详细,因为它涉及 Chat 模型、Embedding 模型、Dataset、Chunk Template 和解析状态。用户最容易误以为“聊天模型通了,知识库就一定通了”,但 RAGFlow 需要 embedding 也配置正确。

推荐的小白流程

  1. 先只配置 Chat 模型,发一条普通问题确认能回答。
  2. 再配置 Embedding 模型,不要把 Chat 模型填进 embedding。
  3. 新建一个测试 Dataset,只上传 1 个小文件。
  4. 等文件状态变成解析完成,再创建 Chat Assistant。
  5. 让 assistant 回答文档里的具体问题,而不是问泛泛问题。

选择模型的建议

重新配置 embedding 的注意事项

RAGFlow 官方 quickstart 提醒:Dataset 已经解析文件后,不建议随意切换 embedding 模型。要换模型时,新手更稳妥的做法是新建 Dataset,重新上传文件。