RAGFlow

RAGFlow

Crea preguntas y respuestas con LLM y embeddings de TokenMix.

Datos de TokenMix

RAGFlow normalmente necesita dos modelos:

Configuración en la interfaz

  1. Inicia RAGFlow e inicia sesión.
  2. Abre Model providers.
  3. Elige OpenAI-API-Compatible.
  4. Base URL: https://api.tokenmix.ai/v1.
  5. API Key: TokenMix Key.
  6. Model: ID del modelo chat de TokenMix.
  7. Añade también el modelo embedding de TokenMix.

Configuración antes de iniciar

En service_conf.yaml.template puedes definir user_default_llm:

user_default_llm:
  factory: "OpenAI-API-Compatible"
  api_key: "<your-tokenmix-key>"
  base_url: "https://api.tokenmix.ai/v1"

Reinicia RAGFlow después del cambio.

Probar una base documental

  1. Crea un dataset.
  2. Selecciona el embedding de TokenMix y un chunk template.
  3. Sube solo un PDF o Markdown pequeño.
  4. Espera el parsing y crea un Chat Assistant.
  5. Prueba:
Summarize the uploaded document in five bullet points.

Después de procesar archivos en un dataset, evita cambiar el modelo embedding para mantener el mismo espacio vectorial.

Solución de problemas

Consejos prácticos

RAGFlow tiene más pasos que un chat normal: modelo chat, modelo embedding, dataset, chunk template y estado de parsing deben comprobarse por separado.

Flujo para principiantes

  1. Configura primero solo el modelo chat y haz una pregunta simple.
  2. Configura después embedding; no pongas un modelo chat en ese campo.
  3. Crea un dataset de prueba con un solo archivo pequeño.
  4. Espera a que termine parsing antes de crear Chat Assistant.
  5. Pregunta algo que dependa del documento subido.

Elección de modelos

Después de procesar un dataset, evita cambiar embedding. Es más seguro crear un nuevo dataset.

Notas prácticas

RAGFlow no termina al elegir un modelo. Debes comprobar en orden: modelo chat, modelo embedding, dataset, chunk template y estado de parsing.

Checklist para principiantes:

  1. Añade OpenAI-API-Compatible en Model providers.
  2. Verifica que el modelo chat responde a una pregunta simple.
  3. Añade el modelo embedding por separado.
  4. Crea un dataset y sube un solo archivo pequeño.
  5. Espera a que termine parsing antes de crear Chat Assistant.
  6. Pregunta algo que dependa del contenido del documento.

El modelo embedding afecta directamente la calidad de búsqueda. Como indica el quickstart, evita cambiar embedding después de procesar archivos. Si necesitas cambiarlo, crea un dataset nuevo.

Para principiantes, recomienda “1 archivo, 1 dataset, 1 assistant”. Subir muchos PDF al inicio dificulta saber si falla API, embedding, chunk o formato.