RAGFlow

Crea preguntas y respuestas con LLM y embeddings de TokenMix.

Datos de TokenMix

RAGFlow normalmente necesita dos modelos:

Chat model ID: para generar respuestas
Embedding model ID: para procesar y buscar documentos
API Key: TokenMix Key
Base URL: https://api.tokenmix.ai/v1

Configuración en la interfaz

Inicia RAGFlow e inicia sesión.
Abre Model providers.
Elige OpenAI-API-Compatible.
Base URL: https://api.tokenmix.ai/v1.
API Key: TokenMix Key.
Model: ID del modelo chat de TokenMix.
Añade también el modelo embedding de TokenMix.

Configuración antes de iniciar

En service_conf.yaml.template puedes definir user_default_llm:

user_default_llm:
  factory: "OpenAI-API-Compatible"
  api_key: "<your-tokenmix-key>"
  base_url: "https://api.tokenmix.ai/v1"

Reinicia RAGFlow después del cambio.

Probar una base documental

Crea un dataset.
Selecciona el embedding de TokenMix y un chunk template.
Sube solo un PDF o Markdown pequeño.
Espera el parsing y crea un Chat Assistant.
Prueba:

Summarize the uploaded document in five bullet points.

Después de procesar archivos en un dataset, evita cambiar el modelo embedding para mantener el mismo espacio vectorial.

Solución de problemas

parsing bloqueado: revisa embedding y API Key.
chat funciona pero Q&A no: problema de embedding o indexing.
404/model not found: ID de chat o embedding incorrecto.
búsqueda débil: cambia chunk template o recrea el dataset.

Consejos prácticos

RAGFlow tiene más pasos que un chat normal: modelo chat, modelo embedding, dataset, chunk template y estado de parsing deben comprobarse por separado.

Flujo para principiantes

Configura primero solo el modelo chat y haz una pregunta simple.
Configura después embedding; no pongas un modelo chat en ese campo.
Crea un dataset de prueba con un solo archivo pequeño.
Espera a que termine parsing antes de crear Chat Assistant.
Pregunta algo que dependa del documento subido.

Elección de modelos

Chat: modelo texto TokenMix con buena comprensión de instrucciones.
Embedding: modelo embedding de TokenMix.
Documentos grandes: prueba primero con un archivo pequeño.
Documentos multilingües: elige embedding adecuado al idioma.

Después de procesar un dataset, evita cambiar embedding. Es más seguro crear un nuevo dataset.

Notas prácticas

RAGFlow no termina al elegir un modelo. Debes comprobar en orden: modelo chat, modelo embedding, dataset, chunk template y estado de parsing.

Checklist para principiantes:

Añade OpenAI-API-Compatible en Model providers.
Verifica que el modelo chat responde a una pregunta simple.
Añade el modelo embedding por separado.
Crea un dataset y sube un solo archivo pequeño.
Espera a que termine parsing antes de crear Chat Assistant.
Pregunta algo que dependa del contenido del documento.

El modelo embedding afecta directamente la calidad de búsqueda. Como indica el quickstart, evita cambiar embedding después de procesar archivos. Si necesitas cambiarlo, crea un dataset nuevo.

Para principiantes, recomienda “1 archivo, 1 dataset, 1 assistant”. Subir muchos PDF al inicio dificulta saber si falla API, embedding, chunk o formato.