RAGFlow

Créez une Q&R documentaire avec les modèles LLM et embedding de TokenMix.

Informations TokenMix

RAGFlow utilise généralement deux modèles:

Chat model ID: génération des réponses
Embedding model ID: parsing et recherche documentaire
API Key: clé TokenMix
Base URL: https://api.tokenmix.ai/v1

Configuration via l'interface

Lancez RAGFlow et connectez-vous.
Ouvrez Model providers.
Choisissez OpenAI-API-Compatible.
Base URL: https://api.tokenmix.ai/v1.
API Key: clé TokenMix.
Model: ID du modèle chat TokenMix.
Ajoutez aussi le modèle embedding TokenMix.

Configuration avant démarrage

Dans service_conf.yaml.template, vous pouvez définir user_default_llm:

user_default_llm:
  factory: "OpenAI-API-Compatible"
  api_key: "<your-tokenmix-key>"
  base_url: "https://api.tokenmix.ai/v1"

Redémarrez RAGFlow après modification.

Tester une base documentaire

Créez un dataset.
Sélectionnez le modèle embedding TokenMix et un chunk template.
Importez un seul petit PDF ou Markdown.
Attendez la fin du parsing puis créez un Chat Assistant.
Testez:

Summarize the uploaded document in five bullet points.

Après parsing de fichiers dans un dataset, évitez de changer le modèle embedding afin de conserver le même espace vectoriel.

Dépannage

parsing bloqué: vérifiez embedding et API Key.
chat OK mais Q&A documentaire KO: problème d'embedding ou d'indexing.
404/model not found: mauvais ID de modèle chat ou embedding.
recherche faible: changez le chunk template ou recréez un dataset.

Conseils pratiques

RAGFlow a plus d'étapes qu'un outil de chat simple: modèle chat, modèle embedding, dataset, chunk template et état de parsing doivent être vérifiés séparément.

Parcours débutant

Configurez d'abord seulement le modèle chat et posez une question simple.
Configurez ensuite l'embedding; ne mettez pas un modèle chat dans ce champ.
Créez un dataset de test avec un seul petit fichier.
Attendez la fin du parsing avant de créer le Chat Assistant.
Posez une question liée explicitement au document importé.

Choix des modèles

Chat: modèle texte TokenMix avec bonne compréhension des consignes.
Embedding: modèle embedding TokenMix.
Gros documents: testez d'abord un petit fichier.
Documents multilingues: choisissez un embedding adapté à la langue.

Après parsing d'un dataset, évitez de changer l'embedding. Créez plutôt un nouveau dataset.

Notes pratiques

RAGFlow ne se limite pas au choix d'un modèle. Il faut vérifier dans l'ordre: modèle chat, modèle embedding, dataset, chunk template et état de parsing.

Checklist débutant:

Ajoutez OpenAI-API-Compatible dans Model providers.
Vérifiez que le modèle chat répond à une question simple.
Ajoutez séparément le modèle embedding.
Créez un dataset et importez un seul petit fichier.
Attendez la fin du parsing avant de créer le Chat Assistant.
Posez une question qui dépend du contenu du document.

Le modèle embedding influence directement la qualité de recherche. Comme indiqué dans le quickstart, évitez de changer l'embedding après parsing. Pour changer de modèle, créez un nouveau dataset.

Pour débutants, conseillez “1 fichier, 1 dataset, 1 assistant”. Importer beaucoup de PDF dès le départ rend le diagnostic difficile.