RAGFlow

RAGFlow

Créez une Q&R documentaire avec les modèles LLM et embedding de TokenMix.

Informations TokenMix

RAGFlow utilise généralement deux modèles:

Configuration via l'interface

  1. Lancez RAGFlow et connectez-vous.
  2. Ouvrez Model providers.
  3. Choisissez OpenAI-API-Compatible.
  4. Base URL: https://api.tokenmix.ai/v1.
  5. API Key: clé TokenMix.
  6. Model: ID du modèle chat TokenMix.
  7. Ajoutez aussi le modèle embedding TokenMix.

Configuration avant démarrage

Dans service_conf.yaml.template, vous pouvez définir user_default_llm:

user_default_llm:
  factory: "OpenAI-API-Compatible"
  api_key: "<your-tokenmix-key>"
  base_url: "https://api.tokenmix.ai/v1"

Redémarrez RAGFlow après modification.

Tester une base documentaire

  1. Créez un dataset.
  2. Sélectionnez le modèle embedding TokenMix et un chunk template.
  3. Importez un seul petit PDF ou Markdown.
  4. Attendez la fin du parsing puis créez un Chat Assistant.
  5. Testez:
Summarize the uploaded document in five bullet points.

Après parsing de fichiers dans un dataset, évitez de changer le modèle embedding afin de conserver le même espace vectoriel.

Dépannage

Conseils pratiques

RAGFlow a plus d'étapes qu'un outil de chat simple: modèle chat, modèle embedding, dataset, chunk template et état de parsing doivent être vérifiés séparément.

Parcours débutant

  1. Configurez d'abord seulement le modèle chat et posez une question simple.
  2. Configurez ensuite l'embedding; ne mettez pas un modèle chat dans ce champ.
  3. Créez un dataset de test avec un seul petit fichier.
  4. Attendez la fin du parsing avant de créer le Chat Assistant.
  5. Posez une question liée explicitement au document importé.

Choix des modèles

Après parsing d'un dataset, évitez de changer l'embedding. Créez plutôt un nouveau dataset.

Notes pratiques

RAGFlow ne se limite pas au choix d'un modèle. Il faut vérifier dans l'ordre: modèle chat, modèle embedding, dataset, chunk template et état de parsing.

Checklist débutant:

  1. Ajoutez OpenAI-API-Compatible dans Model providers.
  2. Vérifiez que le modèle chat répond à une question simple.
  3. Ajoutez séparément le modèle embedding.
  4. Créez un dataset et importez un seul petit fichier.
  5. Attendez la fin du parsing avant de créer le Chat Assistant.
  6. Posez une question qui dépend du contenu du document.

Le modèle embedding influence directement la qualité de recherche. Comme indiqué dans le quickstart, évitez de changer l'embedding après parsing. Pour changer de modèle, créez un nouveau dataset.

Pour débutants, conseillez “1 fichier, 1 dataset, 1 assistant”. Importer beaucoup de PDF dès le départ rend le diagnostic difficile.