API Grok 4.1 Fast Non-Reasoning via TokenMix
Utilisez Grok 4.1 Fast Non-Reasoning de xAI comme modèle chat via le relais API IA et gateway multi-modèles de TokenMix.
Low-latency, non-reasoning variant of Grok 4.1 Fast with 2M context window. Delivers fast responses without extended thinking while maintaining frontier-level tool-calling and agentic capabilities.
Accès API
- Base URL:
https://api.tokenmix.ai/v1 - ID du modèle:
grok-4.1-fast-non-reasoning - Compatible OpenAI SDK. Changez la base URL et utilisez votre clé API TokenMix.
Tarifs
Input $0.19/M tokens, output $0.475/M tokens
Capacités
Vision, Appel de fonctions, Mode JSON, Streaming
Spécifications
- Context: 2000K tokens
- Max output: 30K tokens
Disponibilité
1/1 endpoints API sont opérationnels actuellement.
Performance récente
TTFT 2026ms, latence 5127ms, débit 273.9 tok/s.
Commencer avec ce modèle
Créez une clé API, rechargez dès $1 si nécessaire, puis appelez ce modèle via l’endpoint TokenMix compatible OpenAI.