API Grok 4.1 Fast Non-Reasoning via TokenMix

Utilisez Grok 4.1 Fast Non-Reasoning de xAI comme modèle chat via le relais API IA et gateway multi-modèles de TokenMix.

Low-latency, non-reasoning variant of Grok 4.1 Fast with 2M context window. Delivers fast responses without extended thinking while maintaining frontier-level tool-calling and agentic capabilities.

Accès API

  • Base URL: https://api.tokenmix.ai/v1
  • ID du modèle: grok-4.1-fast-non-reasoning
  • Compatible OpenAI SDK. Changez la base URL et utilisez votre clé API TokenMix.

Tarifs

Input $0.19/M tokens, output $0.475/M tokens

Capacités

Vision, Appel de fonctions, Mode JSON, Streaming

Spécifications

  • Context: 2000K tokens
  • Max output: 30K tokens

Disponibilité

1/1 endpoints API sont opérationnels actuellement.

Performance récente

TTFT 2026ms, latence 5127ms, débit 273.9 tok/s.

Commencer avec ce modèle

Créez une clé API, rechargez dès $1 si nécessaire, puis appelez ce modèle via l’endpoint TokenMix compatible OpenAI.

Create API key · View pricing · Quickstart