API de Grok 4.1 Fast Non-Reasoning vía TokenMix

Usa Grok 4.1 Fast Non-Reasoning de xAI como modelo chat mediante el relay de API de IA y gateway multi-modelo de TokenMix.

Low-latency, non-reasoning variant of Grok 4.1 Fast with 2M context window. Delivers fast responses without extended thinking while maintaining frontier-level tool-calling and agentic capabilities.

Acceso API

Base URL: https://api.tokenmix.ai/v1
ID del modelo: grok-4.1-fast-non-reasoning
Compatible con OpenAI SDK. Cambia la base URL y usa tu API key de TokenMix.

Precios

Input $0.19/M tokens, output $0.475/M tokens

Capacidades

Visión, Function calling, Modo JSON, Streaming

Especificaciones

Context: 2000K tokens
Max output: 30K tokens

Disponibilidad

1/1 endpoints API están saludables ahora.

Rendimiento reciente

TTFT 2026ms, latencia 5127ms, throughput 273.9 tok/s.

Empieza a usar este modelo

Crea una API key, recarga desde $1 cuando lo necesites y llama este modelo mediante el endpoint compatible con OpenAI de TokenMix.

Create API key · View pricing · Quickstart