Grok 4.1 Fast Non-Reasoning
by xAI · chat
Grok 4.1 Fast 的非推理低延迟模式,支持 200 万 token 上下文。无需扩展思考即可快速响应,保持前沿水平的工具调用和智能体能力。
Pricing
Input: $0.19/M tokens · Output: $0.475/M tokens
Capabilities
Vision, Function Calling, JSON Mode, Streaming
Context: 2000K tokens
Max output: 30K tokens
Routes: 1/1 healthy
Performance
TTFT: 2333ms · Latency: 3133ms · Throughput: 36.6 tok/s