Grok 4 Fast Reasoning

by xAI · chat

Grok 4 Fast 的推理模式,高性价比多模态模型,支持 200 万 token 上下文。性能与 Grok 4 相当,但思考 token 消耗减少约 40%%。

Pricing

Input: $0.19/M tokens · Output: $0.475/M tokens

Capabilities

Vision, Function Calling, JSON Mode, Streaming, Reasoning

Context: 2000K tokens

Max output: 16K tokens

Routes: 2/2 healthy

Performance

TTFT: 1361ms · Latency: 3947ms · Throughput: 170.8 tok/s