Grok 4.1 Fast Non-Reasoning API 中转

通过 TokenMix AI API 中转与多模型聚合网关调用 xAI 的 Grok 4.1 Fast Non-Reasoning 聊天 模型。

Grok 4.1 Fast 的非推理低延迟模式,支持 200 万 token 上下文。无需扩展思考即可快速响应,保持前沿水平的工具调用和智能体能力。

API 接入方式

  • Base URL: https://api.tokenmix.ai/v1
  • 模型 ID: grok-4.1-fast-non-reasoning
  • 兼容 OpenAI SDK。替换 base URL,使用 TokenMix API Key 即可调用。

价格

输入 $0.19 / 百万 tokens,输出 $0.475 / 百万 tokens

模型能力

视觉, 工具调用, JSON 模式, 流式输出

模型规格

  • Context: 2000K tokens
  • Max output: 30K tokens

可用性

当前 1/1 个 API 接入点可用。

近期性能

首 token 2026ms,整体延迟 5127ms,吞吐 273.9 tok/s。

开始调用这个模型

创建 API Key,按需从 $1 起充值,通过 TokenMix OpenAI 兼容接口调用这个模型。

Create API key · View pricing · Quickstart