Grok 4.1 Fast Non-Reasoning API via TokenMix

xAI の Grok 4.1 Fast Non-Reasoning チャット モデルを、TokenMix の AI API リレーとマルチモデルゲートウェイ経由で利用できます。

Low-latency, non-reasoning variant of Grok 4.1 Fast with 2M context window. Delivers fast responses without extended thinking while maintaining frontier-level tool-calling and agentic capabilities.

API アクセス

  • Base URL: https://api.tokenmix.ai/v1
  • モデル ID: grok-4.1-fast-non-reasoning
  • OpenAI SDK 互換。base URL を変更し、TokenMix API キーを使用します。

料金

Input $0.19/M tokens, output $0.475/M tokens

機能

ビジョン, ツール呼び出し, JSON モード, ストリーミング

モデル仕様

  • Context: 2000K tokens
  • Max output: 30K tokens

可用性

現在 1/1 の API エンドポイントが正常です。

最近のパフォーマンス

TTFT 2026ms、レイテンシ 5127ms、スループット 273.9 tok/s。

このモデルを使い始める

API キーを作成し、必要に応じて $1 からチャージして、TokenMix の OpenAI 互換エンドポイント経由で呼び出します。

Create API key · View pricing · Quickstart