Llama 4 Maverick API via TokenMix

Meta の Llama 4 Maverick チャット モデルを、TokenMix の AI API リレーとマルチモデルゲートウェイ経由で利用できます。

Meta's first natively multimodal open-weight model using MoE architecture (17B active / 400B total, 128 experts). Beats GPT-4o and Gemini 2.0 Flash across broad benchmarks.

API アクセス

  • Base URL: https://api.tokenmix.ai/v1
  • モデル ID: llama-4-maverick
  • OpenAI SDK 互換。base URL を変更し、TokenMix API キーを使用します。

料金

Input $0.372/M tokens, output $1.581/M tokens

機能

ビジョン, ツール呼び出し, JSON モード, ストリーミング

モデル仕様

  • Context: 1000K tokens
  • Max output: 16K tokens

可用性

現在 2/2 の API エンドポイントが正常です。

最近のパフォーマンス

TTFT 514ms、レイテンシ 1031ms、スループット 6.0 tok/s。

このモデルを使い始める

API キーを作成し、必要に応じて $1 からチャージして、TokenMix の OpenAI 互換エンドポイント経由で呼び出します。

Create API key · View pricing · Quickstart