Gemini 3.1 Flash-Lite API via TokenMix

Google の Gemini 3.1 Flash-Lite チャット モデルを、TokenMix の AI API リレーとマルチモデルゲートウェイ経由で利用できます。

Google's most cost-efficient Gemini model for high-volume workloads. Based on Gemini 3 Pro architecture. 45% faster output generation than Gemini 2.5 Flash with matching quality.

API アクセス

  • Base URL: https://api.tokenmix.ai/v1
  • モデル ID: gemini-3.1-flash-lite
  • OpenAI SDK 互換。base URL を変更し、TokenMix API キーを使用します。

料金

Input $0.2425/M tokens, output $1.455/M tokens

機能

ビジョン, ツール呼び出し, JSON モード, ストリーミング, 推論

モデル仕様

  • Context: 1049K tokens
  • Max output: 66K tokens

可用性

現在 1/1 の API エンドポイントが正常です。

最近のパフォーマンス

TTFT 1172ms、レイテンシ 1590ms、スループット 250.4 tok/s。

このモデルを使い始める

API キーを作成し、必要に応じて $1 からチャージして、TokenMix の OpenAI 互換エンドポイント経由で呼び出します。

Create API key · View pricing · Quickstart