Gemini 2.5 Flash Lite API via TokenMix
Google の Gemini 2.5 Flash Lite チャット モデルを、TokenMix の AI API リレーとマルチモデルゲートウェイ経由で利用できます。
Google's fastest and most economical multimodal model. Optimized for low latency and high-volume use cases. Supports adjustable thinking budgets. Deprecated March 31, 2026.
API アクセス
- Base URL:
https://api.tokenmix.ai/v1 - モデル ID:
gemini-2.5-flash-lite - OpenAI SDK 互換。base URL を変更し、TokenMix API キーを使用します。
料金
Input $0.097/M tokens, output $0.388/M tokens
機能
ビジョン, ツール呼び出し, JSON モード, ストリーミング, 推論
モデル仕様
- Context: 1049K tokens
- Max output: 66K tokens
可用性
現在 1/1 の API エンドポイントが正常です。
最近のパフォーマンス
TTFT 490ms、レイテンシ 854ms、スループット 41.3 tok/s。
このモデルを使い始める
API キーを作成し、必要に応じて $1 からチャージして、TokenMix の OpenAI 互換エンドポイント経由で呼び出します。