API Gemini 3.1 Flash-Lite via TokenMix
Utilisez Gemini 3.1 Flash-Lite de Google comme modèle chat via le relais API IA et gateway multi-modèles de TokenMix.
Google's most cost-efficient Gemini model for high-volume workloads. Based on Gemini 3 Pro architecture. 45% faster output generation than Gemini 2.5 Flash with matching quality.
Accès API
- Base URL:
https://api.tokenmix.ai/v1 - ID du modèle:
gemini-3.1-flash-lite - Compatible OpenAI SDK. Changez la base URL et utilisez votre clé API TokenMix.
Tarifs
Input $0.2425/M tokens, output $1.455/M tokens
Capacités
Vision, Appel de fonctions, Mode JSON, Streaming, Raisonnement
Spécifications
- Context: 1049K tokens
- Max output: 66K tokens
Disponibilité
1/1 endpoints API sont opérationnels actuellement.
Performance récente
TTFT 1172ms, latence 1590ms, débit 250.4 tok/s.
Commencer avec ce modèle
Créez une clé API, rechargez dès $1 si nécessaire, puis appelez ce modèle via l’endpoint TokenMix compatible OpenAI.