API Gemini 3.1 Flash-Lite via TokenMix

Utilisez Gemini 3.1 Flash-Lite de Google comme modèle chat via le relais API IA et gateway multi-modèles de TokenMix.

Google's most cost-efficient Gemini model for high-volume workloads. Based on Gemini 3 Pro architecture. 45% faster output generation than Gemini 2.5 Flash with matching quality.

Accès API

  • Base URL: https://api.tokenmix.ai/v1
  • ID du modèle: gemini-3.1-flash-lite
  • Compatible OpenAI SDK. Changez la base URL et utilisez votre clé API TokenMix.

Tarifs

Input $0.2425/M tokens, output $1.455/M tokens

Capacités

Vision, Appel de fonctions, Mode JSON, Streaming, Raisonnement

Spécifications

  • Context: 1049K tokens
  • Max output: 66K tokens

Disponibilité

1/1 endpoints API sont opérationnels actuellement.

Performance récente

TTFT 1172ms, latence 1590ms, débit 250.4 tok/s.

Commencer avec ce modèle

Créez une clé API, rechargez dès $1 si nécessaire, puis appelez ce modèle via l’endpoint TokenMix compatible OpenAI.

Create API key · View pricing · Quickstart