API Gemini 2.5 Flash Lite via TokenMix

Utilisez Gemini 2.5 Flash Lite de Google comme modèle chat via le relais API IA et gateway multi-modèles de TokenMix.

Google's fastest and most economical multimodal model. Optimized for low latency and high-volume use cases. Supports adjustable thinking budgets. Deprecated March 31, 2026.

Accès API

  • Base URL: https://api.tokenmix.ai/v1
  • ID du modèle: gemini-2.5-flash-lite
  • Compatible OpenAI SDK. Changez la base URL et utilisez votre clé API TokenMix.

Tarifs

Input $0.097/M tokens, output $0.388/M tokens

Capacités

Vision, Appel de fonctions, Mode JSON, Streaming, Raisonnement

Spécifications

  • Context: 1049K tokens
  • Max output: 66K tokens

Disponibilité

1/1 endpoints API sont opérationnels actuellement.

Performance récente

TTFT 490ms, latence 854ms, débit 41.3 tok/s.

Commencer avec ce modèle

Créez une clé API, rechargez dès $1 si nécessaire, puis appelez ce modèle via l’endpoint TokenMix compatible OpenAI.

Create API key · View pricing · Quickstart