API de Gemini 3.1 Flash-Lite vía TokenMix
Usa Gemini 3.1 Flash-Lite de Google como modelo chat mediante el relay de API de IA y gateway multi-modelo de TokenMix.
Google's most cost-efficient Gemini model for high-volume workloads. Based on Gemini 3 Pro architecture. 45% faster output generation than Gemini 2.5 Flash with matching quality.
Acceso API
- Base URL:
https://api.tokenmix.ai/v1 - ID del modelo:
gemini-3.1-flash-lite - Compatible con OpenAI SDK. Cambia la base URL y usa tu API key de TokenMix.
Precios
Input $0.2425/M tokens, output $1.455/M tokens
Capacidades
Visión, Function calling, Modo JSON, Streaming, Razonamiento
Especificaciones
- Context: 1049K tokens
- Max output: 66K tokens
Disponibilidad
1/1 endpoints API están saludables ahora.
Rendimiento reciente
TTFT 1172ms, latencia 1590ms, throughput 250.4 tok/s.
Empieza a usar este modelo
Crea una API key, recarga desde $1 cuando lo necesites y llama este modelo mediante el endpoint compatible con OpenAI de TokenMix.