API de Gemini 3.1 Flash-Lite vía TokenMix

Usa Gemini 3.1 Flash-Lite de Google como modelo chat mediante el relay de API de IA y gateway multi-modelo de TokenMix.

Google's most cost-efficient Gemini model for high-volume workloads. Based on Gemini 3 Pro architecture. 45% faster output generation than Gemini 2.5 Flash with matching quality.

Acceso API

Base URL: https://api.tokenmix.ai/v1
ID del modelo: gemini-3.1-flash-lite
Compatible con OpenAI SDK. Cambia la base URL y usa tu API key de TokenMix.

Precios

Input $0.2425/M tokens, output $1.455/M tokens

Capacidades

Visión, Function calling, Modo JSON, Streaming, Razonamiento

Especificaciones

Context: 1049K tokens
Max output: 66K tokens

Disponibilidad

1/1 endpoints API están saludables ahora.

Rendimiento reciente

TTFT 1172ms, latencia 1590ms, throughput 250.4 tok/s.

Empieza a usar este modelo

Crea una API key, recarga desde $1 cuando lo necesites y llama este modelo mediante el endpoint compatible con OpenAI de TokenMix.

Create API key · View pricing · Quickstart