Gemini 2.5 Flash Lite API via TokenMix

TokenMix AI API 릴레이와 멀티 모델 게이트웨이를 통해 Google의 Gemini 2.5 Flash Lite 채팅 모델을 호출하세요.

Google's fastest and most economical multimodal model. Optimized for low latency and high-volume use cases. Supports adjustable thinking budgets. Deprecated March 31, 2026.

API 접근

Base URL: https://api.tokenmix.ai/v1
모델 ID: gemini-2.5-flash-lite
OpenAI SDK 호환. base URL을 바꾸고 TokenMix API 키를 사용하면 됩니다.

가격

Input $0.097/M tokens, output $0.388/M tokens

기능

비전, 도구 호출, JSON 모드, 스트리밍, 추론

모델 사양

Context: 1049K tokens
Max output: 66K tokens

가용성

현재 1/1개 API 엔드포인트가 정상입니다.

최근 성능

TTFT 490ms, 지연 시간 854ms, 처리량 41.3 tok/s.

이 모델 사용 시작

API 키를 만들고 필요할 때 $1부터 충전한 뒤 TokenMix OpenAI 호환 엔드포인트로 호출하세요.

Create API key · View pricing · Quickstart