Gemini 2.5 Flash Lite API via TokenMix
TokenMix AI API 릴레이와 멀티 모델 게이트웨이를 통해 Google의 Gemini 2.5 Flash Lite 채팅 모델을 호출하세요.
Google's fastest and most economical multimodal model. Optimized for low latency and high-volume use cases. Supports adjustable thinking budgets. Deprecated March 31, 2026.
API 접근
- Base URL:
https://api.tokenmix.ai/v1 - 모델 ID:
gemini-2.5-flash-lite - OpenAI SDK 호환. base URL을 바꾸고 TokenMix API 키를 사용하면 됩니다.
가격
Input $0.097/M tokens, output $0.388/M tokens
기능
비전, 도구 호출, JSON 모드, 스트리밍, 추론
모델 사양
- Context: 1049K tokens
- Max output: 66K tokens
가용성
현재 1/1개 API 엔드포인트가 정상입니다.
최근 성능
TTFT 490ms, 지연 시간 854ms, 처리량 41.3 tok/s.
이 모델 사용 시작
API 키를 만들고 필요할 때 $1부터 충전한 뒤 TokenMix OpenAI 호환 엔드포인트로 호출하세요.