Gemini 2.5 Flash Lite
by Google · chat
Google 最快最经济的多模态模型。针对低延迟和高流量场景优化。支持可调节思考预算。将于 2026 年 3 月 31 日下线。
Pricing
Input: $0.095/M tokens · Output: $0.38/M tokens
Capabilities
Vision, Function Calling, JSON Mode, Streaming, Reasoning
Context: 1049K tokens
Max output: 66K tokens
Routes: 1/1 healthy
Performance
TTFT: 583ms · Latency: 2373ms · Throughput: 5.3 tok/s