Gemini 2.5 Flash Lite

by Google · chat

Google 最快最经济的多模态模型。针对低延迟和高流量场景优化。支持可调节思考预算。将于 2026 年 3 月 31 日下线。

Pricing

Input: $0.095/M tokens · Output: $0.38/M tokens

Capabilities

Vision, Function Calling, JSON Mode, Streaming, Reasoning

Context: 1049K tokens

Max output: 66K tokens

Routes: 1/1 healthy

Performance

TTFT: 583ms · Latency: 2373ms · Throughput: 5.3 tok/s