Gemini 2.5 Flash Lite API 中转

通过 TokenMix AI API 中转与多模型聚合网关调用 Google 的 Gemini 2.5 Flash Lite 聊天模型。

Google 最快最经济的多模态模型。针对低延迟和高流量场景优化。支持可调节思考预算。将于 2026 年 3 月 31 日下线。

API 接入方式

输入 $0.097 / 百万 tokens，输出 $0.388 / 百万 tokens

视觉, 工具调用, JSON 模式, 流式输出, 推理

当前 1/1 个 API 接入点可用。

首 token 490ms，整体延迟 854ms，吞吐 41.3 tok/s。

创建 API Key，按需从 $1 起充值，通过 TokenMix OpenAI 兼容接口调用这个模型。