Gemini 3.1 Flash-Lite API 中转
通过 TokenMix AI API 中转与多模型聚合网关调用 Google 的 Gemini 3.1 Flash-Lite 聊天 模型。
Google 最具成本效益的 Gemini 模型,适用于高流量工作负载。基于 Gemini 3 Pro 架构。输出速度比 Gemini 2.5 Flash 快 45%。
API 接入方式
- Base URL:
https://api.tokenmix.ai/v1 - 模型 ID:
gemini-3.1-flash-lite - 兼容 OpenAI SDK。替换 base URL,使用 TokenMix API Key 即可调用。
价格
输入 $0.2425 / 百万 tokens,输出 $1.455 / 百万 tokens
模型能力
视觉, 工具调用, JSON 模式, 流式输出, 推理
模型规格
- Context: 1049K tokens
- Max output: 66K tokens
可用性
当前 1/1 个 API 接入点可用。
近期性能
首 token 1172ms,整体延迟 1590ms,吞吐 250.4 tok/s。
开始调用这个模型
创建 API Key,按需从 $1 起充值,通过 TokenMix OpenAI 兼容接口调用这个模型。