DeepSeek V4 Flash
by DeepSeek · chat
DeepSeek V4 Flash 是 DeepSeek V4 系列面向通用对话、代码、分析与高吞吐场景的高效模型。支持思考与非思考模式,1M 上下文,最高 384K 输出,支持 JSON 输出、工具调用、聊天前缀补全,非思考模式下支持 FIM 补全。
Pricing
Input: $0.1358/M tokens · Output: $0.2716/M tokens
Capabilities
Function Calling, JSON Mode, Streaming, Reasoning
Context: 1000K tokens
Max output: 384K tokens
Routes: 1/1 healthy
Performance
TTFT: 1391ms · Latency: 3284ms · Throughput: 46.6 tok/s