DeepSeek Chat

by DeepSeek · chat

DeepSeek V4 Flash 非思考模式的别名。面向通用对话、代码、分析与高吞吐场景的高效模型。1M 上下文,最高 384K 输出,支持 JSON 输出和工具调用。

Pricing

Input: $0.1358/M tokens · Output: $0.2716/M tokens

Capabilities

Function Calling, JSON Mode, Streaming

Context: 1000K tokens

Max output: 384K tokens

Routes: 6/6 healthy

Performance

TTFT: 8360ms · Latency: 18582ms · Throughput: 136.4 tok/s