GLM-5.1

by Zhipu · chat

GLM-5.1 是智谱最新旗舰模型,推理、编程与智能体能力全面升级。按上下文长度分档计费(<=32K 和 >32K),198K 上下文。

Pricing

Input: $0.771429/M tokens · Output: $3.085714/M tokens

Capabilities

Function Calling, JSON Mode, Streaming, Reasoning

Context: 198K tokens

Max output: 128K tokens

Routes: 1/1 healthy

Performance

TTFT: 1520ms · Latency: 10133ms · Throughput: 21.7 tok/s