GLM-5.1
by Zhipu · chat
GLM-5.1 是智谱最新旗舰模型,推理、编程与智能体能力全面升级。按上下文长度分档计费(<=32K 和 >32K),198K 上下文。
Pricing
Input: $0.771429/M tokens · Output: $3.085714/M tokens
Capabilities
Function Calling, JSON Mode, Streaming, Reasoning
Context: 198K tokens
Max output: 128K tokens
Routes: 1/1 healthy
Performance
TTFT: 1520ms · Latency: 10133ms · Throughput: 21.7 tok/s