Qwen3 235B

by Qwen · chat

通义千问3旗舰MoE模型,总参数235B/激活22B。支持思考/非思考双模式,擅长复杂推理、代码生成和多语言任务,131K上下文。

Pricing

Input: $0.537143/M tokens · Output: $2.148571/M tokens

Capabilities

Function Calling, JSON Mode, Streaming, Reasoning

Context: 131K tokens

Max output: 8K tokens

Routes: 2/2 healthy

Performance

TTFT: 2797ms · Latency: 18645ms · Throughput: 30.8 tok/s