Qwen2.5 VL 72B
by Qwen · chat
720 亿参数视觉语言模型,擅长图像/文档理解、OCR、图表分析和视觉推理,支持 33K 上下文。
Pricing
Input: $0.2375/M tokens · Output: $0.7125/M tokens
Capabilities
Vision, Streaming
Context: 33K tokens
Max output: 8K tokens
Routes: 1/1 healthy
Performance
TTFT: 649ms · Latency: 4325ms · Throughput: 4.8 tok/s