Qwen2.5 VL 72B

by Qwen · chat

720 亿参数视觉语言模型,擅长图像/文档理解、OCR、图表分析和视觉推理,支持 33K 上下文。

Pricing

Input: $0.2375/M tokens · Output: $0.7125/M tokens

Capabilities

Vision, Streaming

Context: 33K tokens

Max output: 8K tokens

Routes: 1/1 healthy

Performance

TTFT: 649ms · Latency: 4325ms · Throughput: 4.8 tok/s