GPT-OSS 120B

by OpenAI · chat

OpenAI 以 Apache 2.0 许可证发布的开源混合专家模型,1200 亿总参数(每 token 激活 51 亿)。支持可调推理深度,借助 MXFP4 量化可在单张 80GB GPU 上运行。

Pricing

Input: $0.1425/M tokens · Output: $0.57/M tokens

Capabilities

Function Calling, JSON Mode, Streaming, Reasoning

Context: 131K tokens

Max output: 131K tokens

Routes: 2/2 healthy

Performance

TTFT: 680ms · Latency: 2335ms · Throughput: 436.3 tok/s