GPT-OSS 120B
by OpenAI · chat
OpenAI 以 Apache 2.0 许可证发布的开源混合专家模型,1200 亿总参数(每 token 激活 51 亿)。支持可调推理深度,借助 MXFP4 量化可在单张 80GB GPU 上运行。
Pricing
Input: $0.1425/M tokens · Output: $0.57/M tokens
Capabilities
Function Calling, JSON Mode, Streaming, Reasoning
Context: 131K tokens
Max output: 131K tokens
Routes: 2/2 healthy
Performance
TTFT: 680ms · Latency: 2335ms · Throughput: 436.3 tok/s