Grok 4.1 Fast Non-Reasoning API via TokenMix

TokenMix AI API 릴레이와 멀티 모델 게이트웨이를 통해 xAI의 Grok 4.1 Fast Non-Reasoning 채팅 모델을 호출하세요.

Low-latency, non-reasoning variant of Grok 4.1 Fast with 2M context window. Delivers fast responses without extended thinking while maintaining frontier-level tool-calling and agentic capabilities.

API 접근

  • Base URL: https://api.tokenmix.ai/v1
  • 모델 ID: grok-4.1-fast-non-reasoning
  • OpenAI SDK 호환. base URL을 바꾸고 TokenMix API 키를 사용하면 됩니다.

가격

Input $0.19/M tokens, output $0.475/M tokens

기능

비전, 도구 호출, JSON 모드, 스트리밍

모델 사양

  • Context: 2000K tokens
  • Max output: 30K tokens

가용성

현재 1/1개 API 엔드포인트가 정상입니다.

최근 성능

TTFT 2026ms, 지연 시간 5127ms, 처리량 273.9 tok/s.

이 모델 사용 시작

API 키를 만들고 필요할 때 $1부터 충전한 뒤 TokenMix OpenAI 호환 엔드포인트로 호출하세요.

Create API key · View pricing · Quickstart