Grok 4.1 Fast Non-Reasoning API via TokenMix
TokenMix AI API 릴레이와 멀티 모델 게이트웨이를 통해 xAI의 Grok 4.1 Fast Non-Reasoning 채팅 모델을 호출하세요.
Low-latency, non-reasoning variant of Grok 4.1 Fast with 2M context window. Delivers fast responses without extended thinking while maintaining frontier-level tool-calling and agentic capabilities.
API 접근
- Base URL:
https://api.tokenmix.ai/v1 - 모델 ID:
grok-4.1-fast-non-reasoning - OpenAI SDK 호환. base URL을 바꾸고 TokenMix API 키를 사용하면 됩니다.
가격
Input $0.19/M tokens, output $0.475/M tokens
기능
비전, 도구 호출, JSON 모드, 스트리밍
모델 사양
- Context: 2000K tokens
- Max output: 30K tokens
가용성
현재 1/1개 API 엔드포인트가 정상입니다.
최근 성능
TTFT 2026ms, 지연 시간 5127ms, 처리량 273.9 tok/s.
이 모델 사용 시작
API 키를 만들고 필요할 때 $1부터 충전한 뒤 TokenMix OpenAI 호환 엔드포인트로 호출하세요.