
AnythingLLM
문서 및 지식베이스를 위한 올인원 프라이빗 AI 어시스턴트 및 RAG 플랫폼
소개
AnythingLLM은 RAG, 에이전트, 다중 사용자 워크스페이스를 지원하는 프라이빗 AI 어시스턴트 플랫폼입니다. Generic OpenAI LLM 공급자를 통해 OpenAI 호환 엔드포인트(TokenMix 포함)에 연결할 수 있어 프라이빗 인프라를 벗어나지 않고 Claude, GPT-5, Qwen을 사용할 수 있습니다. RAG를 위한 문서 인덱싱을 위해 Generic OpenAI Embedder도 구성해야 합니다.
사전 조건
Docker로 AnythingLLM을 셀프호스트합니다:
docker pull mintplexlabs/anythingllm
docker run -d -p 3001:3001 \
-v anythingllm_storage:/app/server/storage \
--name anythingllm \
mintplexlabs/anythingllm
http://localhost:3001에 접속하여 온보딩 마법사를 완료합니다.
TokenMix API 키도 필요합니다. tokenmix.ai → 콘솔 → API Keys에서 생성하세요.
설정 단계
1단계 — LLM 설정 열기
AnythingLLM에서 왼쪽 하단 설정(기어 아이콘) → AI 공급자 → LLM을 클릭합니다.
2단계 — LLM 공급자로 Generic OpenAI 선택
공급자 목록에서 Generic OpenAI를 선택합니다.
3단계 — LLM 연결 정보 입력
| 필드 | 값 |
|---|---|
| Base URL | https://api.tokenmix.ai/v1 |
| API 키 | TokenMix 키(sk-tm-…) |
| Model Name | 예: claude-sonnet-4.6 |
| 토큰 컨텍스트 창 | 모델에 따라 설정(Claude Sonnet은 200000) |
변경사항 저장을 클릭합니다.
4단계 — Embedding 공급자 구성
설정 → AI 공급자에서 Embedder를 클릭합니다.
Embedder로 Generic OpenAI를 선택하고 입력합니다:
| 필드 | 값 |
|---|---|
| Base URL | https://api.tokenmix.ai/v1 |
| API 키 | TokenMix 키(sk-tm-…) |
| Model Name | 예: text-embedding-3-large |
변경사항 저장을 클릭합니다.
5단계 — 워크스페이스 생성 및 문서 업로드
메인 화면으로 돌아가 새 워크스페이스를 만들고 문서(PDF, Word, TXT 등)를 업로드합니다. AnythingLLM은 4단계에서 구성한 임베딩 모델로 문서를 인덱싱합니다.
인덱싱이 완료되면 3단계에서 구성한 LLM으로 문서와 대화할 수 있습니다.
검증
워크스페이스에서 메시지를 보내고 문서 내용을 참조하는 정상 응답이 오면 LLM과 Embedder 모두 TokenMix를 통해 정상 작동하는 것입니다.
TokenMix 콘솔 → 사용 기록에서 채팅과 임베딩 요청이 모두 기록되었는지 확인하세요.
자주 묻는 질문
Q: 저장 후 "LLM 공급자에 연결할 수 없습니다" 오류가 발생합니다.
A: Base URL이 정확히 https://api.tokenmix.ai/v1인지(후행 슬래시 없음), API 키가 sk-tm-으로 시작하는지 확인하세요. TokenMix 계정 잔액도 확인하세요.
Q: TokenMix는 어떤 임베딩 모델을 제공하나요?
A: tokenmix.ai → 모델에서 Embedding 유형으로 필터링하고, short_id(예: text-embedding-3-large)를 Embedder의 Model Name 필드에 입력하세요. 임베딩 모델은 채팅 모델과 별도로 설정합니다.
Q: 워크스페이스마다 다른 LLM 모델을 사용할 수 있나요? A: 기본적으로 전역 LLM 설정이 모든 워크스페이스에 적용됩니다. AnythingLLM Pro/Cloud에서는 워크스페이스별 모델 재정의가 가능합니다. 오픈소스 버전에서는 전역 설정을 변경하여 모델을 전환합니다.