Browser Use
用 TokenMix 的 OpenAI 兼容模型驱动浏览器 Agent。
适合谁
browser-use 适合开发者做浏览器自动化 Agent,例如打开网页、点击按钮、读取页面、填写表单、总结网页内容。它不是普通聊天应用,通常需要写一点 Python。
第一步:准备 TokenMix 信息
准备:
- API Key: TokenMix Key
- Base URL:
https://api.tokenmix.ai/v1 - 模型 ID: TokenMix 文本模型 ID
第二步:安装环境
建议使用 Python 3.11+。如果你用 uv:
uv init tokenmix-browser-agent
cd tokenmix-browser-agent
uv add browser-use langchain-openai
如果你用 pip:
python -m venv .venv
source .venv/bin/activate
pip install browser-use langchain-openai
第三步:写最小示例
新建 agent.py:
from browser_use import Agent
from langchain_openai import ChatOpenAI
llm = ChatOpenAI(
model="<your-model-short-id>",
api_key="<your-tokenmix-key>",
base_url="https://api.tokenmix.ai/v1",
)
agent = Agent(
task="Open example.com and summarize the page title.",
llm=llm,
)
agent.run_sync()
运行:
python agent.py
第四步:替换成真实任务
确认最小示例能跑后,再把 task 换成真实任务,例如:
Open https://tokenmix.ai, find the Apps page, and summarize what kinds of AI tools are listed there.
新手建议一次只让 Agent 做 1 到 3 步操作。任务太长时,浏览器自动化更容易失败。
常见问题
- 401: API Key 错误。
- model not found: 模型 ID 写错。
- 浏览器没有打开: 检查 browser-use 的浏览器依赖是否安装完整。
- Agent 卡住: 缩短任务,先让它只打开页面并总结标题。
- 成本高: 浏览器 Agent 会多轮思考,先用便宜模型测试流程。