浏览器控制 Agent
任何能控制 Chromium 浏览器的 AI agent 都可以通过 esphome.cloud/mcp/esp-idf 使用 espctl——不用装任何东西。不用二进制、不用装包、不用配 PATH。
这一页覆盖 browser-use、 computer-use 或任何通过 CDP、Playwright、Puppeteer 驱动浏览器的框架的设置。
要求
| 要求 | 细节 |
|---|---|
| 浏览器 | Chrome、Edge 或其他 Chromium 浏览器 |
| Agent 能力 | 能访问 URL、点击元素、读取文字 |
| 网络 | HTTPS 访问 esphome.cloud |
| 安装 | 不需要——这就是重点 |
配置
不需要 MCP 服务器配置。agent 打开浏览器标签而不是运行二进制。 把你的 agent 指向:
https://esphome.cloud/mcp/esp-idf
如果你的 agent 框架有“起始 URL“或“初始页面“设置,用这个 URL。 如果需要任务描述,告诉它:
用 Chrome 打开 https://esphome.cloud/mcp/esp-idf。如果有登录 提示就登录。点 Connect。然后按构建指示操作。
构建流程
agent 在浏览器里按这个顺序操作:
- 打开
esphome.cloud/mcp/esp-idf。 - 登录(如果出现登录提示)。
- 点 Connect —— 等绿灯亮。
- 选目标芯片(esp32、esp32s3……)。
- 选 IDF 版本(可选——默认的就行)。
- 选构建类型(release 或 debug)。
- 点 Build —— 日志实时滚动。
- 等 构建完成(状态变为 succeeded 或 failed)。
- 看结果 —— 点 Size Report、SBOM 或 Diagnostics 做构建后分析。
- 下载固件 —— 点固件卡片上的下载图标。
烧录流程(可选)
如果 agent 能访问 USB 连接的 ESP 设备:
- 切到 Flash 标签。
- 点 Connect —— 从端口列表里选 USB 设备。
- 点 Flash。
注意: Web Serial 需要浏览器有 USB 访问权限。如果 agent 跑在 无头或沙箱环境里,烧录可能不可用。
监控流程(可选)
Monitor 标签不需要登录或连接构建服务器:
- 切到 Monitor 标签。
- 点 Open Monitor —— 选 USB 设备。
- 选波特率(默认 115200)。
- 看串口输出。
看看是不是工作了
agent 打开页面并点 Connect 后,应该看到:
- 绿色连接指示灯
- 工具检查器面板,列出可用工具
- 构建配置控件(目标芯片、版本、构建类型)
如果 agent 看到登录提示,需要先完成登录。
和本地 MCP 对比
| 这个(浏览器 MCP) | 本地 MCP | |
|---|---|---|
| 需要的配置 | 只要一个 URL | 配置文件里写 JSON + 装二进制 |
| Agent 能力要求 | 浏览器控制 | Shell 命令执行 |
| 不装软件能用 | 能 | 不能 |
| 同样的工具 | 全部 40 + 浏览器附加 | 全部 40 |
当你的 agent 不能装二进制时用浏览器 MCP。当你的 agent 有 shell 访问权限并且你想要更紧密的 MCP 协议集成时,用 本地 MCP。
另见
- MCP 控制台 —— 浏览器 MCP 页面的 完整参考。
- Claude Code —— 通过
espctl mcp serve的本地 MCP 设置。 - 工具参考 —— 全部 40 个工具。