Keyboard shortcuts

Press or to navigate between chapters

Press S or / to search in the book

Press ? to show this help

Press Esc to hide this help

浏览器控制 Agent

任何能控制 Chromium 浏览器的 AI agent 都可以通过 esphome.cloud/mcp/esp-idf 使用 espctl——不用装任何东西。不用二进制、不用装包、不用配 PATH。

这一页覆盖 browser-usecomputer-use 或任何通过 CDP、Playwright、Puppeteer 驱动浏览器的框架的设置。

要求

要求细节
浏览器Chrome、Edge 或其他 Chromium 浏览器
Agent 能力能访问 URL、点击元素、读取文字
网络HTTPS 访问 esphome.cloud
安装不需要——这就是重点

配置

不需要 MCP 服务器配置。agent 打开浏览器标签而不是运行二进制。 把你的 agent 指向:

https://esphome.cloud/mcp/esp-idf

如果你的 agent 框架有“起始 URL“或“初始页面“设置,用这个 URL。 如果需要任务描述,告诉它:

用 Chrome 打开 https://esphome.cloud/mcp/esp-idf。如果有登录 提示就登录。点 Connect。然后按构建指示操作。

构建流程

agent 在浏览器里按这个顺序操作:

  1. 打开 esphome.cloud/mcp/esp-idf
  2. 登录(如果出现登录提示)。
  3. 点 Connect —— 等绿灯亮。
  4. 选目标芯片(esp32、esp32s3……)。
  5. 选 IDF 版本(可选——默认的就行)。
  6. 选构建类型(release 或 debug)。
  7. 点 Build —— 日志实时滚动。
  8. 构建完成(状态变为 succeeded 或 failed)。
  9. 看结果 —— 点 Size Report、SBOM 或 Diagnostics 做构建后分析。
  10. 下载固件 —— 点固件卡片上的下载图标。

烧录流程(可选)

如果 agent 能访问 USB 连接的 ESP 设备:

  1. 切到 Flash 标签。
  2. Connect —— 从端口列表里选 USB 设备。
  3. Flash

注意: Web Serial 需要浏览器有 USB 访问权限。如果 agent 跑在 无头或沙箱环境里,烧录可能不可用。

监控流程(可选)

Monitor 标签不需要登录或连接构建服务器:

  1. 切到 Monitor 标签。
  2. Open Monitor —— 选 USB 设备。
  3. 选波特率(默认 115200)。
  4. 看串口输出。

看看是不是工作了

agent 打开页面并点 Connect 后,应该看到:

  • 绿色连接指示灯
  • 工具检查器面板,列出可用工具
  • 构建配置控件(目标芯片、版本、构建类型)

如果 agent 看到登录提示,需要先完成登录。

和本地 MCP 对比

这个(浏览器 MCP)本地 MCP
需要的配置只要一个 URL配置文件里写 JSON + 装二进制
Agent 能力要求浏览器控制Shell 命令执行
不装软件能用不能
同样的工具全部 40 + 浏览器附加全部 40

当你的 agent 不能装二进制时用浏览器 MCP。当你的 agent 有 shell 访问权限并且你想要更紧密的 MCP 协议集成时,用 本地 MCP

另见