Keyboard shortcuts

Press or to navigate between chapters

Press S or / to search in the book

Press ? to show this help

Press Esc to hide this help

MCP 控制台(esphome.cloud/mcp/esp-idf)

完整的 espctl MCP 工具集,跑在浏览器里。任何能控制 Chromium 浏览器 的 AI agent 都能拿到和 espctl mcp serve 一样的 40 个工具——不用 装任何东西。

用 Chrome 或 Edge 打开 esphome.cloud/mcp/esp-idf。 就这样。不用下载二进制,不用装包,不用配 PATH。agent 操作 UI、调用 工具、读取结果。

别和浏览器向导搞混: esphome.cloud/app 是给人用的一步步 引导流程。见浏览器向导

这适合谁

  • 能控制浏览器的 AI agent(browser-use、computer-use、 MCP-over-browser)——这是主要受众。agent 打开 Chrome,访问这个 URL,零安装就能用全套 MCP。
  • 开发者——想先在浏览器里手动调用 MCP 工具,再接进 Claude Code 或 Cursor。
  • 没装 espctl 的人——不用下载,打开网址就能用。

为什么重要

本地 MCP(espctl mcp serve浏览器 MCP(esphome.cloud/mcp/esp-idf
需要安装espctl 二进制不需要——只要 Chromium 浏览器
对 agent 的要求能跑 shell 命令能控制浏览器
同样的工具是,全部 40 个是,全部 40 个 + 浏览器附加
在限制安装的机器上不行(需要装二进制)可以

如果你的 AI agent 能打开浏览器标签但不能装二进制,这就是入口。

Agent 怎么用

完整的构建和烧录流程,8 步:

1. 用 Chrome 打开 esphome.cloud/mcp/esp-idf
2. 登录(如果有提示)
3. 点 Connect                             → 绿灯亮
4. 选目标芯片、IDF 版本、构建类型
5. 点 Build                               → 日志实时滚动
6. 等构建完成
7. 点 Size Report / SBOM / Diagnostics    → 看结果
8. 点固件卡片上的下载图标                 → .bin 文件就绪

可选继续烧录:

9.  切到 Flash 标签
10. 点 Connect → 选 USB 设备
11. 点 Flash                              → 固件写入
12. 切到 Monitor 标签 → Open Monitor      → 看设备输出

每一步都是一次点击或一次读取。能控制浏览器的 AI agent 按这个顺序 操作就行。人也一样——UI 完全相同。

客户端设置说明(怎么配置你的 AI agent 来用浏览器 MCP)见 浏览器控制 Agent

它长什么样

一个页面,三个标签,加一个工具列表:

区域内容
Build选芯片、选 IDF 版本、构建。实时日志、大小报告、SBOM、诊断、固件下载。
Flash把 ESP 设备用 USB 插上,直接从浏览器烧录固件。
Monitor串口终端——通过 USB 直接和本地设备通信。不需要服务器。
工具检查器列出构建机器提供的所有工具和说明。

Build 标签

连接

先登录——没登录的话会看到登录提示。登录后点 Connect。控制台打开 和向导一样的三个通道(espctlptyfirmware)。绿灯亮了就是 连上了。

配置和构建

  1. 选一个目标芯片(esp32、esp32s3、esp32c3……)。
  2. 可选:选一个 IDF 版本(默认用构建服务器的默认版本)。
  3. releasedebug
  4. Build

日志实时滚动。错误红色,警告黄色。

构建之后

构建成功后多出三个操作:

操作工具你得到什么
大小报告size.run按 section 的 Flash 和 RAM 用量
SBOMsbom.create构建里包含的所有库的列表
诊断diag.run自动检查构建输出

下载固件

Firmware Builds 卡片列出已完成的构建。点下载图标拉取 .bin 文件。 下载后自动出现在 Flash 标签里。

安全提示: 固件可能包含敏感信息(Wi-Fi 密码、API key)。不要 公开分享 .bin 文件。构建机器会算 SHA-256 哈希,控制台下载后 会验证。

Flash 标签

把 ESP 设备用 USB 插上,直接从浏览器烧录。

  1. Connect 打开串口。
  2. 从浏览器的端口列表里选你的设备。
  3. 最近下载的固件已经选好了。
  4. Flash

浏览器要求: 需要 Chrome、Edge 或其他 Chromium 浏览器。Safari 和 Firefox 不支持 Web Serial。

Monitor 标签

不需要连接构建服务器。不需要登录——打开页面,点 Monitor 标签, 直接用。

一个串口终端,通过浏览器的 Web Serial API 直接和你本地的设备 USB 通信。适合烧录后快速检查——启动日志、传感器读数、调试打印。

  1. Open Monitor
  2. 从浏览器的端口列表里选你的设备。
  3. 选一个波特率(ESP-IDF 默认 115200)。
  4. 看输出。如果你的固件接受命令,也可以输入。

不是完整终端——没有行编辑或回滚。

浏览器要求 —— Chrome、Edge 或其他 Chromium 浏览器。Safari 和 Firefox 不支持 Web Serial。

架构

┌─────────────────────────────────────┐
│   浏览器(MCP 控制台)              │
│  - 登录                             │
│  - 打开直连                         │
│  - 通过 espctl 通道发送工具调用     │
│  - 通过 pty 通道收实时日志          │
│  - 通过 firmware 通道下载固件       │
└──────┬──────────────────────────────┘
       │ HTTPS(登录 + 建立连接)
       ▼
┌─────────────────────────────────────┐
│  构建服务器(esphome.cloud)        │
│  - 颁发短命许可                     │
│  - 挑最佳的构建机器                 │
│  - 帮两边找到对方                   │
└──────┬──────────────────────────────┘
       │ 任务分配
       ▼
┌─────────────────────────────────────┐
│  构建机器                           │
│  - 检查许可                         │
│  - 直接和你的浏览器对话             │
│  - 在沙箱里跑构建                   │
│  - 回传日志 + 固件                  │
└─────────────────────────────────────┘

和向导一样的连接——同样三个通道,同样经过构建服务器建立连接,同样的 沙箱。区别在浏览器这边:控制台直接暴露工具,而不是包装成引导流程。

能控制浏览器的 AI agent 像人一样操作它——点击、读取、点击——但更快、 不犯错。

例外: Monitor 标签跳过以上所有步骤。它用 Web Serial 直接和 你本地设备通信——不需要构建服务器、不需要通道、不需要登录。

安全

浏览器向导一样的规则:

  • 要登录。 不登录就不能连接。
  • 许可只有效几秒。 过期了断开重连就行。
  • 只能开三个通道。 许可写明了哪些通道(espctlptyfirmware)能用。构建机器拒绝其他一切。
  • 带宽和频率有上限。 每个许可按通道限速。构建机器执行限制。
  • 端到端加密。 构建服务器看不到你的流量。
  • 证书验证。 构建机器检查你的证书和许可里的是否一致。偷来的许可 对别人没用。

完整细节见 Grant 与安全

控制台 vs 向导 vs 本地 MCP

浏览器 MCP 控制台浏览器向导本地 MCP(espctl mcp serve
地址 / 命令esphome.cloud/mcp/esp-idfesphome.cloud/appespctl mcp serve
需要安装不需要不需要espctl 二进制
谁驱动AI agent 通过浏览器,或人AI agent 通过 MCP 协议
完整工具访问全部 40 + 附加常用任务全部 40
最适合不装软件的 AI agent新手、工坊日常开发

另见