MCP 控制台(esphome.cloud/mcp/esp-idf)
完整的 espctl MCP 工具集,跑在浏览器里。任何能控制 Chromium 浏览器
的 AI agent 都能拿到和 espctl mcp serve 一样的 40 个工具——不用
装任何东西。
用 Chrome 或 Edge 打开 esphome.cloud/mcp/esp-idf。 就这样。不用下载二进制,不用装包,不用配 PATH。agent 操作 UI、调用 工具、读取结果。
别和浏览器向导搞混: esphome.cloud/app 是给人用的一步步 引导流程。见浏览器向导。
这适合谁
- 能控制浏览器的 AI agent(browser-use、computer-use、 MCP-over-browser)——这是主要受众。agent 打开 Chrome,访问这个 URL,零安装就能用全套 MCP。
- 开发者——想先在浏览器里手动调用 MCP 工具,再接进 Claude Code 或 Cursor。
- 没装 espctl 的人——不用下载,打开网址就能用。
为什么重要
本地 MCP(espctl mcp serve) | 浏览器 MCP(esphome.cloud/mcp/esp-idf) | |
|---|---|---|
| 需要安装 | espctl 二进制 | 不需要——只要 Chromium 浏览器 |
| 对 agent 的要求 | 能跑 shell 命令 | 能控制浏览器 |
| 同样的工具 | 是,全部 40 个 | 是,全部 40 个 + 浏览器附加 |
| 在限制安装的机器上 | 不行(需要装二进制) | 可以 |
如果你的 AI agent 能打开浏览器标签但不能装二进制,这就是入口。
Agent 怎么用
完整的构建和烧录流程,8 步:
1. 用 Chrome 打开 esphome.cloud/mcp/esp-idf
2. 登录(如果有提示)
3. 点 Connect → 绿灯亮
4. 选目标芯片、IDF 版本、构建类型
5. 点 Build → 日志实时滚动
6. 等构建完成
7. 点 Size Report / SBOM / Diagnostics → 看结果
8. 点固件卡片上的下载图标 → .bin 文件就绪
可选继续烧录:
9. 切到 Flash 标签
10. 点 Connect → 选 USB 设备
11. 点 Flash → 固件写入
12. 切到 Monitor 标签 → Open Monitor → 看设备输出
每一步都是一次点击或一次读取。能控制浏览器的 AI agent 按这个顺序 操作就行。人也一样——UI 完全相同。
客户端设置说明(怎么配置你的 AI agent 来用浏览器 MCP)见 浏览器控制 Agent。
它长什么样
一个页面,三个标签,加一个工具列表:
| 区域 | 内容 |
|---|---|
| Build | 选芯片、选 IDF 版本、构建。实时日志、大小报告、SBOM、诊断、固件下载。 |
| Flash | 把 ESP 设备用 USB 插上,直接从浏览器烧录固件。 |
| Monitor | 串口终端——通过 USB 直接和本地设备通信。不需要服务器。 |
| 工具检查器 | 列出构建机器提供的所有工具和说明。 |
Build 标签
连接
先登录——没登录的话会看到登录提示。登录后点 Connect。控制台打开
和向导一样的三个通道(espctl、pty、firmware)。绿灯亮了就是
连上了。
配置和构建
- 选一个目标芯片(esp32、esp32s3、esp32c3……)。
- 可选:选一个 IDF 版本(默认用构建服务器的默认版本)。
- 选 release 或 debug。
- 点 Build。
日志实时滚动。错误红色,警告黄色。
构建之后
构建成功后多出三个操作:
| 操作 | 工具 | 你得到什么 |
|---|---|---|
| 大小报告 | size.run | 按 section 的 Flash 和 RAM 用量 |
| SBOM | sbom.create | 构建里包含的所有库的列表 |
| 诊断 | diag.run | 自动检查构建输出 |
下载固件
Firmware Builds 卡片列出已完成的构建。点下载图标拉取 .bin 文件。
下载后自动出现在 Flash 标签里。
安全提示: 固件可能包含敏感信息(Wi-Fi 密码、API key)。不要 公开分享
.bin文件。构建机器会算 SHA-256 哈希,控制台下载后 会验证。
Flash 标签
把 ESP 设备用 USB 插上,直接从浏览器烧录。
- 点 Connect 打开串口。
- 从浏览器的端口列表里选你的设备。
- 最近下载的固件已经选好了。
- 点 Flash。
浏览器要求: 需要 Chrome、Edge 或其他 Chromium 浏览器。Safari 和 Firefox 不支持 Web Serial。
Monitor 标签
不需要连接构建服务器。不需要登录——打开页面,点 Monitor 标签, 直接用。
一个串口终端,通过浏览器的 Web Serial API 直接和你本地的设备 USB 通信。适合烧录后快速检查——启动日志、传感器读数、调试打印。
- 点 Open Monitor。
- 从浏览器的端口列表里选你的设备。
- 选一个波特率(ESP-IDF 默认 115200)。
- 看输出。如果你的固件接受命令,也可以输入。
不是完整终端——没有行编辑或回滚。
浏览器要求 —— Chrome、Edge 或其他 Chromium 浏览器。Safari 和 Firefox 不支持 Web Serial。
架构
┌─────────────────────────────────────┐
│ 浏览器(MCP 控制台) │
│ - 登录 │
│ - 打开直连 │
│ - 通过 espctl 通道发送工具调用 │
│ - 通过 pty 通道收实时日志 │
│ - 通过 firmware 通道下载固件 │
└──────┬──────────────────────────────┘
│ HTTPS(登录 + 建立连接)
▼
┌─────────────────────────────────────┐
│ 构建服务器(esphome.cloud) │
│ - 颁发短命许可 │
│ - 挑最佳的构建机器 │
│ - 帮两边找到对方 │
└──────┬──────────────────────────────┘
│ 任务分配
▼
┌─────────────────────────────────────┐
│ 构建机器 │
│ - 检查许可 │
│ - 直接和你的浏览器对话 │
│ - 在沙箱里跑构建 │
│ - 回传日志 + 固件 │
└─────────────────────────────────────┘
和向导一样的连接——同样三个通道,同样经过构建服务器建立连接,同样的 沙箱。区别在浏览器这边:控制台直接暴露工具,而不是包装成引导流程。
能控制浏览器的 AI agent 像人一样操作它——点击、读取、点击——但更快、 不犯错。
例外: Monitor 标签跳过以上所有步骤。它用 Web Serial 直接和 你本地设备通信——不需要构建服务器、不需要通道、不需要登录。
安全
和浏览器向导一样的规则:
- 要登录。 不登录就不能连接。
- 许可只有效几秒。 过期了断开重连就行。
- 只能开三个通道。 许可写明了哪些通道(
espctl、pty、firmware)能用。构建机器拒绝其他一切。 - 带宽和频率有上限。 每个许可按通道限速。构建机器执行限制。
- 端到端加密。 构建服务器看不到你的流量。
- 证书验证。 构建机器检查你的证书和许可里的是否一致。偷来的许可 对别人没用。
完整细节见 Grant 与安全。
控制台 vs 向导 vs 本地 MCP
| 浏览器 MCP 控制台 | 浏览器向导 | 本地 MCP(espctl mcp serve) | |
|---|---|---|---|
| 地址 / 命令 | esphome.cloud/mcp/esp-idf | esphome.cloud/app | espctl mcp serve |
| 需要安装 | 不需要 | 不需要 | espctl 二进制 |
| 谁驱动 | AI agent 通过浏览器,或人 | 人 | AI agent 通过 MCP 协议 |
| 完整工具访问 | 全部 40 + 附加 | 常用任务 | 全部 40 |
| 最适合 | 不装软件的 AI agent | 新手、工坊 | 日常开发 |
另见
- 浏览器向导——给人用的引导式版本。
- 典型 8 步工作流——同样的流程,AI 驱动。
- 系统总览——更大的图。
- WebRTC 与数据通道——构建机器怎么执行 许可。
- 工具参考——全部 40 个工具。