乐于分享
好东西不私藏

OpenClaw 以前最大的问题,不是不够聪明,是没手没眼:Peter 刚发的 Peekaboo v3,正好补这一下

OpenClaw 以前最大的问题,不是不够聪明,是没手没眼:Peter 刚发的 Peekaboo v3,正好补这一下

大家好,我是 One,

兄弟们,如果你最近已经把 OpenClaw 跑起来了,你大概率都会卡在同一个地方:

它会回消息。 会调工具。 会接工作流。

但你真让它去碰你的 Mac,去看屏幕,去点按钮,去切窗口,它还是差最后一口气。

这口气,Peter 现在开始补了。

他刚正式发了 Peekaboo 3.0。而且不是发完就算,5 月 10 日发了 v3.1.0,5 月 11 日又连着发了 v3.1.1v3.1.2

这说明一件事:

他现在盯的不是概念,是执行层。

Peekaboo 不是又一个 AI 聊天壳。它是给 OpenClaw 补“眼睛”和“手”的。

官方文档写得很直接:它是一个 macOS automation toolkit for humans and agents

它能干什么?

  • 抓屏
  • 读 accessibility tree
  • 点按钮
  • 打字
  • 滚动
  • 切应用
  • 调菜单
  • 通过 MCP 接给 Codex、Claude Code、Cursor 这些客户端

说白了,过去很多 Agent 不是脑子不够。

是只有脑子,没有手。

所以 Peekaboo 这次重要,不是因为又多了个项目。

而是 OpenClaw 终于开始补最关键的本地执行层。

一、它到底补了什么?

GitHub 的 v3.0.0 release 里,有几句特别关键:

  • action-first automation 变成默认路径
  • CLI 和 MCP 走统一截图 + UI detection 流程
  • 快照、窗口、菜单、Dock、dialog 这些都在统一
  • v3 强调 multi-screen automation

翻成人话就是:

它不只是“看见”屏幕了,而是在认真解决“看见以后怎么稳定地下手”。

这个差别很大。

以前很多 Agent 能告诉你“下一步应该点哪里”。 现在这套东西,是在往“它自己去点”走。

二、今天就能跑的 4 步实操

1)先装 Peekaboo

brew install steipete/tap/peekaboo

装完先确认版本:

peekaboo --version

别跳过这一步。 先看版本,再排错。

2)先把两个 macOS 权限给了

Peekaboo 文档里要求很明确,要给:

  • Screen Recording
  • Accessibility

不给这两个,后面很多命令看起来像坏了,其实只是系统没放权。

3)先跑最小截图闭环

peekaboo image --mode screen --retina --path ~/Desktop/peekaboo-test.png

如果桌面上成功生成 peekaboo-test.png,说明第一层通了。

4)直接跑一句自然语言任务

peekaboo agent "open Safari and search for Peekaboo"

这一步的意义不是看热闹。

而是确认:你的机器上,Peekaboo 已经能从“截图”进入“动作链”了。

三、如果你是 OpenClaw 用户,真正该怎么接?

这才是重点。

OpenClaw 文档已经写了,OpenClaw.app 可以作为 PeekabooBridge host。 翻成人话就是:

  • OpenClaw 负责接消息、调 Agent、管任务
  • Peekaboo 负责看桌面、做动作

如果你是拿 MCP 客户端接,先起 MCP:

npx -y @steipete/peekaboo

最小配置可以先这样写:

{"mcpServers":{"peekaboo":{"command":"npx","args":["-y","@steipete/peekaboo"]}}}

这一步接上以后,Codex、Claude Code、Cursor 这些工具,才会把 Peekaboo 当成真正的桌面执行工具来用。

四、我建议你立刻测的 3 个动作

1)测“看”

peekaboo image --mode screen --path ~/Desktop/screen.png

先确认它能稳定看见。

2)测“认”

peekaboo see --app Safari --json

这一步看的是:它不只是截图,而是能不能把界面元素结构化吐出来。

3)测“动手”

如果上一步已经拿到了 snapshot_id,再试点击:

peekaboo click --on "Reload this page" --snapshot <SNAPSHOT_ID>

这一条一旦通了,你就能立刻感受到区别:

以前 Agent 只能告诉你“去点刷新”。现在它开始自己点了。

五、One掌柜的泼冷水

这东西现在很值得看,但别一上来就上头。

先记住 4 句:

  • 先在测试环境试,别直接碰生产账号
  • 权限别全给,先给最小需要的那两个
  • 先测截图,再测识别,再测点击,别一口气全开
  • 真要接 OpenClaw,先把一条最小任务链跑通,再谈自动化大活

这是血泪教训。

Computer Use 最怕的不是不会演示。

是你一上来就把它丢进真业务里,然后让它替你乱点。

六、最后一句判断

我对 Peekaboo v3 的判断很直接:

它不是 OpenClaw 生态里又多了个小工具。

它是在补 OpenClaw 最缺的本地执行层。

以前 OpenClaw 更像“会接消息的 Agent 平台”。 现在配上 Peekaboo,它才开始往“能替你碰电脑、替你往下干活”的方向走。

眼睛长出来了。 手也开始长出来了。

如果你最近就在折腾 OpenClaw,别只收藏这条消息。

直接把上面那 4 步跑一遍。

你跑完,再回来看 Peekaboo v3,感觉会完全不一样。

以上,

免费体验 3 天<生财有术>

生财有术现在可以免费体验 3 天。互联网Top1大社群!

关注 AI、OpenClaw、Agents、互联网项目的,建议先进去白嫖看看。

公开网上的信息很多已经是二手、三手了,但社群里能更早看到一线实战者的项目反馈和机会判断。

不满意还能退款,基本没什么试错成本。

先看 3 天,再决定要不要留下。

有时候差距不是努力,而是你离优质信息源太远。