macOS AI自动化终极工具:Peekaboo3 深度解析与实战
🚀 你有没有想过:让 AI 像人一样"看懂"并"操作"你的 Mac 桌面?
今天要介绍的这个工具——Peekaboo3,就是让 AI 拥有"眼睛和手"的黑科技。

它能让 AI 感知屏幕内容、理解 UI 元素语义、执行完整的图形界面交互,彻底打破 AI 只能处理文本和代码的局限。
一、它是什么?
Peekaboo3 是由 PSPDFKit 前创始人 Peter Steinberger(@steipete)发起开发,现由 OpenClaw 社区维护的 macOS 专属 AI 原生 UI 自动化工具。
🔗 官方仓库:https://github.com/openclaw/Peekaboo 🌐 官方网站:https://peekaboo.sh 📌 当前状态:v3 开发中 ✅ 许可证:MIT(完全免费)
二、它能做什么?
Peekaboo 的核心使命是:让 macOS GUI 自动化获得与现代 Web 自动化同等的确定性和可调试性。
通过以下六大核心能力全面赋能 AI:
- 高精度视觉感知
— 捕获屏幕、窗口、菜单栏的像素级精确图像,支持 Retina 2x 缩放 - 结构化 UI 理解
— 生成带唯一元素 ID 的语义化 UI 地图,AI 可理解每个元素 - 多模态智能交互
— 执行点击、输入、滚动、拖拽、快捷键等操作 - 自然语言任务编排
— 内置代理引擎,直接理解自然语言描述的复杂任务 - 系统级深度控制
— 应用、窗口、空间、菜单、Dock、系统对话框全覆盖 - 多工具生态集成
— 作为标准 MCP 服务器,可被 Claude Desktop、Cursor、OpenClaw 等工具无缝调用
三、核心优势
🤖 AI 原生设计 vs 传统自动化改造
传统工具(AppleScript、PyAutoGUI、Keyboard Maestro)都是为人类设计的,后来被尝试改造用于 AI。
Peekaboo 从立项之初就是为 AI 代理构建的,这是本质区别。
🍎 深度 macOS 系统集成
完全基于 Apple 官方 API(ScreenCaptureKit、Accessibility、CoreGraphics)构建,比第三方跨平台工具更稳定、更高效。
🔒 极致隐私保护
完整支持本地 AI 模型(Ollama),所有屏幕数据捕获、分析和决策都在本地完成,无需上传到任何云端服务器。
🎯 混合自动化模型
结合语义化的 Accessibility API 和视觉识别技术,在应用不支持 Accessibility 时自动回退到视觉定位,实现 99% 以上的应用覆盖。
四、安装部署
系统要求
操作系统:macOS 15.0+ 硬件:Apple Silicon(ARM64)强烈推荐 权限:必须授予"屏幕录制"权限,推荐授予"辅助功能"权限
方法一:Homebrew 安装(推荐)
brew install steipete/tap/peekaboo方法二:OpenClaw 技能安装
# 1. 先通过Homebrew安装Peekaboo CLI核心 brew install steipete/tap/peekaboo # 2. 授予必要的系统权限 peekaboo permissions grant # 3. 克隆官方仓库并复制技能文件 git clone https://github.com/openclaw/Peekaboo.git cp -r Peekaboo/skills/peekaboo ~/.openclaw/skills/五、使用示例
屏幕捕获与分析
# 捕获全屏并保存(Retina分辨率) peekaboo image --mode screen --retina --path ~/Desktop/screen.png # 捕获屏幕并让AI分析总结内容 peekaboo image --mode screen --analyze "总结这个页面的主要内容"语义化 UI 自动化
# 捕获Safari窗口并生成带元素ID的UI快照 peekaboo see --app Safari --json # 通过标签文本点击按钮 peekaboo click --on "重新加载页面" # 在TextEdit中输入文本 peekaboo type --text "Hello from AI automation" --app TextEdit自然语言自动化(最强大!)
# 直接用自然语言描述任务,AI自动编排执行 peekaboo agent "打开Notes应用,创建一个新笔记,标题为'TODO列表'"六、与其它工具对比
七、总结
Peekaboo3 是目前 macOS 平台上最先进的 AI 原生 UI 自动化工具。
它填补了传统自动化工具与现代 AI 代理之间的巨大鸿沟,使 AI 从只能处理文本和代码的"书呆子",变成了能够真正"看到"并"操作"整个 macOS 桌面环境的智能助手。
对于 OpenClaw 用户来说,Peekaboo 是不可或缺的核心技能。它极大地扩展了 AI 代理的能力边界,开启了 AI 桌面自动化的全新时代。
💡 快速落地:可以让 OpenClaw agent 阅读这篇文章并制定落地计划。
夜雨聆风