OpenClaw 发布原生手机App:让你的AI助手真正随身可用
如果你一直在用 OpenClaw,或者关注 AI Agent 领域,这个消息值得注意:
OpenClaw 正式上线 iOS 和 Android 平台。
这意味着什么?你的 AI 助手不再被「绑」在电脑前。它可以跟着你出门、在车里、在咖啡厅——随时待命。语音对话、拍照、定位、审批 Agent 操作,全部通过手机完成。
本文带你完整了解 App 的核心功能、安装配置和实战用法。
一、为什么需要手机 App
OpenClaw 之前的能力已经很强大:跑在服务器或电脑上的 Gateway,通过飞书、Telegram、Discord 等消息渠道跟用户交互,能读写文件、执行命令、搜索网页、控制浏览器。
但有一个短板始终存在:你不在电脑前时,很多能力用不上。
想出门时用语音跟 AI 聊几句?不行。想让 AI 通过摄像头看看周围环境?不行。想让 AI 知道你的位置推荐附近餐厅?不行。
手机 App 就是来补上这块拼图的。它把手机变成了 AI Agent 的「身体」——有眼睛(摄像头)、有耳朵(麦克风)、知道你在哪(GPS),还能随时用语音对话。
二、核心功能一览
### 🎙️ 实时语音对话(Talk Mode)
这是手机 App 最核心的体验。打开 Talk Mode,就像跟 AI 打电话:
- 持续监听:你说完一句,AI 回答,然后继续等你说话
- 自动断句:停顿即发送,不需要手动按按钮
- 语音回复:通过 TTS 引擎自然语言播报,支持多种音色
- 打断机制:AI 正在说话时你开口,它会自动停下来听你说
Talk Mode 支持配置 ElevenLabs、OpenAI TTS 等主流语音合成引擎,音质自然,延迟低。
适用场景:开车时查信息、做饭时问菜谱、散步时讨论问题。
### 💬 聊天界面
完整的聊天体验,和桌面端无缝同步:
- 多 Session 切换:主会话、自定义会话随意切换
- 历史记录同步:手机上能看到完整的聊天历史
- 实时消息推送:Agent 执行完任务后主动通知你
- 富文本支持:代码块、图片、链接都能正常显示
### 📷 摄像头调用
Agent 可以远程调用手机摄像头:
- 拍照:
camera.snap——拍一张照片 - 录视频:
camera.clip——录制短视频片段
场景举例:你在外面看到一台设备不知道怎么用,让 AI 拍张照片分析一下说明书;或者让 AI 定时拍一张窗外的照片记录天气变化。
### 📍 定位服务
Agent 可以获取你的 GPS 位置(需授权):
- 精度可选:精确定位 / 大致位置
- 场景:「我在哪附近有什么好吃的?」「帮我导航到最近的充电站」
- 注意:出于隐私保护,App 仅在前台时共享位置
### 🖥️ Canvas 渲染
手机上展示 Agent 生成的网页和交互式 UI:
- Agent 生成的 HTML/CSS/JS 可以直接在 App 内渲染
- 支持实时更新:Agent 改了代码,手机端自动刷新
- 数据可视化、表格、交互组件都能正常展示
### 🔔 通知转发(Android)
Android 版额外支持设备通知转发:
- 指定 App 的通知自动转发给 Agent
- 支持白名单/黑名单过滤
- 支持静默时间段设置
- Agent 可以读取通知内容并做出响应
比如:收到重要邮件时 Agent 自动摘要发给你;收到验证码时 Agent 自动提取并填写。
### ✅ Exec 审批
Agent 需要执行敏感操作时(比如运行系统命令、发送邮件),你可以在手机上直接审批:
- 实时弹出审批请求
- 一键批准或拒绝
- 不在电脑前也能掌控 Agent 的每一步操作
三、iOS vs Android 功能对比
| 功能 | iOS | Android |
|---|---|---|
| 语音对话(Talk Mode) | ✅ | ✅ |
| 聊天界面 | ✅ | ✅ |
| 摄像头拍照/录视频 | ✅ | ✅ |
| 定位服务 | ✅ | ✅ |
| Canvas 渲染 | ✅ | ✅ |
| 后台推送唤醒 | ✅(APNs) | ✅(前台服务) |
| 通知转发 | ❌ | ✅ |
| 通讯录访问 | ❌ | ✅ |
| 日历访问 | ❌ | ✅ |
| 短信搜索 | ❌ | ✅ |
| 通话记录搜索 | ❌ | ✅ |
| 计步器/运动传感器 | ❌ | ✅ |
| Google Assistant 入口 | ❌ | ✅ |
Android 在系统级数据访问方面更开放,iOS 则在隐私安全和推送可靠性上更有优势。两个平台的核心体验(语音、聊天、摄像头、定位、Canvas)完全对齐。
四、安装教程
### 前置条件
你需要一台运行 OpenClaw Gateway 的设备(Mac、Linux 或 Windows WSL2)。手机 App 是 Gateway 的伴侣节点,不独立运行。
如果还没安装 Gateway,参考官方安装指南:https://docs.openclaw.ai/start/getting-started
### Step 1:下载 App
iOS 用户:
- App Store 搜索「OpenClaw」
- 或直接访问:https://apps.apple.com/us/app/openclaw-ai-that-does-things/id6780396132
Android 用户:
- Google Play 搜索「OpenClaw」
- 或从源码编译:
./gradlew :app:assemblePlayDebug
### Step 2:确保 Gateway 正在运行
在 Gateway 设备上启动服务:
# 启动 Gateway(默认端口 18789)
openclaw gateway --port 18789
# 确认运行状态
openclaw gateway status
你会看到类似输出:
✓ Gateway is running
Port: 18789
URL: ws://192.168.1.100:18789
### Step 3:手机连接 Gateway
打开 App,进入连接设置页面,三种方式任选:
方式一:局域网自动发现(推荐)
确保手机和 Gateway 在同一 WiFi 下,App 会自动发现附近的 Gateway。点击选择即可。
方式二:Tailscale 远程连接
如果你在外网,可以通过 Tailscale 连接:
# 在 Gateway 端启用 Tailscale Serve
openclaw gateway --tailscale serve
然后在 App 中输入 Tailscale 提供的 wss:// 地址。
方式三:手动输入
在设置中开启「Manual Host」,输入 Gateway 的 IP 和端口:
Host: 192.168.1.100
Port: 18789
### Step 4:完成配对审批
首次连接时,Gateway 会收到配对请求。在 Gateway 设备上审批:
# 查看待审批的设备
openclaw devices list
# 批准配对
openclaw devices approve <requestId>
审批通过后,手机 App 显示「已连接」,所有功能即可使用。
💡 提示:如果你在受信任的家庭网络中,可以开启自动审批省去手动操作:
`json{
“gateway”: {
“nodes”: {
“pairing”: {
“autoApproveCidrs”: [“192.168.1.0/24”]
}
}
}
}
`
五、使用教程
### 启用语音对话
- 打开 App,进入 Settings
- 找到「Talk Mode」,开启开关
- 授权麦克风权限
- 在 Gateway 配置中设置 TTS 引擎(以 ElevenLabs 为例):
{
"talk": {
"provider": "elevenlabs",
"providers": {
"elevenlabs": {
"voiceId": "your_voice_id",
"modelId": "eleven_v3",
"apiKey": "your_api_key"
}
}
}
}
- 回到主界面,点击麦克风图标开始对话
### 聊天操作
- 点击底部的聊天输入框,直接发送消息
- 左滑切换不同的 Session(主会话、自定义会话)
- 点击右上角的时钟图标查看完整历史记录
- 支持发送图片、文件,Agent 可以直接分析
### 授权摄像头和定位
在 Settings 中逐个开启:
- Camera:授权后 Agent 可以调用
camera.snap拍照 - Location:授权后 Agent 可以获取你的 GPS 位置
- Notifications(Android):授权后可以转发设备通知
这些权限都是可选的,不开启不影响基础聊天和语音功能。
### Canvas 使用
Agent 生成的网页会自动在 Canvas 中渲染。你也可以手动控制:
# 在 Gateway 端控制手机 Canvas 导航
openclaw nodes invoke --node "iPhone" \
--command canvas.navigate \
--params '{"url":"http://gateway.local:18789/__openclaw__/canvas/"}'
# 截图查看效果
openclaw nodes invoke --node "iPhone" \
--command canvas.snapshot \
--params '{"format":"jpeg","maxWidth":900}'
六、实战示例
### 场景1:语音查天气
出门前,打开 Talk Mode 直接说:
「今天北京天气怎么样?需要带伞吗?」
AI 回复:「北京今天晴,最高温 35°C,不需要带伞。但紫外线较强,建议涂防晒。」
全程语音交互,不需要打字。
### 场景2:远程拍照分析
你在修理家电时不认识某个零件,打开聊天对 AI 说:
「帮我拍张照片看看这个零件是什么」
Agent 调用手机摄像头拍照,识别后回复:
「这是一个电容启动器,常见于空调压缩机电路板。型号是 CBB65,额定容量 45μF。建议联系售后更换同型号配件。」
对应的 Gateway 命令:
# Agent 在对话中自动执行
openclaw nodes invoke --node "iPhone" \
--command camera.snap \
--params '{"facing":"back","quality":85}'
### 场景3:基于位置推荐
在外面不知道吃什么时:
「帮我找找附近评分高的火锅店」
Agent 获取你的 GPS 位置,搜索附近餐厅:
# Agent 自动获取位置
openclaw nodes invoke --node "iPhone" \
--command location.get \
--params '{"desiredAccuracy":"precise"}'
然后返回:「你当前位置三公里内有 3 家高分火锅店:1. 海底捞(4.8分,800米)2. 巴奴毛肚火锅(4.7分,1.2公里)3. 铜锅涮肉(4.6分,2.5公里)」
### 场景4:审批 Agent 操作
Agent 在执行任务时需要运行一个系统命令,手机弹出审批通知:
🔒 Agent 请求执行:
命令: git push origin main
来源: project-deploy session
[批准] [拒绝]
你在外面的咖啡厅,点一下「批准」,Agent 继续执行。全程不需要回到电脑前。
七、与其他 OpenClaw 能力协同
手机 App 不是孤立的产品,它和 OpenClaw 生态深度整合:
- ClawHub 技能市场:在手机上使用社区发布的各种 Agent 技能
- MCP Server:手机端也能享受到 Model Context Protocol 带来的工具扩展
- 多渠道同步:手机聊天、飞书消息、Telegram 消息共享同一个 Agent,无缝切换
- Cron 定时任务:定时提醒直接推送到手机
- Sub-Agent 任务:Agent 后台执行的长任务完成后,结果推送到手机
八、总结
OpenClaw 手机 App 的发布,标志着这个项目从开发者工具进化为真正的「随身 AI 管家」。
核心价值:
- 随身携带:语音、拍照、定位,AI 的感知能力延伸到现实世界
- 随时掌控:审批操作、查看进度,不在电脑前也能管理 Agent
- 无缝协同:和桌面端、消息渠道完全同步,多端一致
相关链接:
- App Store:https://apps.apple.com/us/app/openclaw-ai-that-does-things/id6780396132
- 官网:https://openclaw.ai
- 文档:https://docs.openclaw.ai
- GitHub:https://github.com/openclaw/openclaw
*你的 AI 助手,终于可以跟你出门了。* 📱🤖
夜雨聆风