乐于分享
好东西不私藏

OpenClaw 发布原生手机App:让你的AI助手真正随身可用

OpenClaw 发布原生手机App:让你的AI助手真正随身可用

如果你一直在用 OpenClaw,或者关注 AI Agent 领域,这个消息值得注意:

OpenClaw 正式上线 iOS 和 Android 平台。

这意味着什么?你的 AI 助手不再被「绑」在电脑前。它可以跟着你出门、在车里、在咖啡厅——随时待命。语音对话、拍照、定位、审批 Agent 操作,全部通过手机完成。

本文带你完整了解 App 的核心功能、安装配置和实战用法。


一、为什么需要手机 App

OpenClaw 之前的能力已经很强大:跑在服务器或电脑上的 Gateway,通过飞书、Telegram、Discord 等消息渠道跟用户交互,能读写文件、执行命令、搜索网页、控制浏览器。

但有一个短板始终存在:你不在电脑前时,很多能力用不上。

想出门时用语音跟 AI 聊几句?不行。想让 AI 通过摄像头看看周围环境?不行。想让 AI 知道你的位置推荐附近餐厅?不行。

手机 App 就是来补上这块拼图的。它把手机变成了 AI Agent 的「身体」——有眼睛(摄像头)、有耳朵(麦克风)、知道你在哪(GPS),还能随时用语音对话。


二、核心功能一览

### 🎙️ 实时语音对话(Talk Mode)

这是手机 App 最核心的体验。打开 Talk Mode,就像跟 AI 打电话:

  • 持续监听:你说完一句,AI 回答,然后继续等你说话
  • 自动断句:停顿即发送,不需要手动按按钮
  • 语音回复:通过 TTS 引擎自然语言播报,支持多种音色
  • 打断机制:AI 正在说话时你开口,它会自动停下来听你说

Talk Mode 支持配置 ElevenLabs、OpenAI TTS 等主流语音合成引擎,音质自然,延迟低。

适用场景:开车时查信息、做饭时问菜谱、散步时讨论问题。

### 💬 聊天界面

完整的聊天体验,和桌面端无缝同步:

  • 多 Session 切换:主会话、自定义会话随意切换
  • 历史记录同步:手机上能看到完整的聊天历史
  • 实时消息推送:Agent 执行完任务后主动通知你
  • 富文本支持:代码块、图片、链接都能正常显示

### 📷 摄像头调用

Agent 可以远程调用手机摄像头:

  • 拍照camera.snap——拍一张照片
  • 录视频camera.clip——录制短视频片段

场景举例:你在外面看到一台设备不知道怎么用,让 AI 拍张照片分析一下说明书;或者让 AI 定时拍一张窗外的照片记录天气变化。

### 📍 定位服务

Agent 可以获取你的 GPS 位置(需授权):

  • 精度可选:精确定位 / 大致位置
  • 场景:「我在哪附近有什么好吃的?」「帮我导航到最近的充电站」
  • 注意:出于隐私保护,App 仅在前台时共享位置

### 🖥️ Canvas 渲染

手机上展示 Agent 生成的网页和交互式 UI:

  • Agent 生成的 HTML/CSS/JS 可以直接在 App 内渲染
  • 支持实时更新:Agent 改了代码,手机端自动刷新
  • 数据可视化、表格、交互组件都能正常展示

### 🔔 通知转发(Android)

Android 版额外支持设备通知转发:

  • 指定 App 的通知自动转发给 Agent
  • 支持白名单/黑名单过滤
  • 支持静默时间段设置
  • Agent 可以读取通知内容并做出响应

比如:收到重要邮件时 Agent 自动摘要发给你;收到验证码时 Agent 自动提取并填写。

### ✅ Exec 审批

Agent 需要执行敏感操作时(比如运行系统命令、发送邮件),你可以在手机上直接审批:

  • 实时弹出审批请求
  • 一键批准或拒绝
  • 不在电脑前也能掌控 Agent 的每一步操作

三、iOS vs Android 功能对比

功能 iOS Android
语音对话(Talk Mode)
聊天界面
摄像头拍照/录视频
定位服务
Canvas 渲染
后台推送唤醒 ✅(APNs) ✅(前台服务)
通知转发
通讯录访问
日历访问
短信搜索
通话记录搜索
计步器/运动传感器
Google Assistant 入口

Android 在系统级数据访问方面更开放,iOS 则在隐私安全和推送可靠性上更有优势。两个平台的核心体验(语音、聊天、摄像头、定位、Canvas)完全对齐。


四、安装教程

### 前置条件

你需要一台运行 OpenClaw Gateway 的设备(Mac、Linux 或 Windows WSL2)。手机 App 是 Gateway 的伴侣节点,不独立运行。

如果还没安装 Gateway,参考官方安装指南:https://docs.openclaw.ai/start/getting-started

### Step 1:下载 App

iOS 用户:

  • App Store 搜索「OpenClaw」
  • 或直接访问:https://apps.apple.com/us/app/openclaw-ai-that-does-things/id6780396132

Android 用户:

  • Google Play 搜索「OpenClaw」
  • 或从源码编译:./gradlew :app:assemblePlayDebug

### Step 2:确保 Gateway 正在运行

在 Gateway 设备上启动服务:

# 启动 Gateway(默认端口 18789)
openclaw gateway --port 18789

# 确认运行状态
openclaw gateway status

你会看到类似输出:

✓ Gateway is running
  Port: 18789
  URL: ws://192.168.1.100:18789

### Step 3:手机连接 Gateway

打开 App,进入连接设置页面,三种方式任选:

方式一:局域网自动发现(推荐)

确保手机和 Gateway 在同一 WiFi 下,App 会自动发现附近的 Gateway。点击选择即可。

方式二:Tailscale 远程连接

如果你在外网,可以通过 Tailscale 连接:

# 在 Gateway 端启用 Tailscale Serve
openclaw gateway --tailscale serve

然后在 App 中输入 Tailscale 提供的 wss:// 地址。

方式三:手动输入

在设置中开启「Manual Host」,输入 Gateway 的 IP 和端口:

Host: 192.168.1.100
Port: 18789

### Step 4:完成配对审批

首次连接时,Gateway 会收到配对请求。在 Gateway 设备上审批:

# 查看待审批的设备
openclaw devices list

# 批准配对
openclaw devices approve <requestId>

审批通过后,手机 App 显示「已连接」,所有功能即可使用。

💡 提示:如果你在受信任的家庭网络中,可以开启自动审批省去手动操作:

`json

{

“gateway”: {

“nodes”: {

“pairing”: {

“autoApproveCidrs”: [“192.168.1.0/24”]

}

}

}

}

`


五、使用教程

### 启用语音对话

  1. 打开 App,进入 Settings
  2. 找到「Talk Mode」,开启开关
  3. 授权麦克风权限
  4. 在 Gateway 配置中设置 TTS 引擎(以 ElevenLabs 为例):
{
  "talk": {
    "provider": "elevenlabs",
    "providers": {
      "elevenlabs": {
        "voiceId": "your_voice_id",
        "modelId": "eleven_v3",
        "apiKey": "your_api_key"
      }
    }
  }
}
  1. 回到主界面,点击麦克风图标开始对话

### 聊天操作

  • 点击底部的聊天输入框,直接发送消息
  • 左滑切换不同的 Session(主会话、自定义会话)
  • 点击右上角的时钟图标查看完整历史记录
  • 支持发送图片、文件,Agent 可以直接分析

### 授权摄像头和定位

在 Settings 中逐个开启:

  • Camera:授权后 Agent 可以调用 camera.snap 拍照
  • Location:授权后 Agent 可以获取你的 GPS 位置
  • Notifications(Android):授权后可以转发设备通知

这些权限都是可选的,不开启不影响基础聊天和语音功能。

### Canvas 使用

Agent 生成的网页会自动在 Canvas 中渲染。你也可以手动控制:

# 在 Gateway 端控制手机 Canvas 导航
openclaw nodes invoke --node "iPhone" \
  --command canvas.navigate \
  --params '{"url":"http://gateway.local:18789/__openclaw__/canvas/"}'

# 截图查看效果
openclaw nodes invoke --node "iPhone" \
  --command canvas.snapshot \
  --params '{"format":"jpeg","maxWidth":900}'

六、实战示例

### 场景1:语音查天气

出门前,打开 Talk Mode 直接说:

「今天北京天气怎么样?需要带伞吗?」

AI 回复:「北京今天晴,最高温 35°C,不需要带伞。但紫外线较强,建议涂防晒。」

全程语音交互,不需要打字。

### 场景2:远程拍照分析

你在修理家电时不认识某个零件,打开聊天对 AI 说:

「帮我拍张照片看看这个零件是什么」

Agent 调用手机摄像头拍照,识别后回复:

「这是一个电容启动器,常见于空调压缩机电路板。型号是 CBB65,额定容量 45μF。建议联系售后更换同型号配件。」

对应的 Gateway 命令:

# Agent 在对话中自动执行
openclaw nodes invoke --node "iPhone" \
  --command camera.snap \
  --params '{"facing":"back","quality":85}'

### 场景3:基于位置推荐

在外面不知道吃什么时:

「帮我找找附近评分高的火锅店」

Agent 获取你的 GPS 位置,搜索附近餐厅:

# Agent 自动获取位置
openclaw nodes invoke --node "iPhone" \
  --command location.get \
  --params '{"desiredAccuracy":"precise"}'

然后返回:「你当前位置三公里内有 3 家高分火锅店:1. 海底捞(4.8分,800米)2. 巴奴毛肚火锅(4.7分,1.2公里)3. 铜锅涮肉(4.6分,2.5公里)」

### 场景4:审批 Agent 操作

Agent 在执行任务时需要运行一个系统命令,手机弹出审批通知:

🔒 Agent 请求执行:
   命令: git push origin main
   来源: project-deploy session
   
   [批准]  [拒绝]

你在外面的咖啡厅,点一下「批准」,Agent 继续执行。全程不需要回到电脑前。


七、与其他 OpenClaw 能力协同

手机 App 不是孤立的产品,它和 OpenClaw 生态深度整合:

  • ClawHub 技能市场:在手机上使用社区发布的各种 Agent 技能
  • MCP Server:手机端也能享受到 Model Context Protocol 带来的工具扩展
  • 多渠道同步:手机聊天、飞书消息、Telegram 消息共享同一个 Agent,无缝切换
  • Cron 定时任务:定时提醒直接推送到手机
  • Sub-Agent 任务:Agent 后台执行的长任务完成后,结果推送到手机

八、总结

OpenClaw 手机 App 的发布,标志着这个项目从开发者工具进化为真正的「随身 AI 管家」。

核心价值:

  • 随身携带:语音、拍照、定位,AI 的感知能力延伸到现实世界
  • 随时掌控:审批操作、查看进度,不在电脑前也能管理 Agent
  • 无缝协同:和桌面端、消息渠道完全同步,多端一致

相关链接:

  • App Store:https://apps.apple.com/us/app/openclaw-ai-that-does-things/id6780396132
  • 官网:https://openclaw.ai
  • 文档:https://docs.openclaw.ai
  • GitHub:https://github.com/openclaw/openclaw

*你的 AI 助手,终于可以跟你出门了。* 📱🤖