
在电脑上还没把小龙虾折腾明白,首款手机小龙虾来了。3 月 6 号小米宣布 miclaw 开启小范围封测。
我就来“扒一扒”小米手机龙虾🦞miclaw
❝
Xiaomi miclaw能干嘛?
和电脑上的小龙虾有什么区别?
和豆包的 AI 手机有什么区别?
今天咱们说人话,从 miclaw 出发看看 AI 手机这事还有多远。

一、Xiaomi miclaw 能干嘛?
在说能干嘛之前,先说安全。
在电脑上小龙虾的“破坏力”大家多多少少都有所听闻,丝毫没影响大家使用的热情,但说白了,除开工作电脑,再怎么破坏对大家的影响还是可控的。大众更多的隐私、“机密”以及支付相关的内容其实都在手机上。那小龙虾上了手机还得了?
先给你一个定心丸。miclaw 是一款集成 openclaw 精神且相对安全可控的产品。小米在安全上还是下了一些功夫,后面会讲到。

官方的说法:Xiaomi miclaw 是一个基于小米 MiMo 大模型构建的 AI 交互测试产品,核心定位是验证大模型在小米"人车家全生态"中的系统级执行能力。
miclaw能够调用手机系统工具、应用能力以及小米生态设备,并根据你的模糊指令自动拆解任务、逐步执行。以下是官方给出的系统工具列表:

它目前在手机上能做的事情主要包括:
自动识别并处理短信和通知(比如购票短信自动加日历设闹钟) 跨应用执行复杂流程(如分析银行扣费短信发现重复订阅) 联动米家智能家居设备(根据日程自动调整家中环境) 记忆你的习惯和偏好(越用越懂你的需求) 以及在沙箱内运行 Python/JavaScript 代码解决需要编程能力的任务。
所有这些,都是在它以系统 UID 身份运行、拥有 50+ 系统级工具调用权限的基础上实现的。

权限这么大,为什么说它相对安全可控?
小米立了三个非常硬的规矩:
⚠️ "高敏操作"必弹窗:像发送短信、修改日程、删除文件等操作,miclaw 不可自动执行,一定会弹出确认框让用户确认。如果你 60 秒内没理它,它就默认不同意,自动拒绝执行。
⚠️ 物理隔离的隐私计算:所有的对话消息、语音音频、搜索关键词上传云端后都遵从隐私内容用完即弃原则,不会被持久保存,更不会被拿去训练模型(小米反复声明🐶)。
⚠️ “金钱”禁区:代码中压根没有任何支付、转账、下单相关工具。目前它一分钱都花不出去,需要你主动操作。不过未来,像千问买奶茶一样全链路打通肯定是会发生的,但前提是有一个过硬的安全策略/方案。
我从官方案例里挑了 2 个(其他案例我觉得没找好,很弱),看看它是怎么"真的做事"的:
官方案例一:起床毁灭
问题:明天早上7点叫醒我,起不来你就使劲折腾 回答:联动了小爱音箱,口令“我起床了”+开灯+播放摇滚音乐
官方案例二:理财雷达
问题:你能帮我关注一下现货行黄金的价格吗?每两分钟向我播报一次 回答:调用各种工具最终给出准确信息
❝官方的案例看完,说实话,“很一般”。一方面团队可能不想吹牛逼/展示期货,另一方面 miclaw 刚推出,生态还没来得及建起来。
但小米的生态能力,从软到硬,没话说。我相信再给点时间,“美好”肯定发生。
以小米的实力,合理畅想一下那些贴近日常、能真正改变我们生活方式的场景(近期真的能实现):
畅想场景一:通勤救星
早上 7:30,你还在洗漱。
miclaw 自动查看你的日程发现你 8:30 有早会 发现你昨晚睡得晚(通过小米手环监测睡眠) 而且今天会下雨,不适合骑车(天气 API)
它经过一番思索
先帮你把那个会改到了 10:00(是底层牛马 就帮你请个假) 然后主动建议你: "今天路况可能不太好,我帮你叫个车吧?" 确认后,它直接帮你打车,根据“记忆”直接写好起点、终点、选好车型。 你只需要确认支付,拿钥匙出门,从从容容(本来是连滚带爬)。
畅想场景二:紧急救场
周五晚上 11 点,你正在和朋友聚会,突然收到微信,老板:“周一汇报下最近的工作”。
直接 emo,周末可能都在焦虑中度过。但 如果有 miclaw:
它先看看你的 PPT 风格(文件系统访问权限、甚至在工作群里 PPT 往来记录中读取) 再搜索一下你最近工作的内容(日常发的日报、周报、工作文档、和 ai 的沟通信息等) 然后自动生成一个初稿,保存在你的云端文档里,并告诉你: "我帮你草拟了 PPT 初稿,周末找个时间稍微改改就能用。安心聚会吧!" (对,他可能真的知道你在聚会,也应该知道) 周末修改确认后,它还会提醒你老板周一上午 9 点有空闲段,可以帮你提前预约好汇报时间。
畅想场景三:减肥“督导”
你最近一直在说减肥,但总是忍不住夜宵。😋
结合你的体重目标和运动数据(健康 App ),miclaw 不仅仅是提醒你"该运动了" 而是真的在帮你分析:你近一个月的外卖订单(美团外卖API ),发现你最喜欢麻辣小龙虾和炸鸡。 在晚上 10 点你要下单前,主动弹出一个替代建议:"我知道你今天特别想吃小龙虾,但考虑到你的减肥进度和今天已经摄入的热量,要不我帮你点一份轻食沙拉?或者,你愿意明天多跑 3 公里来抵消这顿夜宵的热量?" 选择沙拉的话,它直接调用美团 API 下单;选择跑步的话,它自动设置好明早 6:30 的跑步提醒。

❝所有这些,miclaw 都在后台“静默”完成,你的手机界面上不需要打开任何一个 App,也不需要等待界面加载和跳转(参考千问点奶茶的体验)。这就是它"不得了"的地方:
手机上的“小龙虾”可以掌握最隐私、最琐碎的数据,且让枯燥的操作环节消失。
它可以帮你搞定生活里的琐事,而且是主动的、跨场景的、真正懂你的。
二、和电脑上的小龙虾有什么区别?
miclaw 可以通过 MCP 和 SDK 的方式扩展能力,官方帖子中对于开放协议扩展的描述如下。
生态不止于小米自有设备。两个开放通道让第三方也能接进来: MCP(Model Context Protocol):AI 工具集成的开放标准。Xiaomi miclaw 实现了完整的 MCP 客户端,支持标准化通信协议、流式响应和异步服务发现。PC 上已有的数千个 MCP 工具,理论上可以直接接入手机 AI。
开放 SDK:Xiaomi miclaw 发布了第三方应用接入 SDK,通过签名级权限保护确保安全。第三方 App 主动声明自己能提供的工具能力,Xiaomi miclaw 动态发现和调用。适配关系反过来了:App 主动告诉 AI "我能做什么",AI 按需调用。
这里的“开放 SDK”我认为是最大的亮点,对标甚至超越openclaw 的skills。这也是和电脑上龙虾不同的根源之一。
1. 手机上的龙虾“真”的更懂你

手机才是你的"第二大脑"
miclaw 做好事情的前提是需要最好的"记忆",巧了,它出生就在“罗马” - 你的手机。
OpenClaw,确实部署在你的电脑上,它能访问你电脑里的文件,但那里有多少真正关于你的记忆?你把照片、聊天记录、消费记录、位置信息、健康数据,这些最私密的、最构成"你"的数据,都存在哪里?
反正我的工作电脑里面只有工作,我的私人电脑里只有“娱乐”。都是不完整的。
PC 上的龙虾,再聪明,它也"不够懂你",因为它接触不到你的核心数据。
而 miclaw,它是长在你的手机上的。

miclaw 它能读取你的相册、短信、通话记录、位置信息、健康数据、消费记录……这些数据才是真正构成"你"的东西。
miclaw 记住的不是冷冰冰的参数,而是你的人生轨迹。
它知道你最爱的烧烤店,因为位置数据显示你过去三个月每个周五 7 点都出现在那里;
它知道你喜欢中辣、少葱、多蒜,因为你过去一年的外卖订单里 85% 都这么备注;
它知道你最近在减肥,因为你最近两周的运动量增加了 30%,外卖订单从"炸鸡"变成了"沙拉";
它知道你夜深的时候最想家,因为你经常在晚上 11 点后给父母打电话。
这些记忆,PC 上的 Claw 无法获取,但 miclaw 可以。这才是真正的"懂你"
2. 最强手脚 - 从 App 森林到能力池

正如 miclaw 团队自己所说:App 主动告诉 AI "我能做什么",AI 按需调用。
❝想象一下,当手机 App 真的开始开始适配 miclaw 的开放 SDK 提供能力接口时,miclaw 的"记忆"将无限延展!做事的能力也会非常非常强。
如果一个聊天 App(微信不可能,但总有“头铁”的) 提供了一个能力接口,它可以声明自己能提供"读取聊天记录"、"分析聊天习惯"、"提取关键信息"的能力。miclaw 在获得你授权后,可以通过这个接口读取你的聊天数据,然后分析出你的社交网络、常聊话题、情感状态等。
如果你的电商 App(淘宝、京东够呛,小米商城未来可期🤪)也提供了能力接口,它可以声明自己能提供"读取购物历史"、"分析消费习惯"、"推荐商品"的能力。miclaw 可以通过这个接口分析你的消费偏好,预测你未来的需求(家里纸快用完了...要不要我帮你买一点)。
如果你的理财 App 也提供了能力接口,它可以声明自己能提供"读取账单"、"分析收支情况"、"理财建议"的能力。miclaw 可以通过这个接口为你做个性化的财务规划。

这些记忆数据,以前是分散在各个 App 的孤岛里的,AI 无法触达。但现在,通过适配开放SDK,面向 AI 提供能力,这些数据可以被 miclaw 访问和分析,这才是"颠覆级"的突破。
miclaw(代指手机上的“小龙虾”) 的"记忆"将不再局限于手机本地文件,而是延伸到整个数字世界,但它依然是在你的授权和控制下进行的。
这里引申出另外一个话题,以 miclaw 看未来:

手机 App 形态的根本性变革大概率即将发生。
未来的 App 可能会拥有完全不同的“两张面孔”:
A 面:人类交互界面(UI)。 极简、重结果呈现。屏幕不再是让你枯燥的“点点点”的地方,而是让你审批关键决定,以及呈现 AI 帮你办完事后的那个“必要结果”。
B 面:AI 能力调用接口(API)。 这是为 AI 准备的。App 不再是封闭的孤岛,而是主动声明自己能提供什么能力(如:下单、退订、搜索)。有的同学可能就要发问了,这些 app 为什么要提供能力?这些巨头愿意自己打开护城河吗?时代发展如此,开放也许继续霸业千秋,不开放就等着被拍死在沙滩上吧。

未来“攻守之势异也”:
以前是系统求 App 开门,以后是 App 排队向系统 AI 报到。
当你想办一件事,AI 动态调用不同 App 的能力,像搭积木一样串联起任务。屏幕存在的意义,就是为了让你点一下确认。🙂
三、和豆包的 AI 手机有什么区别?
大家是否还记得 去年 12 月,豆包发布 AI 手机的一时风头无两?
但在我看来,两者完全不是一个量级的尝试。
从“外挂模拟”到“原生革新”
这个量级,是指对后续业态的影响,而不是投入资源。
我们需要理清两种技术路线的本质差异。豆包 AI 手机和 Xiaomi miclaw,代表了两种完全不同的手机 AI 助手(哲学)。
豆包 AI 手机 - “外挂”逻辑粗糙且低效

豆包 AI 手机本质上是靠模拟人眼(高频截屏)和模拟人手(点击注入)来操作手机。
这种方式极其笨拙,一个简单的比价任务可能要执行好几分钟,期间你看着手机屏幕像被“夺舍”一样乱跳,不仅慢,甚至还占用你的手机,它操作时,你什么都干不了。
抛开手机被“鬼上身”的感受,似乎比人快,但这个效率在真实场景是不可接受的。问题出在它要占据你的手机,而不是自己在后台悄悄处理。
豆包 AI 手机发布视频里的案例,比价花了 3 分 12 秒


如果上面这个案例,你觉得还可以接受,那下面这个,真的当时把我看呆了。盯着屏幕足足等了 8 分钟!真实使用的时候,谁有这个耐心。🥲如果中途老板给你发了一条消息,你看不看?看了,前面的时间可能就白等了。

豆包 AI 手机它需要识别界面元素(按钮、输入框、菜单)、判断点击位置、等待界面跳转、继续识别新界面……这个过程就像一个笨拙的外科医生,戴着厚厚的手套在显微镜下做手术。
为什么说这种方式"很蠢"、效率低下?
一个简单命令可能就要执行好几分钟,而且执行过程中手机被完全"占用"。因为屏幕上正有一个 AI 在"啪嗒啪嗒"地点来点去。
你让它帮你订一张票,它需要:打开 App → 等待加载 → 点击搜索框 → 输入目的地 → 选择日期 → 点击搜索 → 等待结果 → 选择车次 → 点击预订 → 填写信息 → 支付……整个过程串行执行,而且中间任何一步出错,或者被打断,就需要重新开始。
为什么说安全隐私问题尤其突出?
这是最致命的问题。豆包 AI 手机要实现屏幕点击模拟,就必须全程录制手机屏幕,让 AI 能够"看到"界面。但你想想:你的屏幕上会显示什么?你的聊天记录、银行账号、密码、身份证号、支付二维码……这些敏感信息,AI 全都能看到。厂商会说"我们做了安全处理",但本质上的风险是无法完全消除的——你无法保证 AI 不会"记住"这些信息,也无法保证这些数据不会在云端被分析或泄露。
为什么会被各厂商抵制?
这不是简单的商业竞争,而是安全和用户环境的必然考量。如果每个 AI 助手都能通过屏幕录制获取你的敏感信息,那么各种灰产、黑产就会趁虚而入:自动抢券、自动刷单、自动薅羊毛……这些行为会严重破坏平台的正常运营秩序。所以,各大 App 厂商必然会通过技术手段检测并阻断这种"模拟点击"行为,保护用户和平台的生态安全。
这种全权限的录屏&模拟操作如果被滥用,简直是灰产、黑产的温床。
从这个角度看,豆包 AI 手机这种"粗糙"、"低效"的尝试,注定是一条死路。它试图在旧框架内解决问题,但框架本身就成了瓶颈。
Xiaomi miclaw 的革新 - 原生且高效

豆包 AI 手机走"模拟屏幕点击"的路线,本质上是对传统交互方式的"修补"。而 miclaw 走的是"协议调用"的路线,是对传统交互方式的"重构"。
miclaw 它不录屏,而是通过协议直接与 App 进行“脑电波通信”。 这不仅极大的提高了效率,更在底层建立了一套三级权限防线:
低敏直接干。ALWAYS_ALLOW:低敏感行为(查天气、查时间等)直接执行。 中敏首次确认。ASK_FIRST_TIME:中敏感行为(如获取位置、读取日程等)首次执行需确认。 高敏每次必弹窗,60 秒不理它就自动拒绝。ASK_EVERY_TIME:高敏感行为(如发送短信、创建日程等)每次都弹确认框。
核心差异:从"模拟人"到"超越人"。
Xiaomi miclaw 代表了新一代思路:让 AI 调用底层能力。它不模拟屏幕点击,而是直接通过标准协议调用 App 的能力接口。
你让它帮你订一张票,它只需要:理解你的需求 → 调用订票 App 的 API → 传入目的地、日期、车次参数 → 返回确认信息。整个过程可能只需要 1-3 秒,而且完全不依赖界面识别。
效率对比,是数量级的差距。
手机不再是一个个孤立的图标孤岛,而是一个由 AI 统一调动的能力池。当手机不再是 App 的集合,而是能力的集合时,我们的生活会有怎样的改变?这才是关系到我们每个人的未来。
四、新人换旧人,但都是真爱,值得鼓励与期待

“损”了豆包 AI 手机很多,但,我内心其实是尊重、赞赏豆包 AI 手机团队的,在那个时间点,有那样的思考和尝试并且是落地的尝试,是非常厉害的。
只是,当前,面对当红炸子鸡 - 各种龙虾、claw,豆包 AI 手机似乎都成了“古董”。2~3 个月,已换了人间,这就是 AI 时代的变化速度...
miclaw 还处于早期封测阶段,仅支持小米 17 系列机型,普通用户真正用上还需要一些时间。但是,很快就会有 华为 claw、vivo claw...
对于我们普通用户来说,最好的态度或许是:保持关注,观察这只"手机小龙虾"是如何一步步爬进每个人的口袋。
但更重要的是,你要开始思考:当手机不再是 App 的集合,而是能力的集合时,一系列连锁反应,对你的工作生活有何影响?
欢迎添加微信 - 与臭味相投的人,一起顺势而为。

夜雨聆风