你周五晚上想去上海出差,顺手还想订酒店、叫车、找一家离客户公司近的餐厅。过去你要打开航旅 App、地图、酒店 App、点评 App,再来回比较价格、时间、位置,最后支付。
屏幕上看起来只是点了很多下,本质上是你在给一堆 App 分配机会。
如果 AI Agent 手机成熟了,流程可能变成一句话:帮我订明天上午到上海的票,酒店离客户公司近一点,晚饭找一家安静的餐厅。
然后 Agent 自己拆任务、看屏幕、调 App、填信息、比价格,在关键节点让你确认。
问题来了:如果手机替你完成了下一次点击,那这次点击到底算谁的?

真正的竞争不是谁的手机更像 AI 手机,而是谁能控制用户的下一次搜索、跳转、下单、支付和任务执行。
2026 年5 月12 日,Google 官方博客发布 Gemini Intelligence,称相关能力会在今年夏天进入最新 Samsung Galaxy 和 Pixel 手机,并展示了从用户日常习惯、屏幕内容和图片里理解上下文,进一步完成订餐、叫车等多步骤任务的方向。
这不是普通语音助手升级。它说明手机里的 AI 正在从“回答问题”往“接手流程”移动。以前它嘴上很忙,现在终于开始动手了。
国内,中兴通讯旗下 nubia 在 MWC Barcelona 2026 期间发布 nubia M153,官方介绍称它深度集成豆包 AI 助手,可以在系统层理解指令、跨应用执行任务,并把餐厅预订、比价购物、导航等场景作为例子。
这个案例的意义不在销量。更重要的是,它让行业看到:所谓 AI Agent 手机,不是手机里多装一个聊天 App,而是让模型开始触碰系统层操作。
技术变量在这里:GUI Agent、屏幕理解、多模态识别、跨 App 操作、工具调用、权限管理和端云协同。
普通语音助手像坐在你旁边给建议的人。GUI Agent 更像拿过鼠标替你操作的人。前者负责说,后者开始点。
这件事难在几个地方。
它要看懂屏幕上哪个是按钮,哪个是输入框;要知道一个任务拆成几步;要在 App 之间跳转;要记住当前状态;还要在出错时停下来,而不是一路自信地乱点。
所以 AI Agent 手机不是“AI 手机”的简单升级。
过去的 AI 手机,很多还是手机里加 AI 工具:修图、摘要、语音转文字、智能搜索。它们提升的是单点功能。
Agent 手机改变的是产品形态。AI 不再只是一个 App,而是系统里的代操作层。手机也不再只是 App 容器,而可能变成 Agent 执行终端。
这会重排移动互联网入口。
过去,入口是应用商店、桌面图标、搜索框和超级 App。用户先选择 App,再进入服务。
Agent 时代,用户先提出任务,再由 Agent 决定调用哪个 App、哪个服务、哪个商家。App 以前抢的是桌面位置,Agent 抢的是用户意图。
这也是手机厂商和模型厂商真正紧张的地方。
中间不只是技术合作,还有命名权、叙事权、用户入口、订阅收入和交易分发。过去手机厂商怕用户不换机,现在还要怕用户换了机,却记住了别人的名字。
商业上,下一次点击很值钱。
小米 2025 年年报显示,其互联网服务收入为人民币 374 亿元,其中广告收入为人民币 285 亿元,互联网服务毛利率为 76.5%。
这组数据翻译成人话就是:手机厂商不只靠卖手机赚钱,用户在手机里怎么点、看什么、去哪下载、买什么服务,本身就是一门大生意。
如果 Agent 接管了“下一步去哪”,手机厂商当然会紧张。
谁控制 Agent,谁就更接近用户意图;谁更接近用户意图,谁就更接近搜索、广告、下载、下单和支付。
受益的,可能是掌握强模型和 Agent 能力的模型厂商,也可能是能把 Agent 深度嵌入系统的手机厂商。还有一类受益者,是有账号、支付、地图、本地生活、内容和交易能力的平台。
被改变的,是只靠桌面入口、预装位置和 App 内广告位挣钱的玩家。以前你争的是用户点开你,现在你还要争 Agent 记不记得你。
普通人会怎么感知?
不是跑分更高,也不是发布会多讲一个 AI 名词,而是你少点了很多次屏幕。
订票、叫车、找客服、整理日程、跨 App 比价、填表、查物流,这些都是可能被 Agent 改写的动作。
但用户也会问几个很现实的问题:它会不会乱点?会不会乱买?会不会乱授权?它到底代表我,还是代表某个平台?
过去手机厂商争的是桌面入口,互联网公司争的是 App 入口。AI Agent 时代,大家争的是“替用户动手”的入口。
未来 1-3 年,可以看六个信号。
第一,更多手机厂商推出系统级 Agent,而不是单独 AI App。
第二,手机发布会从跑分、影像、续航,转向跨 App 任务执行能力。
第三,App 开始适配 Agent 调用,出现更多开放接口和权限管理。
第四,手机厂商和模型厂商围绕品牌命名、订阅收入、数据归属展开谈判。
第五,监管开始关注 Agent 自动操作、广告推荐、交易责任和用户授权。
第六,二线手机厂商更愿意与模型厂商深度绑定,头部厂商更强调自研 AIOS。
这个判断也可能错。
一个强反方观点是:AI Agent 手机可能只是短期概念。用户不一定愿意把手机操作交给 AI,App 生态和监管也未必允许 Agent 随意跨 App 操作。
2026 年5 月26 日,arXiv 上的 AndroidDaily 研究构建了 94 个真实高频 App、350 个日常任务来测试移动 GUI Agent,结果显示最强模型在任务成功率上也只有 62.0%。
这说明什么?手机里的 Agent 还不是老司机,很多时候更像刚拿驾照。权限、安全、误操作、状态管理和责任归属,都会限制它的速度。
但只要 Agent 能在 3-5 个高频场景里明显减少用户操作,它就会从炫技功能变成入口变量。
移动互联网很多入口变化,最初都不是替代全部,而是先替代一个高频动作。
如果你是普通用户,观察重点不是“它是不是 AI 手机”,而是:它能不能真正减少操作;能不能解释为什么这样操作;能不能让你保留确认权;会不会把你的选择变成平台的选择。
如果你是创业者或产品经理,观察重点是:你的服务能不能被 Agent 正确理解和调用;你的 App 会不会被 Agent 变成后台工具;你还能不能在用户决策链条里保留品牌存在感。
过去,手机里最重要的是那个你最常打开的 App。
夜雨聆风