第十章:AI手机的产品困境——谁来控制这台手机?

一、一个发布会，定义了一个新品类

2024年1月，三星在美国圣何塞召开了Galaxy S24系列发布会。

发布会的主角，不是摄像头，不是屏幕，不是续航——是AI。

三星给这套AI功能起了一个名字：Galaxy AI。圈搜索、实时通话翻译、AI壁纸生成、照片编辑AI修复……每一个功能背后，都有谷歌Gemini的影子。

台下的媒体记者们这样描述那一天的气氛：这是手机行业第一次，一场发布会的核心词不是"拍照""性能""续航"，而是"AI"。

但仔细看Galaxy AI的功能清单，它做的事情本质上还是辅助——帮你修图，帮你翻译，帮你生成壁纸。AI在展示能力，你还是那个操控手机的人。

Galaxy S24定义了"AI手机"这个品类概念，是一次认知革命。

但真正的能力革命，发生在将近一年十个月后的中国。

二、豆包首创：AI第一次真正"动手"

2025年10月，字节跳动与中兴努比亚联合推出豆包AI手机（努比亚M153），搭载豆包大模型。

这款手机推出了一个让同行集体沉默的功能：AI Agent跨App操控。

你只需要说一句话——"帮我在美团上订一份午饭，选评分最高的那家"——豆包会自己打开美团，自己搜索，自己筛选，自己下单，完成整个操作流程。

这不是语音助手，不是聊天机器人。

这是AI第一次真正意义上替你操控手机。

从"AI辅助"到"AI代理"，是一次本质的跨越——不是把AI功能做得更多，而是把AI的角色从工具变成了代理人。Galaxy S24是AI手机品类的定义者，豆包手机是AI手机能力的跃迁者。两件事都是第一，但是两个完全不同维度的第一。

与此同时，智谱AI推出了GLM框架的手机端部署方案，走了另一条技术路径：通过更轻量的端侧模型，让AI在手机本地完成任务规划和执行，减少对云端的依赖，在隐私保护和响应速度上做出了差异化。

这是中国 AI 企业在手机端 Agent 能力上，首次在实际产品化层面领先全球的标志性时刻。

2026年初，三星联合谷歌发布了Galaxy S26，Gemini正式支持直接操控第三方应用程序。海外媒体把这个功能描述为"革命性的"——但在中国用户看来，这不过是豆包几个月前就做过的事。

三、权限战争：一场没有硝烟的博弈

但豆包的故事，没有就此圆满。

野路子的代价：

豆包实现跨App操控的技术方案，是无障碍权限（Accessibility API）。

这个权限原本是为视障用户设计的——让辅助软件能够读取和模拟操控屏幕上的内容。它的副作用是：拥有这个权限的应用，几乎可以做任何事——读取屏幕内容、模拟点击、输入文字，甚至绕过部分安全检测。

豆包靠着这把万能钥匙，获得了控制手机上几乎所有应用的能力。功能演示震惊四座，整个行业都在研究这个方向。

但很快，反制开始了。

美团、支付宝、微信——这些超级App的风控系统，开始识别并拦截通过无障碍权限发起的自动化操作。它们的逻辑很简单：一个通过无障碍权限在操控我的应用的程序，和一个恶意软件没有什么区别。

豆包帮你点外卖的功能，开始时不时失效——下单流程走到一半，被平台识别为异常操作，直接中断。曾经流畅的演示场景，变成了时好时坏的玄学体验。

豆包手机的Agent能力，就这样在上线后遭到了实质性的阉割。不是字节主动缩减，而是被各大平台的风控系统逼退的。

智谱的GLM框架同样面临类似处境。端侧模型的轻量化路线在隐私和速度上有优势，但一旦涉及跨App操控，同样绕不开权限这道墙。技术路径不同，但面对的生态博弈是一样的。

阿里千问走了类似无障碍权限的路，但做了一个聪明的变通：在自己的生态内（淘宝、饿了么、高德）提前打通了官方接口。千问的"点外卖、订酒店、查快递"功能，在阿里系应用里跑得相当顺畅——因为那是自家地盘，不存在风控博弈。

这揭示了无障碍权限路线的本质局限：它是一条野路，能跑，但跑不远，跑不稳。出了自家生态，处处是墙。

正规军的选择：

三星和谷歌看到了豆包的前车之鉴，选择了一条截然不同的路。

Galaxy S26的Gemini在推出App控制能力之前，谷歌做了一件中国厂商没有做的事：提前和主流App厂商谈判，建立官方接口。

类似苹果的App Intents框架，谷歌推动各大应用开发商主动开放标准化的"AI可调用接口"——不是绕过App的防线，而是让App主动开门迎接AI。Uber、DoorDash、Spotify……这些应用按照谷歌的标准，把自己的核心功能封装成AI可以安全调用的接口。

结果是：Gemini帮你叫车、点餐、播放音乐，每一步都走在App厂商划定的合规通道里，没有风控拦截，没有功能阉割，运行稳定。

但这条路有它的代价：速度慢，覆盖有限。和App厂商一家家谈判、等待对方适配、建立信任——这个过程需要时间和生态影响力。谷歌能推动DoorDash开放接口，但它很难推动中国的美团；三星能在美国市场建立这套生态，但它的生态影响力在中国相当有限。

这也解释了为什么Galaxy S26的能力在中国用户看来"不如豆包"——不是Gemini不强，而是它的正规军打法在中国生态里根本没有足够的谈判筹码。

正规军的路线更稳，但也更慢，覆盖面受限于自身的生态边界。

小米的第三条路：

2026年3月，小米悄悄给出了第三个答案：Mi Claw（澎湃OS系统级能力）。

Mi Claw集成于澎湃OS底层，不走无障碍权限，也不需要和第三方App逐一谈判——它直接以系统权限运行，调用的是操作系统的原生接口。

在小米自己的生态内，这套方案几乎无懈可击：整理短信生成表格、调取米家摄像头截屏、控制智能家居设备——所有操作流畅、稳定，没有被风控拦截的风险。从试用反馈看，Mi Claw完成这些生态内任务的体验，是目前所有方案里最顺滑的。

但边界同样清晰：出了小米生态，Mi Claw就变成了普通助手。让它帮你在美团点外卖、在微信发消息——它要么做不到，要么绕回无障碍权限的老路。

系统级集成的能力边界，就是操作系统生态的边界。

这场博弈的本质：

把这三条路并排放在一起，它们在回答同一个问题：

AI要代替你操控手机，它的合法性从哪里来？

豆包选择了"强行闯入"——万能钥匙，强大但被封堵。

千问选择了"在自家地盘开绿灯"——生态内顺畅，出了生态寸步难行。

三星×谷歌选择了"敲门进入"——官方通道，稳定但慢，覆盖受限。

小米选择了"在自己家里不需要钥匙"——系统级集成，生态内无摩擦，出了生态就是普通助手。

没有哪条路是完美的。这场权限战争还在进行，胜负未定。

但有一件事越来越清晰：下一代真正意义上的AI手机，一定需要一套被所有应用厂商认可的、标准化的AI调用接口——就像当年移动互联网需要一套标准的浏览器内核一样。在这套标准建立之前，每一条路都是临时方案，每一个方案都有它的天花板。

谁来定这套标准？苹果、谷歌、还是某个意想不到的玩家？这个问题的答案，将决定下一代AI手机战争的最终格局。

四、大模型厂商的渠道战

豆包手机的出现，开创了一种全新的商业模式：大模型厂商×手机厂商的深度合作范式。

这场战争里的玩家，各有算盘：

字节不造手机，但它把豆包的能力渗透进合作厂商的手机里。这不是简单的功能合作，而是一场渠道争夺——谁的大模型住进了最多用户的手机，谁就拥有了最直接的用户触达能力和数据积累。

字节豆包率先跑通了"大模型+手机厂商"的合作模式，努比亚豆包手机是第一个成熟案例，后续陆续扩展到更多机型。豆包的野心从来不只是一个AI助手，而是通过手机入口，成为用户生活的AI代理人。

阿里千问把这套逻辑延伸进了整个阿里生态——手机上的千问，和AI眼镜上的千问，和淘宝、饿了么、高德协同，构建一个"AI办事"的闭环。千问的差异化不是模型最强，而是生态最深。

智谱GLM走的是更技术向的路线，通过端侧轻量化模型和手机厂商合作，让GLM的多模态能力在本地就能运行，打隐私和速度的差异化牌，吸引对数据安全敏感的企业和专业用户。

这场渠道战的本质，是大模型时代的分发权之争——在PC时代，分发权在浏览器和搜索引擎手里；在移动时代，分发权在App Store和微信手里；在AI时代，谁成为手机里的默认AI代理，谁就拿到了下一个时代最重要的分发入口。

五、苹果的迟到与尴尬

2024年6月，苹果在WWDC上发布了Apple Intelligence，宣布Siri将迎来史上最大的升级——理解上下文、执行跨应用任务、生成图像和文本。

台下掌声雷动，苹果股价当天上涨。

然后，问题来了。

Apple Intelligence仅限于英语地区，仅限于iPhone 15 Pro及以上机型。中国市场，不在第一批支持范围内。

当华为、小米、vivo、OPPO的旗舰手机都在大力宣传AI功能，苹果的中国版iPhone却只有一个朴素的Siri。这个缺席，对苹果在中国的竞争力造成了实质性影响。

但苹果在系统级AI架构上的选择，随着时间推移反而变得越来越有说服力——私有云计算（Private Cloud Compute）确保用户数据不离开苹果的受信环境，App Intents框架让第三方开发者可以把应用功能主动暴露给Siri，从根本上避免了无障碍权限的野路子问题。

苹果的路是最慢的，架构是最正确的，但在中国市场缺席的这两年，它失去的份额，未必能靠架构优势找回来。

六、华为与荣耀：两条分叉的路

华为和荣耀，曾经是同一家公司的两个品牌，如今走上了截然不同的AI手机路线。

华为的AI手机战略深度绑定鸿蒙生态和盘古大模型。麒麟芯片、鸿蒙系统、盘古大模型三者协同，端侧AI能力在国产手机里处于第一梯队。小艺助手在2024—2025年经历了大幅升级，能够理解复杂指令、调用系统功能、在鸿蒙生态内完成跨设备任务。但鸿蒙生态的封闭性，决定了这些能力主要在华为自己的设备生态里发挥——出了华为，就是另一个世界。

荣耀在与华为分家后选择了更开放的路线。Magic OS配合MagicLM，HONOR AI Agent可以跨应用完成任务，在第三方应用兼容性上投入了更多精力。2025年推出的AI通话摘要、AI会议记录、跨应用智能搜索，在商务用户群体中获得了相当高的认可度。荣耀走的是"用AI提升效率"的务实路线，不追求最炫的Agent能力，而追求最稳定的日常使用体验。

两条路，各有受众：华为的重度生态用户，和荣耀的商务效率用户。

七、OPPO、vivo、一加：各自押注

同出步步高体系但完全独立运营的OPPO和vivo，OPPO的AI布局以ColorOS和AndesGPT为核心。AndesGPT支持70亿参数端侧部署，在Find X7系列上实现了本地运行的AI功能。OPPO的差异化在摄影AI——与哈苏的合作让计算摄影在色彩科学上有独特优势，AI介入摄影的方式更偏向"让照片更美"而不是"帮你做任务"。

vivo坚持自研AI大模型与系统级AI能力，并未与字节豆包进行深度机型合作。vivo的逻辑清晰：聚焦硬件、影像与系统体验，AI能力以自研为主，保持体验可控性。

一加已并入OPPO旗下，走年轻化和性能路线，在海外市场保持独立品牌调性，AI功能更多以"效率工具"形态出现，不是核心卖点。

八、功能通胀与用户冷漠

2025年，一个令手机厂商们集体头疼的现象出现了。

各家发布会上，AI功能越来越多，越来越炫，越来越长。但用户调研的数据在说另一件事：大多数用户，对大多数AI功能，用了一两次就再也不用了。

AI壁纸生成——新鲜感过了就忘了。AI通话摘要——有用，但不是每天必需。AI修图——大多数人日常使用频率极低。

真正留存率高的AI功能，反而是那些最低调的：实时字幕、相册智能搜索、输入法联想优化。这些功能不炫，但解决了真实的、高频的小痛点。

这揭示了AI手机的核心产品悖论：越强调"AI"的功能，用户往往越快遗忘；越融入日常操作的AI，反而越难被感知但越难被放弃。

功能堆叠是军备竞赛的必然结果，但军备竞赛的终点不是最多的功能，而是最深的场景。

九、谁会做出AI时代的"手机时刻"

2007年，乔布斯站在台上说"我们要重新发明手机"。那一刻，所有人都意识到，手机这个品类被彻底重新定义了。

2024—2026年，AI手机的战争打得热火朝天，但还没有人站出来说那句话。没有哪款手机，让用户觉得"以前的手机不值得再用了"。

差距在哪里？

在于今天的AI手机，本质上还是"在原有手机上加了AI功能"，而不是"围绕AI重新设计的手机"。

Galaxy S26的Gemini Agent很强，但它还是住在Android的权限框架里；Mi Claw的系统集成很深，但它还是受制于生态边界；豆包的跨App能力最强，但被风控系统逼退；Apple Intelligence的架构最优雅，但还没有完全落地中国市场。

那个真正的"AI手机时刻"，是当有一款手机让你感觉：这台手机认识你，它知道你想做什么，它不需要你去操控它，它在帮你生活。

那一刻还没有到来。但它越来越近了。

内存价格在飞涨，AI抢产能、大厂转产HBM，加上端侧AI算力持续提升——手机硬件的成本在上升，AI功能的期待在上升，用户的耐心在被消耗。留给这个行业的时间窗口，正在收紧。

第一个找到那个时刻的人，将赢得这场战争。

第三部到这里结束。走过了芯片、AI PC和AI手机——计算，已经无处不在。

下一部，我们要离开屏幕，走向一个更真实、更物理的世界。AI不再只是帮你回答问题、帮你点外卖——它开始走路了，开始搬东西了，开始用它的手触碰这个世界了。

具身智能的时代，正在到来。