第十章:AI手机的产品困境——谁来控制这台手机?
一、一个发布会,定义了一个新品类 2024年1月,三星在美国圣何塞召开了Galaxy S24系列发布会。 发布会的主角,不是摄像头,不是屏幕,不是续航——是AI。 三星给这套AI功能起了一个名字:Galaxy AI 。圈搜索、实时通话翻译、AI壁纸生成、照片编辑AI修复 ……每一个功能背后,都有谷歌Gemini的影子。 台下的媒体记者们这样描述那一天的气氛:这是手机行业第一次,一场发布会的核心词不是"拍照""性能""续航",而是"AI"。 但仔细看Galaxy AI的功能清单,它做的事情本质上还是辅助 ——帮你修图,帮你翻译,帮你生成壁纸。AI在展示能力,你还是那个操控手机的人。 Galaxy S24定义了"AI手机"这个品类概念,是一次认知革命 。 二、豆包首创:AI第一次真正"动手" 2025年10月,字节跳动与中兴努比亚 联合推出豆包AI手机(努比亚M153) ,搭载豆包大模型。 这款手机推出了一个让同行集体沉默的功能:AI Agent跨App操控 。 你只需要说一句话——"帮我在美团上订一份午饭,选评分最高的那家"——豆包会自己打开美团,自己搜索,自己筛选,自己下单,完成整个操作流程。 从"AI辅助"到"AI代理",是一次本质的跨越 ——不是把AI功能做得更多,而是把AI的角色从工具变成了代理人。Galaxy S24是AI手机品类的定义者 ,豆包手机是AI手机能力的跃迁者 。两件事都是第一,但是两个完全不同维度的第一。与此同时,智谱AI推出了GLM框架的手机端部署方案 ,走了另一条技术路径:通过更轻量的端侧模型,让AI在手机本地完成任务规划和执行 ,减少对云端的依赖,在隐私保护和响应速度上做出了差异化。 这是中国 AI 企业在手机端 Agent 能力上,首次在实际产品化层面领先全球的标志性时刻。 2026年初 ,三星联合谷歌发布了Galaxy S26,Gemini正式支持直接操控第三方应用程序 。海外媒体把这个功能描述为"革命性的"——但在中国用户看来,这不过是豆包几个月前就做过的事。三、权限战争:一场没有硝烟的博弈 野路子的代价: 豆包实现跨App操控的技术方案,是无障碍权限(Accessibility API) 。 这个权限原本是为视障用户设计的——让辅助软件能够读取和模拟操控屏幕上的内容 。它的副作用是:拥有这个权限的应用,几乎可以做任何事——读取屏幕内容、模拟点击、输入文字,甚至绕过部分安全检测。 豆包靠着这把万能钥匙,获得了控制手机上几乎所有应用的能力。 功能演示震惊四座,整个行业都在研究这个方向。美团、支付宝、微信——这些超级App的风控系统,开始识别并拦截通过无障碍权限发起的自动化操作。它们的逻辑很简单:一个通过无障碍权限在操控我的应用的程序,和一个恶意软件没有什么区别。 豆包帮你点外卖的功能,开始时不时失效——下单流程走到一半,被平台识别为异常操作,直接中断。曾经流畅的演示场景,变成了时好时坏的玄学体验。 豆包手机的Agent能力,就这样在上线后遭到了实质性的阉割。 不是字节主动缩减,而是被各大平台的风控系统逼退 的。智谱的GLM框架同样面临类似处境 。端侧模型的轻量化路线在隐私和速度上有优势,但一旦涉及跨App操控,同样绕不开权限这道墙。技术路径不同,但面对的生态博弈是一样的。 阿里千问 走了类似无障碍权限的路,但做了一个聪明的变通:在自己的生态内(淘宝、饿了么、高德)提前打通了官方接口。 千问的"点外卖、订酒店、查快递"功能,在阿里系应用里跑得相当顺畅——因为那是 自家地盘,不存在风控博弈。 这揭示了无障碍权限路线的本质局限:它是一条野路,能跑,但跑不远,跑不稳。出了自家生态,处处是墙。 正规军的选择: 三星和谷歌看到了豆包的前车之鉴,选择了一条截然不同的路。 Galaxy S26的Gemini在推出App控制能力之前,谷歌做了一件中国厂商没有做的事:提前和主流App厂商谈判,建立官方接口。 类似苹果的App Intents框架,谷歌推动各大应用开发商主动开放标准化的"AI可调用接口" ——不是绕过App的防线,而是让App主动开门迎接AI。Uber、DoorDash、Spotify……这些应用按照谷歌的标准,把自己的核心功能封装成AI可以安全调用的接口 。 结果是:Gemini帮你叫车、点餐、播放音乐,每一步都走在App厂商划定的 合规通道 里,没有风控拦截,没有功能阉割,运行稳定。 但这条路有它的代价:速度慢,覆盖有限。 和App厂商一家家谈判、等待对方适配、建立信任——这个过程需要时间和生态影响力 。谷歌能推动DoorDash开放接口,但它很难推动中国的美团;三星能在美国市场建立这套生态,但它的生态影响力在中国相当有限。 这也解释了为什么Galaxy S26的能力在中国用户看来"不如豆包"——不是Gemini不强,而是它的正规军打法在中国生态里根本没有足够的谈判筹码。 正规军的路线更稳,但也更慢,覆盖面受限于自身的生态边界 。 小米的第三条路: 2026年3月,小米悄悄给出了第三个答案:Mi Claw(澎湃OS系统级能力) 。 Mi Claw集成于澎湃OS底层,不走无障碍权限,也不需要和第三方App逐一谈判——它直接以系统权限运行,调用的是操作系统的原生接口 。 在小米自己的生态内,这套方案几乎无懈可击:整理短信生成表格、调取米家摄像头截屏、控制智能家居设备 ——所有操作流畅、稳定,没有被风控拦截的风险。从试用反馈看,Mi Claw完成这些生态内任务的体验,是目前所有方案里最顺滑的。 但边界同样清晰:出了小米生态,Mi Claw就变成了普通助手。 让它帮你在美团点外卖、在微信发消息——它要么做不到,要么绕回无障碍权限的老路。 这场博弈的本质: 豆包选择了"强行闯入"——万能钥匙,强大但被封堵。 千问选择了"在自家地盘开绿灯"——生态内顺畅,出了生态寸步难行。 三星×谷歌选择了"敲门进入"——官方通道,稳定但慢,覆盖受限。 小米选择了"在自己家里不需要钥匙"——系统级集成,生态内无摩擦,出了生态就是普通助手。 没有哪条路是完美的。这场权限战争还在进行,胜负未定。 但有一件事越来越清晰:下一代真正意义上的AI手机,一定需要一套被所有应用厂商认可的、标准化的AI调用接口——就像当年移动互联网需要一套标准的浏览器内核一样。 在这套标准建立之前,每一条路都是临时方案,每一个方案都有它的天花板。 谁来定这套标准?苹果、谷歌、还是某个意想不到的玩家?这个问题的答案,将决定下一代AI手机战争的最终格局。 四、大模型厂商的渠道战 豆包手机的出现,开创了一种全新的商业模式:大模型厂商×手机厂商 的深度合作范式。 字节不造手机,但它把豆包的能力渗透进合作厂商的手机里。这不是简单的功能合作,而是一场渠道争夺 ——谁的大模型住进了最多用户的手机,谁就拥有了最直接的用户触达能力和数据积累。 字节豆包率先跑通了"大模型+手机厂商"的合作模式 ,努比亚豆包手机是第一个成熟案例,后续陆续扩展到更多机型。豆包的野心从来不只是一个AI助手,而是通过手机入口,成为用户生活的AI代理人。阿里千问把这套逻辑延伸进了整个阿里生态 ——手机上的千问,和AI眼镜上的千问,和淘宝、饿了么、高德协同,构建一个"AI办事"的闭环。千问的差异化不是模型最强,而是生态最深。 智谱GLM走的是更技术向的路线 ,通过端侧轻量化模型和手机厂商合作,让GLM的多模态能力在本地就能运行,打隐私和速度的差异化牌,吸引对数据安全敏感的企业和专业用户。这场渠道战的本质,是大模型时代的分发权之争 ——在PC时代,分发权在浏览器和搜索引擎手里;在移动时代,分发权在App Store和微信手里;在AI时代,谁成为手机里的默认AI代理,谁就拿到了下一个时代最重要的分发入口。 五、苹果的迟到与尴尬 2024年6月,苹果在WWDC上发布了Apple Intelligence,宣布Siri将迎来史上最大的升级——理解上下文、执行跨应用任务、生成图像和文本。 Apple Intelligence仅限于英语地区,仅限于iPhone 15 Pro及以上机型。中国市场,不在第一批支持范围内。 当华为、小米、vivo、OPPO的旗舰手机都在大力宣传AI功能,苹果的中国版iPhone却只有一个朴素的Siri。 这个缺席,对苹果在中国的竞争力造成了实质性影响。 但苹果在系统级AI架构上的选择,随着时间推移反而变得越来越有说服力——私有云计算(Private Cloud Compute) 确保用户数据不离开苹果的受信环境,App Intents框架让第三方开发者可以把应用功能主动暴露给Siri,从根本上避免了无障碍权限的野路子问题。 苹果的路是最慢的,架构是最正确的 ,但在中国市场缺席的这两年,它失去的份额,未必能靠架构优势找回来。六、华为与荣耀:两条分叉的路 华为和荣耀,曾经是同一家公司的两个品牌,如今走上了截然不同的AI手机路线。 华为的AI手机战略深度绑定鸿蒙生态和盘古大模型 。麒麟芯片、鸿蒙系统、盘古大模型三者协同,端侧AI能力在国产手机里处于第一梯队。小艺助手在2024—2025年经历了大幅升级,能够理解复杂指令、调用系统功能、在鸿蒙生态内完成跨设备任务。但 鸿蒙生态的封闭性,决定了这些能力主要在华为自己的设备生态里发挥 ——出了华为,就是另一个世界。 荣耀在与华为分家后选择了更开放的路线 。Magic OS配合MagicLM,HONOR AI Agent可以跨应用完成任务,在第三方应用兼容性上投入了更多精力。2025年推出的AI通话摘要、AI会议记录、跨应用智能搜索,在商务用户群体中获得了相当高的认可度。荣耀走的是"用AI提升效率"的务实路线 ,不追求最炫的Agent能力,而追求最稳定的日常使用体验。两条路,各有受众:华为的重度生态用户,和荣耀的商务效率用户。 七、OPPO、vivo、一加:各自押注 同出步步高体系但完全独立运营的OPPO和vivo,OPPO的AI布局以ColorOS和AndesGPT为核心。AndesGPT支持70亿参数端侧部署,在Find X7系列上实现了本地运行的AI功能。OPPO的差异化在摄影AI ——与哈苏的合作让计算摄影在色彩科学上有独特优势,AI介入摄影的方式更偏向"让照片更美"而不是"帮你做任务"。 vivo坚持自研AI大模型与系统级AI能力,并未与字节豆包进行深度机型合作 。vivo的逻辑清晰:聚焦硬件、影像与系统体验,AI能力以自研为主,保持体验可控性。一加 已并入OPPO旗下,走年轻化和性能路线,在海外市场保持独立品牌调性,AI功能更多以"效率工具"形态 出现,不是核心卖点。八、功能通胀与用户冷漠 2025年,一个令手机厂商们集体头疼的现象出现了。 各家发布会上,AI功能越来越多,越来越炫,越来越长。但用户调研的数据在说另一件事:大多数用户,对大多数AI功能,用了一两次就再也不用了。 AI壁纸生成——新鲜感过了就忘了。AI通话摘要——有用,但不是每天必需。AI修图——大多数人日常使用频率极低。 真正留存率高的AI功能,反而是那些最低调的:实时字幕、相册智能搜索、输入法联想优化。这些功能不炫,但解决了真实的、高频的小痛点 。 这揭示了AI手机的核心产品悖论:越强调"AI"的功能,用户往往越快遗忘;越融入日常操作的AI,反而越难被感知但越难被放弃。 功能堆叠是军备竞赛的必然结果,但军备竞赛的终点不是最多的功能,而是 最深的场景 。 九、谁会做出AI时代的"手机时刻" 2007年,乔布斯站在台上说"我们要重新发明手机"。那一刻,所有人都意识到,手机这个品类被彻底重新定义了。 2024—2026年,AI手机的战争打得热火朝天,但还没有人站出来说那句话。没有哪款手机,让用户觉得"以前的手机不值得再用了"。 差距在哪里? 在于今天的AI手机,本质上还是"在原有手机上加了AI功能",而不是"围绕AI重新设计的手机"。 Galaxy S26的Gemini Agent很强,但它还是住在Android的权限框架里;Mi Claw的系统集成很深,但它还是受制于生态边界;豆包的跨App能力最强,但被风控系统逼退;Apple Intelligence的架构最优雅,但还没有完全落地中国市场。 那个真正的"AI手机时刻",是当有一款手机让你感觉:这台手机认识你,它知道你想做什么,它不需要你去操控它,它在帮你生活。 内存价格在飞涨,AI抢产能、大厂转产HBM,加上端侧AI算力持续提升——手机硬件的成本在上升,AI功能的期待在上升,用户的耐心在被消耗 。留给这个行业的时间窗口,正在收紧。 第三部到这里结束。走过了芯片、AI PC和AI手机——计算,已经无处不在。 下一部,我们要离开屏幕,走向一个更真实、更物理的世界。AI不再只是帮你回答问题、帮你点外卖——它开始走路了,开始搬东西了,开始用它的手触碰这个世界了。