乐于分享
好东西不私藏

字节跳动二代AI手机曝光:智能体接管系统,一句话完成跨平台复杂操作

字节跳动二代AI手机曝光:智能体接管系统,一句话完成跨平台复杂操作

那个靠内容起家的互联网大厂,又要拿出自家第二代“能自己动脑子干活”的智能终端了。供应链和爆料圈最近都在传,这台设备大概率会在2026年上半年的某个节点露面,核心运算件指向了高通那颗还没完全铺开的新锐旗舰芯。更关键的是,这次它不打算只停留在极客圈测试,而是奔着更高的完成度去的。

这机器的底层逻辑和咱们平时喊“小爱”“小艺”完全不同。以前的语音助手大多是在应用内部帮你点几下,或者搜个信息读给你听。但这台设备里的智能体,被赋予了类似“副驾驶”甚至“代驾”的权限,你动口,它动手,而且能跨过不同软件的围墙去办成一件事。

有网友看到跨应用操作的演示后就吐槽:“以后买东西不用自己打开淘宝京东一个个切着比了,只要说句话,它就能把各平台最低价、领券后价格全算好,到付款时拍拍我肩膀让我输密码就行。”也有人犯嘀咕:“这权限给这么高,万一它理解错我意思,给我乱订阅一堆会员怎么办?”

最实用的想象场景,就是你对着手机说一句“帮我把这几个平台里买的东西到哪了全查出来”。它会自己去点开对应的购物软件,逐一抓取物流状态,最后给你整整齐齐汇总成一张表。甚至你说“帮我把刚下载的几个文档里的数据合并一下”,它也能调工具去解压、提取、排版,最后扔个新文件到你面前。

这种“一句话干一串活”的背后,其实依赖两个东西:一是端侧算力的暴涨,二是系统给这个智能体开了特殊的自动化通道。爆料提到的新芯片不仅要跑得动大模型本地推理,还得实时理解当前屏幕界面元素,知道哪个是按钮、哪个是搜索框,从而模拟人的点击和滑动。

除了这种日常杂务,它还有一个被单独授权的记忆库。等你允许后,它在回答你问题或者执行指令时,能调用你过去给过的一些偏好信息,不用你每次都把背景交代一遍。比如你常飞的城市、你选货时最在意价格还是售后,它都能记住,下次直接按这个习惯筛。

有搞技术的老哥在评论区说:“记忆功能最怕变成全天候监听的借口,只要权限管理透明,别老偷偷摸摸上传,这功能能省一半重复对话。”也有人补充:“关键看它会不会越界,比如在我没明说的情况下,偷偷用我的账号上下文去点什么东西。”

还有一个叫Pro的模式,相当于把智能体的“脑速”和工具调用权再放大一圈。这个时候它不是只执行你的明面指令,而是能拆解更复杂的意图,比如你丢给它一个模糊任务,它能自己规划先查什么、再下什么、最后怎么整合。这种多步推理一旦跑顺,很多过去需要人盯着进度的工作流,确实可能被压缩成几秒钟的事。

硬件这块,听说依旧是老牌通信设备厂那边的团队负责整机设计、供应链和生产,内容厂这边死磕AI能力的定义与体验打磨。这样的分工其实挺清晰:一方懂怎么把手机做扎实、信号做稳、品控过线;另一方懂怎么把大模型、自然语言指令、跨应用自动化这些纯软的东西嵌入到系统骨骼里。

屏幕方面早早有信息称是一块接近6.8英寸的大视野面板,处理器是妥妥的旗舰定位,这意味着它不光是个“AI玩具”,日常打个游戏、剪个轻量视频、当主力机使也完全扛得住。毕竟想让更多人接受这种新交互,基础体验就不能比普通旗舰差,否则大家可能连打开它的欲望都没有。

更有意思的是,除了这台相对“纯血”的迭代机,圈内还在传好几个消费级大厂也在和这个AI团队接触。如果这事落地,未来我们可能会在更多成熟品牌的机器上,看到“某机型 + AI智能体后缀”的命名方式,而不是只有一个孤立的系列。这也侧面说明,行业里不少人开始认真考虑:下一个卖点会不会是“系统到底多懂你怎么偷懒”。

当然,想让这种“代操作”真正好用,最大的拦路虎不是芯片,也不是模型,而是第三方应用的配合。过去一年里,这类智能体终端在调用某些主流App时吃过闭门羹,对方担心安全、流量劫持或者体验失控。所以第二代设备能不能成,很大程度看它在外卖、出行、购物这些高频场景里,能不能谈下更稳的接口或权限共识。

有人留言说:“只要别每次到付款都弹异常,别比价半天结果点进去券用不了,我就愿意把这部分操作权交出去。”也有做产品的朋友认为:“一旦多家手机厂都接同一个智能体能力,App厂商可能反而会更主动去适配,毕竟不想在自己的入口里被绕开。”

从目前放风的时间点看,这台二代设备离我们不算远了,但具体哪天开发布会、定价打哪个区间、初期开放哪些自动化场景,都还得再等等。可不管怎样,它至少抛出了一个很直接的问题:当手机里的助手不再只是“问答机”,而是能真的帮你把事办了,你还愿意花那么多时间亲手点来点去吗?