AI正在从一个工具变成一种环境
文 | 安叙里
6月25日一早,我习惯性地点开文心一言的网页,发现首页已经变了——那个熟悉的话筒图标不见了,取而代之的是一个全新的统一入口。百度把所有AI产品合并成了一个"文心网站"。
我愣了一下,反复刷新了好几次,确认这不是网页故障。
同一时间,朋友圈里有人在晒截图:腾讯的Marvis马维斯终于上了App Store。这个去年还在内测的AI助手,如今已经覆盖Windows、macOS、安卓、iOS四端。有人在评论区@我说:"你试试用手机远程开电脑。"
我试了。掏出手机,在Marvis里输入"打开我电脑上的PPT",三十秒后,电脑屏幕亮了起来。
那一刻,我突然意识到一个变化正在发生——AI不再只是一个个散落在手机里的App,它们正在变成一个统一的、横跨所有设备的"操作系统"。
01 文心一言的"消失",藏着百度的大算盘

说实话,6月25日之前,我对文心一言的印象还停留在"又一个AI聊天窗口"。每次想用它,得先打开浏览器,搜到官网,输入问题——跟用ChatGPT没太大区别。
但百度6月25日的动作,远比"换个域名"复杂得多。
他们把文心一言官网入口直接关了。是的,关了。用户只能在6月25日到7月25日这一个月的窗口期内,去下载自己的对话记录和数据。7月26日,正式迁移到全新的"百度文心网站"。
新的文心网站是什么?它不是一个聊天工具,而是一个AI生产力平台:
- 集成了AI云盘——类似百度网盘,但里面是文心5.1大模型驱动的AI助手
- 支持全格式Office在线编辑——PPT、Excel、Word直接由AI帮你改
- 保留了智能文字创作、图片创作、AI阅读、智能问答等所有原有功能
- 最关键的是,统一了账户体系,所有功能在一个入口内切换
百度的逻辑很清晰:与其让用户在十个不同页面之间跳转,不如直接合并成一个超级入口。
这让我想起一个有意思的对比。2023年到2024年,几乎所有大厂都在疯狂推自己的"AI聊天App"——百度的文心一言、阿里的通义千问、腾讯的元宝、字节的豆包,各自为战,像极了当年的"App Store大战"。
但到了2026年,风向变了。用户受够了手机里同时装着五六个"AI助手",却发现它们做的事情大同小异。 大家想要的是一个入口,而不是十个。
百度这次合并,某种程度上是这场"AI助手大乱斗"的阶段性答案:谁能最先把碎片化的AI能力整合成一个超级平台,谁就赢得了下半场。
02 腾讯的Marvis,在做一个更疯狂的实验

如果说百度在整合AI能力的入口,腾讯在做的事情更加激进——他们正在把AI变成操作系统的底层。
Marvis这个名字听起来有点陌生,但它做的事情并不陌生。
你想想现在大家是怎么控制电脑的:点桌面图标、用键盘快捷键、打开菜单……这些动作人类已经做了三十年了。Marvis要做的是,把所有这些动作"翻译"成自然语言。
你对着Marvis说:"帮我整理一下桌面上那些乱七八糟的截图,按日期分好文件夹。"它真的会去执行——打开文件管理器、找到截图文件夹、创建新目录、移动文件。整个过程你不需要碰鼠标。
这是腾讯去年5月20日就开始做的事:从操作系统层面切入AI。
为什么这个方向很重要?因为过去所有的AI助手——Siri、小爱同学、Google Assistant——都只能在你打开App的时候工作。它们像是住在各自手机App里的"小助理",出了App就什么都做不了。
但Marvis不同。它是一个系统级助手,可以直接操控电脑桌面。你不需要打开某个特定的App,只需要呼出它,然后告诉它你想做什么。
这次iOS版的上线,把最后一片拼图补齐了。现在,无论你手里拿的是什么牌子的手机,只要装着Marvis,就能远程控制你的电脑。安卓、iOS、Windows、macOS——四端完全打通。
我在知乎上看到有人问:"Marvis会不会取代传统操作系统?"
我的回答是:不会取代,但它正在重新定义人与设备之间的交互方式。
想象一下,当你不再需要记住哪个App在哪里,只需要说出来,所有的设备都能听懂、能执行——这不仅仅是"便利"的问题,这是交互逻辑的根本变化。
03 谷歌也没闲着:Gemini直接接管你的桌面

提到AI控制桌面,就不能不提谷歌。
6月25日,谷歌发布了Gemini 3.5 Flash的一个新功能:原生集成计算机操作能力。
这意味着什么?它可以直接通过键鼠操控你的桌面电脑。不需要额外的App,不需要安装插件——它已经集成在Gemini里了。
更激进的还有,谷歌同步推出了Chrome 149,直接打通了浏览器和桌面AI之间的链路。你在浏览器里看到的内容,Gemini可以直接操作;你在桌面做的事情,Gemini可以直接帮你看管。
这个功能在技术上的意义不大,但在商业上的信号非常明确:谷歌也在往"全场景AI操作系统"的方向狂奔。
如果说百度做的是"AI功能大整合",腾讯做的是"系统级AI助手",谷歌做的则是"浏览器即AI入口"。
三家公司的路径不同,但目标惊人地一致:让用户不再需要打开多个App来完成一件事,而是用一个AI来完成所有事。
04 这件事,正在悄悄改变每个人的工作
可能有人会觉得,上面说的这些跟普通人有什么关系?
让我讲一个真实的故事。
我认识一个做数据分析的朋友,叫大伟。他以前每天的工作流程是这样的:
早上到公司,打开电脑,先打开飞书看消息,然后打开Excel做报表,打开浏览器查数据,打开邮件回客户,打开钉钉跟同事沟通……
光是"打开App"这个动作,他每天至少重复二十次。
上个月他开始试用Marvis。现在他的早上变成了这样:
掏出手机,对Marvis说:"帮我打开电脑,调出昨天的销售报表,生成一个PPT总结发给客户。"
三十秒,电脑自动开机,Excel自动打开,PPT自动生成,邮件自动发送。
大伟跟我说:"以前花两个小时的工作,现在十分钟就完成了。"
这不是个例。我观察身边越来越多的朋友,他们的工作方式正在发生同样的变化:
- 不再需要记住每个App的菜单位置
- 不再需要在不同设备之间复制粘贴
- 不再需要写很长的邮件来描述需求,直接说就行
AI助手从一个"问答工具"变成了"执行工具",这是一个质的变化。
以前的AI,你问它问题,它回答你。现在的AI,你告诉它目标,它自己去完成。
而这个变化的背后,是一个更大的趋势:所有的大厂都在朝同一个方向押注——让AI成为跨设备的统一执行者。
05 写在最后:你的下一部手机,可能不再需要那么多App

写完这篇文章,我又打开手机看了一眼。
桌面上还是那些熟悉的App图标——微信、支付宝、抖音、淘宝……但我知道,有些东西已经不一样了。
AI助手不再只是一个个独立存在的App。它们正在变成一个统一的、跨设备的"底层能力"——就像Wi-Fi、就像摄像头、就像触屏一样,你不需要特意去打开它,它已经渗透到你使用的每一个设备、每一个动作里。
百度合并了文心,腾讯打通了四端,谷歌在Chrome里集成桌面控制。这些看似分散的动作,其实都在指向同一个方向。
AI的下一个阶段,不是"更好的模型",而是"更统一的能力"。
谁先把这件事做到极致,谁就定义了AI时代的用户界面。
到那时候,我们的手机里也许还是会有几十个App,但真正需要"打开"的,可能只有一个。
那就是AI。
作者:安叙里
本文首发于微信公众号「安叙里」
夜雨聆风