点击上方蓝字关注,第一时间获取推送
2026年6月16日到18日,如果只看科技新闻,你会觉得AI行业开始了“文艺复兴”。
这边Anthropic推出了一款叫Claude Design的工具,说是不用学设计也能做PPT和原型图;
那边Transformer的发明人之一Noam Shazeer又跳槽了,从谷歌去了OpenAI;
再往下翻,腾讯悄悄上线了「腾讯网盘」,说是面向Agent时代的产品,百度阿里立刻跟牌。
三条新闻,三个方向,看起来谁也不挨谁。
但你把这些事放到一起,会发现它们其实在说同一句话。那句话不是一个公司的发布计划,不是一个天才的职业选择,也不是一场商业混战——它是整个AI行业在2026年夏天给出的一个判断。
这三件事,拼的不是巧合
先说Claude Design。Anthropic Labs在4月发布了这个工具,但直到6月才被广泛讨论,因为大家终于理解了它的分量。它不是一个「AI帮你做PPT」的小功能,而是一个底层逻辑的切换:过去你向AI描述你要什么,AI给你一段文字;现在你向AI描述你要什么,AI直接给你一个可交互的视觉作品。
从文字到画面,从描述到交付——这不是功能升级,这是能力的跃迁。
然后是Shazeer的跳槽。这个人的履历读起来像AI行业的浓缩史:2017年他还在谷歌的时候,跟同事合写了一篇论文叫《Attention Is All You Need》,这篇论文后来催生了Transformer架构,而Transformer又催生了GPT、Claude和几乎所有你今天在用的大模型。2021年他离开谷歌创办Character.AI,2024年谷歌花27亿美元把他的公司买了回来,他在谷歌主导了Gemini 3的研发,登顶多项排行榜。两年后,他又走了。
八位Transformer论文作者,如今全数离开了谷歌。两位去了OpenAI。
再说腾讯网盘。6月16日上线的官网写得清清楚楚:六大能力里面有一条叫「支持Agent调用(CLI/MCP)」。什么意思?你的AI助手可以直接调取网盘里的文件,不需要你手动上传、手动授权、手动找目录。这在过去是不可思议的——网盘的核心逻辑是「人存人取」,现在变成了「Agent存Agent取」。
百度跟得更早,2025年发布的沧舟OS已经把内容解析、向量化、公域私域知识库这些基础设施搭好了。阿里则走了一个更轻的路线,把搜索、浏览器、网盘、扫描整合成一个「超级框」。
三家公司的路径不同,但方向一致:Agent需要自己的存储空间、自己的身份系统、自己的数据管道。
这三件事,一件关乎AI的能力边界,一件关乎AI的人才流向,一件关乎AI的基础设施——它们刚好卡在「能力-人才-基础设施」三个维度上,同时发出了同一个信号。
从聊天到办事,为什么这一步那么难
如果你想理解为什么2026年被称为「Agent元年」,得先理解一件反直觉的事:大模型在「聊天」这件事上已经强到可怕,但在「办事」这件事上始终像个实习生。
你可以让AI写一份5000字的报告,但你不能让AI替你发一封邮件——因为你得手动把报告内容复制粘贴过去,点发送。你可以让AI分析一堆数据,但你不能让AI把它发现的异常自动同步到你的工作群和文档系统里——因为AI没有账号、没有权限、没有属于自己的「文件柜」。
这个问题的本质,不是AI不够聪明,而是AI没有身份。
人和人协作的时候,我有我的账号、我的文件夹、我的日程表,我知道什么东西该存哪里、该给谁看。但Agent——哪怕它智力和GPT-7一样高——如果它没有一个属于自己的「数字存在」,它就只能在一个聊天窗口里给你说话,然后等你动手。
这就是为什么腾讯网盘的Agent调用能力被放在六大能力的核心位置。你让AI帮你写了一个调研提纲,它能直接存在自己的网盘空间里;下回另一个AI同事要用这份提纲,不需要你再手动转发,跨应用全局搜索就能找到。
这不是方便不方便的问题。这是人类和AI协作方式的一次结构变化。
27亿美元买不回来的人
Shazeer的跳槽之所以引发这么大的关注,不是因为一个天才换了公司——AI行业每天都在挖人。真正让人心头一紧的是:这是Transformer论文八位作者中第二位加入OpenAI的核心作者。此前的Lukasz Kaiser已经在那里了。
谷歌花了27亿美元把Shazeer买回来,给了他Gemini联席负责人的位置,让他推动Gemini 3成为行业标杆。不到两年,他走了。
OpenAI给他的职位是「架构研究负责人」,目标明确:探索Transformer之后的新架构。官方说法很温和,但所有人都知道这句话的分量——Transformer统治了AI八年,从2017年的论文到今天,几乎所有重大突破都在这个框架内发生。但越是大家依赖的架构,越值得思考「之后」的事。
Shazeer本人是个值得单独拎出来看的角色。高中IMO数学奥林匹克满分金牌,杜克大学数学天才,谷歌200号员工。他在离开谷歌创办Character.AI的时候,已经49岁。这个年纪的人通常要么在攀登下一个权力高峰,要么在考虑退休——他选了「再创业」。27亿美元被买回来之后,他又选了「再出走」。
一个人一生的职业选择,恰好画出了AI行业从学术驱动→商业驱动→架构革命的演进弧线。他每一步都踩在了转折点上,不知道是时代选中了他,还是他总能在正确的时候闻到风向。
网盘大战2.0:这次不打空间,打协议
你可能记得上一轮网盘大战。2014年前后,百度、360、腾讯、阿里打了一场轰轰烈烈的「容量价格战」,最终结果是大鱼吃小鱼,百度和腾讯各据一方,用户手机里装了两三个网盘同步不同文件夹。
这一次的网盘大战,战场换了。
过去的网盘核心是「空间」和「速度」——你给我1TB,我给你2TB;你下载快,我比你更快。用户的需求是存储。
今天的网盘核心是「连接」和「身份」——腾讯网盘强调跨应用数据互通、OneID统一身份、Agent可调用;百度强调对多种内容的解析和向量化、知识库构建;阿里强调原子能力的整合。
关键词变了:从「存」到「通」。
再看一组数据:百度文库AI付费用户超4000万,AI月活9700万;百度网盘AI月活超8000万。这些数字意味着什么?意味着在百度已有的数亿用户里,几乎每两个人就有一个用过AI功能——不是作为尝鲜,而是作为日常工具。
腾讯的优势在于办公协同链:腾讯文档、企业微信、腾讯会议、WorkBuddy已经形成了一个闭环。你开会生成的纪要,AI直接存到网盘;你写的文档,AI直接调取会议数据做调研——不再需要人手动搬运。
阿里的打法最轻巧:夸克本身就集合了搜索、浏览器、扫描、拍题这些高频场景,Agent只是这些场景的「大脑」。用户不需要学习一个新东西,只是在过去的习惯里多了一步「让AI替我查」。
三家路径不同,但底层判断是一样的:未来的互联网,用户不是唯一的主体。Agent会是另一类用户,它们需要存储、身份、权限和通信管道。谁先把这些基础设施建好,谁就是Agent时代的入口。
基础设施的逻辑变了
如果只用一个词概括这48小时里发生的事情,那个词应该是「基建」。
Claude Design提供的是创造力的基建——一个不需要设计背景的人也能产出一套原型图。Shazeer的去向暗示的是技术架构的基建——Transformer是否足够承载未来十年。BAT的网盘大战争的是数据流动的基建——Agent能不能像人类一样有自己的数字分身。
你回想一下移动互联网的崛起过程:iPhone发布的时候,大家觉得这是一个好手机。后来App Store出现,大家觉得这是一个好商店。再后来4G普及、云服务成熟、支付体系打通——整个基础设施就位之后,移动互联网才真正爆发,诞生了滴滴、美团、抖音这些「之前不存在的东西」。
AI Agent走的是同样的路。过去两年大模型争的是智商,下一阶段争的是「你能做什么」。而「能做什么」这件事,不取决于模型有多聪明,而取决于它有多少通道——能否访问文件、能否调用工具、能否跨应用协作、能否持续运行。
这48小时的新闻,看起来是无序的。但在无序的背后,基础设施正在被一层层搭建起来。现在的混乱和喧嚣,是这个行业正在从「聊天」走向「办事」时必须经历的阵痛。
OpenAI的Andrej Karpathy加入了Anthropic,去预训练团队做「用Claude改进Claude」这件事。英伟达专门为Agent AI设计的Vera CPU首批交付给Anthropic、OpenAI和SpaceX AI。ChatGPT即将迎来历史上最大的一次改版——从聊天机器人转型为集成编程工具和AI Agent的超级应用。
每一个事件都在指向同一个方向:AI的下一站,不再是更好的对话,而是真正能替你干活。
而你以为这些是互不相干的新闻。它们不是。它们是一个时代的脚步声。
— END —
点击下方赞👍和推荐❤️,分享给更多的人
夜雨聆风