每日AI热文早播

每日AI热文早播 | 2026.06.19

今日共 7 篇热门AI资讯，涵盖最新技术动态与行业趋势。

1. 上百个Agent，该怎么管？清华团队新思路：重做Session [2026-06-18]

多智能体系统从demo走到生产，最大的拦路虎从来不是「造不出更多Agent」，而是「管不住Agent之间状态怎么流动」。当一个项目里跑着几十上百个Agent，研究Agent读过的issue、编码Agent改过的diff、沙箱里跑过的测试、校验Agent给出的否决信号、记忆后端写下的失败索引——这些本该拼成一条完整证据链的事件，往往散落在各自的日志里，谁也说不清哪条分支最终交出了答案。OpenRath正是冲着这道墙来的。它由清华大学与中山大学联合组成的Rath Team开源，思路反直觉却极其清晰：别再围着Agent转了，真正该被当成「一等公民」的，是Session。在OpenRath的视角里，Session不只是聊天历史，而是证据的载体——工具调用的参数与结果、代码改动、沙箱身份、失败重试的路径、人工批准或否决的校验信号，都要被Session这条数据流装下、串联、可追溯。

围绕这条核心主张，OpenRath把多智能体协作重新切成了四象限：单Agent单Session是ChatGPT式聊天，多Agent单Session是子代理协作，单Agent多Session是分支扇出，而多Agent多Session（即MAMS，Multi-Agent Multi-Session）才是OpenRath面向的方向。它把多Agent协作从「群聊」拉回到「运行时控制平面」：当前该交给哪个Agent、它能看到什么上下文、读了哪些记忆、下一条命令该在哪个沙箱跑、继续之前需要什么校验信号，这些原本靠「再加一个群聊角色」解决不了的问题，被压回一张Session Graph上。Agent、工具、工作流、记忆、沙箱位置，都在这张图上交汇——OpenRath想要的，从来不是一屋子聪明的工人，而是先建好工位、工单和流水线。

这套设计最聪明的点在于，OpenRath几乎是把深度学习开发者最熟悉的PyTorch抽象整套搬了过来，做了一组「一一对应」的映射：Tensor→Session承载流动的数据，Module/Linear→Workflow/Agent承载可组合的变换单元，Device→Sandbox/Backend决定算在哪，Parameter→Memory承载可学习的状态，Function→Tool承担动作，Selector则承担控制流。它从这套映射里抽出三根支柱来回答「为什么这么设计」：第一根支柱是Agent作为变换层，Agent不是全能助手，而是Session上的一层forward(session) → session变换，调工具的Agent、Compressor、记忆的recall/commit、写摘要的Agent都套在同一个接口下，可以像神经网络层一样任意堆叠、任意嵌套；第二根支柱是运行时的控制平面由Session Graph承担，它决定fork、merge、复用与追踪的单位是整条Session数据流，而不是某个Agent内部那份各自维护的消息列表；第三根支柱是开放的BSD-3-Clause协议与极低门槛——目前OpenRath已在PyPI发布到v1.2.1，pip install openrath就能装，官网、文档、博客、GitHub一应俱全，任何人都可以把这套「像PyTorch一样搭Agent集群」的工作流搬进自己的多智能体系统里去。AutoGen把多Agent对话做成了实用编程模型，CrewAI把Agent团队与结构化流程分开，LangGraph用图状态和supervisor节点表达路由与控制——它们解决的是「Agent之间怎么说话」，而OpenRath接着追问的那一句「说完之后谁拥有这份工作的状态」，正是它在多智能体赛道里卡住的位置。

2. 中国AI黑马演语科技Evoken狂揽近3亿美元B+融资，ARR破3亿、估值站上20亿美元 [2026-06-18]

在2026年的AI赛道里，「谁能率先跑通商业化闭环」几乎是所有投资人反复追问的同一道题。当无数底座大模型公司还在烧钱、还在为下一轮融资发愁的时候，一家叫演语科技的中国公司，用一笔近3亿美元的B+轮融资和一份「ARR已突破3亿美元」的成绩单，给出了响亮的答案。本轮融资由Granite Asia、腾讯、顺为资本联合领投，HT Investment、时代资本共同参与投资，而高榕资本、蚂蚁集团、渶策资本、明势创投、源码资本、红杉中国等老股东全部持续加码——这种一线机构「超额认购」、追着加码的密度，在过去几年的AI应用赛道里几乎绝无仅有，也让演语科技一举站上20多亿美元的投后估值，成为国内AI应用层有史以来最大单笔融资。资本给出的信号再清晰不过：它已经在中国AI应用落地这场战役中确立了断层式领先。

支撑这个估值的，不是PPT上的模型参数，而是真金白银的自我造血。披露数据显示，演语科技在过去12个月里连续跑通了多个AI产品的PMF（产品与市场匹配），实现从单点产品到集团化业务矩阵的跨越式扩张，2026年5月集团整体收入同比增长超过3000%。在它「三驾马车」中，LiblibAI是压舱石——累计用户突破3000万，相当于每三位中国设计师就有一位在用它做日常创作，平台沉淀了超过50万个原创模型和过亿专业素材，AI创意界的「B站+淘宝」名副其实；今年3月才正式上线的LibTV则是那支「超级火箭」，它瞄准专业创作者、工作室、品牌和影视团队的工业级AI视频生产需求，上线首月就实现单日收入突破100万美金的惊人战绩，5月收入达到上线首月的13倍以上，平台人气第一的短剧《武松打虎》与AI影像狂飙季最佳短片《格子》都验证了「用AI做短剧也能稳定商业化变现」这条路径；此外还有用户规模同样过千万的星流（Star Stream），作为国内用户规模领先的AI设计Agent，它探索的是下一代从创意构思到设计交付的完整工作流，又是一条全新的增长曲线。

比起产品本身，更值得拆解的是这套商业逻辑为什么成立。多数中国AI公司今天仍停留在「单一产品、单一场景」的精细化运营阶段，而演语科技已经构建起「高收入、高增长、健康现金流」三位一体的业务闭环，并且没有走大规模烧钱路线——这在当下的资本市场里几乎是稀有物种。对比海外同类AI独角兽动辄几十倍甚至上百倍的市销率，投后20多亿美元的演语科技反而处于明显估值洼地，资本超额认购在逻辑上就讲得通。但演语科技的野心显然不止于「再多融一轮」。这次B+轮融资里有一个值得注意的细节：公司首次以全新的集团品牌「Evoken」统一对外发声，从「演语科技」到「Evoken」，背后是创始人陈冕对AI创意内容产业的重新定义——在他看来，AI技术的本质不只是提升效率的「工具」，更是重构整个内容产业底座的「新型基础设施」。创作者真正需要的不是十个互不兼容的AI工具，而是一套无缝衔接、生态互通、能直接转化为商业价值的内容生产流水线，LiblibAI做创意生态、LibTV做生产力工具、星流做智能体服务，三条曲线共同把演语科技推向了3000%的年营收增长，也让这家中国AI黑马稳稳站在了全球AI应用商业化的舞台中央。

3. Dario 69分钟访谈全曝光：Mythos首度被亲口称为「超级武器」 [2026-06-18]

在这场长达69分钟的Bloomberg《The Circuit》访谈中，Anthropic CEO Dario Amodei 首次公开谈论了内部代号为 Mythos 的下一代模型，而主持这次对话的正是知名记者 Emily Chang。与往常的公关辞令不同，Dario这次几乎毫无保留，把Mythos最危险的一面摊到了台面上。他透露，Mythos最让他震惊的能力，是在漏洞发现与武器化之间出现了「断崖式跃升」——它不仅能找到漏洞，还能自主走完扫描、发现、利用、武器化的完整网络攻击杀伤链（cyber kill chain）。换句话说，这不是「辅助黑客的工具」，而是一个AI黑客。更让人警觉的是，参与内测的Palo Alto Networks首席产品官直言，Mythos在不到三周内就完成了一整年渗透测试的工作量，并且能把中低危漏洞串成攻击链直接打穿系统，几家安全公司在测试后甚至打电话来恳求Anthropic「别发布」——「这是超级武器，你应该要持枪证才能用这东西」。

面对「奇点何时到来」这个终极追问，Dario给出了一个出乎多数人意料的答案：奇点不是一个时间点，而是一条我们已经在其中的连续曲线。他用一组数字支撑这个判断——AI已经能为下一代AI建议架构，而全要素生产率的提升从一年前的10%-15%，已经翻倍到了现在的20%-30%。他把这个过程称为平滑的指数（smooth exponential）。这意味着，AI的自我改进不是某天早上一觉醒来突然「觉醒」，而是在每一个当下都要做出的判断：是否该踩刹车？是否该加更多防护？这条不断加速的曲线，正是Dario最核心的风险框架——它的危险不在于某个「开关被按下」，而在于速度本身。也正因此，Mythos被压着不发布，Dario反问道：「我们因为不发布Mythos，商业上已经遭受了巨大损失。它在Anthropic内部极大地加速了研究和下一代模型的生产。如果放出去，外部世界也会获得同样的加速。这怎么可能是营销？」

当Emily Chang把话题引向历史，Dario明确拒绝被类比为奥本海默，他最认同的人是1933年在伦敦街头过马路时第一个想到核链式反应的利奥·西拉德（Leo Szilard）——后来正是西拉德起草了那封改变历史、催生曼哈顿计划的信，但他也是最早站出来反对实际使用原子弹的人。Dario直言不讳地把奥本海默看作「一个失败案例」，并强调「我们不可能靠一个大人物来解决这件事，这里有太多强大的利益方，唯一能让所有人都安全的方式是制衡和平衡」。在这一框架下，他在去年Axios峰会上给出的「文明崩塌概率10%-25%」就显得格外沉重。面对「是不是Anthropic自己造出来的东西导致了崩塌」这种追问，Dario没有回避，用一个航空公司的比喻精准回应：可以造一家比同行安全10倍的航空公司，但25%的坠机概率「你不会上那架飞机」，能做的只有继续把它降得更低。

这场访谈里另一个被反复引用的判断，是AI可能在1到5年内消灭一半的入门级白领工作。Dario坦言自己最痛恨的就是社交媒体——他一年前完整的论述被剪成三秒钟的「doom is coming」在X上疯传，脱离了所有上下文。面对「廉价营销」的指责，他毫不客气地回怼：这种说法本身才是懒惰和廉价营销，是硅谷被三秒钟短视频绑架的病。他同时透露，在Anthropic内部，AI已经写了几乎全部代码，工程师反而更高效，但有些岗位，AI确实做得更好。他把出路寄托在物理世界、以人为本的工作、由人引导AI这三条路径上，但他也承认「没人保证」。访谈最后，他难得露出轻松一面，说当CEO最让他意外的是「得经常化妆」——然而，玩笑背后是一个严肃的事实：他正在造可能改变文明的东西，他也比任何人都清楚，这东西可能把文明拆了。指数曲线的另一边是什么？没人知道。

4. 今天起，Claude Design要把设计师和程序员变成同一种人了 [2026-06-18]

Anthropic在6月18日深夜突然放出Claude Design的大版本更新，一次性甩出四个大招，瞬间在X上引爆讨论。这四个动作包括：设计系统可从GitHub一键导入并由AI自动校验品牌合规、新增**/design-sync和/design两条命令打通Claude Code双向通道、导出目的地一口气扩到9个（覆盖Adobe、Canva、Vercel、Replit、Miro、Gamma、Lovable、Wix、Base44**），以及画布编辑重做——拖拽、缩放、对齐直接动手，不再每改一个像素就烧一轮模型调用。最有戏剧性的细节来自Anthropic设计师Nate Parrott在X上连发的三段实操录屏：他把一个浅色主题的邮件注册页面变成深绿色暗色版时，Claude Design自己跑了八轮自查才把图交出来——不是「尽量接近品牌规范」，而是「反复确认后才敢给你看」。网友看完之后有人惊呼「设计师的时代要终结了」，也有人玩梗喊话「我们不要新功能，我们要Claude Fable」。

真正把整个行业最头疼的环节干掉的，是**/design-sync和/design这两条命令。前者把代码仓库里的设计系统（颜色、字体、组件库、间距规则）一键拉进Claude Design，之后每次生成都拿真实组件去搭，搭完自己审，不合规自己改；后者则反过来，让开发者在Claude Code终端里一行指令就能创建设计项目、编辑已有设计、同步整个设计文件夹。这意味着，过去那种「设计师在一个工具里做完，工程师在另一个工具里重新搭」的有损交接——再附赠几场扯皮会议——正在被端到端的工作流**取代。设计在Claude Design里做，做完一个动作就能推进Claude Code写代码；写到一半想看界面，/design一行命令拉出可视化项目。那堵名为「交接、标注、排期、返工」的墙，被Anthropic亲手拆了。

设计工具只是表面，底下是一场更大的仗。2026年上半年，OpenAI、Google、Anthropic三家都在疯狂扩张产品线——聊天、编程、图片、视频、设计——每一个品类都在抢。Altman说AGI已经非常接近了，Amodei说大概率2027年到来，三家谁都不敢停。而通往超级智能的竞赛，表面比的是模型能力，底下比的是谁圈住了更多用户和更多使用场景。Claude Code锁住了开发者，Claude Design锁住了设计师和产品经理，两个加在一起，Anthropic拿下了从「想法」到「上线」的完整链条。半年之内，设计工具市场从Figma一家独大，变成了Claude Design、Figma AI、Google Stitch、Vercel v0、Lovable五方混战——3月18日Google Stitch大更新当天Figma股价跌约8%，4月17日Claude Design发布再跌约7.5%，5月20日Figma反击推出原生AI设计代理——这是十年来设计工具市场的第一次真正变天。

但这场仗的重点远不止设计工具本身。站在Claude Design背后的，是正在冲刺通用人工智能的三大巨头——Google、Anthropic、OpenAI——不约而同把手伸进了设计领域。设计工具只是它们扩张产品版图、抢占用户入口的一个棋子。Vercel和Replit的高管在第一时间表态，口径出奇一致：不再提「设计师」，统一换成了「建造者」——创始人、产品经理、市场人员、独立开发者，全都能用。回到网友那句被反复转发的判断：设计师和开发者，正在变成同一种人。他们变成同一种人，不是因为谁被淘汰了，而是因为中间那堵名为「交接、标注、排期、返工」的墙被拆掉了——而拆墙的工具，恰好掌握在正在定义下一代AI的三家公司手里。

5. 1.5亿美元砸向30万AI顾问，OpenAI要把你的报销周报和工作流全重写 [2026-06-18]

OpenAI在2026年6月14日投下1.5亿美元，推出名为Partner Network（合作伙伴网络）的计划，目标是在2026年底前训练并认证30万名AI顾问。这并非OpenAI一时兴起的豪赌，而是AI巨头竞争逻辑根本性切换的明确信号。麦肯锡、BCG、贝恩、埃森哲、普华永道这些全球顶级咨询公司被集体拉入同一张网，它们不再是置身事外的看客，而是OpenAI打开企业级市场的核心渠道。要做的事清晰而单一：把OpenAI的AI模型塞进全世界企业的工作流程里。

这1.5亿美元为何不砸进研发去练一个更强的模型？因为在OpenAI眼里，模型之战已经接近尾声。前沿模型的能力正在快速拉平——OpenAI、Anthropic、谷歌三家产品，用户越来越不看模型有多强，而看它能不能在真实场景里干出活。BCG给出了一个极其扎心的数据：高达97%的企业，在早期生成式AI项目里，压根证明不了商业价值——钱花了，模型买了，就是用不起来。这种状态被BCG称为"困在试验阶段"，也正是Partner Network要解决的核心命题。

这30万"AI改造大军"的工作被拆解为三件实事：重写工作流程、把AI接进现有系统、帮员工适应新的干活方式。OpenAI为这些顾问设了精选级（Select）、高级（Advanced）、精英级（Elite）三段位，每个层级对销售业绩、技术能力、联合销售参与度及部署经验设有高标准要求。段位之上还分了专精方向，包括主攻Codex、网络安全、AI智能体等。这种分级体系借鉴的是Salesforce和SAP多年来的成熟打法——把"认证"做成企业采购的硬通货，让Elite级伙伴在竞标里凭等级背书碾压对手。

此外，OpenAI还推出前沿部署专家（Forward Deployed Experts）机制，把OpenAI工程团队内部的落地剧本直接灌给合作伙伴，让OpenAI工程师与合作伙伴一起驻场客户现场，这正是Palantir玩了十几年的招数。真实世界的落地案例已经在说话：薪资公司Paychex联手贝恩和OpenAI做薪资自动化，等待时间比人工砍掉80%，需要人工复核的请求工作时间再降30%，准确与安全一个没丢；T-Mobile拉上埃森哲、eBay找了Artium、Agilent配了BCG——每一对组合背后，都是一条被重新设计过的真实业务流。

Anthropic其实更早看清了这个趋势，早在3月就推出Claude Partner Network并砸下1亿美元，到6月已有4万家公司申请、逾1万名顾问拿到认证。OpenAI此次砸钱，显然带着回防意味。更深一层的算盘在于：认证本身就是OpenAI的护城河。一家公司一旦掏钱让员工考了OpenAI的认证，再想掉头用别家模型，成本就上去了。OpenAI与微软解绑后第一次能自己掌控认证和销售渠道，Partner Network正是这份"独立"落地的重要一手。模型战打完了，新战火烧到了每个打工人的工位上——AI正从"你打开的工具"变成"默认的环境"，未来每家公司都会有"AI改造员"用AI重写你的工作方式。

6. Transformer之父Noam Shazeer转投OpenAI，谷歌27亿留人落空 [2026-06-18]

2026年6月18日，AI圈迎来一条震动全行业的突发消息：Transformer八子之一的Noam Shazeer正式官宣离开谷歌，加盟OpenAI，出任新设的"架构研究负责人"（Head of Architecture Research）一职。这位亲手写下AI时代第一行代码的传奇人物，将把自己的下一程押在通向ASI（超级人工智能）的路上。OpenAI首席研究官Mark Chen亲自发推接人，足见这家公司在AGI赌桌上的野心——让发明了Transformer的人，去发明下一个Transformer。

要理解这条消息的分量，得先明白Noam Shazeer在AI史上的坐标。2017年，那篇标题狂得有点嚣张的论文**《Attention Is All You Need》横空出世，提出了Transformer架构**——今天每一个大模型，从GPT到Gemini再到Claude，底层全部脱胎于这篇15页的论文。八位作者被业界封为"Transformer八子"，Shazeer便是其中之一，且绝非挂名作者：多头注意力（multi-head attention）是他亲手设计的，残差结构是他搭的，第一个跑赢SOTA的可用实现，是他一行一行敲出来的。

但属于Noam Shazeer的封神榜，远不止这一篇论文。2016年，他提出了稀疏门控的混合专家（MoE）架构，这是现代大模型省算力的命门技术；2018年，他主导了Mesh-TensorFlow——第一个能在超算上训练巨型Transformer的实用系统；2019年，他参与打造了T5；他还是谷歌对话系统LaMDA的核心贡献者。现代大模型赖以生存的几大底层技术，几乎全都在他的名下。1994年国际数学奥林匹克（IMO）金牌得主、满分，随后进入杜克大学攻读数学与计算机的天才少年，2000年加入当时才两岁的谷歌，一干就是21年。

Noam Shazeer的离开对谷歌而言是切肤之痛。2021年他与Daniel De Freitas共同创办了Character.AI；2024年8月，谷歌以27亿美元的天价授权Character.AI的技术，只为把他请回公司。业内都心知肚明，谷歌真正想买的是那个人——Shazeer持有Character.AI三到四成股份，仅这一笔交易个人就套现约7.5亿到10亿美元。回归后，他与Jeff Dean、Oriol Vinyals共同执掌Gemini技术，被传揪出训练里的深藏bug，让模型训练效率暴涨，直接把Gemini 3推上各大榜单第一，逼得奥特曼在OpenAI内部拉响"红色警报"。

这步人事变动之所以更让人脊背发凉，是因为一个细节：Transformer八子早已各奔东西——Aidan Gomez去做Cohere，Llion Jones创办Sakana AI，Vaswani和Parmar去了Adept。唯独有一个人，Lukasz Kaiser，五年前就低调走进了OpenAI，主导了o1、o3的核心研发。如今Noam Shazeer再入OpenAI，这家公司一口气集齐了两位Transformer原作者——一个定义了过去，一个在啃未来。Shazeer对超级智能的信仰近乎赤裸：他公开谈论"百万个自动化研究员"在数据中心里日夜运转，谈论"世界GDP暴涨100倍"。当被问到大模型为什么能work，他给过一个堪称玄学的回答——"我最好的猜测，是神的恩典"。这个把地基铺向ASI的人，如今站到了OpenAI一边——27亿美元能买回一个人，却买不回他赌的那个未来。

7. 什么！ChatGPT也要刷脸实名认证了？ [2026-06-18]

在2026年6月这个看似平常的夏夜，一条来自X平台开发者「Kai」的截图，像一颗石子投入了AI社区的湖面，瞬间激起千层浪。截图显示，ChatGPT 弹出了一个前所未有的窗口——要求用户上传带照片的证件、对着摄像头完成一段实时自拍视频，过程中还要配合转头、眨眼等动作，背后的3D活体检测算法正在暗中审视镜头前这张脸的真实性。这不是个别现象。几乎同一时间段，OpenAI 的老对手 Anthropic 也通过一封群发邮件宣布，旗下产品 Claude 将在7月8日更新隐私政策，正式引入身份验证和年龄验证机制。一时间，评论区里「这跟开户有什么区别」「不如立刻改用本地模型」的吐槽刷了屏，但喧嚣背后的事实却很清晰：AI 行业最顶级的两款产品，正在从「随取随用的公共设施」变成「需要实名登记的管制品」。

如果把时间轴拉长，会发现这一切并非一蹴而就。OpenAI 在「查户口」这条路上，已经领先 Anthropic 至少半年。早在2026年1月20日，他们就静悄悄地上线了一套年龄预测模型，没有公告、没有弹窗、没有任何通知。模型会综合账号注册时长、最活跃时段、日常使用模式以及用户自填年龄四条信号，交叉比对后给出一个「未成年人概率」。一旦超过阈值，ChatGPT 便会自动屏蔽潜在有害内容，限制静悄悄地生效。几个月前的2025年4月，OpenAI 把矛头对准了开发者侧——想调用高级 API 模型？先上传实体证件、通过 Verify Organization 认证，手机驾照、数字身份证一律不认，每个证件90天内只能验证一个组织，一人一证的硬性规则堵死了马甲号薅羊毛的可能。而 Anthropic 这边则把目光投向了 Agent 时代：当 AI 不再只是聊天、而是开始替你订机票、改文件、操作第三方应用时，「谁在下指令」就从安全命题升级成了法律命题。

两大巨头不约而同走向同一个终点，背后是两条清晰的逻辑线。第一条线叫 防滥用——API 端的证件验证，官方说法是防止少数开发者违规使用，比如批量注册薅模型能力，甚至用高级模型训练其他模型。一人一证、90天一次的硬约束，本质上是在把灰色产业链彻底斩断。第二条线叫 Agent 责任——这是 Anthropic 邮件里专门点出的关键词。当 AI 变成 Agent、开始代替人类执行真实世界的操作，「谁在背后操控」就成了监管绕不开的问题；刷脸不是终点，只是起点，而7月8日 Claude 的隐私政策更新，只是这条长链上的又一步。OpenAI 帮助中心几小时前刚更新的「为什么我被要求验证身份」页面、网友晒出的刷脸弹窗，都在说明一件事：身份验证正从「被标记用户」向更大范围的普通用户铺开，文档在改、系统在扩，一切都在加速。

于是我们站在了一个新的分水岭上。从2025年4月 API 开发者证件验证、2026年1月消费端年龄预测模型静默上线、到6月10日 Anthropic 发邮件、6月17日 ChatGPT 弹出刷脸窗口，半年之内，两家 AI 巨头用行动给出了同一个答案：要知道屏幕后面坐着的，到底是谁。匿名使用 AI 的时代正在结束，最强的那批模型正在和银行开户、运营商实名一样，成为一件必须亮明身份才能使用的基础设施。普通用户也好，开发者也罢，从今往后，想用最聪明的 AI，得先准备好自己的「身份证」——这既是一道安全门，也可能是一扇通往 Agent 时代合规框架 的入场券。