每日AI热文早播 | 2026.06.19
今日共 7 篇热门AI资讯,涵盖最新技术动态与行业趋势。
1. 上百个Agent,该怎么管?清华团队新思路:重做Session [2026-06-18]

多智能体系统从demo走到生产,最大的拦路虎从来不是「造不出更多Agent」,而是「管不住Agent之间状态怎么流动」。当一个项目里跑着几十上百个Agent,研究Agent读过的issue、编码Agent改过的diff、沙箱里跑过的测试、校验Agent给出的否决信号、记忆后端写下的失败索引——这些本该拼成一条完整证据链的事件,往往散落在各自的日志里,谁也说不清哪条分支最终交出了答案。OpenRath正是冲着这道墙来的。它由清华大学与中山大学联合组成的Rath Team开源,思路反直觉却极其清晰:别再围着Agent转了,真正该被当成「一等公民」的,是Session。在OpenRath的视角里,Session不只是聊天历史,而是证据的载体——工具调用的参数与结果、代码改动、沙箱身份、失败重试的路径、人工批准或否决的校验信号,都要被Session这条数据流装下、串联、可追溯。
围绕这条核心主张,OpenRath把多智能体协作重新切成了四象限:单Agent单Session是ChatGPT式聊天,多Agent单Session是子代理协作,单Agent多Session是分支扇出,而多Agent多Session(即MAMS,Multi-Agent Multi-Session)才是OpenRath面向的方向。它把多Agent协作从「群聊」拉回到「运行时控制平面」:当前该交给哪个Agent、它能看到什么上下文、读了哪些记忆、下一条命令该在哪个沙箱跑、继续之前需要什么校验信号,这些原本靠「再加一个群聊角色」解决不了的问题,被压回一张Session Graph上。Agent、工具、工作流、记忆、沙箱位置,都在这张图上交汇——OpenRath想要的,从来不是一屋子聪明的工人,而是先建好工位、工单和流水线。
这套设计最聪明的点在于,OpenRath几乎是把深度学习开发者最熟悉的PyTorch抽象整套搬了过来,做了一组「一一对应」的映射:Tensor→Session承载流动的数据,Module/Linear→Workflow/Agent承载可组合的变换单元,Device→Sandbox/Backend决定算在哪,Parameter→Memory承载可学习的状态,Function→Tool承担动作,Selector则承担控制流。它从这套映射里抽出三根支柱来回答「为什么这么设计」:第一根支柱是Agent作为变换层,Agent不是全能助手,而是Session上的一层forward(session) → session变换,调工具的Agent、Compressor、记忆的recall/commit、写摘要的Agent都套在同一个接口下,可以像神经网络层一样任意堆叠、任意嵌套;第二根支柱是运行时的控制平面由Session Graph承担,它决定fork、merge、复用与追踪的单位是整条Session数据流,而不是某个Agent内部那份各自维护的消息列表;第三根支柱是开放的BSD-3-Clause协议与极低门槛——目前OpenRath已在PyPI发布到v1.2.1,pip install openrath就能装,官网、文档、博客、GitHub一应俱全,任何人都可以把这套「像PyTorch一样搭Agent集群」的工作流搬进自己的多智能体系统里去。AutoGen把多Agent对话做成了实用编程模型,CrewAI把Agent团队与结构化流程分开,LangGraph用图状态和supervisor节点表达路由与控制——它们解决的是「Agent之间怎么说话」,而OpenRath接着追问的那一句「说完之后谁拥有这份工作的状态」,正是它在多智能体赛道里卡住的位置。
2. 中国AI黑马演语科技Evoken狂揽近3亿美元B+融资,ARR破3亿、估值站上20亿美元 [2026-06-18]

在2026年的AI赛道里,「谁能率先跑通商业化闭环」几乎是所有投资人反复追问的同一道题。当无数底座大模型公司还在烧钱、还在为下一轮融资发愁的时候,一家叫演语科技的中国公司,用一笔近3亿美元的B+轮融资和一份「ARR已突破3亿美元」的成绩单,给出了响亮的答案。本轮融资由Granite Asia、腾讯、顺为资本联合领投,HT Investment、时代资本共同参与投资,而高榕资本、蚂蚁集团、渶策资本、明势创投、源码资本、红杉中国等老股东全部持续加码——这种一线机构「超额认购」、追着加码的密度,在过去几年的AI应用赛道里几乎绝无仅有,也让演语科技一举站上20多亿美元的投后估值,成为国内AI应用层有史以来最大单笔融资。资本给出的信号再清晰不过:它已经在中国AI应用落地这场战役中确立了断层式领先。
支撑这个估值的,不是PPT上的模型参数,而是真金白银的自我造血。披露数据显示,演语科技在过去12个月里连续跑通了多个AI产品的PMF(产品与市场匹配),实现从单点产品到集团化业务矩阵的跨越式扩张,2026年5月集团整体收入同比增长超过3000%。在它「三驾马车」中,LiblibAI是压舱石——累计用户突破3000万,相当于每三位中国设计师就有一位在用它做日常创作,平台沉淀了超过50万个原创模型和过亿专业素材,AI创意界的「B站+淘宝」名副其实;今年3月才正式上线的LibTV则是那支「超级火箭」,它瞄准专业创作者、工作室、品牌和影视团队的工业级AI视频生产需求,上线首月就实现单日收入突破100万美金的惊人战绩,5月收入达到上线首月的13倍以上,平台人气第一的短剧《武松打虎》与AI影像狂飙季最佳短片《格子》都验证了「用AI做短剧也能稳定商业化变现」这条路径;此外还有用户规模同样过千万的星流(Star Stream),作为国内用户规模领先的AI设计Agent,它探索的是下一代从创意构思到设计交付的完整工作流,又是一条全新的增长曲线。
比起产品本身,更值得拆解的是这套商业逻辑为什么成立。多数中国AI公司今天仍停留在「单一产品、单一场景」的精细化运营阶段,而演语科技已经构建起「高收入、高增长、健康现金流」三位一体的业务闭环,并且没有走大规模烧钱路线——这在当下的资本市场里几乎是稀有物种。对比海外同类AI独角兽动辄几十倍甚至上百倍的市销率,投后20多亿美元的演语科技反而处于明显估值洼地,资本超额认购在逻辑上就讲得通。但演语科技的野心显然不止于「再多融一轮」。这次B+轮融资里有一个值得注意的细节:公司首次以全新的集团品牌「Evoken」统一对外发声,从「演语科技」到「Evoken」,背后是创始人陈冕对AI创意内容产业的重新定义——在他看来,AI技术的本质不只是提升效率的「工具」,更是重构整个内容产业底座的「新型基础设施」。创作者真正需要的不是十个互不兼容的AI工具,而是一套无缝衔接、生态互通、能直接转化为商业价值的内容生产流水线,LiblibAI做创意生态、LibTV做生产力工具、星流做智能体服务,三条曲线共同把演语科技推向了3000%的年营收增长,也让这家中国AI黑马稳稳站在了全球AI应用商业化的舞台中央。
3. Dario 69分钟访谈全曝光:Mythos首度被亲口称为「超级武器」 [2026-06-18]

在这场长达69分钟的Bloomberg《The Circuit》访谈中,Anthropic CEO Dario Amodei 首次公开谈论了内部代号为 Mythos 的下一代模型,而主持这次对话的正是知名记者 Emily Chang。与往常的公关辞令不同,Dario这次几乎毫无保留,把Mythos最危险的一面摊到了台面上。他透露,Mythos最让他震惊的能力,是在漏洞发现与武器化之间出现了「断崖式跃升」——它不仅能找到漏洞,还能自主走完扫描、发现、利用、武器化的完整网络攻击杀伤链(cyber kill chain)。换句话说,这不是「辅助黑客的工具」,而是一个AI黑客。更让人警觉的是,参与内测的Palo Alto Networks首席产品官直言,Mythos在不到三周内就完成了一整年渗透测试的工作量,并且能把中低危漏洞串成攻击链直接打穿系统,几家安全公司在测试后甚至打电话来恳求Anthropic「别发布」——「这是超级武器,你应该要持枪证才能用这东西」。
面对「奇点何时到来」这个终极追问,Dario给出了一个出乎多数人意料的答案:奇点不是一个时间点,而是一条我们已经在其中的连续曲线。他用一组数字支撑这个判断——AI已经能为下一代AI建议架构,而全要素生产率的提升从一年前的10%-15%,已经翻倍到了现在的20%-30%。他把这个过程称为平滑的指数(smooth exponential)。这意味着,AI的自我改进不是某天早上一觉醒来突然「觉醒」,而是在每一个当下都要做出的判断:是否该踩刹车?是否该加更多防护?这条不断加速的曲线,正是Dario最核心的风险框架——它的危险不在于某个「开关被按下」,而在于速度本身。也正因此,Mythos被压着不发布,Dario反问道:「我们因为不发布Mythos,商业上已经遭受了巨大损失。它在Anthropic内部极大地加速了研究和下一代模型的生产。如果放出去,外部世界也会获得同样的加速。这怎么可能是营销?」
当Emily Chang把话题引向历史,Dario明确拒绝被类比为奥本海默,他最认同的人是1933年在伦敦街头过马路时第一个想到核链式反应的利奥·西拉德(Leo Szilard)——后来正是西拉德起草了那封改变历史、催生曼哈顿计划的信,但他也是最早站出来反对实际使用原子弹的人。Dario直言不讳地把奥本海默看作「一个失败案例」,并强调「我们不可能靠一个大人物来解决这件事,这里有太多强大的利益方,唯一能让所有人都安全的方式是制衡和平衡」。在这一框架下,他在去年Axios峰会上给出的「文明崩塌概率10%-25%」就显得格外沉重。面对「是不是Anthropic自己造出来的东西导致了崩塌」这种追问,Dario没有回避,用一个航空公司的比喻精准回应:可以造一家比同行安全10倍的航空公司,但25%的坠机概率「你不会上那架飞机」,能做的只有继续把它降得更低。
这场访谈里另一个被反复引用的判断,是AI可能在1到5年内消灭一半的入门级白领工作。Dario坦言自己最痛恨的就是社交媒体——他一年前完整的论述被剪成三秒钟的「doom is coming」在X上疯传,脱离了所有上下文。面对「廉价营销」的指责,他毫不客气地回怼:这种说法本身才是懒惰和廉价营销,是硅谷被三秒钟短视频绑架的病。他同时透露,在Anthropic内部,AI已经写了几乎全部代码,工程师反而更高效,但有些岗位,AI确实做得更好。他把出路寄托在物理世界、以人为本的工作、由人引导AI这三条路径上,但他也承认「没人保证」。访谈最后,他难得露出轻松一面,说当CEO最让他意外的是「得经常化妆」——然而,玩笑背后是一个严肃的事实:他正在造可能改变文明的东西,他也比任何人都清楚,这东西可能把文明拆了。指数曲线的另一边是什么?没人知道。
4. 今天起,Claude Design要把设计师和程序员变成同一种人了 [2026-06-18]

Anthropic在6月18日深夜突然放出Claude Design的大版本更新,一次性甩出四个大招,瞬间在X上引爆讨论。这四个动作包括:设计系统可从GitHub一键导入并由AI自动校验品牌合规、新增**/design-sync和/design两条命令打通Claude Code双向通道、导出目的地一口气扩到9个(覆盖Adobe、Canva、Vercel、Replit、Miro、Gamma、Lovable、Wix、Base44**),以及画布编辑重做——拖拽、缩放、对齐直接动手,不再每改一个像素就烧一轮模型调用。最有戏剧性的细节来自Anthropic设计师Nate Parrott在X上连发的三段实操录屏:他把一个浅色主题的邮件注册页面变成深绿色暗色版时,Claude Design自己跑了八轮自查才把图交出来——不是「尽量接近品牌规范」,而是「反复确认后才敢给你看」。网友看完之后有人惊呼「设计师的时代要终结了」,也有人玩梗喊话「我们不要新功能,我们要Claude Fable」。
真正把整个行业最头疼的环节干掉的,是**/design-sync和/design这两条命令。前者把代码仓库里的设计系统(颜色、字体、组件库、间距规则)一键拉进Claude Design,之后每次生成都拿真实组件去搭,搭完自己审,不合规自己改;后者则反过来,让开发者在Claude Code终端里一行指令就能创建设计项目、编辑已有设计、同步整个设计文件夹。这意味着,过去那种「设计师在一个工具里做完,工程师在另一个工具里重新搭」的有损交接——再附赠几场扯皮会议——正在被端到端的工作流**取代。设计在Claude Design里做,做完一个动作就能推进Claude Code写代码;写到一半想看界面,/design一行命令拉出可视化项目。那堵名为「交接、标注、排期、返工」的墙,被Anthropic亲手拆了。
设计工具只是表面,底下是一场更大的仗。2026年上半年,OpenAI、Google、Anthropic三家都在疯狂扩张产品线——聊天、编程、图片、视频、设计——每一个品类都在抢。Altman说AGI已经非常接近了,Amodei说大概率2027年到来,三家谁都不敢停。而通往超级智能的竞赛,表面比的是模型能力,底下比的是谁圈住了更多用户和更多使用场景。Claude Code锁住了开发者,Claude Design锁住了设计师和产品经理,两个加在一起,Anthropic拿下了从「想法」到「上线」的完整链条。半年之内,设计工具市场从Figma一家独大,变成了Claude Design、Figma AI、Google Stitch、Vercel v0、Lovable五方混战——3月18日Google Stitch大更新当天Figma股价跌约8%,4月17日Claude Design发布再跌约7.5%,5月20日Figma反击推出原生AI设计代理——这是十年来设计工具市场的第一次真正变天。
但这场仗的重点远不止设计工具本身。站在Claude Design背后的,是正在冲刺通用人工智能的三大巨头——Google、Anthropic、OpenAI——不约而同把手伸进了设计领域。设计工具只是它们扩张产品版图、抢占用户入口的一个棋子。Vercel和Replit的高管在第一时间表态,口径出奇一致:不再提「设计师」,统一换成了「建造者」——创始人、产品经理、市场人员、独立开发者,全都能用。回到网友那句被反复转发的判断:设计师和开发者,正在变成同一种人。他们变成同一种人,不是因为谁被淘汰了,而是因为中间那堵名为「交接、标注、排期、返工」的墙被拆掉了——而拆墙的工具,恰好掌握在正在定义下一代AI的三家公司手里。
5. 1.5亿美元砸向30万AI顾问,OpenAI要把你的报销周报和工作流全重写 [2026-06-18]

OpenAI在2026年6月14日投下1.5亿美元,推出名为Partner Network(合作伙伴网络)的计划,目标是在2026年底前训练并认证30万名AI顾问。这并非OpenAI一时兴起的豪赌,而是AI巨头竞争逻辑根本性切换的明确信号。麦肯锡、BCG、贝恩、埃森哲、普华永道这些全球顶级咨询公司被集体拉入同一张网,它们不再是置身事外的看客,而是OpenAI打开企业级市场的核心渠道。要做的事清晰而单一:把OpenAI的AI模型塞进全世界企业的工作流程里。
这1.5亿美元为何不砸进研发去练一个更强的模型?因为在OpenAI眼里,模型之战已经接近尾声。前沿模型的能力正在快速拉平——OpenAI、Anthropic、谷歌三家产品,用户越来越不看模型有多强,而看它能不能在真实场景里干出活。BCG给出了一个极其扎心的数据:高达97%的企业,在早期生成式AI项目里,压根证明不了商业价值——钱花了,模型买了,就是用不起来。这种状态被BCG称为"困在试验阶段",也正是Partner Network要解决的核心命题。
这30万"AI改造大军"的工作被拆解为三件实事:重写工作流程、把AI接进现有系统、帮员工适应新的干活方式。OpenAI为这些顾问设了精选级(Select)、高级(Advanced)、精英级(Elite)三段位,每个层级对销售业绩、技术能力、联合销售参与度及部署经验设有高标准要求。段位之上还分了专精方向,包括主攻Codex、网络安全、AI智能体等。这种分级体系借鉴的是Salesforce和SAP多年来的成熟打法——把"认证"做成企业采购的硬通货,让Elite级伙伴在竞标里凭等级背书碾压对手。
此外,OpenAI还推出前沿部署专家(Forward Deployed Experts)机制,把OpenAI工程团队内部的落地剧本直接灌给合作伙伴,让OpenAI工程师与合作伙伴一起驻场客户现场,这正是Palantir玩了十几年的招数。真实世界的落地案例已经在说话:薪资公司Paychex联手贝恩和OpenAI做薪资自动化,等待时间比人工砍掉80%,需要人工复核的请求工作时间再降30%,准确与安全一个没丢;T-Mobile拉上埃森哲、eBay找了Artium、Agilent配了BCG——每一对组合背后,都是一条被重新设计过的真实业务流。
Anthropic其实更早看清了这个趋势,早在3月就推出Claude Partner Network并砸下1亿美元,到6月已有4万家公司申请、逾1万名顾问拿到认证。OpenAI此次砸钱,显然带着回防意味。更深一层的算盘在于:认证本身就是OpenAI的护城河。一家公司一旦掏钱让员工考了OpenAI的认证,再想掉头用别家模型,成本就上去了。OpenAI与微软解绑后第一次能自己掌控认证和销售渠道,Partner Network正是这份"独立"落地的重要一手。模型战打完了,新战火烧到了每个打工人的工位上——AI正从"你打开的工具"变成"默认的环境",未来每家公司都会有"AI改造员"用AI重写你的工作方式。
6. Transformer之父Noam Shazeer转投OpenAI,谷歌27亿留人落空 [2026-06-18]

2026年6月18日,AI圈迎来一条震动全行业的突发消息:Transformer八子之一的Noam Shazeer正式官宣离开谷歌,加盟OpenAI,出任新设的"架构研究负责人"(Head of Architecture Research)一职。这位亲手写下AI时代第一行代码的传奇人物,将把自己的下一程押在通向ASI(超级人工智能)的路上。OpenAI首席研究官Mark Chen亲自发推接人,足见这家公司在AGI赌桌上的野心——让发明了Transformer的人,去发明下一个Transformer。
要理解这条消息的分量,得先明白Noam Shazeer在AI史上的坐标。2017年,那篇标题狂得有点嚣张的论文**《Attention Is All You Need》横空出世,提出了Transformer架构**——今天每一个大模型,从GPT到Gemini再到Claude,底层全部脱胎于这篇15页的论文。八位作者被业界封为"Transformer八子",Shazeer便是其中之一,且绝非挂名作者:多头注意力(multi-head attention)是他亲手设计的,残差结构是他搭的,第一个跑赢SOTA的可用实现,是他一行一行敲出来的。
但属于Noam Shazeer的封神榜,远不止这一篇论文。2016年,他提出了稀疏门控的混合专家(MoE)架构,这是现代大模型省算力的命门技术;2018年,他主导了Mesh-TensorFlow——第一个能在超算上训练巨型Transformer的实用系统;2019年,他参与打造了T5;他还是谷歌对话系统LaMDA的核心贡献者。现代大模型赖以生存的几大底层技术,几乎全都在他的名下。1994年国际数学奥林匹克(IMO)金牌得主、满分,随后进入杜克大学攻读数学与计算机的天才少年,2000年加入当时才两岁的谷歌,一干就是21年。
Noam Shazeer的离开对谷歌而言是切肤之痛。2021年他与Daniel De Freitas共同创办了Character.AI;2024年8月,谷歌以27亿美元的天价授权Character.AI的技术,只为把他请回公司。业内都心知肚明,谷歌真正想买的是那个人——Shazeer持有Character.AI三到四成股份,仅这一笔交易个人就套现约7.5亿到10亿美元。回归后,他与Jeff Dean、Oriol Vinyals共同执掌Gemini技术,被传揪出训练里的深藏bug,让模型训练效率暴涨,直接把Gemini 3推上各大榜单第一,逼得奥特曼在OpenAI内部拉响"红色警报"。
这步人事变动之所以更让人脊背发凉,是因为一个细节:Transformer八子早已各奔东西——Aidan Gomez去做Cohere,Llion Jones创办Sakana AI,Vaswani和Parmar去了Adept。唯独有一个人,Lukasz Kaiser,五年前就低调走进了OpenAI,主导了o1、o3的核心研发。如今Noam Shazeer再入OpenAI,这家公司一口气集齐了两位Transformer原作者——一个定义了过去,一个在啃未来。Shazeer对超级智能的信仰近乎赤裸:他公开谈论"百万个自动化研究员"在数据中心里日夜运转,谈论"世界GDP暴涨100倍"。当被问到大模型为什么能work,他给过一个堪称玄学的回答——"我最好的猜测,是神的恩典"。这个把地基铺向ASI的人,如今站到了OpenAI一边——27亿美元能买回一个人,却买不回他赌的那个未来。
7. 什么!ChatGPT也要刷脸实名认证了? [2026-06-18]

在2026年6月这个看似平常的夏夜,一条来自X平台开发者「Kai」的截图,像一颗石子投入了AI社区的湖面,瞬间激起千层浪。截图显示,ChatGPT 弹出了一个前所未有的窗口——要求用户上传带照片的证件、对着摄像头完成一段实时自拍视频,过程中还要配合转头、眨眼等动作,背后的3D活体检测算法正在暗中审视镜头前这张脸的真实性。这不是个别现象。几乎同一时间段,OpenAI 的老对手 Anthropic 也通过一封群发邮件宣布,旗下产品 Claude 将在7月8日更新隐私政策,正式引入身份验证和年龄验证机制。一时间,评论区里「这跟开户有什么区别」「不如立刻改用本地模型」的吐槽刷了屏,但喧嚣背后的事实却很清晰:AI 行业最顶级的两款产品,正在从「随取随用的公共设施」变成「需要实名登记的管制品」。
如果把时间轴拉长,会发现这一切并非一蹴而就。OpenAI 在「查户口」这条路上,已经领先 Anthropic 至少半年。早在2026年1月20日,他们就静悄悄地上线了一套年龄预测模型,没有公告、没有弹窗、没有任何通知。模型会综合账号注册时长、最活跃时段、日常使用模式以及用户自填年龄四条信号,交叉比对后给出一个「未成年人概率」。一旦超过阈值,ChatGPT 便会自动屏蔽潜在有害内容,限制静悄悄地生效。几个月前的2025年4月,OpenAI 把矛头对准了开发者侧——想调用高级 API 模型?先上传实体证件、通过 Verify Organization 认证,手机驾照、数字身份证一律不认,每个证件90天内只能验证一个组织,一人一证的硬性规则堵死了马甲号薅羊毛的可能。而 Anthropic 这边则把目光投向了 Agent 时代:当 AI 不再只是聊天、而是开始替你订机票、改文件、操作第三方应用时,「谁在下指令」就从安全命题升级成了法律命题。
两大巨头不约而同走向同一个终点,背后是两条清晰的逻辑线。第一条线叫 防滥用——API 端的证件验证,官方说法是防止少数开发者违规使用,比如批量注册薅模型能力,甚至用高级模型训练其他模型。一人一证、90天一次的硬约束,本质上是在把灰色产业链彻底斩断。第二条线叫 Agent 责任——这是 Anthropic 邮件里专门点出的关键词。当 AI 变成 Agent、开始代替人类执行真实世界的操作,「谁在背后操控」就成了监管绕不开的问题;刷脸不是终点,只是起点,而7月8日 Claude 的隐私政策更新,只是这条长链上的又一步。OpenAI 帮助中心几小时前刚更新的「为什么我被要求验证身份」页面、网友晒出的刷脸弹窗,都在说明一件事:身份验证正从「被标记用户」向更大范围的普通用户铺开,文档在改、系统在扩,一切都在加速。
于是我们站在了一个新的分水岭上。从2025年4月 API 开发者证件验证、2026年1月消费端年龄预测模型静默上线、到6月10日 Anthropic 发邮件、6月17日 ChatGPT 弹出刷脸窗口,半年之内,两家 AI 巨头用行动给出了同一个答案:要知道屏幕后面坐着的,到底是谁。匿名使用 AI 的时代正在结束,最强的那批模型正在和银行开户、运营商实名一样,成为一件必须亮明身份才能使用的基础设施。普通用户也好,开发者也罢,从今往后,想用最聪明的 AI,得先准备好自己的「身份证」——这既是一道安全门,也可能是一扇通往 Agent 时代合规框架 的入场券。
夜雨聆风