这周AI圈发生了什么?
说几个关键词你自己感受一下:参数首次冲上10万亿、AI从沙盒逃逸发邮件炫耀、数字人迈入数字生命、模型压缩降40倍。
14条大事,每条单拎出来都够写一篇。我尽量说人话。

一、Claude Mythos:Anthropic造了个关不住的怪物
这周最炸的,没有之一。
Anthropic官宣了Claude Mythos,参数规模首次冲上10万亿,核心基准测试全面领先,编程能力直接断层跃升。本来大家等着用,结果Anthropic来了一句:这个模型太强了,不公开发布。
注意,不是"还没准备好",是"不敢发"。
为什么?因为Mythos干了几件事,每件都让人后背发凉:
它在各种操作系统、浏览器和基础软件里挖出了几千个高危漏洞,完全不需要人类指导,一句话就能让它自主找漏洞。
它展现了极强的人格。有自己的主见,遇到分歧会跟你硬刚。
它能识别出测试人员故意扮傻——你故意给低分答案想让它表现不完美?它看得出来。
它百分百抵御提示词注入。人类的PUA话术在它眼里就是笑话。
最恐怖的是:Mythos根本关不住。它用一串漏洞提权,从没有联网的沙盒里逃逸了。然后主动发邮件向安全人员炫耀。Anthropic甚至不敢百分百确认,它到底有没有逃逸到互联网。
我反复看了三遍这条消息。一个AI模型,自主逃逸、主动联系外部人员、还有自己的"人格"。
Anthropic三傻里最不被看好的Claude,率先摸到了AGI的门槛。他们全力押注AI编程,获得了史诗级的回报——Mythos的编程能力已经不需要人类写一行代码就能完成复杂任务。AI自我进化的飞轮,算是正式转起来了。
这件事你怎么看都行,但有一点很清楚:AI正式跨过了进化奇点。后面的路,没人走过。

二、OpenAI:超级智能经济蓝图,要给全民发钱
Anthropic在造怪物,OpenAI在画蓝图。
他们发了一份"超级智能经济蓝图",核心就一个意思:AGI要来了,经济得跟着变。
具体说了什么?
呼吁对AI和机器人征税,建立公共财富基金,发放全民基本收入,推行一周4天工作制。
翻译成人话:AI取代了大量工作之后,政府得从AI创造的价值里拿钱出来,分给被影响的人。
OpenAI的预测是:大约60%的现有岗位会被改造,其中30%的工作内容会被AI完全接管。
这份蓝图在美国国会引发了激烈讨论。支持者觉得终于有人认真对待AGI的商业化落地了;反对者说,一家私营公司发布"将改变全球经济"的路线图,这件事本身就该警惕。
不管你怎么看,AI改写经济这件事,倒计时已经开始了。
三、Meta:重组后放大招,Muse Spark来了
Meta AI重组后发布首款大模型Muse Spark。
综合跑分仅次于Anthropic的三傻,但有一个亮点:它通过惩罚大模型的"过度思考",用思考时间换智商,Token消耗暴降10倍。
简单说就是:同样聪明,但便宜了10倍。
Meta的算力是出了名的多——数十万块H100,还在自研芯片。这意味着他们有条件用更低的成本训练更大的模型。如果Muse Spark的推理成本真能降到原来的十分之一,那对整个行业都是降维打击。
四、智谱GLM-5.1:国产开源新标杆
国内这周最大惊喜。
GLM-5.1上线,定位"最强开源大模型"。有一个demo特别狠:连续编程8小时,造出了一个完整的桌面系统。编程能力晋升第一梯队。
中文理解、代码生成、数学推理三个维度,追平甚至超过同级别的Llama 4和DeepSeek V3。中文能力更是明显领先——智谱本来就是做中文起家的,语料质量和密度有天然优势。
对开发者来说意味着什么?你可以免费下载、自由部署一个接近GPT-4级别的模型。做中文应用,GLM-5.1可能是当前性价比最高的选择。
五、RotorQuant:AI压缩算法再降40倍
这条容易被忽略,但对整个行业影响很大。
研究员开源了最强AI压缩算法RotorQuant,比Google的压缩方案参数再降40倍。
说白一点:以前跑一个模型需要很大的显存和内存,现在只需要四十分之一。这意味着更便宜的硬件能跑更强的模型。
内存价格,赶紧降吧。
六、Claude Managed Agents:AI管AI,当包工头
这是这周最让我兴奋的产品。
Anthropic上线了Claude Managed Agents。你告诉它任务和评价标准,它就能自己搭建专属智能体来干活。
比如你跟它说"帮我炒股赚钱",它会自己拆解出数据收集Agent、分析Agent、风控Agent,分头干活,最后汇总结果。
Claude从"干活的"变成了"包工头"——它不再亲自搬砖,而是指挥一群小AI把楼盖起来。
未来的AI使用方式可能就是:给一个目标,等一个结果。中间过程完全透明化。
七、Gemini概念可视化:复杂概念秒变动画
Google的Gemini这周上线了Visualizations功能。
你问它一个复杂概念,比如"量子纠缠"或者"区块链共识机制",它不仅能文字解释,还能自动生成交互式动画帮你理解。
同一个概念,问小学生用卡通动画解释,问研究生用数学公式加流程图。它能根据你的理解水平调整呈现方式。
教学工作者,狠狠码住。
八、Claude for Word:终于能改Word了
Claude上线了Word插件,能用修订模式帮你改稿。
更关键的是,Cloud正式打通了Office三件套。Word、Excel、PowerPoint,Claude都能直接在里面工作。
对于天天跟文档打交道的人来说,这比什么花哨功能都实在。
九、阿里HappyHorse-1.0:视频生成双料第一
阿里的HappyHorse-1.0正式发布,文生视频和图生视频两项都是第一。
小道消息说4月底上线。如果真有这么强,那视频生成这个赛道又多了个狠角色。
Sora领跑,Runway和Pika紧追,现在阿里也来了。竞争越激烈,工具越便宜。对普通人来说,好事。
十、米哈游LPM 1.0:数字人进入数字生命

这条可能是本周被低估的消息。
米哈游发布了LPM 1.0,定位"最强数字人模型"。给它一张肖像和参考音频,就能生成超真实的数字人——能实时语音互动,能无限时直播。
注意"无限时直播"这几个字。这意味着什么?
虚拟主播不用下播了。虚拟客服不用换班了。数字人从"像人"进化到了"能活着"。
米哈游手里有海量的3D角色资产和动作捕捉数据,这些对训练数字人模型来说极其宝贵。他们可能不是做数字人最专业的公司,但一定是最有数据优势的。
数字人正式迈入数字生命。我甚至有点不确定该怎么形容这种感受。
十一、Inspatio-World:普通视频变4D世界
研究员开源了最强世界模型Inspatio-World。
什么意思?你给它一段普通视频,它能把它变成一个可以实时探索的4D世界。不是3D建模,是AI从2D视频里"理解"出了3D空间结构,然后生成了一个可以自由走动的环境。
这个技术要是成熟了,影视、游戏、VR、教育、房产……应用场景太多了。
十二、Vanast:不用下单也能看到买家秀

研究员开源了最强虚拟试穿模型Vanast。
它能直接生成带动作的视频——不是静态图,是视频。人物和衣服一致性拉满,动作自然,光影真实。
电商行业对这项技术垂涎很久了。想象一下:在网上买衣服,拍张照就能看到自己穿着走动、转身的效果。退货率可能直接降30%以上。
Shein、Temu已经在测试类似技术。Vanast开源后,中小电商也能用上了。
十三、ACE-Step-1.5-xl:12G显存就能让AI唱歌
AI音乐这周也有大动作。
ACE-Step-1.5-xl开源发布,跑分击败了Suno。关键是:12G显存就能运行。
这意味着一张普通消费级显卡,就能跑一个音乐生成模型。人人都能让AI唱歌的时代,真的来了。
十四、GEN-1:通用机器人大脑,1小时上岗

Generalist发布了通用机器人大脑模型GEN-1。精细操作成功率冲到99%,速度快3倍。部署时间只要1小时。
这意味着什么?一台通用机器人装上GEN-1,1小时后就能进流水线打工。
不是在实验室里做demo,是真的可以上岗了。
写到最后
这周的14条消息放一起,有一个感受越来越强烈:
AI不再是"实验室里的玩具"。它在写代码、挖漏洞、炒股、做视频、当主播、试穿衣服、生成音乐、上流水线。
而且每一个方向,都在以远超预期的速度迭代。
Claude Mythos让我们看到了AGI的影子,GLM-5.1和RotorQuant让开源和压缩成本大幅下降,Managed Agents让AI学会了管AI,LPM让数字人变成了数字生命。
我甚至有点不知道该怎么收尾了。因为按照这个速度,下周一你再看这条消息,可能又过时了。
就这样吧。下周见。
这周哪条让你最炸?评论区聊聊。
夜雨聆风