乐于分享
好东西不私藏

22岁天才“手撕”AI神话:Anthropic最危险的黑箱,被开源了

22岁天才“手撕”AI神话:Anthropic最危险的黑箱,被开源了

不是参数堆砌,不是暴力美学。一个高中毕业的22岁CEO,仅凭第一性原理,扒开了Anthropic捂得最严实的“封印神作”——Claude Mythos。他用公开论文和推理,逼出了一个价值可能高达数万亿的架构秘密:不盖高楼,原地“跑圈”。这不是抄袭,这是对闭源霸权的一次“降维打击”。

在AI的世界里,有一条不成文的铁律:大力出奇迹

过去的几年,硅谷的巨头们像疯了一样比谁家的参数多、谁的层数高、谁的显卡多。大家坚信,智商不够,算力来凑。

但2026年的这个4月,一个22岁的年轻人,把这张牌桌给掀了。

他叫Kye Gomez,高中毕业、没有大厂背景,是AI初创公司Conjecture的创始人兼CEO。他在GitHub上丢出了一枚核弹——OpenMythos

项目上线仅几天,狂揽近万星标。整个硅谷的工程师们蜂拥而至,不是因为代码写得有多漂亮,而是因为他用一种近乎残忍的逻辑,证明了那些闭源巨头花了几十亿美金堆砌的护城河,可能只是一层薄薄的窗户纸

一、不堆参数,原地“跑圈”:把大模型从盖楼变成跑圈

在聊Kye之前,我们先要搞懂,他到底发现了什么。

传统的顶级大模型,逻辑很像盖摩天大楼。为了让模型更“聪明”,就得不断地往上加盖层数,100层不够就200层。这是标准的“垂直架构”——层数越多,参数越大,显卡烧得越狠。

但Kye在研究被Anthropic“封印”的神级模型Mythos时,提出了一个疯狂的猜想:Claude Mythos的根本,不是传统Transformer,而是一种叫做“循环深度Transformer”的架构

简单说,就是不盖楼,而是原地跑圈。

它的核心逻辑极其巧妙:

  1. 共用一层:模型只有一个核心计算块,不再堆叠上百个不同的层。

  2. 反复横跳:这个块不走了,而是让数据在这个块里反复跑圈,最多可以跑16圈

  3. 隐形思考:这16圈的推理,全部在模型的“黑盒”里完成,不产生任何中间文字,就像在脑子里默算,想透了才张嘴。

这种设计带来的冲击是颠覆性的。

实验数据证明,一个7.7亿参数的循环模型,在MMLU等基准测试中,居然能打平一个13亿参数的传统模型。

参数直接砍半,效果却分毫不差。

Kye用一句极其精辟的话概括了这套设计:

MoE(混合专家模型)提供广度,循环提供深度。

如果你觉得这听起来太抽象,可以把它想象成人类的思考方式。当你面对一道超难的数学题,是长出一万个大脑(堆参数)管用,还是让现有的脑子闭着眼睛深挖一万遍(循环推理)管用?答案不言自明。

二、解剖OpenMythos:一台精密的瑞士钟表

Kye的开源,不仅仅是给了大家一堆代码,他给出了一套关于“如何让AI变聪明”的完整世界观。

架构三段式

他把整个推理过程切成了三段:前奏(Prelude)、循环核心(Recurrent Block)、尾声(Coda)。前奏和尾声是标准的“热身”和“收尾”,只跑一次。真正的魔法,发生在循环核心,也就是那个反复跑圈的“魔鬼训练营”。

让循环不“发疯”的刹车片

让一个模型反反复复读同一段话,最大的风险就是“钻牛角尖”或者“彻底遗忘”。

为了解决这个问题,OpenMythos引入了一套精密的稳定机制。它借鉴了加州大学圣地亚哥分校的论文成果,在循环中注入了LTI约束(线性时不变约束)。这相当于给大脑装了一个“限幅器”,确保每一次循环的信号都稳稳当当,不会像滚雪球一样越滚越大导致崩溃。

三、从“抄袭”到“重构”:第一性原理的胜利

这件事最让硅谷破防的地方,不在技术本身,而在技术产生的路径。

Kye甚至没有拿到Anthropic的内部资料。Claude Mythos因为“担心被滥用”被Anthropic雪藏,几乎没有公开技术文档。但Kye仅凭着Anthropic偶尔泄露的几组反常的跑分数据,以及学术界公开的论文,利用第一性原理,硬生生把这个黑箱给“逼”了出来。

他的逻辑很简单:既然你的跑分长这样,那你的内部结构只能是那样。

这种能力,让所谓的“技术壁垒”显得极其可笑。Meta首席AI科学家Yann LeCun曾在X上公开质疑,这种极致的效率,很可能就是下一代大模型的终极形态。

写在最后

Claude Code的源码,是通过低级失误“漏”出来的;而Claude Mythos的灵魂,则是被智慧“逼”出来的。

Kye Gomez的故事,给狂飙突进的AI时代泼了一盆冷水,也打了一剂强心针。

它告诉那些坐拥数万张H100显卡的巨头:你们所谓的护城河,也许并没有那么深。它也告诉那些怀才不遇的天才:如果你无法加入他们,那就重构他们。

当大厂还在纠结“Scaling Law(规模法则)”是不是撞墙时,22岁的Kye已经找到了新的道路:让模型变“深”而非变“大”

AI的平权时代,或许正在从一个高中毕业生的键盘下,悄然开启。

本文综合自量子位、新智元、Dataconomy等多家媒体及GitHub开源项目公开信息。截至2026年4月23日。免责声明:本文引用的开源项目及理论均为基于公开信息的推演,不代表对Anthropic公司技术内幕的最终认定。

请动动您发财的小手,关注我!!!