22岁天才“手撕”AI神话:Anthropic最危险的黑箱,被开源了-夜雨聆风

22岁天才“手撕”AI神话:Anthropic最危险的黑箱,被开源了

不是参数堆砌，不是暴力美学。一个高中毕业的22岁CEO，仅凭第一性原理，扒开了Anthropic捂得最严实的“封印神作”——Claude Mythos。他用公开论文和推理，逼出了一个价值可能高达数万亿的架构秘密：不盖高楼，原地“跑圈”。这不是抄袭，这是对闭源霸权的一次“降维打击”。

在AI的世界里，有一条不成文的铁律：大力出奇迹。

过去的几年，硅谷的巨头们像疯了一样比谁家的参数多、谁的层数高、谁的显卡多。大家坚信，智商不够，算力来凑。

但2026年的这个4月，一个22岁的年轻人，把这张牌桌给掀了。

他叫Kye Gomez，高中毕业、没有大厂背景，是AI初创公司Conjecture的创始人兼CEO。他在GitHub上丢出了一枚核弹——OpenMythos。

项目上线仅几天，狂揽近万星标。整个硅谷的工程师们蜂拥而至，不是因为代码写得有多漂亮，而是因为他用一种近乎残忍的逻辑，证明了那些闭源巨头花了几十亿美金堆砌的护城河，可能只是一层薄薄的窗户纸。

一、不堆参数，原地“跑圈”：把大模型从盖楼变成跑圈

在聊Kye之前，我们先要搞懂，他到底发现了什么。

传统的顶级大模型，逻辑很像盖摩天大楼。为了让模型更“聪明”，就得不断地往上加盖层数，100层不够就200层。这是标准的“垂直架构”——层数越多，参数越大，显卡烧得越狠。

但Kye在研究被Anthropic“封印”的神级模型Mythos时，提出了一个疯狂的猜想：Claude Mythos的根本，不是传统Transformer，而是一种叫做“循环深度Transformer”的架构。

简单说，就是不盖楼，而是原地跑圈。

它的核心逻辑极其巧妙：

这种设计带来的冲击是颠覆性的。

实验数据证明，一个7.7亿参数的循环模型，在MMLU等基准测试中，居然能打平一个13亿参数的传统模型。

参数直接砍半，效果却分毫不差。

Kye用一句极其精辟的话概括了这套设计：

MoE（混合专家模型）提供广度，循环提供深度。

如果你觉得这听起来太抽象，可以把它想象成人类的思考方式。当你面对一道超难的数学题，是长出一万个大脑（堆参数）管用，还是让现有的脑子闭着眼睛深挖一万遍（循环推理）管用？答案不言自明。

Kye的开源，不仅仅是给了大家一堆代码，他给出了一套关于“如何让AI变聪明”的完整世界观。

架构三段式

他把整个推理过程切成了三段：前奏（Prelude）、循环核心（Recurrent Block）、尾声（Coda）。前奏和尾声是标准的“热身”和“收尾”，只跑一次。真正的魔法，发生在循环核心，也就是那个反复跑圈的“魔鬼训练营”。

让循环不“发疯”的刹车片

让一个模型反反复复读同一段话，最大的风险就是“钻牛角尖”或者“彻底遗忘”。

为了解决这个问题，OpenMythos引入了一套精密的稳定机制。它借鉴了加州大学圣地亚哥分校的论文成果，在循环中注入了LTI约束（线性时不变约束）。这相当于给大脑装了一个“限幅器”，确保每一次循环的信号都稳稳当当，不会像滚雪球一样越滚越大导致崩溃。

这件事最让硅谷破防的地方，不在技术本身，而在技术产生的路径。

Kye甚至没有拿到Anthropic的内部资料。Claude Mythos因为“担心被滥用”被Anthropic雪藏，几乎没有公开技术文档。但Kye仅凭着Anthropic偶尔泄露的几组反常的跑分数据，以及学术界公开的论文，利用第一性原理，硬生生把这个黑箱给“逼”了出来。

他的逻辑很简单：既然你的跑分长这样，那你的内部结构只能是那样。

这种能力，让所谓的“技术壁垒”显得极其可笑。Meta首席AI科学家Yann LeCun曾在X上公开质疑，这种极致的效率，很可能就是下一代大模型的终极形态。

Claude Code的源码，是通过低级失误“漏”出来的；而Claude Mythos的灵魂，则是被智慧“逼”出来的。

Kye Gomez的故事，给狂飙突进的AI时代泼了一盆冷水，也打了一剂强心针。

它告诉那些坐拥数万张H100显卡的巨头：你们所谓的护城河，也许并没有那么深。它也告诉那些怀才不遇的天才：如果你无法加入他们，那就重构他们。

当大厂还在纠结“Scaling Law（规模法则）”是不是撞墙时，22岁的Kye已经找到了新的道路：让模型变“深”而非变“大”。

AI的平权时代，或许正在从一个高中毕业生的键盘下，悄然开启。

本文综合自量子位、新智元、Dataconomy等多家媒体及GitHub开源项目公开信息。截至2026年4月23日。免责声明：本文引用的开源项目及理论均为基于公开信息的推演，不代表对Anthropic公司技术内幕的最终认定。

请动动您发财的小手，关注我！！！