你打开任何一个AI对话工具,问一个问题,它给你一段流畅的回答。很多时候你分辨不出,这到底是一个人,还是一台机器。
这很惊人。但有一个拿过图灵奖的人说:这条路就算走到头,也到不了真正的智能。
他叫杨立昆(Yann LeCun),2018 年图灵奖得主、卷积神经网络(CNN)之父、Meta 首席 AI 科学家。2022 年,他发表了一篇立场论文,系统性地指出了当前 AI 路线的根本缺陷,并提出了一套全新的框架——JEPA(联合嵌入预测架构)。
他用一句话概括了整件事:
GPT 学的是"下一个词该说什么",JEPA 学的是"这个世界是怎么运作的"。前者是背台词,后者是理解剧本。
这篇文章,就是把这句话给你彻底讲明白。
一、GPT 很强,但它不知道自己在说什么
GPT 的能力毋庸置疑:写文章、编代码、聊天、翻译,甚至在某些考试里超过人类。
但它的工作原理,和你想的可能不太一样。
GPT 做的事情极其简单:给你前面一段文字,猜下一个词最应该是什么。猜对了继续,猜错了调整。重复几万亿次之后,它成了地球上最厉害的"语句接龙机器"。
请注意这个描述——它不是在想,它是在接龙。
你问 GPT"把一杯水从桌子上推下去会发生什么?",它能给你一段漂亮的描述:杯子掉落、水洒出来、杯子可能碎。但它并不真的"知道"重力、液体流动、陶瓷的脆性。它只是从训练数据中学到:当有人问这个问题时,最可能的下一个词序列就是这些。
有一个经典比喻:
GPT 像一个读了全世界所有书但从未出过门的人。他能说出所有正确的句子,但没有一句是基于亲身体验的。
它不知道什么是真的。它只知道什么是"听起来像真的"。
二、JEPA:不是猜下一个词,而是猜"被遮住的那块"
杨立昆提出的 JEPA,走的是完全不同的路线。
我用一个比喻说清楚。
给你一张猫的照片,遮住 80%,只露出耳朵和一小截尾巴——我问你:被遮住的部分应该长什么样?
你会怎么回答?
你不会去想象每根毛怎么排列、每个像素的颜色值是多少。你脑子里会直接形成一个印象:
那里应该是一个猫头 眼睛在脸的中间位置 身体是毛茸茸的、偏椭圆
你不必画出每根毛——但你"知道"那里有什么。
这个"知道",就是理解。
JEPA 做的正是这件事。它不是在像素层面去"画"出缺失的内容(那是 GPT 的做法),而是在一个更高层的抽象空间里,判断"那里应该有什么"。
这个抽象空间叫表征空间。但你不必记住这个术语,你只需要记住一句:
JEPA 不画画,它只猜大意。猜大意就够了,因为大意里包含了真正的理解。
为什么猜大意就够了?因为如果你能判断被遮住的是一只猫还是一条狗、耳朵朝上还是耷拉、尾巴长还是短——你已经理解了这张图的结构。至于每根毛的颜色深浅、光影强弱,那些细节对"理解"来说,不重要。
杨立昆的原话是:"一个好的智能系统,应该学会忽略那些不可预测的细节。"GPT 做不到忽略,它必须建模一切。JEPA 天生就学会了跳过噪声、直取关键。
这就是 JEPA 的效率来源,也是它靠近"真正理解"的第一步。
三、两条路线,两种哲学
GPT 走的是生成路线——通过大量的文本拟合,学会模仿人类的语言模式。
JEPA 走的是理解路线——通过预测缺失信息,学习世界的结构。
这两条路线不一定冲突,但杨立昆明确认为:理解路线才是通向真正智能的方向。生成路线再往前走,也只是参数更多的"接龙机器",它不会突然产生对世界的理解。
四、说点跟你工作有关的事
如果你不是写代码的,上面这些技术对比跟你有什么关系?关系很大。
第一,你判断 AI 产品潜力的框架需要更新。
现在市面上几乎所有 AI 产品,本质上都在做同一件事——"猜下一个词"。这意味着它们有共同的天花板:擅长"听起来对",但不擅长"真的理解"。你评估一个 AI 产品时,不妨多问一句:它是在拟合数据,还是在理解问题?这个区别,决定了它能走多远。
第二,下一波机会可能不在"更大的模型",而在"新的架构"。
过去两年,大家默认 AI 的进步等于"参数更多、模型更大"。但杨立昆告诉我们:另一条路是"让模型学会理解结构,而不是记住模式"。如果你在做产品规划、技术选型或判断投资方向,这个视角会让你在别人只盯着 GPT-5、GPT-6 的时候,看到另一条暗线。
第三,今天的 JEPA,可能就是你三年前错过的 GPT。
2018 年 GPT-1 刚出来时,关注它的人很少。真正看懂它价值的人,后来在 AI 领域占据了先机。今天的 JEPA 就处在那个阶段——论文发了,代码开源了,但知道的人还不多。现在开始了解它的人,三年后会在同行的谈话里显得"早就知道了"。
这不是劝你押注。而是说:当一个拿过图灵奖的人告诉你"现在这条路走不远",你至少应该听他讲完理由,再做判断。
五、这不是"新东西打败旧东西"
我不是在说 JEPA 已经超越了 GPT。事实是:GPT 产品已服务数亿用户,而 JEPA 还在学术圈和实验室里迭代。前者的商业化程度远超后者。
但 AI 领域的历史反复证明一件事:工程上的领先不等于思想上的正确。
CNN 刚提出来的时候,也被主流学术界无视了十几年。杨立昆自己在神经网络研究的"寒冬期"坚守了近 20 年,后来 CNN 成了计算机视觉的基石。
今天 JEPA 的处境,和当年的 CNN 很像——思想已经成形,但大规模落地还需要时间。
六、为什么要关注这件事?
因为真正的技术趋势,从来不是从新闻头条里看出来的,而是从那些"还在实验室里"的想法里长出来的。
GPT 代表了当下。JEPA 可能代表下一个阶段。
杨立昆在《科学之路》里写过一句话:
真正的智能,来自对世界运作方式的理解,而不是来自对语言序列的拟合。
GPT 擅长的是后者。JEPA 追求的是前者。
这两种路线之间的争论,可能是未来十年 AI 领域最核心的思想碰撞。现在开始了解它的人,三年后会庆幸自己"在那时候就知道了"。
*本文内容参考了Yann LeCun的公开论文及演讲,由"下一站AI"编译整理。
下一篇预告:
从"被主流排斥"到"影响整个时代"——杨立昆在 AI 寒冬里独自坚守了 20 年,他的故事比技术本身更值得一听。
夜雨聆风