【一】你用过的AI对话工具很火,但杨立昆说它的方向已经是错的

你打开任何一个AI对话工具，问一个问题，它给你一段流畅的回答。很多时候你分辨不出，这到底是一个人，还是一台机器。

这很惊人。但有一个拿过图灵奖的人说：这条路就算走到头，也到不了真正的智能。

他叫杨立昆（Yann LeCun），2018 年图灵奖得主、卷积神经网络（CNN）之父、Meta 首席 AI 科学家。2022 年，他发表了一篇立场论文，系统性地指出了当前 AI 路线的根本缺陷，并提出了一套全新的框架——JEPA（联合嵌入预测架构）。

他用一句话概括了整件事：

GPT 学的是"下一个词该说什么"，JEPA 学的是"这个世界是怎么运作的"。前者是背台词，后者是理解剧本。

这篇文章，就是把这句话给你彻底讲明白。

一、GPT 很强，但它不知道自己在说什么

GPT 的能力毋庸置疑：写文章、编代码、聊天、翻译，甚至在某些考试里超过人类。

但它的工作原理，和你想的可能不太一样。

GPT 做的事情极其简单：给你前面一段文字，猜下一个词最应该是什么。猜对了继续，猜错了调整。重复几万亿次之后，它成了地球上最厉害的"语句接龙机器"。

请注意这个描述——它不是在想，它是在接龙。

你问 GPT"把一杯水从桌子上推下去会发生什么？"，它能给你一段漂亮的描述：杯子掉落、水洒出来、杯子可能碎。但它并不真的"知道"重力、液体流动、陶瓷的脆性。它只是从训练数据中学到：当有人问这个问题时，最可能的下一个词序列就是这些。

有一个经典比喻：

GPT 像一个读了全世界所有书但从未出过门的人。他能说出所有正确的句子，但没有一句是基于亲身体验的。

它不知道什么是真的。它只知道什么是"听起来像真的"。

二、JEPA：不是猜下一个词，而是猜"被遮住的那块"

杨立昆提出的 JEPA，走的是完全不同的路线。

我用一个比喻说清楚。

给你一张猫的照片，遮住 80%，只露出耳朵和一小截尾巴——我问你：被遮住的部分应该长什么样？

你会怎么回答？

你不会去想象每根毛怎么排列、每个像素的颜色值是多少。你脑子里会直接形成一个印象：

那里应该是一个猫头
眼睛在脸的中间位置
身体是毛茸茸的、偏椭圆

你不必画出每根毛——但你"知道"那里有什么。

这个"知道"，就是理解。

JEPA 做的正是这件事。它不是在像素层面去"画"出缺失的内容（那是 GPT 的做法），而是在一个更高层的抽象空间里，判断"那里应该有什么"。

这个抽象空间叫表征空间。但你不必记住这个术语，你只需要记住一句：

JEPA 不画画，它只猜大意。猜大意就够了，因为大意里包含了真正的理解。

为什么猜大意就够了？因为如果你能判断被遮住的是一只猫还是一条狗、耳朵朝上还是耷拉、尾巴长还是短——你已经理解了这张图的结构。至于每根毛的颜色深浅、光影强弱，那些细节对"理解"来说，不重要。

杨立昆的原话是："一个好的智能系统，应该学会忽略那些不可预测的细节。"GPT 做不到忽略，它必须建模一切。JEPA 天生就学会了跳过噪声、直取关键。

这就是 JEPA 的效率来源，也是它靠近"真正理解"的第一步。

三、两条路线，两种哲学

维度	GPT 的路线	JEPA 的路线
学的对象	下一个词/下一个像素	物体之间的结构关系
"懂了"的定义	能生成一段通顺的话	能猜出被遮住的部分应该有什么
关注什么	所有细节，包括无意义的	语义结构，忽略像素级噪声
最大的弱点	没有真实世界的体验	目前主要限于视觉等感知领域
像什么角色	一个特别会说话的机器	一个在搭建世界模型的设计师

GPT 走的是生成路线——通过大量的文本拟合，学会模仿人类的语言模式。

JEPA 走的是理解路线——通过预测缺失信息，学习世界的结构。

这两条路线不一定冲突，但杨立昆明确认为：理解路线才是通向真正智能的方向。生成路线再往前走，也只是参数更多的"接龙机器"，它不会突然产生对世界的理解。

四、说点跟你工作有关的事

如果你不是写代码的，上面这些技术对比跟你有什么关系？关系很大。

第一，你判断 AI 产品潜力的框架需要更新。

现在市面上几乎所有 AI 产品，本质上都在做同一件事——"猜下一个词"。这意味着它们有共同的天花板：擅长"听起来对"，但不擅长"真的理解"。你评估一个 AI 产品时，不妨多问一句：它是在拟合数据，还是在理解问题？这个区别，决定了它能走多远。

第二，下一波机会可能不在"更大的模型"，而在"新的架构"。

过去两年，大家默认 AI 的进步等于"参数更多、模型更大"。但杨立昆告诉我们：另一条路是"让模型学会理解结构，而不是记住模式"。如果你在做产品规划、技术选型或判断投资方向，这个视角会让你在别人只盯着 GPT-5、GPT-6 的时候，看到另一条暗线。

第三，今天的 JEPA，可能就是你三年前错过的 GPT。

2018 年 GPT-1 刚出来时，关注它的人很少。真正看懂它价值的人，后来在 AI 领域占据了先机。今天的 JEPA 就处在那个阶段——论文发了，代码开源了，但知道的人还不多。现在开始了解它的人，三年后会在同行的谈话里显得"早就知道了"。

这不是劝你押注。而是说：当一个拿过图灵奖的人告诉你"现在这条路走不远"，你至少应该听他讲完理由，再做判断。

五、这不是"新东西打败旧东西"

我不是在说 JEPA 已经超越了 GPT。事实是：GPT 产品已服务数亿用户，而 JEPA 还在学术圈和实验室里迭代。前者的商业化程度远超后者。

但 AI 领域的历史反复证明一件事：工程上的领先不等于思想上的正确。

CNN 刚提出来的时候，也被主流学术界无视了十几年。杨立昆自己在神经网络研究的"寒冬期"坚守了近 20 年，后来 CNN 成了计算机视觉的基石。

今天 JEPA 的处境，和当年的 CNN 很像——思想已经成形，但大规模落地还需要时间。

六、为什么要关注这件事？

因为真正的技术趋势，从来不是从新闻头条里看出来的，而是从那些"还在实验室里"的想法里长出来的。

GPT 代表了当下。JEPA 可能代表下一个阶段。

杨立昆在《科学之路》里写过一句话：

真正的智能，来自对世界运作方式的理解，而不是来自对语言序列的拟合。

GPT 擅长的是后者。JEPA 追求的是前者。

这两种路线之间的争论，可能是未来十年 AI 领域最核心的思想碰撞。现在开始了解它的人，三年后会庆幸自己"在那时候就知道了"。

*本文内容参考了Yann LeCun的公开论文及演讲，由"下一站AI"编译整理。

下一篇预告：

从"被主流排斥"到"影响整个时代"——杨立昆在 AI 寒冬里独自坚守了 20 年，他的故事比技术本身更值得一听。

#JEPA #杨立昆 #AI趋势