AI世界模型这仨流派,到底在吵什么?

说实话，第一次听到"世界模型"这个词的时候，我脑子里闪过的是小时候玩《模拟城市》——你造个世界，然后看着小人在里面跑来跑去。结果最近研究了一下，发现AI圈说的"世界模型"根本不是一回事，而且最骚的是，同样叫"世界模型"，李飞飞、杨立昆、黄仁勋说的完全是三种不同的东西。

这就像三个人都说自己在造"车"，结果一个造的是F1赛车，一个造的是坦克，还有一个造的是磁悬浮——都叫交通工具，但根本不在一个次元。

今天给你们捋一捋，这三条路线到底在搞什么，以及我个人觉得哪条最靠谱。

黄仁勋：造赛道的

先说英伟达，因为这哥们最实在——他在造"赛车场"。

黄仁勋的逻辑特别简单粗暴：机器人要训练吧？训练需要数据吧？但问题是，你不可能让机器人在真实世界里摔一亿次来学习走路，这既不现实也太贵了。那怎么办？

造个虚拟世界，让机器人在里面摔。

这就是英伟达的Cosmos平台干的事。它本质上是个超级逼真的"物理模拟器"，里面有重力、摩擦力、碰撞检测，甚至光照反射都给你模拟得明明白白。机器人在里面撞墙、摔跤、试错，学会的技能再迁移到现实世界。

这玩意儿已经商业化了，西门子、宝马、亚马逊都在用，Cosmos工具链下载量都200万次了。

优点是：立竿见影，能解决问题，现在就能赚钱。 但我个人的担忧是：这条路有点像"氪金玩家"的玩法——靠堆算力、堆仿真环境来暴力破解。可问题是，当真实世界的机器人数据越来越多，这种"虚拟训练"会不会变成过渡方案？

就像你学车用模拟器练手没问题，但真要成老司机，还得上路。

李飞飞：造眼睛的

如果说黄仁勋在造"赛道"，那李飞飞就在给AI造"眼睛"——而且不是普通的眼睛，是能看懂三维空间的眼睛。

她的World Labs最近发了Marble 1.1/Plus和Spark 2.0，这东西有多神呢？你拍一张照片，它就能给你生出一个完整的3D世界，你可以在里面走来走去、看各个角落。

这不是简单的3D建模，它理解的是"空间关系"——杯子在桌子上、椅子可以被坐下、门是推还是拉。李飞飞管这叫"空间智能"（Spatial Intelligence）。

更离谱的是Spark 2.0，支持浏览器渲染上亿粒子的3D场景，手机、VR都能跑。

这条路的优势是：刚需明确。VR/AR需要这个，建筑设计需要这个，游戏开发需要这个。它是最快能商业化的——World Labs估值已经冲到50亿美元（2026年2月融资10亿美元）。

我的看法是：这条路最"稳"，因为需求真实存在。但它也有天花板——它解决的是"看懂空间"，不是"理解因果"。就像一个人眼睛很好使，但脑子不知道"推杯子会掉"一样。

杨立昆：造大脑的

最后说说杨立昆（Yann LeCun），这位图灵奖得主现在走了一条最"叛逆"的路。

他直接开炮说：现在的LLM（大语言模型）都是垃圾，只是高级复读机，根本没有真正的理解。

2026年3月10日，杨立昆的AMI Labs宣布完成10.3亿美元种子轮融资，估值35亿美元，创下欧洲史上最大种子轮纪录。这笔钱就是为了打造他的"世界模型"。

技术上叫JEPA架构（联合嵌入预测架构），简单说就是：不预测下一个像素，也不预测下一个词，而是预测"接下来会发生什么"的抽象模式。

举个例子：你看视频里有个球飞起来，杨立昆的模型不关心球长什么样、像素怎么变，它学到的是"球会受重力影响，最终落地"这个物理规律。

这条路的最大问题是：太难了。杨立昆自己都承认，真正的产品可能还要几年。而且他要挑战的是整个AI圈的主流范式（Transformer架构）。

但我的直觉是：如果AGI（通用人工智能）真的存在，它大概率是从这条路上长出来的。

因为人类智能的本质确实不是"预测下一个词"，而是"理解世界运行的规律"。你让GPT写首诗可以，但你问它"如果我推这个杯子，会发生什么"，它其实不懂，它只是根据训练数据"猜"一个最可能的回答。

杨立昆想做的，是让AI真的懂。

三条路，谁更对？

讲到这里，你可能会问：这三条路，哪条是对的？

我的答案是：它们根本不是竞争关系，而是在解决同一个问题的不同层面。

这就像盖房子：英伟达在打地基，李飞飞在搭框架，杨立昆在搞装修。少了哪个都不行。

但如果是个人押注，我目前的排序是：

短期看李飞飞，中期看英伟达，长期看杨立昆。

李飞飞的路线最快能出产品，英伟达的基建最扎实，但杨立昆的路线如果走通了，那才是真的"智能"。

最后扯两句

写到这里，我突然想起一个细节：杨立昆离开Meta的时候，据说是因为跟公司在AI路线上有根本分歧——Meta想死磕LLM，他认为那是死路一条。

然后他拿了10亿美元，去赌一个"没人相信"的方向。

这有点像当年深度学习还没火的时候，Hinton（也是图灵奖得主）在角落里默默搞了30年神经网络。当时所有人都觉得那是死胡同，结果呢？

所以我的观点是：现在AI圈有点太卷"快钱"了——谁出产品快、谁调用量大、谁融资多，谁就牛。但世界模型这件事，可能真的需要有人去啃硬骨头。

杨立昆的路线现在看起来最遥远，但如果十年后回头看，可能正是这条"最难走的路"，才真正改变了AI的走向。

毕竟，让AI真正"理解"这个世界，而不是只会"预测下一个词"，才是我们当初对人工智能的想象，不是吗？

编辑：小哎

来源：36氪、量子位、新浪财经、中国基金报

📢 AI世界，哎咆为你精选。资讯快如咆，观点不随大流。