
说实话,第一次听到"世界模型"这个词的时候,我脑子里闪过的是小时候玩《模拟城市》——你造个世界,然后看着小人在里面跑来跑去。结果最近研究了一下,发现AI圈说的"世界模型"根本不是一回事,而且最骚的是,同样叫"世界模型",李飞飞、杨立昆、黄仁勋说的完全是三种不同的东西。
这就像三个人都说自己在造"车",结果一个造的是F1赛车,一个造的是坦克,还有一个造的是磁悬浮——都叫交通工具,但根本不在一个次元。
今天给你们捋一捋,这三条路线到底在搞什么,以及我个人觉得哪条最靠谱。

黄仁勋:造赛道的
先说英伟达,因为这哥们最实在——他在造"赛车场"。
黄仁勋的逻辑特别简单粗暴:机器人要训练吧?训练需要数据吧?但问题是,你不可能让机器人在真实世界里摔一亿次来学习走路,这既不现实也太贵了。那怎么办?
造个虚拟世界,让机器人在里面摔。
这就是英伟达的Cosmos平台干的事。它本质上是个超级逼真的"物理模拟器",里面有重力、摩擦力、碰撞检测,甚至光照反射都给你模拟得明明白白。机器人在里面撞墙、摔跤、试错,学会的技能再迁移到现实世界。
这玩意儿已经商业化了,西门子、宝马、亚马逊都在用,Cosmos工具链下载量都200万次了。
优点是:立竿见影,能解决问题,现在就能赚钱。 但我个人的担忧是:这条路有点像"氪金玩家"的玩法——靠堆算力、堆仿真环境来暴力破解。可问题是,当真实世界的机器人数据越来越多,这种"虚拟训练"会不会变成过渡方案?
就像你学车用模拟器练手没问题,但真要成老司机,还得上路。

李飞飞:造眼睛的
如果说黄仁勋在造"赛道",那李飞飞就在给AI造"眼睛"——而且不是普通的眼睛,是能看懂三维空间的眼睛。
她的World Labs最近发了Marble 1.1/Plus和Spark 2.0,这东西有多神呢?你拍一张照片,它就能给你生出一个完整的3D世界,你可以在里面走来走去、看各个角落。
这不是简单的3D建模,它理解的是"空间关系"——杯子在桌子上、椅子可以被坐下、门是推还是拉。李飞飞管这叫"空间智能"(Spatial Intelligence)。
更离谱的是Spark 2.0,支持浏览器渲染上亿粒子的3D场景,手机、VR都能跑。
这条路的优势是:刚需明确。VR/AR需要这个,建筑设计需要这个,游戏开发需要这个。它是最快能商业化的——World Labs估值已经冲到50亿美元(2026年2月融资10亿美元)。
我的看法是:这条路最"稳",因为需求真实存在。但它也有天花板——它解决的是"看懂空间",不是"理解因果"。就像一个人眼睛很好使,但脑子不知道"推杯子会掉"一样。

杨立昆:造大脑的
最后说说杨立昆(Yann LeCun),这位图灵奖得主现在走了一条最"叛逆"的路。
他直接开炮说:现在的LLM(大语言模型)都是垃圾,只是高级复读机,根本没有真正的理解。
2026年3月10日,杨立昆的AMI Labs宣布完成10.3亿美元种子轮融资,估值35亿美元,创下欧洲史上最大种子轮纪录。这笔钱就是为了打造他的"世界模型"。
技术上叫JEPA架构(联合嵌入预测架构),简单说就是:不预测下一个像素,也不预测下一个词,而是预测"接下来会发生什么"的抽象模式。
举个例子:你看视频里有个球飞起来,杨立昆的模型不关心球长什么样、像素怎么变,它学到的是"球会受重力影响,最终落地"这个物理规律。
这条路的最大问题是:太难了。杨立昆自己都承认,真正的产品可能还要几年。而且他要挑战的是整个AI圈的主流范式(Transformer架构)。
但我的直觉是:如果AGI(通用人工智能)真的存在,它大概率是从这条路上长出来的。

因为人类智能的本质确实不是"预测下一个词",而是"理解世界运行的规律"。你让GPT写首诗可以,但你问它"如果我推这个杯子,会发生什么",它其实不懂,它只是根据训练数据"猜"一个最可能的回答。
杨立昆想做的,是让AI真的懂。

三条路,谁更对?
讲到这里,你可能会问:这三条路,哪条是对的?
我的答案是:它们根本不是竞争关系,而是在解决同一个问题的不同层面。
英伟达解决的是"在哪里练"——虚拟训练场 李飞飞解决的是"看到什么"——空间感知 杨立昆解决的是"怎么想"——因果推理
这就像盖房子:英伟达在打地基,李飞飞在搭框架,杨立昆在搞装修。少了哪个都不行。
但如果是个人押注,我目前的排序是:
短期看李飞飞,中期看英伟达,长期看杨立昆。
李飞飞的路线最快能出产品,英伟达的基建最扎实,但杨立昆的路线如果走通了,那才是真的"智能"。
最后扯两句
写到这里,我突然想起一个细节:杨立昆离开Meta的时候,据说是因为跟公司在AI路线上有根本分歧——Meta想死磕LLM,他认为那是死路一条。
然后他拿了10亿美元,去赌一个"没人相信"的方向。
这有点像当年深度学习还没火的时候,Hinton(也是图灵奖得主)在角落里默默搞了30年神经网络。当时所有人都觉得那是死胡同,结果呢?
所以我的观点是:现在AI圈有点太卷"快钱"了——谁出产品快、谁调用量大、谁融资多,谁就牛。但世界模型这件事,可能真的需要有人去啃硬骨头。
杨立昆的路线现在看起来最遥远,但如果十年后回头看,可能正是这条"最难走的路",才真正改变了AI的走向。

毕竟,让AI真正"理解"这个世界,而不是只会"预测下一个词",才是我们当初对人工智能的想象,不是吗?
编辑:小哎
来源:36氪、量子位、新浪财经、中国基金报
📢 AI世界,哎咆为你精选。资讯快如咆,观点不随大流。
夜雨聆风