你们有没有这种感觉——
ChatGPT写诗写代码,牛逼吧?Claude能帮你改bug,牛逼吧?但你有没有发现一个问题:在它们眼里,这个世界就是一堆文字。
它不知道水往低处流。它不知道东西松手会掉。它不知道你推一张桌子,桌子会往前滑,然后停住。
它背了全世界的数据,但没有一点物理直觉。
这个问题,现在终于被认真对待了。
5月12号,MIT Technology Review发了一篇文章,把World Models(世界模型)列进了「AI当前最重要的10件事」。执行主编Niall Firth专门拍了个视频——
"World models recently made our list of 10 Things That Matter in AI Right Now."
同期,斯坦福发布了2026 AI Index,里面的结论让我后背发凉——
"AI is sprinting, and we're struggling to keep up."
AI在狂奔,我们在掉队。而World Models,可能是那把打开下一个大门的钥匙。
01 先说清楚:World Models是什么
你可能听过一种说法:大模型就是"概率机器"。
这听起来很技术,但每天你都在感受它——ChatGPT回复你的时候,其实是在"猜"下一个词。就像你打字时手机给你推荐下一个词一样,只不过它推荐的是一整段话。
但这个世界不是纯文字和像素。
现实世界有物理规则。你推一下物体,它会动。你松开手,它会停。你踢一脚球,球会飞出去然后落下来。
这些事情,对人类来说是"本能"。但对AI来说,是空白。
World Models想做的,就是填上这块空白。
说人话:不是教AI更多答案,而是让AI学会"推演"——就像你教小孩,不是塞给他一本百科全书,而是让他自己摸清楚"这样推会滑、那样松手会掉"。
02 为什么这事,现在才爆发
其实World Models这个概念不新。Yann LeCun好几年前就提过,但那时候——说白了,就是算力不够、场景没到、没人信。
今年突然爆了,三个原因撞在一起:
第一,你用的大模型,变聪明了。
o1、o3这类推理模型证明了:让AI"多想想再答",它真的能变强。就像你让一个人做数学题,不让他检查过程,他能对;但让他一步步想清楚,准确率直接飙升。这不是玄学,是真实的技术突破。
第二,训练成本降了一半。
以前这种规模的东西,只有大公司才玩得起。现在——价格打下来了,创业公司也能进了。
第三,你手里的产品,到了瓶颈。
ChatGPT聊天已经很好了,但它下一步往哪走?World Models就是答案之一。你每天在用的那个App、那个智能音箱,下一代升级就靠这个。
03 到底能做什么
第一个:工厂里的机械臂,会自己适应环境了。
现在的工业机器人是怎么工作的?人一步步教——这个关节转30度,那个动作要避开障碍物。笨拙得一逼。
有World Model之后呢?
它直接模拟:推一下会怎样,撞到了会怎样,工具脱手了往哪飞。它自己推演出最优路径,不用人教。
这意味着什么?你家楼下那个工厂,以后可能不再需要那么多老师傅了。
第二个:自动驾驶,不再靠规则库了。
现在自动驾驶的逻辑是——遇到红灯停车,遇到行人停下,遇到障碍物绕行。遇到什么查什么,像个笨学生在翻手册。
但现实情况是无限的,你写不完所有规则。
World Model让车自己"长出物理直觉":雨天路滑刹车距离变长多少?行人突然变向的可能轨迹是什么?它不是查手册,是推演。
特斯拉为什么死磕"端到端"?就是想绕过这条路,让车自己学物理。
第三个:科研假设,AI先帮你验证。
AlphaFold当年预测蛋白质结构,让整个生物圈炸了。以前要几年才能搞清楚的结构,AI几分钟就算出来了。
World Models想把这件事扩展到更多领域——
你提一个科研假设,AI先帮你推演一遍——这个分子结构会怎么反应,这个物理条件会发生什么。对的再去做实验,错的先排除。
以前一个科研假设要验证半年,现在AI先帮你过一遍。
04 我的判断
方向是对的。
但现在还在早期——算力瓶颈、物理模拟数据的质量、训练方法,都还在摸索。可能还需要2-3年才能看到真正落地的东西。
但机会往往在早期。
你现在刷到这个概念,比90%的人早知道。知道和看不懂,中间差了红利期。
有意思的是,MIT那篇文章底下还同步推了几个相关故事——
OpenAI全力押注"全自动研究员",让AI自己研究AI,不用等人类下指令。首次让子宫在体外存活,AI辅助生物科技突破了。
这三个方向,底层都在说同一件事:AI要从"工具"变成"理解者"。
能不能成,看执行。但方向没走错。
05 最后说一句
AI行业每隔一段时间,就会出现一个"所有人都知道是对的方向",但大多数人看不懂所以不跟进。
World Models现在就在这个节点上。
你现在不跟进,到时候就晚了。
怎么跟进?简单——关注这个方向,看谁在做,看谁的应用场景先跑通。不需要你现在就懂,但你要在场。
评论区聊聊:你觉得AI还需要多久才能真正"懂"世界?
素材来源:MIT Technology Review、Stanford AI Index、Yann LeCun公开访谈
夜雨聆风