乐于分享
好东西不私藏

AI 开始学万有引力了

AI 开始学万有引力了

有人做过一个测试

把一个玻璃球放在斜面上,问 AI:它会往哪里滚?

AI 回答得很好——”沿斜面方向向下滚动,受重力分量影响”

然后换一个问题:如果斜面末端有一堵墙,球撞上去之后会发生什么?

AI 依然能回答,说会反弹,角度取决于材质和入射角

但如果继续追问:反弹之后,球会停在哪里?

这时候 AI 开始给出模糊的描述,越来越像在”猜”,而不是在”算”。

它懂每一条物理定律的文字表述,但它没有办法在脑子里真正模拟这个过程

这个问题,AI 已经憋了三年。而就在最近,它开始认真解决了


我们亲历了这一切,只是没意识到

回头看,AI 这几年的进化,我们其实全程都在场

2023 年,AI 学会了对话

那一年,我们第一次打开 ChatGPT,发现它居然能回答任何问题,还能帮写邮件、改简历。有点惊讶,但也觉得——不过是个聪明的搜索引擎吧

2024 年,AI 学会了画图

 那一年,朋友圈第一次出现了 AI 生成的头像。有人用它做 PPT 配图,有人用它给自己”画”了一张油画肖像。创作这件事,第一次不再需要专业门槛

2025 年,AI 学会了拍视频

那一年,Sora 横空出世,一段提示词就能生成一段电影质感的短片。视频创作这件事,突然变得和发朋友圈一样简单

每一步,我们都见证了。每一步,我们都觉得”也不过如此”

但 2026 年这一步,不一样


这次,AI 要学的是物理世界本身

2026 年 4 月 16 日,腾讯和阿里在同一天,宣布了同一件事——发布各自的世界模型

这个词听起来很玄,但它要解决的问题其实非常具体

过去的 AI,不管多聪明,本质上都活在”语言的世界”里。它能告诉我们”苹果从树上掉下来是因为重力”,但它不知道这个苹果掉下来之后会怎么弹、会不会滚进水沟。它懂文字描述的物理,但不懂物理本身

更准确地说:它能预测”下一个词”,但它预测不了”下一个状态”

这个差别,在聊天的时候感觉不出来。但一旦 AI 要走进真实世界——控制机械臂、驾驶汽车、操控机器人——这个漏洞就是致命的。一个不懂物理的机器人,在预设场景里能干活,换个陌生环境就完全失效

世界模型要填的,正是这个漏洞

它的核心逻辑是:让 AI 在行动之前,先在脑子里”演一遍”。我伸手抓这个杯子,力度多大合适?这条路走过去会不会碰壁?液体倒进去会不会溢出来?——不是查答案,而是真正推演出来

技术上,目前业界形成了三条路线

杨立昆(图灵奖得主)走的是抽象预测路径,不追求像素级还原,而是在压缩的”潜空间”里学习因果规律,就像人脑不会把每个场景都完整回放,而是抓住关键逻辑

李飞飞的 World Labs 走的是3D 仿真路径,直接构建可计算的虚拟三维环境,让模型在里面学物理

而国内生数科技、腾讯、阿里走的则是视频驱动路径——视频天然包含时间、空间、动作和因果关系,是目前数据最丰富、最接近真实世界的训练素材

腾讯这次发布的混元 3D 世界模型 2.0,已经能根据一张图片或一段文字,直接生成可以导入游戏引擎的 3D 场景资产——不是视频,是真实可编辑的三维空间,物理规律完整保留,开发者可以直接拿去用

阿里发布的 Happy Oyster(快乐生蚝),是全球首个支持主动式实时交互的世界模型产品。它有两种模式:漫游模式让你在生成的世界里自由探索,导演模式让你像拍电影一样控制场景走向,最长可生成 3 分钟的连贯内容。在全球世界模型评测榜单 WorldArena 上,阿里的模型已经登顶第一——它能准确预测物体在复杂交互下的运动轨迹,包括滑动、倾倒、堆叠,甚至流体变化

值得一提的是,这两家公司选择同日发布,并非巧合。这背后是整个赛道从”学术探索”走向”产业卡位”的集体加速——谁先做出”真能干活”的产品,谁就能在下一轮 AI 竞争里占据先机


这和我们有什么关系?

世界模型不是给极客玩的新玩具,它会在几个非常具体的地方,先改变我们能看到的行业

游戏行业会最先感受到

过去,一款游戏的场景搭建需要专业团队花几个月时间建模、贴图、调物理引擎

现在,腾讯的世界模型可以把一张草图直接变成可导入引擎的游戏地图。独立游戏开发者的门槛,正在被彻底拆掉

影视和广告行业紧随其后

 世界模型能生成物理规律一致的三维场景,意味着过去需要实地取景或搭建绿幕的内容,未来可以完全在 AI 里完成。不是”生成一段视频”,而是”构建一个可以任意角度拍摄的虚拟世界”

机器人和自动驾驶是最深远的战场

这才是世界模型真正的战略价值所在。没有世界模型,机器人永远只能在预设场景里干活;有了世界模型,它才能真正走进我们家、走进工厂、走进手术室


最后说一句

从 2023 年到 2026 年,我们见证了 AI 从”能聊天”到”能画图”到”能拍视频”,现在到了”能理解物理世界”

每一步回头看都觉得理所当然,但每一步在发生的时候,都是一道真实的门槛被跨过去了

世界模型这道门,刚刚打开