李飞飞团队刚把3D渲染引擎开源,第二天腾讯就把世界模型扔出来了。
一天一个重磅,这是商量好的?不是。这是在抢同一个赛道。
什么赛道?世界模型。让AI不仅能对话、画图,还能直接创造完整3D世界的技术。
一、Spark 2.0解决的不是生成问题,是门槛问题
4月15日,World Labs开源了Spark 2.0,一个3D高斯泼溅渲染引擎。
说人话就是:以前想在手机上看一个超高清的3D场景,得用专业工作站跑,手机直接卡死。现在Spark 2.0让任何带浏览器的设备——手机、平板、VR眼镜——都能流畅跑起来。流畅到什么程度?能同时渲染超过一亿个高斯点。
怎么做到的?三个技术:细节层级系统,远看低清近看高清,帧率不掉;渐进式流式加载,边加载边渲染;虚拟显存分页,用有限内存撑起无限场景。
李飞飞本人发帖说:能为为能为基于网页的3DGS渲染开源生态做出贡献,感到无比自豪。
注意,她没有强调技术本身有多强。她强调的是开源、是生态。
翻译一下:我造的工具,大家都能拿去用。
二、腾讯HY-World 2.0解决的不是生成问题,是可用性问题
第二天,4月16日,腾讯混元团队发布并开源了HY-World 2.0。
多模态输入:文字、图片、视频丢进去,自动生成包含人、物、景的完整3D空间。
这是技术参数。真正的突破在输出端。
HY-World 2.0可以直接导出Mesh、3DGS、点云,能无缝导入Unity、UE等主流游戏引擎。
腾讯在技术文件里说得很好:Google Genie 3、NVIDIA Cosmos以及自家前代HY-World 1.5等模型,本质上都是生成像素影片,播放结束后世界就此消失,无法编辑。
意思是:别人生成的3D内容是电影,看完了就没了。我生成的是游戏世界,素材直接拿去用,能编辑、能导进引擎、能做产品。
业界知名研究员杨怀的主观评价,模型通过生成可直接导入引擎的3D资产,直接解决游戏行业工业化产能瓶颈,显著缩短重度游戏的开发周期,将创意转化为产品的边际成本大幅降低。
三、为什么扎堆爆发
把这两件事放在一起看,会发现整个行业在同时抢跑。
三股力量在叠加。
第一,3DGS技术走向成熟。以前造3D场景靠搭建三角网格,耗时费力。现在高斯泼溅用数百万个彩色点叠加还原真实场景,效率暴增。
第二,行业痛点倒逼。过去两年AI生成3D内容最大的尴尬是:生成效果很惊艳,但拿不到实际生产流程里用。格式不兼容,无法二次编辑,管线接不上。腾讯这次卡住的点,恰恰是行业最痛的地方。
第三,市场价值巨大。 2025年全球3D生成大模型市场销售额达9.36亿美元,预计2032年将突破185.6亿美元,年复合增长率54%。游戏娱乐是占比最高的应用场景。A股游戏板块已被点燃。
资本也早已闻风而动。极佳视界一个月内完成近10亿+15亿两轮融资,估值超百亿。Tripo AI获5000万美元新融资。影眸科技被Unity和英伟达同时选中。阿里同日发布Happy Oyster。英伟达紧随其后发布Lyra 2.0。
世界模型已经不再是技术概念,而是正在加速商业化的产业风口。
四、谁在焦虑,谁在狂欢
最直接受益的,是独立游戏开发者。以前做3D游戏,得雇建模师、场景设计师、关卡策划,光人力成本就能压垮一个小团队。现在一句话生成场景,几分钟导出可用资产,创作门槛被打下来,更多创意有机会变成产品。
但大厂在焦虑。Unity和Unreal当然不会倒下,但他们的护城河正在被AI从侧面挖开。开发者不再被引擎绑定,而是被AI生成能力吸引。
中金公司有份报告,观点很有意思:当前世界模型在游戏制作中仍处于早期,起局部赋能作用,在预研和3D资产制作上提效较为明显,未来更可能作为单场景生成工具而非综合化游戏基座。意思是,别指望AI立刻做出一个完整3A大作,但用它来生成地图、关卡原型、快速迭代创意,已经足够改变游戏行业的底层效率。
腾讯2025年全年资本开支达792亿元,研发投入857.5亿元,均创历史新高。管理层明确表示,2026年AI营运开支将增长超过一倍。这是真金白银的投入。
五、谁能用好谁就赢
这场竞赛的终局,不是看谁的参数更大、谁的演示更炫。比的是谁的技术真正能被开发者用起来,谁的生态能跑起来。
李飞飞选择开源,让渲染能力触达所有人。腾讯选择开源,把3D资产生成能力交给整个行业。两条路,同一个方向。
游戏行业的人力成本结构,正在被AI重写。
这或许就是空间智能的终极意义:不是让机器更聪明,而是让创造变得更简单。而更简单的创造,意味着更多的创意、更好的产品、更繁荣的行业。
阿蒙/蒙哥:
一个跨界产品人、金融人,
善于透过现象看本质。
关注前沿科技与时事经济,
擅长从趋势中挖掘投资机会和产业机会。
欢迎志同道合的朋友共同探讨,
欢迎感兴趣的朋友关注阅读转发。
夜雨聆风