核心结论
世界模型不是“又一个生成模型”,而是在自动驾驶、具身智能等Physical AI场景中,承接数据生成、环境构建、闭环训练与验证迭代的新基础设施。未来3—5年,这一层能力有机会成为AI进入真实世界的重要底座。
过去两年,AI行业最热的话题几乎都围绕着大语言模型、多模态模型和Agent展开。但如果把视角从“数字世界里的智能”转向“物理世界里的智能”,一个更底层、也更可能长期改变产业结构的方向,正在快速升温:世界模型(World Model)。
它看上去像模型技术,实质上更接近一层新的基础设施。因为无论是自动驾驶,还是具身智能,最终都不是让机器“会说”,而是让机器“会动”。而一旦进入行动层,产业的核心矛盾就不再只是模型参数和推理能力,而变成了更现实的问题:数据从哪里来、训练如何规模化、仿真是否足够真实、系统怎样闭环验证、成本能不能真正下降。

一、赛道定义:什么是世界模型?
如果用最通俗的话解释,世界模型的核心能力,不是生成一段视频,而是学习并重建“世界如何运转”。它要处理的不只是视觉表面,而是更完整的现实结构:场景与空间关系、几何与三维结构、运动轨迹与交互逻辑、物理规律与结果反馈、动作执行后的环境变化。
语言模型压缩的是文字世界,世界模型压缩的是物理世界。这两者最大的区别在于:文字错误,往往只是“说错了”;而物理世界里的错误,往往意味着“做错了”。
所以,世界模型真正服务的,不是内容生成本身,而是那些需要机器在真实环境中稳定行动的场景。自动驾驶是这样,机器人也是这样,未来大量智能硬件、工业系统、空间计算场景也都会是这样。
二、产业痛点:这个赛道到底在解决什么问题?
从产业视角看,世界模型真正切中的,是Physical AI最核心的三个瓶颈:数据、训练、验证。
数据瓶颈:自动驾驶和具身智能都高度依赖真实世界数据,但真实数据成本高、采集慢、长尾场景覆盖差。世界模型试图在“真实度、规模化、可控性”之间找到新的平衡点。
训练瓶颈:Physical AI真正难的不是“能不能识别”,而是“能不能执行、能不能泛化、能不能闭环优化”。世界模型和强化学习、VLA结合后,有机会让系统从“看见世界”升级成“在世界中学习”。
验证瓶颈:没有足够真实、足够丰富、足够便宜的验证环境,模型能力再强,也很难形成产业化闭环。世界模型正在把验证效率变成一个可被重构的变量。
三、为什么是现在?
我们的判断是:这个方向不是刚出现,但现在确实到了值得重点研究和布局的阶段。底层技术栈开始成熟;下游产业开始形成强需求;资本市场的关注点也开始从单点模型转向系统能力。
四、产业链分层:这个赛道会长成什么结构?
从瞻行资本的视角,世界模型产业链大致可以分成四层:底层能力层、世界模型平台层、垂直行业训练层、应用落地层。底层能力层决定天花板,平台层决定中枢价值,垂直行业层决定商业化速度,应用层决定长期空间。

五、商业化路径:最先会从哪里跑出来?
自动驾驶是世界模型当前最现实的落地方向,因为行业已经有明确客户、成熟预算和真实需求。
具身智能更晚兑现,但长期空间更大;一旦训练成本下降、泛化能力提升,市场边界会迅速扩大。
空间内容与行业仿真则是容易被低估的外溢市场,只要行业需要更真实的三维场景和更复杂的物理交互,就可能被世界模型重新定义。
六、竞争格局:谁会占到优势?
这个赛道未来不会是简单的“谁模型更强谁赢”,而更可能形成三类玩家并存的格局:大厂与基础模型平台、垂直场景基础设施公司、整机公司与应用方自研。
七、代表玩家怎么看?
从全球趋势看,可以粗略分成三类玩家:研究型/平台型玩家、自动驾驶导向玩家、具身智能导向玩家。真正值得重视的,不是谁会讲“世界模型”的故事,而是谁能把世界模型嵌进数据、训练、验证和客户交付体系里。
八、投资机会图谱:钱应该往哪里看?
瞻行资本认为,这个赛道的投资机会主要集中在四个方向:训练基础设施、行业闭环平台、高门槛交付团队,以及从自动驾驶迁移到具身智能的能力。

九、如何看A公司这类项目?
如果以A公司为例,它并不只是某一家创业公司的故事,而是一个很典型的赛道样本。这类公司通常会有几个共同特征:从世界模型或仿真切入,同时连接自动驾驶与具身智能,强调数据引擎、闭环训练、强化学习和具身基础模型的结合,团队横跨学术、自动驾驶、机器人和产业落地多个背景。
这背后反映的,不只是公司策略,而是赛道本身的规律:谁先成为训练体系的一部分,谁才更有机会成为产业基础设施的一部分。
十、投资纪律:这个赛道值得看什么?
我们更看重以下几类指标:是否真的嵌入客户工作流;是否有明确的效率提升或成本下降,能量化成ROI;是否具备足够深的复合团队;是否具备从单点能力走向平台能力的可能;是否已经出现付费客户、定点合作、试点验证或持续复购迹象。
十一、风险清单:哪些地方最容易被高估?
任何新赛道在升温时,最容易高估技术潜力,低估商业兑现难度。世界模型也不例外。我们认为至少有四个风险必须持续关注:技术效果与商业价值之间仍有距离;重研发属性会拉长兑现周期;通用平台可能不如想象中容易成立;叙事会先跑在业绩前面。
十二、瞻行资本的核心判断
如果把过去几年AI的发展简单归纳:大语言模型解决的是“知识与表达”的问题;而世界模型正在尝试解决“行动与现实”的问题。
未来真正有产业价值的AI,不会只停留在数字空间里“会说、会写、会生成”,而会进一步进入真实世界,去“会感知、会操作、会闭环、会执行”。而一旦AI进入真实世界,世界模型的地位就会迅速上升。因为它决定的不是某个单点模型能不能惊艳,而是整个系统能不能被更低成本地训练出来、验证出来、规模化复制出来。
瞻行观点:下一阶段AI竞争的关键,不只是模型变得更聪明,而是智能能否更高效地进入真实世界。谁能更低成本地重建世界、模拟世界、训练智能、验证结果,谁就更接近Physical AI时代真正的底层入口。
夜雨聆风