从"悟道"到"悟界":AI终于开始理解真实世界了
AI摘要:2026年6月12日,第八届北京智源大会在中关村开幕,200余位全球顶尖AI学者和40余位企业CEO齐聚。大会最重磅的发布是悟界Physis-v0.1——全球首个通用世界基座模型。这意味着AI正在经历从"理解文字"到"理解物理世界"的范式跃迁。如果说GPT代表的是"读万卷书"的语言智能,那么世界模型代表的就是"行万里路"的物理智能——它让AI像一个婴儿一样,开始理解重力、碰撞、因果和时间的流动。这不是锦上添花,而是通往AGI的必经之路。
阅读时间:约5分钟(约2100字)
GPT能写诗,但它不知道苹果从树上掉下来会砸到地面。Claude能编程,但它不理解一个杯子推倒后水会洒出来。我们拥有越来越聪明的"语言大脑",但它们对物理世界一无所知。这就是为什么2026年智源大会上发布的悟界Physis-v0.1如此重要——它不是在语言模型上修修补补,而是直接换了一张新地图。
一、第八届智源大会:世界模型站上C位
智源大会已经是第八届了。过往七届累计邀请了14位图灵奖得主,被称为"AI内行的学术盛会"。但2026年这届的基调明显不同——议题从过去的"大模型""深度学习""自然语言处理",全面转向了世界模型、通用智能体、具身智能和AI自进化。
大会主题"从'悟道'到'悟界'"本身就充满象征意义。"悟道"是智源早期的语言大模型项目,代表过去的成就;"悟界"指向的是世界模型——让AI不仅理解人类语言,更能理解人类所处的物理世界。
最重磅的发布是悟界Physis-v0.1——全球首个通用世界基座模型,以及面向机器人场景的悟界RoboBrainOrca。同步亮相的还有智源牵头打造的智算软件栈FlagOS2.1,可适配18家厂商的32款芯片——这意味着国产芯片生态也进入了"统一调度"的阶段。
周期视角:如果2023-2025年是"大语言模型"的周期——GPT、Claude、Gemini不断刷新语言理解和生成的极限——那么2026年正在开启的,是"世界模型"的周期。这两个周期之间有一个根本区别:语言模型学的是"人类怎么说",世界模型学的是"世界怎么运作"。前者通向更好的聊天机器人,后者通向真正的通用智能。

▲ AI大脑连接数字世界与物理世界的概念图——中间是世界模型桥梁(AI生成)
二、什么是世界模型?为什么它更难?
用最简单的话说:大语言模型是"文本预测机"——给定前面的话,预测下一个词。这个任务看似简单,但互联网上数万亿字的文本数据提供了极为丰富的训练素材,所以模型能学到惊人的语言能力。
但世界模型要学的是"物理预测机"——给定当前状态,预测下一秒会发生什么。这比语言预测难得多:
第一,数据来源完全不同。语言模型有互联网这个超级数据源,但物理世界的数据分散在无数摄像头、传感器和机器人中,缺乏统一的"物理语料库"。第二,维度更高。语言是线性的(词一个接一个),物理世界是并行多维的(力、速度、方向、材质、温度同时起作用)。第三,没有标准答案。GPT可以根据人类文本来判断自己写得"对不对",但一个世界模型怎么判断自己预测的物理状态是否正确?
这也是为什么世界模型被公认为"通往AGI的圣杯"——一个真正理解物理因果的AI,就不再只是一个"超级搜索引擎"或"高级自动补全",而是一个能推理、预测和干预物理世界的智能体。

▲ 2026智源大会现场,悟界Physis世界模型架构发布的概念场景(AI生成)
三、悟界Physis:AI的"物理直觉"
那么悟界Physis-v0.1到底做了什么?根据大会披露的信息,这个模型的核心能力可以概括为三层:
你不需要告诉Physis"苹果会掉在地上",它自己能从物理规律中学到这一点。这才是关键——世界模型不是靠人类标注的"常识库",而是靠对物理世界的大规模建模学习到的"物理直觉"。这和人类婴儿通过观察和互动学习物理世界的过程,在原理上惊人地相似。
一个有趣的对比:GPT-4用了互联网上几乎所有文本,花了数亿美元训练费,但它仍然不知道把水杯推倒会发生什么。一个两岁的小孩,只看过几次类似场景,就能准确预测"水会洒出来"。这说明人类与生俱来的"物理直觉"——那种无需语言、无需推理的本能理解——大语言模型完全没有。而世界模型,正是试图填补这个鸿沟。

▲ 人形机器人在真实环境中操作物体,体现从数字到物理跨越的概念图(AI生成)
四、从数字世界迈向物理世界:一个时代的开始
智源大会不只是一个学术会议,它是中国AI产业方向的晴雨表。从2026年这届大会释放的信号来看,中国AI产业正在明确地从一个"跟随+追赶"的角度,切换到"定义下一个前沿"的角度。
一个细节值得注意:大会上一批垂直领域的AI应用已经走出实验室——心脏磁共振辅助诊断智能体、高分子材料研发智能体(全球首个)、科学发现智能体——这些不是PPT,而是已经在真实场景中实测的产品。
更值得关注的是FlagOS2.1——一个适配18家厂商32款芯片的统一智算软件栈。在全球芯片格局日趋复杂的背景下,这相当于为国产AI生态搭建了一条"高速公路"——无论底层用什么芯片,上层AI应用都能无缝运行。
AI的发展正在经历一个必然的分叉:一条路继续把语言模型做大做深(GPT-6已经证明这条路还没到尽头),另一条路向物理世界进军(具身智能、机器人、世界模型)。
回顾AI历史,每个大周期都是从一个"不可能"变成"可能"开始的。2012年AlexNet让图像识别从"不可能"变成了"可能";2018年BERT让自然语言理解从"不可能"变成了"可能";2022年ChatGPT让通用对话从"不可能"变成了"可能"。2026年,悟界Physis正在试图让"AI理解物理世界"从不可能变成可能——如果成功,这将是AI史上最大的一个周期跨越。
参考:环球网《2026智源大会开幕》、企鹅号《人工智能产业日报(06.12)》、企鹅号《2026北京智源大会开幕》、智源研究院官方发布
免责声明:本文基于公开新闻资讯整理撰写,仅供参考。
夜雨聆风