从悟道到悟界:AI终于开始理解真实世界了

从"悟道"到"悟界"：AI终于开始理解真实世界了

AI摘要：2026年6月12日，第八届北京智源大会在中关村开幕，200余位全球顶尖AI学者和40余位企业CEO齐聚。大会最重磅的发布是悟界Physis-v0.1——全球首个通用世界基座模型。这意味着AI正在经历从"理解文字"到"理解物理世界"的范式跃迁。如果说GPT代表的是"读万卷书"的语言智能，那么世界模型代表的就是"行万里路"的物理智能——它让AI像一个婴儿一样，开始理解重力、碰撞、因果和时间的流动。这不是锦上添花，而是通往AGI的必经之路。

阅读时间：约5分钟（约2100字）

GPT能写诗，但它不知道苹果从树上掉下来会砸到地面。Claude能编程，但它不理解一个杯子推倒后水会洒出来。我们拥有越来越聪明的"语言大脑"，但它们对物理世界一无所知。这就是为什么2026年智源大会上发布的悟界Physis-v0.1如此重要——它不是在语言模型上修修补补，而是直接换了一张新地图。

一、第八届智源大会：世界模型站上C位

智源大会已经是第八届了。过往七届累计邀请了14位图灵奖得主，被称为"AI内行的学术盛会"。但2026年这届的基调明显不同——议题从过去的"大模型""深度学习""自然语言处理"，全面转向了世界模型、通用智能体、具身智能和AI自进化。

大会主题"从'悟道'到'悟界'"本身就充满象征意义。"悟道"是智源早期的语言大模型项目，代表过去的成就；"悟界"指向的是世界模型——让AI不仅理解人类语言，更能理解人类所处的物理世界。

最重磅的发布是悟界Physis-v0.1——全球首个通用世界基座模型，以及面向机器人场景的悟界RoboBrainOrca。同步亮相的还有智源牵头打造的智算软件栈FlagOS2.1，可适配18家厂商的32款芯片——这意味着国产芯片生态也进入了"统一调度"的阶段。

周期视角：如果2023-2025年是"大语言模型"的周期——GPT、Claude、Gemini不断刷新语言理解和生成的极限——那么2026年正在开启的，是"世界模型"的周期。这两个周期之间有一个根本区别：语言模型学的是"人类怎么说"，世界模型学的是"世界怎么运作"。前者通向更好的聊天机器人，后者通向真正的通用智能。

▲ AI大脑连接数字世界与物理世界的概念图——中间是世界模型桥梁（AI生成）

二、什么是世界模型？为什么它更难？

用最简单的话说：大语言模型是"文本预测机"——给定前面的话，预测下一个词。这个任务看似简单，但互联网上数万亿字的文本数据提供了极为丰富的训练素材，所以模型能学到惊人的语言能力。

但世界模型要学的是"物理预测机"——给定当前状态，预测下一秒会发生什么。这比语言预测难得多：

第一，数据来源完全不同。语言模型有互联网这个超级数据源，但物理世界的数据分散在无数摄像头、传感器和机器人中，缺乏统一的"物理语料库"。第二，维度更高。语言是线性的（词一个接一个），物理世界是并行多维的（力、速度、方向、材质、温度同时起作用）。第三，没有标准答案。GPT可以根据人类文本来判断自己写得"对不对"，但一个世界模型怎么判断自己预测的物理状态是否正确？

这也是为什么世界模型被公认为"通往AGI的圣杯"——一个真正理解物理因果的AI，就不再只是一个"超级搜索引擎"或"高级自动补全"，而是一个能推理、预测和干预物理世界的智能体。

▲ 2026智源大会现场，悟界Physis世界模型架构发布的概念场景（AI生成）

三、悟界Physis：AI的"物理直觉"

那么悟界Physis-v0.1到底做了什么？根据大会披露的信息，这个模型的核心能力可以概括为三层：

层级	能力	通俗理解
感知层	多模态物理感知融合	同时理解图像、深度、力反馈等物理信号，像一个"长了眼睛和皮肤"的AI
预测层	物理状态演化预测	看到当前状态，能推演下一秒会发生什么，像一个"有物理直觉"的AI
交互层	物理世界操作规划	不仅能预测，还能规划怎么操作真实物体，像一个"会动手"的AI

你不需要告诉Physis"苹果会掉在地上"，它自己能从物理规律中学到这一点。这才是关键——世界模型不是靠人类标注的"常识库"，而是靠对物理世界的大规模建模学习到的"物理直觉"。这和人类婴儿通过观察和互动学习物理世界的过程，在原理上惊人地相似。

一个有趣的对比：GPT-4用了互联网上几乎所有文本，花了数亿美元训练费，但它仍然不知道把水杯推倒会发生什么。一个两岁的小孩，只看过几次类似场景，就能准确预测"水会洒出来"。这说明人类与生俱来的"物理直觉"——那种无需语言、无需推理的本能理解——大语言模型完全没有。而世界模型，正是试图填补这个鸿沟。

▲ 人形机器人在真实环境中操作物体，体现从数字到物理跨越的概念图（AI生成）

四、从数字世界迈向物理世界：一个时代的开始

智源大会不只是一个学术会议，它是中国AI产业方向的晴雨表。从2026年这届大会释放的信号来看，中国AI产业正在明确地从一个"跟随+追赶"的角度，切换到"定义下一个前沿"的角度。

一个细节值得注意：大会上一批垂直领域的AI应用已经走出实验室——心脏磁共振辅助诊断智能体、高分子材料研发智能体（全球首个）、科学发现智能体——这些不是PPT，而是已经在真实场景中实测的产品。

更值得关注的是FlagOS2.1——一个适配18家厂商32款芯片的统一智算软件栈。在全球芯片格局日趋复杂的背景下，这相当于为国产AI生态搭建了一条"高速公路"——无论底层用什么芯片，上层AI应用都能无缝运行。

AI的发展正在经历一个必然的分叉：一条路继续把语言模型做大做深（GPT-6已经证明这条路还没到尽头），另一条路向物理世界进军（具身智能、机器人、世界模型）。

回顾AI历史，每个大周期都是从一个"不可能"变成"可能"开始的。2012年AlexNet让图像识别从"不可能"变成了"可能"；2018年BERT让自然语言理解从"不可能"变成了"可能"；2022年ChatGPT让通用对话从"不可能"变成了"可能"。2026年，悟界Physis正在试图让"AI理解物理世界"从不可能变成可能——如果成功，这将是AI史上最大的一个周期跨越。

参考：环球网《2026智源大会开幕》、企鹅号《人工智能产业日报(06.12)》、企鹅号《2026北京智源大会开幕》、智源研究院官方发布

免责声明：本文基于公开新闻资讯整理撰写，仅供参考。