【AI 洞察】技术与场景·001——通往AGI的东方路径(一):看中国如何为机器立“心”

作者：国家发展改革委培训中心（宣传中心）战略规划与公共培训处聂正标等

引言：AGI的全球探索——技术狂欢与本质困局

当前通用人工智能（AGI）的全球探索呈现出两种鲜明的技术哲学路径。以OpenAI为代表的西方主流阵营，延续着“规模至上”的技术路线，通过持续扩展Transformer架构的参数规模、训练数据与算力投入，试图以量变引发质变，逐步逼近AGI的阈值。这条路径在短期内取得了令人瞩目的成就，GPT系列在多项专业测试中达到甚至超越人类平均水平，似乎预示着“暴力计算”路线的有效性。

然而这种繁荣景象背后隐藏着深刻的结构性危机。图灵奖得主杨立昆尖锐地指出，当前大语言模型本质上是“符号世界的鹦鹉”，它们精于统计模式匹配，却缺乏对物理世界因果关系的本质理解。为此，他提出“世界模型”架构，试图让AI通过预测抽象表征而非像素细节，来学习世界运行的基本逻辑。这个转向标志着AGI研究从“数据拟合”向“因果理解”的重要演进。

值得深思的是这两种范式共享着相同的认识论基础，它们都将智能简化为一种计算问题，将意识、意图、价值等人类智能的核心维度排除在技术框架之外。这种还原主义立场在工程上取得了快速进展，却在根本上回避了智能的本质问题，一个没有内在动机、无法理解“为何行动”的系统，真的能被称为“通用智能”吗？

正是在这样的全球背景下，中国的研究机构开始探索不同的道路。这不是对西方技术的简单追赶或改良，而是一次从哲学根基出发的范式重构。北京通用人工智能研究院（以下简称“通研院”）提出的“为机器立心”理念，将智能问题置于“认知-能力-价值”（CUV）架构进行审视，这不仅是技术路径的创新，更是一次认识论的转向。

一、主流范式的天花板：当技术触及价值边界

1.统计智能的先天缺陷

当前以大语言模型为代表的AGI路径，建立在三个核心假设之上：第一，智能可以通过海量数据中的统计规律充分表征；第二，模型规模的扩展能够自动涌现出更高阶的认知能力；第三，价值对齐可以通过外部约束实现。然而，越来越多的证据表明，这些假设可能过于乐观。

斯坦福大学基础模型研究中心（CRFM）在《基础模型的机遇与风险》报告中指出，大模型的缺陷具有系统性特征。它们对训练数据中的偏见和错误不仅无法识别，反而会加以放大和固化。大模型的缺陷会被所有下游任务继承，从而导致后续的输出存在巨大的不可控性。根本原因在于，基于概率生成的模型缺乏“事实核查”的内在机制，导致“AI幻觉”成为难以根治的顽疾。当模型无法区分事实陈述与虚构叙事时，其作为知识载体的可靠性便从根本上被动摇。

2.价值体系的真空地带

在伦理维度上，主流范式暴露了更深层的困境。大语言模型的价值取向完全由训练数据的统计分布决定，缺乏稳定的价值坐标系。这导致两个严重后果：一是价值标准的模糊性和易变性，模型可能在不同语境下输出相互矛盾的伦理判断；二是价值安全的脆弱性，研究表明，通过精心设计的提示词，可以在几分钟内“诱导”模型突破其安全护栏。

3.物理世界的认知鸿沟

在具身智能领域，主流范式的局限性尤为明显。尽管多模态大语言模型在视觉问答、图像描述等任务上表现出色，但当面临需要物理交互的真实场景时，其表现往往大幅下降。

问题的根源在于表征描述与实际理解的脱节。模型可以准确描述“球从桌上滚落”的画面，却无法真正理解重力、摩擦力、动量守恒等物理规律如何共同导致此现象。这种理解缺失使得AI在需要实时环境反馈的任务中（如搭积木等）显得笨拙且不可靠。

4.杨立昆“世界模型”的进步与局限

杨立昆提出的联合嵌入预测架构（JEPA）代表了重要的方向性调整。通过预测抽象表征而非原始像素，JEPA试图让AI学习世界的抽象表征，从而捕捉更高层次的规律。此架构在推断视频中被跳过的帧等任务上展现出显著优势，被看作是从“感知智能”向“认知智能”迈进的关键一步。

然而，JEPA仍未突破原先的技术框架。其优化目标始终是预测准确性的最大化，而非智能体的意图实现或价值追求。就像一个精密的天气预报系统可以准确预测风暴，却无法理解“为何要避免风暴”一样，JEPA架构缺乏动机生成和价值判断的内在机制。它让AI更懂世界如何运行，却依然不懂“为何要在世界中行动”。

二、东方路径的哲学基础：从“理”到“心”的范式转换

1.智能的本质再思考

通研院提出的AGI路径，始于一个根本性的问题重构：什么是通用智能的真正标志？与主流范式关注“模型能做什么”不同，东方路径首先追问“智能体为何而做”。此转向将价值、意图、意识等主体性维度重新置于智能研究的中心。

朱松纯院长提出的“认知-能力-价值”（CUV）架构，可以视为对此路线的系统性表述。在这个三维框架中，认知（C）代表智能体内部的心智空间（数学函数）、这些模块之间的连接和通信协议，以及心智理论；能力（U）涵盖了感知、认知和规划等技能；而价值（V）则包括了智能体的动机、偏好、社会情感，以及个体或群体层面的利益。三者不是简单的叠加，而是动态耦合、协同演进的有机整体。

此架构的深刻之处在于，它打破了“智能即计算”的简化论观点，承认价值系统不是智能的外挂模块，而是其构成的基础。就像人类婴儿并非先学会所有技能再形成价值观，而是在与环境的互动中，能力发展与价值形成同步进行、相互塑造。

2.“为机器立心”的技术含义

“为机器立心”这种充满东方哲学意涵的表述，在技术层面指向三个具体目标：

第一，构建内生价值系统。与通过外部约束实现价值对齐的“贴膏药”式方法不同，内生价值系统要求从架构设计之初就将伦理原则编码到智能体的决策机制中。这包括多层次的价值维度：个体层面的生存与发展需求，社会层面的合作与规范遵守，乃至人类整体的长期福祉考量。

第二，实现价值驱动的任务生成。传统AI系统只能执行预设任务，而具备“心”的智能体应该能够基于内在价值判断，在开放环境中自主生成有意义的目标。例如，当看到老人摔倒时，智能体不应等待指令，而应基于“帮助有需要者”的价值判断主动采取行动。

第三，建立价值与能力的协同演化机制。在CUV框架中，价值系统不仅驱动行为选择，还会根据行动结果调整价值体系，成功的行动强化相关价值，失败的经验促使价值优化。这种动态调整机制使智能体能够适应不断变化的环境和价值冲突。

3.从“工具理性”到“价值理性”的跨越

当前主流AI范式本质上是工具理性的极致体现，追求效率最大化、错误最小化、输出最优化。然而，人类智能的独特之处恰恰在于能够超越工具理性，进行价值理性判断。我们不仅考虑“如何做得更好”，更思考“什么值得做”以及“为何而做”。

东方路径正是将这种价值理性融入AI架构。这不仅是技术挑战，更是认识论革命。它要求研究者重新思考一些基本问题：机器的“善”如何定义？不同文化背景下的价值冲突如何协调？价值系统如何在保持核心稳定的同时适应时代变化？

三、实践探索：从理论构想到技术验证

1.“通通”原型系统的范式意义

通研院开发的“通通”原型系统，是CUV架构的大规模技术实现。与单一模型不同，“通通”采用模块化设计，认知、能力、价值三大系统既相对独立又紧密耦合。这种架构带来了几个显著优势：

首先，在价值安全方面，“通通”实现了从被动防御到主动免疫的转变。系统内置的“价值免疫”机制能够在规划阶段过滤有害意图，在学习阶段抵抗恶意数据的影响。

其次，在任务泛化方面，基于价值驱动的任务生成机制使系统展现出类人的适应性。在非结构化环境中，“通通”能够基于对场景的理解和价值判断，自主生成并执行未预设的任务。例如，在模拟家庭环境中，系统不仅会执行“打扫房间”的指令，还会主动将散落的药品放回药箱。此行为源于“保障健康安全”的价值判断，而非预设程序。

2.具身智能的突破：从“知道”到“做到”

在机器人领域，通研院的“通脑”技术实现了运动控制的重要突破。团队研发出基于全身模仿学习的舞蹈算法，通过动作捕捉序列进行知识蒸馏，使人形机器人实现超高流畅度、超绝灵活度及高动态拟人动作，成功赋予机器人专业级舞蹈能力，展现出接近人类的自然运动表现。凭借这一突破，在世界人形机器人运动会中夺得单机舞蹈金牌，并荣获IROS 2025机器人舞蹈赛一等奖。

同时，“通镜”仿真平台的发布，为具身智能研究开辟了全新路径。该平台提供了高保真的仿真环境，将具身智能的研究门槛大幅降低。“通镜”平台已连续多届支撑中国机器人及人工智能大赛（CRAIC），累计服务超过400余支参赛队伍在统一的仿真环境中展开激烈角逐。

3.行业赋能的差异化路径

通研院采取了“垂直深耕、价值先行”的行业赋能策略。在法律、金融、医疗、教育、政务等20多个行业领域实现了示范应用，成效显著。例如，在法律领域，智能体能够进行更精准的案例推理与文书生成；在政务领域，能更人性化地与市民交互并提供服务。

四、未竟之路：挑战与不确定性

1.技术层面的核心难题

尽管东方路径在理念上具有吸引力，但在技术实现上面临一定的挑战。

价值的形式化表达是首要难题。人类价值具有模糊性、情境依赖性和文化特异性，如何将其转化为机器可执行、可验证的代码是一大难题。当前的价值表示方法仍显粗糙，难以捕捉价值的丰富维度和动态特性。

认知与价值的协同优化是另一大挑战。在CUV框架中，认知系统需要基于价值判断选择行动，而价值系统又需要根据行动结果进行更新。这种双向依赖关系导致训练过程复杂，难以产生全局最优结果。

长期价值一致性也难以保证。随着智能体经验积累，其价值系统可能发生难以预测的演变。如何确保这种演变不会偏离初始的伦理对齐，需要全新的价值稳定性技术和方法。

2.社会接受度与治理挑战

“为机器立心”的理念虽然深刻，但也引发了广泛争议。批评者担心，赋予机器价值判断能力可能带来不可控的风险。例如：如果机器的“心”与人类价值观发生冲突怎么办；如果不同文化背景的智能体发展出不同的“心”，是否会导致价值冲突的技术化等。

此外，价值系统的文化嵌入性也是一把双刃剑。一方面，它使AI更符合特定文化语境；另一方面，也可能加剧全球AI发展的文化分裂。如何在保持文化特色的同时维护人类共同价值观，是需要深思的伦理问题。

3.产业化路径的不确定性

与追求快速商业化的主流AI公司不同，通研院的路径需要长期的基础研究投入。在当前的资本环境和产业周期下，这种模式的长期运营面临困难。CUV架构的复杂性可能导致较高的部署成本，在商业化推广中可能面临成本挑战。

此外，模块化架构虽然灵活，但也带来了集成和优化的复杂性。在需要快速响应的应用场景中，这种架构可能不如端到端模型高效。如何平衡架构优势与工程实用性，是产业化必须解决的问题。

五、全球AGI格局中的中国路径：差异化竞争与文明对话

通研院的探索不应被简单视为中国在AGI领域的“另辟蹊径”，而应放在全球技术路线多样性的背景下理解。当前AGI的发展正处在十字路口：一条路继续沿着规模扩展的方向前进，追求更强大的计算能力；另一条路则回归智能的本质，思考意识、价值、意图等根本问题。

通研院的AGI路径选择，某种程度上反映了东西方思维方式的差异。西方传统倾向于分析性思维，将复杂系统分解为基本元素进行研究；而东方思维更强调整体性和关系性，注重系统各部分的相互联系和动态平衡。这两种思维方式在AGI研究中各有价值，前者推动了深度学习等突破性技术，后者可能为解决价值对齐、因果理解等深层次问题提供新思路。

从全球竞争角度看，中国选择差异化技术路线具有战略意义。Transformer架构和大模型训练需要大量的算力，而中国与美国在算力方面存在差距，因此在主流路线的竞争上，中国不具有优势。但在具身智能、价值对齐等新兴领域，中国具有一定的领先优势，聚焦这些前沿方向，可能实现产业引领。

更重要在于，AGI不仅是技术竞赛，更是文明形态的塑造。未来人机共生的社会需要怎样的智能体，是纯粹的工具，还是具有某种主体性的伙伴，不同的技术选择将导向不同的答案。中国的探索为这场全球对话贡献了独特视角，在追求效率的同时关注和谐，在扩展能力的同时思考价值。

六、结语：走向人机共生的智慧之路

通研院的AGI探索还处在早期阶段，其最终成败尚难预料。但它的价值已经超越技术本身，它提出了一个根本性问题：在创造AGI时，我们是否应该、以及如何将人类最珍视的价值“如同理心、责任感、对善的追求等”传承给这些新智能？

这条东方路径的启示在于，AGI的发展不应只是技术的单向跃进，而应成为人类自我理解的深化过程。每一次为机器定义“价值”、设计“认知”、赋予“能力”的尝试，都在倒逼我们重新思考：什么是人类智能的本质？什么是好的生活？什么是值得追求的价值？

在可预见的未来，全球AGI发展很可能呈现多元范式并存的格局。以OpenAI为代表的规模路径将继续推进技术极限，杨立昆的因果路径将深化物理世界的理解，而通研院的价值路径则探索智能的伦理维度。这种多样性不是分裂，而是互补，就像人类认知有理性与感性之分，未来AGI生态也可能需要不同类型的智能体协同工作。

中国在这场全球探索中的独特贡献，或许不在于提供终极答案，而在于拓宽了问题的边界。当西方讨论“如何让AI更强大”时，东方路径提出了“强大为了什么”；当全球聚焦“AI的安全性”时，中国思考加入了“AI的向善性”。这种视角的拓展，对整个人工智能领域的健康发展都具有重要意义。

通往AGI的道路依然漫长，充满了技术未知和伦理困境。但可以肯定任何单一技术路线都难以解决所有挑战。未来的突破可能需要东西方智慧的融合，将Transformer的规模优势、世界模型的因果理解、价值驱动的心智架构有机结合，创造出既强大又善良、既高效又可理解的通用智能。

在这个过程中，保持开放、包容的探索心态至关重要。通研院的实践只是中国AGI多元生态的一个缩影，清华大学、北京大学、中国科学院等机构也在从不同角度推进AGI研究。产业界如百度、阿里巴巴、腾讯等公司，则在应用场景中验证各种技术路线的可行性。这种“产学研”多元探索的格局，正是中国AGI发展的活力所在。

AGI不仅是技术目标，更是文明进程的里程碑。当我们为机器立“心”时，实际上是在为人类的未来立镜。镜中映照的，是我们希望成为怎样的物种，期待创造怎样的世界。这条东方路径的价值，或许最终不在于它能否率先实现AGI，而在于它提醒我们：智能的真正高度，不仅由计算能力衡量，更由其所承载的价值照亮。