AI思想者集萃|中国科学院院士清华大学人工智能研究院名誉院长张钹-夜雨聆风

AI思想者集萃|中国科学院院士清华大学人工智能研究院名誉院长张钹

作为中国人工智能领域的奠基者与开拓者，张钹院士不仅以卓越的学术成就引领了中国人工智能从无到有、从追跑到并跑的历史进程，更构筑起一套深邃而系统的思想体系，为人工智能的未来发展注入了清醒的理性与长远的洞见。从1978年毅然投身这片当时尚属空白的领域，到如今年届九秩依然活跃在科研与思辨的第一线，他的思想始终站在时代前沿，深刻揭示着人工智能的本质、边界与可能。

一、拓荒者之路：中国人工智能的奠基人

张钹院士的学术生涯，本身就是一部浓缩的中国人工智能编年史。1935年生于福建福清的他，1958年毕业于清华大学自动控制系并留校任教。1978年，借清华大学院系调整的契机，他凭借出色的英文能力深入查阅国际前沿资料，敏锐地捕捉到人工智能这一新兴方向的巨大潜力，并果断推动将其确立为新的研究领域，由此开启了中国人工智能的拓荒时代。

他的开创性贡献构建了中国AI研究的基石：1983年，他与弟弟张铃教授成为首批在国际人工智能大会（IJCAI）上发表论文的中国科学家，让世界听见来自中国的声音；1984年，二人共同获得ICL欧洲人工智能奖，这是中国学者在该领域首次斩获国际重要奖项；1985年，他领衔成立中国首个智能机器人实验室；1987年，他培养出中国人工智能领域最早的博士毕业生之一，极大地充实了该领域的尖端人才储备；1990年，他与同事共同创立全国第一个人工智能国家重点实验室——“智能技术与系统”国家重点实验室。这一连串里程碑，不仅标志着中国人工智能研究体系的正式确立，更孕育了一种自强不息、敢为人先的学术精神。

二、人工智能发展的三阶段论

在纷繁的AI演进历程中，张钹院士提炼出一个清晰的三阶段框架，这一范式已成为理解人工智能发展逻辑与内在局限的关键工具。

第一代人工智能（知识驱动）以符号主义为核心，通过规则和逻辑推理模拟人类思维。其优势在于可解释性强，但致命瓶颈在于知识获取极为困难，应用领域狭窄，高度依赖专家系统的手工构建，难以实现规模化推广。

第二代人工智能（数据驱动）以深度学习为代表，借助海量数据训练神经网络模型，在图像识别、语音处理等领域取得突破性进展。然而，张钹院士深刻揭示了其本质缺陷：系统脆弱、不安全、不可信、不可控、不可靠且难以推广。他曾以经典的“对抗性样本”为例——仅在图像上添加人眼无法察觉的微小噪声，系统便会以极高的置信度将“熊猫”识别为“长臂猿”，或将“停止”路标识别为限速标志——这生动而严肃地说明了基于纯数据驱动范式的内在脆弱性。

第三代人工智能则是张钹院士提出的前瞻性理念。他指出，前两代AI均局限于特定领域问题，存在根本性局限。第三代AI的核心在于融合知识驱动与数据驱动，系统性地利用知识、数据、算法与算力四个要素，并将知识置于首要位置，因为“知识才是人类智慧的源泉”。这一代AI的目标，正是建立可解释且鲁棒的理论基础，发展安全、可信、可控、可靠、可扩展的技术体系，从根源上超越前两代范式的天花板。

三、对当前AI技术的深刻批判与建设性思考

面对以ChatGPT、Sora为代表的大模型浪潮，张钹院士始终保持着科学家特有的冷静与审慎。他一方面充分肯定大模型在语言生成、人机交互和迁移学习方面的三大能力突破，特别是其处理开放领域问题的飞跃，使机器初步具备了驾驭人类语言的能力；另一方面，他更为尖锐地指明了大模型无法回避的“幻觉”问题——模型会不断生成看似合理却实际错误或无意义的内容，且这一缺陷具有内在性、不可控性和必然性。

在他看来，当前AI的主流本质上是“机器智能”，而非真正的“人类智能”。他清晰地区分出两条路径：行为主义学派追求机器行为与人类相似；内在主义学派则主张模拟人类大脑的工作机理，即类脑计算。目前成功的大模型属于前者，它们与人类智能仅在行为层面相似，内在工作机制截然不同，这也正是它们缺乏可解释性的深层根源。这一判断，为技术热潮注入了不可或缺的哲学清醒。

四、迈向通用人工智能的四步路径

对于人工智能的终极目标——通用人工智能（AGI），张钹院士没有停留于空泛的想象，而是提出了一条清晰而务实的演进路线。他认为，从当前大语言模型迈向通用人工智能，至少需要迈出四个关键步骤：

第一步，与人类对齐，使AI系统理解并适应人类的价值观、思维方式和行为模式，通过人类反馈持续优化。

第二步，多模态生成，使AI不仅能生成文本，还能生成图像、声音、视频和代码，实现文生图、图生文、文生视频等跨模态理解与创造。

第三步，与数字世界交互，体现为AI智能体（AI Agent）的发展，在“思考”之外加入“感知”与“动作”环节，形成自主执行任务与学习的闭环。

第四步，与客观世界交互，实现具身智能，将智能系统与物理实体结合，在现实世界中进行感知、决策和行动，推动通用硬件的协同演进。

张钹院士特别强调，完成这四步并不等于实现了通用人工智能，而是朝向这一目标迈出的必要阶梯。真正的通用人工智能必须建立在坚实的理论基石之上，而当前AI领域最为匮乏的，恰恰是统一的理论框架。这一认知，将他深邃的务实精神与长远的理论追求融为一体。

五、AI安全、可信与可解释性的技术哲学

在张钹院士的思想体系中，安全性与可信性绝非附加议题，而是人工智能能否被社会广泛接受的先决条件。他一针见血地指出，第二代AI的深度学习算法存在天然缺陷：不可解释、不安全、不可控、易受攻击，且因依赖海量数据而难以推广。他同样以实例警示：攻击者仅需佩戴特制图案的眼镜便可欺骗人脸识别系统；在语音中加入微不可察的噪声，就能让识别系统产生完全错误的判断。

在他看来，破解这一困境的根本出路，在于发展可解释的人工智能理论。如果无法建立起可解释且鲁棒的理论，AI技术就永远无法真正令人信服——这正是他提出第三代人工智能理念的深层动因：通过融合知识驱动与数据驱动，从技术层面构筑安全防线。

特别是在医疗等高风险领域，他的态度尤为审慎。当前大语言模型缺乏真正的推理与因果理解能力，其“黑箱”特性和不可解释性令人高度警惕。更重要的是，AI尚不能“自我负责”。因此，对于大模型给出的任何诊疗意见，都必须由人类医生最终把关。在AI时代，医生的角色将升华为决策者、沟通者和边界守护者，这一洞见为智能时代的专业伦理提供了清晰的坐标。

六、产业发展的务实展望与战略建议

对于人工智能的产业化，张钹院士始终保持着清醒而务实的视野。他指出，当前AI产业由于缺乏统一的理论体系，发展仍高度依赖于特定领域的模型和算法，这直接制约了市场规模与产业演进的速度。

面对“百模大战”的产业热潮，他冷静预言：未来只有少数企业会专注于通用大模型的研发，大多数企业将向三个方向分流——一是深耕垂直领域大模型，深入金融、医疗、能源等专业场景；二是提供通用或开源模型作为基础设施；三是将大模型与其他技术和工具深度融合，开发创新应用。这一判断，为喧嚣的市场提供了理性的导航。

他特别强调，中国在发展第三代人工智能方面与世界站在同一起跑线上，这为我们掌握发展主动权、做出原创性重大贡献提供了难得的历史机遇。为此，他大力倡导建立产学研紧密结合的创新“造血体系”，将科学研究、技术创新与产业发展融为一个有机整体，构建可持续的创新生态。

七、数学工具与理论创新的方法论贡献

张钹院士的学术思想深处，始终流淌着浓重的数学底色。早在二十世纪八十年代，他就敏锐地觉察到，当时多数AI研究恰恰匮乏数学工具，这恰恰意味着“很多还未解决的问题有机会用数学办法解决”。他与张铃教授合作，将概率统计和拓扑理论这两把“快刀”引入人工智能，提出了基于统计推断的启发式搜索、基于拓扑降维的运动规划等方法，为智能系统的严谨性奠定了数学根基。

他们最具代表性的理论贡献是问题求解的商空间理论，这一理论已成为粒计算的主要分支之一。它在商空间数学模型的基础上，提出了多粒度空间之间相互转换、综合与推理的方法，以及问题分层求解的计算复杂性分析和降低复杂性的策略。这一理论创新不仅为机器人运动规划等实际问题提供了强有力的工具，更为人工智能的理论建构开辟了一条全新的路径。它生动地证明：离开深刻的数学思维，真正坚实的人工智能理论便无从建立。

张钹院士的人工智能思想体系，兼具历史的厚度、未来的远见、批判的锐度与建设的温度。从中国人工智能的拓荒者到世界AI思想的重要贡献者，他的思想历程折射出中国科技工作者从追赶到引领的壮阔轨迹。

在AI技术日新月异的今天，他反复提醒我们：真正的创新不在于盲目追随热点，而在于深入本质、夯实根基。他的第三代人工智能理念，不仅是对技术路线的规划，更是一次关于AI发展哲学的深刻思辨——在奋力追求智能的同时，必须牢牢守住安全、可信、可控的底线；在热情拥抱数据驱动的同时，绝不能遗忘知识这一人类智慧的最终源泉。

媒体主理人｜Kevin 138 8041 8738