【报告】AI专题二:从知识图谱到认知智能(附PDF下载)

复旦大学：
《从知识图谱到认知智能（2025年）》
（完整版.pdf ）
以下仅展示部分内容
下载方式见文末

认知智能是以知识的发现和应用为核心内容的智能形式，是实现机器真正理解世界的关键。

在人工智能迅猛发展的今天，知识图谱如何赋能认知智能？机器如何真正理解世界？复旦大学知识工场实验室肖仰华教授在2025年的一份报告中，系统阐述了从知识图谱到认知智能的技术演进、核心思想与工业实践。本文将为你详细解读这份报告的精华内容。

一、人工智能时代需要“机器智脑”

随着大数据时代的到来，我们不仅需要处理数据，更需要从数据中提取知识、实现知识工作的自动化。知识图谱作为结构化知识的载体，正在成为释放大数据价值的关键引擎。

战略意义在于：

全方位、深度渗透到各行各业、各个环节
颠覆性影响，重塑行业形态，甚至社会形态
智能化升级与转型已经成为各行各业的普遍诉求

从信息化走向智能化是必然趋势，“AI+”成为AI赋能传统行业的基本模式。而知识图谱正是使能认知智能的核心基础设施，领域知识的积累与沉淀是实现智能化的必经路径。

二、技术生态的变化：深度学习与知识图谱的融合

近年来，深度学习、大规模预训练模型的大规模应用，对基于知识的应用形成了替代与补充。大规模训练模型可以被视作一类新型的统计驱动的知识库，机器隐性知识正在兴起。

然而，随着知识图谱应用的深化，成本与效用之间的矛盾日益突出，如何在保证效果的同时降低构建和维护成本，成为业界关注的焦点。

三、什么是智能？什么是知识？

康德曾说：“世界上有两件东西能震撼人们的心灵：一件是我们心中崇高的道德标准；另一件是我们头顶上灿烂的星空。”

智能被定义为：从经验中学习、解决问题并运用知识适应新情况的能力。

而知识，按照经典哲学的定义，是“确证的真信念”（Justified True Belief）：

它必须是真实的
我们必须相信它
我们必须有某种理由相信它

在信息科学视角下：

数据：对客观世界的符号化记录
信息：被赋予意义的数据
知识：信息之间有意义的关联

四、认知智能：让机器成为认知世界的新主体

认知智能是以知识的发现和应用为核心内容的智能形式。它的目标是让智能机器成为“认知”世界的新主体。

认知的目的是获取知识，而知识是认知的结果。认知智能以知识智能为核心，涉及从现实世界到知识的认知过程。从人类视角看，知识有狭义与广义之分：狭义知识是人类显性表达的知识，广义知识则包括呈现在数据中的能够有效求解问题的“输入-输出”数据模式。

五、认知与感知的双向互动

认知智能不仅是感知智能升级的一个全新阶段，二者更是双向互动关系。

人类独特的“脑补”效应本质上是认知对于感知的有益引导与补充。例如：

视觉上的鸭兔错觉：同一幅图，认知不同，看到的就不同
听觉上的音位恢复：即使部分音节被噪音覆盖，人脑也能“补全”听到的句子

这说明，机器感知智能的瓶颈突破需要认知的牵引。没有认知的感知，往往只能停留在表面。

六、认知智能的思想支撑：三大流派合流

认知智能的实现需要AI三大流派——符号主义、连接主义、行为主义的合流，形成合力。

特别是面向认知的进化主义：有效的、合理的反馈是进化主义解决问题的关键。文本、图像、语音理解等认知任务，需要从知识库（人类认知世界的逻辑结果）寻求有效的反馈机制，正如强化学习从物理世界寻求反馈一样，认知智能需要从逻辑世界寻求反馈。

七、认知智能的核心能力：理解与解释

“认知智能的核心能力是‘理解’和‘解释’，体现在机器能够理解数据、理解语言进而理解现实世界的能力，体现在机器能够解释数据、解释过程进而解释现象的能力，体现在推理、规划等等一系列人类所独有的认知能力上。”

认知智能是数据智能、知识智能的集成融合创新的产物，是数据、算力、模型发展到一定阶段后的必然方向。

八、大规模符号接地：赋予符号以体验

人类的理解一定程度上体现为从符号产生体验联想。大规模符号接地是赋予符号以体验与意义的过程，是实现认知智能的基础之一。

通过多模态知识图谱，可以：

增强预训练语言模型
增强机器常识理解能力
提升图像到文本生成的准确性
作为多模态额外特征增强NLP任务性能

九、常识理解：认知智能的第一性问题

马文·明斯基在《情感机器》中指出：“常识知识是指我们大多数人都知道的事实与概念……”

常识理解有可能是认知智能乃至人工智能发展的第一性问题。没有常识，机器就难以理解世界的运行规律，难以做出合理的推理与决策。

十、因果理解：从相关到因果

波普尔说：“人类认识世界的过程是基于人们对某种因果关系的猜测。”

从统计相关到事理因果，是机器感知智能（深度学习）向认知智能发展的重要内容之一。因果分析是深化大数据洞察与理解的重要方式，它让机器不仅仅知道“是什么”，更知道“为什么”。

十一、语言理解：认知的窗口

语言是人类认知的外显，也是机器认知的重要入口。让机器真正理解语言，而不仅仅是处理字符串，是认知智能的核心挑战之一。

十二、归纳与演绎：认知的基本形式

智能体现在沿着概念层级进行归纳与演绎的能力：

归纳：从具体到抽象，如从“张三吃面包”归纳出“人吃食物”
演绎：从抽象到具体，如“哲学家有自己的哲学思想，柏拉图是哲学家，所以柏拉图有自己的哲学思想”

大规模概念图谱是实现机器归纳与演绎的基础。

十三、类比推理：人类认知的核心

“真是病来如山倒，祛病如抽丝哇”——类比是人类认知中最丰富和活跃的思维方式，是通过应用过去的经验来解决新问题的一种思维过程。

案例推理（Case-based Reasoning）就是基于类比的典型方法。机器在大规模开放环境下的类比推理能力仍然有限，但大规模知识库支撑下的类比推理机会巨大，有着重大应用价值。

十四、元知识：关于知识的知识

元知识是“有关知识的知识”，包括：领域有哪些核心概念？概念的层级体系如何？概念存在哪些核心属性？概念之间存在哪些核心关系？

人类社会日益复杂，远超出人类专家的理解能力，专家已经难以梳理元知识体系。机器辅助人类建立知识体系日益必要，也初具可能。

十五、高阶认知：机器认知的主动性

高阶认知包括：我知道你知道什么、我知道你需要什么、我知道你知道他知道什么。

人机协作需要机器具备高阶认知能力，实现主动协作。当前交互类应用“智障”的集中体现，就是缺乏高阶认知。比如下面的对话：

人：我渴了，给我一杯喝的机器：您要饮料还是茶水人：水吧机器：有糖还是无糖人：无糖吧机器：有气泡还是无气泡人：无气泡吧机器：热水还是冷水人：冷水吧机器：要加冰块么人：不加机器：要加冰块么人：不加吧机器：水是要矿泉水还是普通水呢人：我只是想要一杯水喝

这种缺乏高阶认知的对话，正是当前人机交互的痛点。

十六、自省认知：知之为知之，不知为不知

自省认知的本质是对未知保持适度的敬畏，实现自知之明：知道自己知道什么、不知道自己不知道什么、知道自己何时犯错、知道自己犯了什么错误。

实际应用的兜底方案需要自省认知。例如：

不合理问题的拒绝：“鲁迅老公是谁？”→“这个问题不合理，鲁迅是男的”
不能答问题的提醒：“XX药物的禁忌症是什么？”→“这个问题我的知识库存缺失，请寻求人类帮助”
不确定问答的提示：“发动机不均匀度范围多少？”→“1%。请进一步参考XX指南获取确信信息”
善意的抗辩与提醒：“给我降压药” →“您今天已经吃过了，不建议再吃了”

“知之为知之，不知为不知，是知也。”

十七、面向工业领域的认知智能

认知智能的应用场景正逐渐由消费互联网向工业互联网转变。

工业认知的本质是：将工业相关知识以及推理能力赋予机器，实现甚至超越人类水平的智能工作。工业认知是机器推理决策的基础，在规模、时效等方面，机器可以远超人类。

主要困难在于：

工业系统是复杂巨系统，涉及多学科知识
知识获取难度大，很多经验难以显性化
数据驱动的方法在工业场景下往往效果不佳

实现思路：

工业系统是人造系统，体现的是人类对世界的认知
工业模拟器是人类知识的主要体现
数据驱动与知识引领相融合是解决工业认知的基本路径
纯数据驱动为特色的消费互联网技术体系难以在工业互联网取得良好效果

十八、知识获取的四种范式

机器如何获取知识？报告提出了四种范式：

基于模板的抽取：通过预定义模板从文本中抽取知识
端到端抽取：利用深度学习模型直接抽取知识
知识萃取：从大规模语言模型中按需提纯特定知识
知识生成：利用生成模型创造新知识

其中，知识萃取成为一种新范式：基于大规模通用语料训练而得的语言模型使得机器具备了足够广度的浅层文本认知，语言模型成为知识的“蓄水池”。但语言模型在常识理解、逻辑推理、长尾知识、元知识理解等方面仍存在局限，需要与知识图谱结合。

十九、端到端抽取的前沿探索

基于阅读理解的概念识别：为CN-DBpedia新增78万概念，准确率达到93%。例如，从文本中抽取出“Google是一家美国跨国科技公司”中的概念“跨国公司”。

关系抽取的持续学习：利用原型网络，使得模型在学习新关系的同时保持对旧关系的分类能力，有效缓解灾难性遗忘。

细粒度概念生成：根据结构化信息生成细粒度概念，如从“刘德华”的属性（香港、男、流行）生成“香港男演员”“著名流行男歌手”等。这一方案为CN-DBpedia增加了130多万细粒度概念，准确率91%。

基于生成模型的概念获取：借助大规模语言模型生成概念，如从《三体》的描述生成“book”“novel”等概念，但需注意概念漂移问题。

基于归纳的无知识获取：从实例中归纳常识，如从“人吃面包”“人吃苹果”归纳出“人吃食物”。

二十、无表征知识工程：下一代知识工程

传统AI遵循“需求-建模-计划-行动”框架，基于知识的方法。而无表征AI（由Rodney Brooks提出）遵循“需求-行动”框架，基于行动的方法，认为能力的产生在于对能力的需求，不一定需要为能力的产生给予明确的定义。

人类的专家：工匠富有经验解决问题，但很少能明确表达；大师能清晰表达自己的经验。知识指引下的强化学习经过较多案例的演化学习，有可能再现工匠的技能。

进化主义的关键在于能够模拟合理的进化环境。人类知识的重要意义在于加速机器智能进化的进程、降低机器进化的起点。知识图谱引导的强化学习，正是实现无表征知识工程的途径。

二十一、人机知识的定量化实证分析

从复杂网络视角分析人工构建与自动构建的知识库差异：

知识图谱总体上是稀疏、异配的，度分布符合（指数截尾的）幂律分布
相对于手工构建，自动化构建的知识图谱不同领域间的语义丰富度更不均衡
自动化构建知识图谱的K-Core部分或许是常识部分
知识图谱中粗粒度概念语义更加丰富

知识图谱是否越大越好？不一定。同质化的知识容易被少量规则压缩，多样性的知识图谱构建更合理。可以通过无损压缩评估知识图谱的冗余性。

二十二、结语：走向认知智能的未来

认知智能的实现，需要知识图谱、语言模型、深度学习、强化学习等多种技术的深度融合。从知识图谱到认知智能，不仅仅是技术的演进，更是对机器理解世界能力的深刻探索。

正如肖仰华教授所言：“实践不仅具有普遍的资格，而且具有绝对现实的资格。”在工业领域、消费互联网、人机协作的各个场景中，认知智能正在从理论走向实践，从实验室走向产业。

未来，机器的隐性知识将成为人类知识体系的显著补充，机器的认知能力将显著拓展人类的认知能力。让我们共同期待，认知智能带来的智能新纪元。

☟☟☟

☞人工智能产业链联盟筹备组征集公告☜

☝

精选报告推荐：

Openclaw龙虾专题：

【报告】Openclaw龙虾专题一：清华大学-龙虾OpenClaw发展研究报告1.0版（附PDF下载）

【报告】Openclaw龙虾专题二：清华大学-龙虾OpenClaw自我研究报告1.0版（附PDF下载）

11份清华大学的DeepSeek教程，全都给你打包好了，直接领取：

【清华第一版】DeepSeek从入门到精通

【清华第二版】DeepSeek如何赋能职场应用？

【清华第三版】普通人如何抓住DeepSeek红利？

【清华第四版】DeepSeek+DeepResearch让科研像聊天一样简单？

【清华第五版】DeepSeek与AI幻觉

【清华第六版】DeepSeek赋能家庭教育

【清华第七版】文科生零基础AI编程：快速提升想象力和实操能力

【清华第八版】DeepSeek政务场景应用与解决方案

【清华第九版】迈向未来的AI教学实验

【清华第十版】DeepSeek赋能品牌传播与营销

【清华第十一版】2025AI赋能教育：高考志愿填报工具使用指南

10份北京大学的DeepSeek教程

【北京大学第一版】DeepSeek与AIGC应用

【北京大学第二版】DeepSeek提示词工程和落地场景

【北京大学第三版】Deepseek 私有化部署和一体机

【北京大学第四版】DeepSeek原理与落地应用

【北京大学第五版】Deepseek应用场景中需要关注的十个安全问题和防范措施

【北京大学第六版】DeepSeek与新媒体运营

【北京大学第七版】DeepSeek原理与教育场景应用报告

【北京大学第八版】AI工具深度测评与选型指南

【北京大学第九版】AI+Agent与Agentic+AI的原理和应用洞察与未来展望

【北京大学第十版】DeepSeek在教育和学术领域的应用场景与案例(上中下合集)

8份浙江大学的DeepSeek专题系列教程

浙江大学DeepSeek专题系列一--吴飞：DeepSeek-回望AI三大主义与加强通识教育

浙江大学DeepSeek专题系列二--陈文智：Chatting or Acting-DeepSeek的突破边界与浙大先生的未来图景

浙江大学DeepSeek专题系列三--孙凌云：DeepSeek：智能时代的全面到来和人机协作的新常态

浙江大学DeepSeek专题系列四--王则可：DeepSeek模型优势：算力、成本角度解读

浙江大学DeepSeek专题系列五--陈静远：语言解码双生花：人类经验与AI算法的镜像之旅

浙江大学DeepSeek专题系列六--吴超：走向数字社会：从Deepseek到群体智慧

浙江大学DeepSeek专题系列七--朱朝阳：DeepSeek之火，可以燎原

浙江大学DeepSeek专题系列八--陈建海：DeepSeek的本地化部署与AI通识教育之未来

4份51CTO的《DeepSeek入门宝典》

51CTO：《DeepSeek入门宝典》：第1册-技术解析篇

51CTO：《DeepSeek入门宝典》：第2册-开发实战篇

51CTO：《DeepSeek入门宝典》：第3册-行业应用篇

51CTO：《DeepSeek入门宝典》：第4册-个人使用篇

5份厦门大学的DeepSeek教程

【厦门大学第一版】DeepSeek大模型概念、技术与应用实践

【厦门大学第二版】DeepSeek大模型赋能高校教学和科研

【厦门大学第三版】DeepSeek大模型及其企业应用实践

【厦门大学第四版】DeepSeek大模型赋能政府数字化转型

【厦门大学第五版】DeepSeek等大模型工具使用手册-实战篇

10份浙江大学的DeepSeek公开课第二季专题系列教程

【精选报告】浙江大学公开课第二季：《DeepSeek技术溯源及前沿探索》（附PDF下载）

【精选报告】浙江大学公开课第二季：2025从大模型、智能体到复杂AI应用系统的构建——以产业大脑为例（附PDF下载）

【精选报告】浙江大学公开课第二季：智能金融——AI驱动的金融变革（附PDF下载）

【精选报告】浙江大学公开课第二季：人工智能重塑科学与工程研究（附PDF下载）

【精选报告】浙江大学公开课第二季：生成式人工智能赋能智慧司法及相关思考(附PDF下载）

【精选报告】浙江大学公开课第二季：AI大模型如何破局传统医疗（附PDF下载）

【精选报告】浙江大学公开课第二季：2025年大模型：从单词接龙到行业落地报告（附PDF下载）

【精选报告】浙江大学公开课第二季：2025大小模型端云协同赋能人机交互报告（附PDF下载）

【精选报告】浙江大学公开课第二季：DeepSeek时代：让AI更懂中国文化的美与善（附PDF下载）

【精选报告】浙江大学公开课第二季：智能音乐生成：理解·反馈·融合（附PDF下载）

6份浙江大学的DeepSeek公开课第三季专题系列教程

【精选报告】浙江大学公开课第三季：走进海洋人工智能的未来（附PDF下载）

【精选报告】浙江大学公开课第三季：当艺术遇见AI：科艺融合的新探索（附PDF下载）

【精选报告】浙江大学公开课第三季：AI+BME，迈向智慧医疗健康——浙大的探索与实践（附PDF下载）

【精选报告】浙江大学公开课第三季：心理学与人工智能（附PDF下载）

【精选报告】浙江大学公开课第三季：人工智能赋能交通运输系统——关键技术与应用（附PDF下载）

【精选报告】浙江大学公开课第三季：人工智能与道德进步（附PDF下载）

篇幅有限，部分展示
加入会员，任意下载
资料下载方式
Download method of report materials
关注公众号后回复：TP260319
即可领取完整版资料
荐：
【中国风动漫】《姜子牙》刷屏背后，藏着中国动画100年内幕！
【中国风动漫】除了《哪吒》，这些良心国产动画也应该被更多人知道！
【中国风动漫】《雾山五行》大火，却很少人知道它的前身《岁城璃心》一个拿着十米大刀的男主夭折！
如需获取更多报告
扫码加入
“人工智能产业链联盟”
知识星球，任意下载相关报告！
报告部分截图
声明
来源：复旦大学，人工智能产业链union（ID:aiyuexingqiu）推荐阅读，不代表人工智能产业链union立场，转载请注明，如涉及作品版权问题，请联系我们删除或做相关处理！
编辑：Zero
文末福利
1.赠送800G人工智能资源。
获取方式：关注本公众号，回复“人工智能”。
2.「超级公开课NVIDIA专场」免费下载
获取方式：关注本公众号，回复“公开课”。
3.免费微信交流群：
人工智能行业研究报告分享群、
人工智能知识分享群、
智能机器人交流论坛、
人工智能厂家交流群、
AI产业链服务交流群、
STEAM创客教育交流群、
人工智能技术论坛、
人工智能未来发展论坛、
AI企业家交流俱乐部
雄安企业家交流俱乐部
细分领域交流群：
【智能家居系统论坛】【智慧城市系统论坛】【智能医疗养老论坛】【自动驾驶产业论坛】【智慧金融交流论坛】【智慧农业交流论坛】【无人飞行器产业论坛】【人工智能大数据论坛】【人工智能※区块链论坛】【人工智能＆物联网论坛】【青少年教育机器人论坛】【人工智能智能制造论坛】【AI/AR/VR/MR畅享畅聊】【机械自动化交流论坛】【工业互联网交流论坛】
入群方式：关注本公众号，回复“入群”
戳“阅读原文”下载报告。