从“文档库”到“知识中台”:源启·知数平台,解锁非结构化数据的认知革新

在2026中国国际金融展期间,中电金信携融合型数智基础设施“源启”及多项金融科技创新成果亮相,并发布源启·知数平台、源启·智能决策操作系统两款数据智能新品,为行业用户打造更好用的知识中台和决策中枢。
作为“源启”产品体系的核心数据智能产品,源启·知数平台旨在通过三类工业化认知流水线,将海量非结构化数据转化为机器可理解、可计算、可推理的认知型数据资产,推动企业实现从“数据堆积”走向“知识驱动”。

01
传统知识库的首要困境
机器“看到”文档,却没“读懂”文档
金融机构日常运转中产生的合同文本、尽调报告、合规文件等,构成了庞大的“暗数据”矿藏。但传统知识库给出的解决方案,本质上只是一个“带搜索功能的网盘”——它能把相关文件和片段找出来,却无法把业务问题转化为可核验的答案。
问题不在“搜不到”,而在“不理解”。
举个例子,当信贷审批员询问“A公司的企业抵押率是多少”,传统知识库只能返回一堆含有“企业抵押率”关键词的文档片段,审批员需手动翻找、核对、判断;机器只是“看到”了文档里有什么字,却没有“理解”这些字在说什么,更无法提供确定的数值、计算口径和事实校验。
这正是当前企业非结构化数据资产面临的根本矛盾:数据存下来了、搜得到了,但用不起来。海量文档不是资产,而是未被激活的“沉默成本”。
02
范式重构
从“可存、可搜”到“可计算、可推理”
源启·知数平台的重要设计思想,是对“知识管理”底层逻辑的彻底重构。
传统范式的核心问题是“文档视角”——把文档当作管理对象,关注的是“存哪儿”“怎么找”。而源启·知数平台则将其切换为“认知视角”——不再把文档当文档,而是把文档加工成机器能直接理解和调用的认知型数据资产。
这一范式跃迁,体现在三个维度:
从“人找信息”到“机器理解”。不再是人输入关键词找片段,而是机器先对文档“阅读理解”,产出结构化、语义化的知识资产,供人+AI直接调用。
从“检索工具”到“认知引擎”。跳出全文检索的局限,以多模态数据智能引擎完成解析、抽取、向量化、图谱化等加工,形成四态并存的知识资产。
从“文档堆积”到“知识驱动”。输出的不是文件链接,而是向量(语义搜索)、图谱(关联推理)、标签(快速筛选)、事件(时序追踪)等可计算、可推理的认知型数据资产,直接成为AI理解业务的“认知基础设施”。
03
加工中枢
多模态数据引擎
从原始数据到认知资产的工业生产枢纽
源启·知数平台运转枢纽为位于中间的多模态数据引擎,作为从原始数据到认知资产的工业化加工中枢,工作流程主要分为四步:
数据接入:通过多元异构数据接入模块统一接入分散的报告、合同等原始数据。
深度加工:经由解析与结构化、知识资产构建、知识服务化三类流水线,将原始信息转化为结构化、语义化的知识单元。
资产输出:生成原始文本向量库、标准摘要向量库、业务知识图谱、标签与事件库四大类认知型数据资产,并封装为可调用的知识服务。
智能应用:上层认知智能引擎基于这些服务快速构建业务智能体,辅助分析问题、判断风险及支持决策。
04
核心突破
三类工业化认知流水线,打造“知识工厂”
如果说传统知识库是“手工作坊”,源启・知数平台就是标准化、可编排、规模化的“知识工厂”,靠三类流水线实现非结构化数据的工业化生产:
第一类流水线:解析与结构化。面对PDF、Word、扫描件、邮件等多源异构文档,通过多格式解析、文本清洗、表格重构,将所有输入转化为标准化中间文本——输入标准,才有可能产出可靠。
第二类流水线:知识资产构建。在统一本体语义蓝图指引下,完成实体关系抽取、标准摘要生成、向量化、图谱构建、标签与事件提取,让文本从“无序信息”变成“结构化知识”。
第三类流水线:知识服务化。加工完成的认知资产,不以文件形式交付,而是通过API/MCP等标准化接口封装输出,上层应用、智能体、决策系统可按需调用,把知识变成可稳定复用的能力。
三类流水线最终形成四大核心资产形态,且统一锚定本体语义框架,互为补充:
通用向量库:支撑语义搜索与广泛召回。
标准摘要向量库:精准回答“A公司资产负债率多少”这类问题。
业务知识图谱:实现“C集团涉诉影响哪些企业”等关联推理。
标签+事件:支撑高风险企业筛选、担保事件时序分析等场景。
05
本体驱动
让知识加工有蓝图、有逻辑
流水线解决了“怎么加工”的问题,但还有一个更前置的问题没有回答:按什么标准加工?
如果没有统一的语义框架,同样的“客户”在不同文档里可能被称作“借款人”“融资方”“授信对象”等,同样的“担保关系”在不同系统里可能是不同的字段名。加工出来的知识资产,仍然是碎片化的。
源启・知数平台以本体驱动为核心:在本体管理平台(OMP)预先定义核心业务实体、关系、规则,所有流水线严格按此语义蓝图加工,让向量、图谱、标签、事件共享同一套“语义坐标”。
更重要的是,企业过往在企架建模、数仓建模中沉淀的实体定义、业务规则,可通过本体平台自动识别、逆向建模,直接映射到语义层——不是另起炉灶,而是唤醒已有资产,实现“语义升级”。
06
从“知识库”到“知识中台”
让知识成为企业战略资产
回顾企业数据管理的演进路径,结构化数据的“存、管、用”体系已经相当成熟,但非结构化数据仍然长期在“文档管理”中徘徊。源启・知数平台用工业化的方式把“让机器理解文档”这件看似不可能规模化的事,变成了可编排、可复制、可持续优化的流水线作业,这不仅是效率的提升,更是资产性质的改变:
过去,文档是“成本”——存着占用空间,找起来费时间。
现在,认知资产是“战略资源”——它既可以作为智能体系统进行上下文决策的“养料”,又可以赋能合规审核、投研分析、报告生成等场景,更可以通过知识服务网关形成企业级“知识基础设施”。
未来,中电金信将持续深耕金融、能源、制造等关键行业,基于源启·知数平台沉淀行业专属的知识加工流水线与本体模型,推动企业从“数据堆积”走向“知识驱动”,让知识真正成为可调用、可编排、可增值的核心生产力。
往期推荐






夜雨聆风