
4月2日,2026未来数商大会在杭州未来科技城学术交流中心举行。大会以“数据定义智能”为主题,汇聚了来自全国18个省份的600余位专家学者、行业代表及专业观众,共同探讨人工智能时代数据产业的发展路径。会上,国脉互联高级副总裁王路燕作了《AI时代的数据供给新范式》主题演讲,清晰拆解了传统数据供给的痛点、AI驱动下的核心转变,以及面向智能时代的三层供给体系与场景化落地路径。

当智能录音笔能够自动完成会议转写、内容总结并同步至知识库,当一句指令即可驱动系统完成全流程数据治理,当信息检索从传统搜索引擎转向AI直接问答,我们正身处一个被AI深刻改变的时代。AI正在全方位重构数据的入口、流动方式与使用逻辑,数据供给领域也随之迎来一场根本性的范式变革。
过去十余年间,行业通用的数据处理链路为数据采集、目录搭建、归集整合、治理优化,最终实现数据共享开放与授权运营,这一体系的服务对象始终是人或业务系统。从人和系统的角度来看,系统使用数据需要按目录查找、按部门或系统归集,要求数据具备完整性、准确性和及时性,通过共享接口与批量数据满足使用需求。
随着AI成为数据的核心消费主体,数据需求逻辑发生彻底颠覆。AI不再关注传统的数据口径与组织形式,而是更聚焦数据的语义、实体关系与可计算特征,同时要求数据具备多样性、样本均衡性、无偏差性与高质量标签,适配隐私计算、AI原生开放、可信数据空间等新型应用模式。
这一转变也直接暴露了传统数据供给存在的三重断层:一是数据质量断层,从数据到信息,面临的是数据质量问题,很多数据“有”,但“不能用”;二是语义断层,从信息到知识,缺乏语义层面的支撑,机器无法理解数据背后的业务逻辑;三是行动断层,从知识到智慧(或行动),缺少最后的产品化封装和场景切入。
二、新范式核心:构建可训练、可理解、可执行的三层供给体系
AI时代的数据供给,核心目标不再是简单完成数据交付,而是要实现三个“可”:

高质量数据集是可训练的基础,面向AI模型预训练与微调打造适配性数据资源。通过多模态数据融合、标准化清洗、精准标注、数据增强、样本均衡与质量评测,让数据具备可训练特性,支撑模型从传统静态规则转向动态智能。以金融信贷风控场景为例,融合银行内部数据、政府公共数据、第三方消费数据等多源异构数据,经过异常清洗、样本均衡、科学划分训练集、验证集与测试集后,可实现毫秒级特征提取与模型推理,挖掘消费稳定性等弱相关特征,替代人工静态规则实现动态智能决策。
知识库是可理解的核心,让AI不仅能读取数据,更能读懂数据背后的业务含义。通过本体论建模搭建连接数字资产与现实世界的桥梁,结合知识图谱、逻辑推演与可解释性设计,将行业隐性知识结构化、显性化,实现经验的机构化沉淀。借鉴Palantir Ontology的设计思路,本体并非单纯的数据目录,而是组织的操作层,包含对象层、关系层、动作层,形成业务数字孪生,清晰回答业务变化对象、关联关系、当前状态与后续动作四大核心问题。
数据产品与智能体是可执行的关键,将数据能力封装为可直接落地业务的工具。通过API化、工具化、Agent化的模块化封装,实现场景化嵌入与复用扩展,形成理解、执行、反馈的闭环能力。以数据编目智能体为例,可自动完成多渠道数据采集、去重补全、质量评估、规范命名、描述生成与目录优化,一键输出符合标准的数据目录,大幅降低数据治理的成本与门槛。
三、完整供给体系:供给加工链与价值释放链协同
AI时代的数据供给新范式并非单点技术优化,而是构建覆盖数据源、加工、输出、应用的完整体系。在供给加工链层面,以业务数据、公共数据、第三方数据、行业数据等多模态数据为源头,依次完成数据清洗、打标、拆分、增强、质量评测等基础处理,再通过本体语义建模、概念模型搭建、规则提炼形成知识库,最终完成能力封装打造数据产品与智能体,就是数据怎么被加工、被理解、被封装。在价值释放链层面,用这些能力去解决实际问题。从场景出发,去调用这些数据产品,然后在实践中不断反馈、迭代,形成闭环。这套体系可覆盖政务、金融、制造、医疗、教育等多个高价值领域,核心遵循以用定供、以供促用的逻辑,让数据从成本中心转变为价值创造中心。
四、落地路径:以场景牵引推进数据供给升级
落地数据供给新范式,需遵循五步实践路径,以高价值场景为牵引稳步推进。第一步选场景,锁定高价值、高频次、可验证的业务场景作为切入点;第二步理需求,明确所需数据类型、质量标准与供给频率;第三步治数据,完成数据归集、清洗、标注、增强,构建高质量数据集;第四步建知识,提取业务规则、搭建知识图谱、沉淀行业经验;第五步出能力,将核心能力模块化封装,打造数据产品与智能体,实现价值落地。
结语
当能力被AI极大拉平之后,真正拉开差距的,不再是“能不能做”,而是“想做什么、为什么做、做到什么程度”。AI时代的数据供给变革,本质是从数据交付向能力交付、从技术实现向价值创造的升级。这场变革不仅是技术架构的调整,更是对业务理解、知识沉淀、价值创造逻辑的重新定义。未来,真正的核心竞争力,在于将数据转化为可训练的模型素材、可理解的业务知识、可执行的场景能力,让数据在AI时代持续释放核心价值。

来源:2026未来数商大会组委会、国脉研究院
夜雨聆风