

一
政策背景与整体目标
2026年6月3日,国家数据局印发《关于推进行业高质量数据集建设行动的实施方案》(国数科基〔2026〕25号),并于6月8日对外公示。
行业高质量数据集,是经过采集、加工处理、可直接训练优化AI模型的标准化行业数据集合,分为行业通识、行业专业两类,是“人工智能+”落地千行百业的核心基础资源。方案紧扣“十五五”规划纲要部署,围绕数据供给、标注、应用、价值释放六大环节部署专项行动。
整体目标:到2028年底,建成多领域可落地标杆数据集,打造AI创新应用场景;培育数据企业与专业人才,统一建设工具与标准;形成数据供给到价值释放的良性循环,推动数据产业和人工智能深度融合,催生智能经济新增长点。
二
六大核心专项行动解读
01
强基扩容行动:拓宽数据供给,夯实底层底座
覆盖全领域布局:覆盖工业制造、农业、金融、医疗、教育、电商、城市治理、绿色低碳等传统重点行业;同步发力低空经济、具身智能、智能驾驶、生物制造等新兴赛道。
多主体协同共建:梳理行业数据资源台账与需求清单,推行示范先行模式;龙头企业牵头联合上下游共建共享,向中小微企业开放数据服务;高校、科研院所、行业协会、第三方机构均可参与建设,盘活公共与行业融合数据。
丰富多模态数据形态:全面建设文本、代码、图像、音视频、点云、时序、仿真合成等多类型数据集;攻坚长推理、人机交互、物理交互场景数据,适配机器人、自动驾驶等前沿智能形态;依托国家数据基础设施,用隐私计算、可信空间实现数据集约、安全供给。
02
标注攻坚行动:从纯人工转向人机协同智能化标
数据标注是数据集品质关键一环,方案推动标注模式转型升级:
•普及智能化标注方案,推行“模型预标注+人工/模型校验”模式,降本提质;搭建行业专家认证体系,产出高专业度、高逻辑密度的行业标注数据。
•壮大标注产业与人才:扩容先行试点城市,培育标注龙头企业;院校增设对应专业,落实产教融合、技能定级,通过灵活就业拓宽人才渠道。
03
提质增效行动:建标准、严测评,压低 AI 训练成本
升级数据清洗、质检自动化工具,运用数据合成、场景仿真技术,解决稀有场景数据短缺问题,降低模型训练门槛与成本。
加快数据集格式、标注、质量测评国家标准落地,政府采购、招投标优先采信统一标准,推动行业规范化。
建立“数据验证+模型反馈”双维度测评体系,发起全国联合测评,实现一次测评、全域互认,减少企业重复投入。
04
应用赋能行动:构建 “数据飞轮”,落地产业实景
打造场景牵引数据、数据迭代模型、模型赋能场景的正向循环:
•建设集数据生产、模型训练、场景应用一体的数据赋能工场,打造可复制的行业标杆案例;
•破除数据孤岛,搭建政产学研金对接平台,以赛事、对接会促协同;稳妥开展国际合规数据合作;
•以数据、模型全面带动实体经济数字化、智能化转型。
05
管理服务行动:全生命周期管控,明晰权属伦理
覆盖采集、标注、质检、审计全生命周期管理,借助区块链、隐私计算实现数据可管、可控、可追溯;搭建全国统一数据集管理平台,支持地方、行业开设专属专区对接。
落实数据持有、使用、经营三权分置制度,规范合成数据、AI训练数据授权与收益分配规则。
设立伦理公平准则,严禁非法采集敏感数据,规避数据偏见歧视,保障成果普惠均衡。
06
价值释放行动:商业化 + 资产化双向激活数据价值
培育数据付费市场:鼓励政府、国企、头部模型企业带头采购,将数据采购纳入预算,树立有偿使用的市场共识。
多元流通模式:支持数据交易所挂牌交易,开放订阅、API调用、以数换数、数据托管等合作;公益性基础数据可对外公开。
探索数据资产化:试点数据集盘点、登记、评估;开放数据质押、作价入股、资产证券化、数据保险等资本化路径。
均衡利益分配:保障供给、加工、流通、应用各环节主体获得市场化收益,共享数据红利。
三
全方位保障措施
资金扶持:国家统筹、地方设立专项资金;引导产业基金、金融资本加大投入,单位可列支数据采购专项经费。
属地有序管控:各地落实属地责任,杜绝同质化低水平重复建设,因地制宜制定配套细则。
安全底线筑牢:严格遵循数据安全法规,建立全流程风控机制,防范数据泄露、投毒污染,创新探索必须合规可控。
动态评估督导:建立成效监测指标,阶段性复盘优化,保障行动扎实落地。
来源:国家数据局

END
往期推荐

夜雨聆风