大模型再强大,没有经过标注的数据,就像没有地址的信件。
全国布局7个先行先试城市,遴选出47个优秀案例,数据标注市场规模从2018年的25.86亿元增长至2025年的117.53亿元。
大模型越“聪明”,背后站着的人工越多。
2026年3月24日,国新办举行介绍第九届数字中国建设峰会有关情况的新闻发布会。国家数据局局长刘烈宏说了一句话:“人工智能发展到哪里,我们就把高质量数据集建设到哪里;‘人工智能+’行动到哪里,行业高质量数据集的建设和推广就要到哪里。”

在大模型频繁亮相、算力中心不断扩建的喧嚣之外,有一个默默运行但又无法绕开的环节——数据标注
01 为什么要标注
一组标注过的医学影像才能让AI学会辨认病灶;一段标注了车道线的视频才能让自动驾驶系统理解路况。
数据标注的本质,是把原始数据翻译成AI可以理解的“语言”。
以工业纺织缺陷检测为例:
02 七座城市的前期布局
2024年5月,在第七届数字中国建设峰会上,国家数据局局长刘烈宏正式发布了承担数据标注基地建设任务的城市名单:四川省成都市、辽宁省沈阳市、安徽省合肥市、湖南省长沙市、海南省海口市、河北省保定市、山西省大同市。7座城市先行先试,探索数据标注产业发展经验。
2025年1月,国家发改委、国家数据局、财政部、人力资源社会保障部四部门联合印发《关于促进数据标注产业高质量发展的实施意见》,提出到2027年,数据标注产业专业化、智能化及科技创新能力显著提升,产业规模大幅跃升,年均复合增长率超过20%。

各地建设已经有了初步成果。截至2025年上半年,7个数据标注基地共建设数据集524个、规模超过29PB,服务大模型163个。
在四川,布局有1个国家数据标注基地(成都)和4个省级数据标注基地。在成都新津牧山园区,产业载体入驻率接近90%,服务对象包括中国电信、字节跳动、百度、京东、比亚迪等,覆盖智能驾驶、大模型、金融、医疗、低空经济等多个领域。

在河北保定,中国移动梧桐大数据标注基地落户莲池区。截至目前,依托保定数据标注基地,双方已联合打造100余个高质量数据集,覆盖辅助驾驶、智能制造、智慧城市、政务服务、文旅等10个领域。基地已从传统的劳动密集型向技能密集型转型升级。
在山西大同,数据标注基地也在加速建设。太原市“数据要素×”三年行动计划中,推进大同数据标注基地建设被列为重点事项之一。
03 “标注攻坚”与两条转型路线
2026年5月19日,高质量数据集建设现场会在广州召开。会上,国家数据局正式将“标注攻坚”列为六大行动之一:发展人机协同智能化标注,强化专家型标注服务,解决“怎么加工”的问题。
“标注攻坚”的核心路径,是聚焦“知识密集型”和“技术驱动型”两大方向,梯次布局一批技术先进、特色鲜明、高效赋能的数据标注产业创新试验区。

知识密集型方向:强调“懂行业”
这一方向要求标注员具备专业领域知识。知识密集型标注在专业领域形成了显著的行业壁垒——团队不仅需要标注工具,更需要行业经验。
技术驱动型方向:强调“人机协同”
这一方向的核心是用AI辅助标注。标注员操作成熟的标注系统,大量重复性工作由AI预标注完成,人工负责复核和纠偏。两者结合,既保证效率又确保准确率。
两条路线的本质区别在于:知识密集型依赖人的专业判断,技术驱动型依赖工具的自动化能力。两者的共同目标是让标注效率更高、质量更稳。
04 两个优秀案例的“手工课”
国家数据局遴选了47个数据标注优秀案例,覆盖技术创新、行业赋能、标准应用、生态培育和人才培养等方向。以下两个案例分别涉及政务数据、国土数据和通信数据,展现了数据标注在不同行业的渗透方式。
案例一:辽宁省政务热线数据标注。
联通(辽宁)产业互联网有限公司与辽宁省数据局共同报送的《省域政务热线高质量数据集》,从663份方案中脱颖而出,成功入围国家数据局首批《高质量数据集典型案例》。

案例二:天津测绘院违建监测数据标注。
天津测绘院自主研发AI辅助标注平台,集成自动标注、质检与纠偏迭代功能,构建“算法优化—标注生成—质量评估—参数调整”闭环流程,实现建筑数据标注的半自动化纠偏更新,为国土执法和城市规划提供高精度数据支撑。

05 商业化的路还要走多久
数据标注产业面临两大核心矛盾。
其一,标注企业盈利难。行业内竞争激烈,纯人力标注模式的毛利率不断被压低,而技术驱动型标注需要前期大量研发投入。不少标注企业长期依赖地方政府的数据治理项目,面向AI企业的商业订单尚未形成稳定利润池。
其二,下游客户习惯“免费数据”。 互联网大厂和创业公司在初期往往更倾向于自行标注训练数据,而非向标注服务商付费采购。标注产业的商业模式,距离成熟还有距离。
2026年3月,刘烈宏在新闻发布会上明确强调,持续培育“为高质量数据付费”的市场共识,推动行业高质量数据集在数据交易所挂牌、上架、交易。“为高质量数据付费”,针对的正是数据标注产业链上“谁为数据价值买单”的长期模糊地带。
2018年,中国数据标注行业市场规模仅为25.86亿元。
八年后,数据标注行业市场规模已达117.53亿元。

2026年的数据标注产业链:
上游是数据资源和标注工具研发,
中游是标注厂商和数据治理平台,
下游是自动驾驶、医疗影像、工业质检等终端场景。
标注工具渗透率已提升至89%。
“标注攻坚”行动的战略地位正在被重新确认。从技术驱动型的人机协同标注,到知识密集型领域的专家型标注,产业升级的路径已经划定。
接下来,随着更多数据标注创新试验区的设立,数据标注需要回答的不再是“怎么标”,而是“谁为高质量数据付费”“标注产业的商业模式如何闭环”。这些问题,或许要到2027年《关于促进数据标注产业高质量发展的实施意见》提出的目标节点时,才能看到初步答案。
企业破局关键:找对专业伙伴
让数据交易少走弯路、快速变现
但多数企业在实操中,仍面临两大核心痛点:
不懂高质量数据集的构建标准,不知道如何梳理、优化数据,无法满足ABS要求;
即便有了高质量数据集,也不懂如何对接ABS申报流程、完成合规确权与估值,导致数据资产错失融资机遇。
作为专注数据资产全流程服务、数据资产入表与ABS融资对接的专业机构,我们依托对数据政策的深度解读、丰富的数据治理经验,以及数据资产入表的全流程服务能力,为企业提供“授权对接—数据治理—资产转化—入表落地”的一站式解决方案,助力企业高效、合规地挖掘公共气象数据价值:

1. 数据资产盘点与确权合规(基础前提)
全量梳理企业内外部数据资源,完成数据分级分类、血缘溯源;依据《数据安全法》《个人信息保护法》等法规,开展合规审查,排查风险;确保数据符合入表、交易的合规要求。
2. 数据资产估值与会计入表(核心环节)
结合企业行业特点,采用成本法、收益法、市场法组合估值,科学计量数据资产价值;帮助企业搭建数据成本归集体系,规范数据采集、加工等成本的追溯与核算;全程辅导企业完成无形资产/存货入账、摊销、减值等会计处理,确保入表通过审计,规范报表披露。
3. 数据产品化与价值变现
协助企业将原始数据加工为标准化、可交易的数据产品,完成脱敏、加密处理;依托数据交易机构资源,为企业对接合适的交易平台,完成数据产品挂牌、交割;根据企业融资需求,定制数据资产质押贷款、ABS发行等融资方案,打通“数据—资产—资本”的转化通道。
无论你是刚起步、想梳理数据资源的中小企业,还是有一定数据基础、想实现入表交易的大型企业,无论你属于制造、服务、金融还是教育领域,我们都能提供解决方案,帮你快速抓住数据要素市场化的风口,结合数据交易的成功经验,让“沉睡数据”变成账上真金。
扫描下方二维码/后台回复【企业需求】,私信我们,获取询服务,我们将结合你的企业行业属性、数据资源情况,为你分析数据确权、入表、交易、变现,帮你快速落地,抢占数据资产黄金风口!
END


关注我们
翰联科技数据网
最了解你的科技网站

夜雨聆风