最近几年,只要提到人工智能,大家讨论最多的都是大模型。从ChatGPT到DeepSeek,从算力大战到芯片大战,整个行业似乎都在围绕一个问题竞争——谁的模型更强?
但就在最近,一个重要信号出现了。国家数据局正式发布《关于推进行业高质量数据集建设行动的实施方案》,同时明确提出,未来人工智能竞争的核心,将逐步从模型竞争转向数据竞争。
换句话说,过去拼算力,今天拼模型,未来拼数据。而这背后,实际上意味着中国数字经济正在进入一个全新的发展阶段。
AI为什么突然开始缺数据了?
很多人觉得奇怪。互联网每天产生海量数据,为什么AI还会缺数据?问题就在于数据多,不代表数据好。
举个简单例子。
互联网上每天产生数十亿条信息新闻、视频、社交媒体内容、图片、评论,这些数据虽然庞大,但其中大量存在重复信息、错误信息、垃圾内容、低价值内容。
对于人工智能来说,100TB垃圾数据可能还不如1TB高质量行业数据。
这也是为什么OpenAI、Google、Meta等全球AI巨头近两年都开始面临同样的问题,高质量训练数据正在成为稀缺资源。
国际研究机构Epoch AI曾预测,如果按照当前训练速度发展,人类互联网中可用于训练的大规模高质量文本数据将在未来几年逐渐接近消耗极限。
因此,全球AI竞争已经开始进入算力→模型→数据的新阶段。
中国首次系统部署高质量数据集建设
此次国家数据局出台的方案,实际上释放了一个非常明确的信号——国家层面开始把高质量数据集视为战略资源。

根据规划,到2028年建设一批国家级高质量数据集,打造一批数据驱动AI应用场景,建立行业数据标准体系,培育数据服务产业生态。
重点领域包括工业制造、医疗健康、自动驾驶、金融服务、能源电力、科研创新。
这意味着未来几年,中国不仅要建设更多大模型,更重要的是建设模型背后的“燃料库”。因为没有高质量数据,再先进的大模型也无法持续进化。
数据正在成为新的生产资料
过去几十年,中国经济发展的核心生产要素主要是土地、劳动力、资本。而进入数字经济时代后,一个新的生产要素正在崛起——数据。
国家数据局今年明确提出2026年是“数据要素价值释放年”。
很多人可能没有意识到这意味着什么,如果说过去企业最重要的资产是厂房、设备、专利。那么未来企业最重要的资产之一,很可能是数据资产。
比如一家物流公司拥有数亿条运输数据;一家医院拥有大量医疗数据;一家制造企业拥有设备运行数据;这些数据过去只是经营过程中产生的副产品,未来却可能成为企业最重要的核心资产之一。
数据产权时代正在到来
更值得关注的是,国家正在推进全国统一的数据产权登记制度。
这个制度本质上解决的是几个关键问题,数据归谁所有?数据如何确权?数据如何交易?数据如何估值?数据收益如何分配?
很多企业以前并不重视数据管理,但未来可能出现同样规模的两家公司。
一家拥有完整的数据资产体系,另一家没有。两者市场价值可能出现巨大差距。因为资本市场越来越关注企业是否拥有可持续的数据资源。
这也是为什么近两年越来越多企业开始建设数据中台、数据治理体系、数据资产管理平台。原因并不仅仅是数字化转型,而是在为未来的数据资产化做准备。
国家正在建设数字时代的“高速公路”
除了数据本身,国家还在推进另一个重大工程——国家数据基础设施建设。
简单理解。过去几十年我们建设的是公路、铁路、港口、电网,而未来几年建设的是数据流通网络,目标是让数据像水、电一样流动起来。
实现供得出、流得动、用得好、保安全。这背后涉及数据空间、数据交易平台、算力网络、数据安全体系。
很多业内人士把它称为数字经济时代的新基建。
如果说工业时代的核心基础设施是铁路和电网,那么数字时代的核心基础设施就是数据网络和算力网络。
下一个风口:具身智能与智能体
如果说今年AI领域最热的是Agent(智能体),那么未来几年最值得关注的方向可能是具身智能。
简单说就是让AI拥有“身体”。包括人形机器人、工业机器人、自动驾驶系统、智能无人设备。
而这些领域最大的挑战并不是模型,而是训练数据。
一个机器人学会倒水、拿东西、开门。背后需要数百万次真实动作数据。一个自动驾驶系统学会识别复杂路况,背后需要海量驾驶数据。
因此在最新政策中多模态数据集、具身智能数据集、世界模型训练数据,都被列为重点建设方向。
未来机器人产业的发展速度,很大程度上取决于数据积累速度。
中国数字经济正在进入“数据时代”
过去几年,很多人认为数字经济的核心是互联网,后来大家认为核心是平台,再后来变成算力和人工智能。
但从最新政策方向来看,国家已经给出了更加明确的答案——未来数字经济的核心资源是数据。
谁拥有高质量数据;谁拥有数据治理能力;谁能够把数据转化为生产力;谁就有机会在下一轮产业竞争中占据优势。
对于企业来说,未来最大的风险或许不是没有AI,而是拥有AI之后,却没有高质量数据可用。
对于城市来说,未来最大的竞争力可能不是GDP规模,而是数据资源和数据流通能力。
对于国家来说,未来科技竞争的关键,也不只是芯片和算力,更是数据资源体系的建设能力。
过去十年,我们见证了互联网改变商业,过去五年,我们见证了人工智能改变产业,而未来十年,一个新的时代正在开启。
数据不再只是企业经营过程中产生的副产品,它正在成为数字经济时代最重要的生产资料之一。
当国家开始系统布局高质量数据集、数据产权制度和国家数据基础设施的时候,其实已经释放出一个明确信号——中国数字经济的发展逻辑,正在从“互联网时代”走向“数据时代”。
未来的竞争,不是谁拥有更多数据,而是谁拥有更高质量的数据;不是谁的数据存得更多,而是谁能把数据真正转化成价值。
而这场关于数据的新竞争,才刚刚开始。
夜雨聆风