多项数据生产与标注领域标准发布,中国联通软件研究院助力人工智能高质量数据体系建设
中国联通软件研究,围绕人工智能数据生产、数据标注、高质量数据集建设、数据可信流通与数据服务能力等方向,多项国家标准、行业标准、团体标准及技术文件陆续发布,为人工智能产业高质量发展提供了更加系统、规范、可落地的标准支撑。
随着大模型、智能体、多模态应用等新一代人工智能技术加速发展,数据已成为驱动模型训练、能力迭代和场景落地的核心生产要素。如何提升数据生产效率、规范数据标注流程、保障数据质量、促进数据可信流通与合规使用,已成为人工智能产业规模化发展的关键问题。本次相关标准的发布,进一步完善了覆盖 “数据采集、清洗、标注、评测、流通、开发、应用、安全合规” 的标准体系,对推动高质量数据供给、提升数据工程化能力、促进人工智能产业健康发展具有重要意义。
中国联通软件研究院一直致力于人工智能领域的技术探索与创新。在数据生产与标注能力建设方面,《面向人工智能的数据生产和标注服务能力通用成熟度模型》(YD/T 6487 – 2025)作为行业标准正式发布,这一成果凝聚了研究院众多专家的智慧与努力。该标准为数据生产和标注服务能力建设提供了成熟度评估框架,有助于推动数据标注服务从经验驱动向标准化、体系化、能力化方向升级。同时,《大模型驱动的智能数据开发平台技术要求》(FT – Y03 – 0506 – 01)面向大模型技术赋能数据开发的新趋势,对智能数据开发平台的能力边界、技术架构和功能要求进行了规范,为数据开发平台智能化升级提供了参考依据,研究院在此标准制定过程中发挥了重要的推动作用。
在数据服务与可信流通方面,《数据 API 服务能力分级要求》《信息技术 大数据 跨域数据可信共享参考架构》(GB/T 45994 – 2025)等标准的发布,进一步明确了数据服务能力建设和跨域数据可信共享的基础要求,有助于提升数据资源开放利用水平,推动跨组织、跨行业、跨区域的数据安全流通与价值释放。中国联通软件研究院凭借在数据领域的深厚技术积累,积极参与标准制定,为标准的科学性和实用性贡献了专业力量。
在高质量数据集建设方面,多项技术文件和团体标准集中发布,覆盖数据集格式要求、质量评测规范、数据质量评估方法、建设运营平台技术要求、建设运营能力成熟度评估模型等内容。其中,《高质量数据集 质量评测规范》《高质量数据集 格式要求》《高质量数据集 数据质量评估方法》《高质量数据集建设运营能力成熟度评估模型》等文件,从数据质量、格式规范、评估方法和运营能力等多个维度,为高质量数据集的建设、管理和评价提供了系统化支撑。《高质量数据集实践指南(1.0)》的发布,也为行业开展高质量数据集建设提供了可操作、可复用的实践参考。中国联通软件研究院深度参与其中,通过自身丰富的实践经验,为这些标准和文件的制定提供了大量有价值的案例与建议。
在数据标注安全合规方面,《面向人工智能的数据标注合规指南》(T/CECC 46—2025)正式发布,聚焦人工智能数据标注过程中的合规管理、数据安全、隐私保护和责任边界等关键问题,为数据标注活动规范开展提供了重要依据,有助于提升人工智能数据加工全流程的安全性、合规性和可信度。中国联通软件研究院一直高度重视数据安全与合规,在该指南制定过程中,积极分享自身在数据标注合规方面的实践经验和技术成果,推动指南的完善与落地。
本次多项标准和技术文件的发布,标志着人工智能数据要素基础设施建设正在从单点能力建设迈向体系化、标准化和规范化发展阶段。相关标准不仅为企业开展数据生产、数据治理、数据标注和数据集建设提供了方法指引,也为行业主管部门、科研机构、平台企业和服务机构开展能力评价、项目建设和生态协同提供了统一参考。
下一步,中国联通软件研究院将持续围绕人工智能高质量数据体系建设,积极推动相关标准在数据标注平台建设、数据集开发运营、智能数据处理、数据可信流通和行业场景应用中的落地实施。凭借自身强大的技术研发实力和丰富的行业经验,进一步提升数据生产和数据服务能力,促进标准成果向产业实践转化,为人工智能产业高质量发展提供坚实的数据基础和能力支撑。