治理即服务:腾讯游戏数据治理的 AI 范式跃迁

导读本次分享围绕“腾讯游戏数据与 AI 结合的治理”展开,聚焦相对细分的治理话题,不覆盖 AI 服务全面内容。
1. 阐述腾讯游戏数据当前的发展背景及面临的具体情况
2. 介绍针对上述问题,在“AI 驱动协同治理”层面的实践进展与方法
3.延伸说明腾讯游戏在“AI 助力数据提效”方面所做的支撑工作
分享嘉宾|张兴华 腾讯游戏 数据治理技术负责人
编辑整理|王红雨
内容校对|郭慧敏
出品社区|DataFun


🎯 《面向Agent的大数据架构》白皮书发布
当智能体开始自主决策,数据基础设施正被重新定义。本白皮书整合腾讯、阿里、小红书等一线实战,聚焦智能体记忆、多模态治理与统一元数据三大核心议题,为技术决策者提供可参考的架构演进路径。
三大核心看点:
🔹 Memory Lake 分层记忆架构:解密智能体如何实现长期记忆可追溯、短期记忆可检索,支撑AI持续进化。
🔹 多模态数据语义化治理:从碎片化到语义层,让AI真正“读懂”业务。
🔹 统一元数据与血缘:基于Gravitino与OpenLineage,构建Data+AI的可信底座。
不是趋势预测,而是深度复盘。立即下载,把握下一代数据架构真实脉络。
[识别二维码,免费获取白皮书]


01
研究背景与行业痛点
随着腾讯游戏业务全球化扩张与数据体量爆发式增长,传统数据治理模式面临资源浪费、协作低效、决策被动等痛点,
1. 腾讯游戏数据业务基础
腾讯游戏以数据驱动为策略,旨在为全球游戏业务及企业创造增量空间,核心是提供智能数据工具平台与定制化方案,覆盖智力开发、全链路分析及多类业务场景,最终助力业务高效增长。其业务主要包含四大板块,具体如下:
(1)一站式数据处理与治理平台(传统核心板块)
该平台是数据业务的基础支撑,核心能力包括两方面:
-
提供数据治理方法论,覆盖数据全生命周期的综合治理能力;
-
实际业务价值体现在优化成本、提升开发效率,同时提供与客户沟通的相关平台。
(2)游戏洞察服务(传统核心板块)
依托腾讯游戏二十余年行业经验及七百多款游戏的实践积累,在全品类游戏业务场景中,为客户提供丰富的解决方案,助力精准把握业务方向。
(3)AI 技术融合应用(近年重点探索板块)
重点探索 AI 技术在数据驱动决策过程中的应用价值,目前已构建起整套数据平台服务体系。该体系实现了两大优化:
-
改变了传统数据方法论支撑的业务交互流程;
-
为用户提供更便捷、高效的使用体验。
(4)全球化数据服务支持(核心保障板块)
针对海外业务需求,重点提供三方面服务支持,保障业务稳定开展:
-
合规性保障,确保业务符合当地法规要求;
-
稳定性支撑,保障海外数据业务持续运行;
-
成本管控服务,助力海外业务优化成本结构。

2. 腾讯游戏数据服务发展的四个阶段
腾讯游戏数据服务的核心目标是:持续提供稳定的数据服务,并高效提升数据服务的使用效率,当前工作重点为降低数据服务使用门槛。数据服务效率的演进,经历了从基础支撑到智能化优化的四个关键阶段,各阶段核心特征与能力如下:
(1)最初的阶段:单纯定制的游戏支撑
(2)管控阶段
此阶段与初期建设数据中台、数据仓库的模式相近,具体工作逻辑如下:
①数据基础:以大量原始数据日志表作为底层数据支撑。
②服务模式:基于原始数据向上逐层搭建定制化数据服务,服务需求由业务方提出后,嵌入现有框架落地。
③覆盖领域:定制化服务已覆盖社区运营、广告投放及其他商业化相关场景,但整体以满足具体需求为主,缺乏标准化沉淀。
(3)目前所处阶段:稳健沉淀阶段(周期较长)
此阶段以“方法沉淀+工具支撑”为核心,目标是提升数据服务的覆盖能力与迭代效率,具体特点如下:
①沉淀内容:形成相对成熟的业务处理方法、标准化模板,完成业务知识与工作流程的沉淀。
②工具支撑:基于沉淀内容孵化配套工具,支撑离线数据分析、实时应用等各类数据服务场景。
③服务效率:采用“粗放式覆盖+标准化方法”的模式,适配高频迭代需求,核心成果为“10% 的核心数据资产可覆盖 80% 的定制化开发需求”,且该阶段仍存在较大的优化与挖掘空间。
(4)下一重点阶段:AI 优化阶段(当前推进中)
此阶段的核心是通过 AI 技术重构数据服务交付流程,实现效率本质提升,具体变革方向如下:
①模式转变:从“业务方提需求–我方定制交付”的类 To B 模式,转变为“提供平台服务+数据资源”的模式。
②核心目标:通过模式变革缩短数据服务交付链路,同时提升数据更新速度,最终提高整体交付效率。
本研究重点聚焦该阶段的“数据治理”环节,探索如何将非标准化的元数据、知识文档转化为可支撑大模型应用的标准化数据资产,进而依托 AI 能力构建自助式数据服务体系。

3. 稳健阶段数据服务面临的挑战
在数据服务的稳健阶段,尽管业务流程相对可控,但在资源成本、协作效率、资源浪费三个维度仍存在显著问题,且部分问题延续至今尚未完全解决。
(1)资源与成本管控被动
①数据治理长期处于“被动响应”状态,仅针对已出现的问题开展治理,缺乏主动规划;
②开发与业务支撑依赖数据中台方法论保障流程有序,但“资源管控”环节被弱化,未形成系统性管控机制;
③现有数据开发平台的管控能力局限于技术层面,难以向上延伸至业务层,无法为更高维度的服务提供支撑。
(2)存储资源浪费严重且优化困难
①历史数据堆积:抽样统计显示,30%的历史数据分区处于未使用状态,但因“担心误删”的风险,无人敢主动清理,增量数据管控难度大;
②无效任务持续运行:大量生命周期已结束的无效任务仍在消耗资源,缺乏全生命周期管控机制,日均浪费约 20% 的计算资源;
③优化方式局限:数据优化依赖人工判断与“点状处理”(如仅针对问题报表、大任务/大表单独处理),无法实现全链路优化,且因原始开发逻辑多依赖开发者经验、文档溯源性差(仅记录部分核心内容),易出现误判风险;
④治理决策滞后:误判风险导致治理决策无人敢下达,进而加剧资源浪费与流程低效的恶性循环。
(3)协作效率挑战
①元数据(如表结构)、数仓规范及指标定义高度依赖人工维护,受人员经验与操作影响大,易出现偏差;
②数据组件间的血缘关系断裂明显,即使存在技术血缘,也仅用于开发者“点状追溯技术链路”(如定位问题、监控流程),无法为业务需求理解、整体效率提升提供支持;
③内部需求沟通中,“口径对齐”消耗大量时间,成为效率瓶颈。

4. 传统数据治理方案的局限性
(1)传统流程现状
传统数据需求开发以离线流程为主,技术组件虽有差异,但整体流程趋同,具体环节如下:
①业务侧提出需求,数据开发人员接收并开展沟通;
②明确需求口径,梳理支撑需求的上游数据表;
③开发 SQL 或其他程序代码,生成基础数据;
④通过指标聚合等操作生成下一层数据,最终产出结果表;
⑤将结果表推送至报表系统,完成看板制作。
(2)局限性
①信息留存与追溯难题:开发人员对需求的时效记忆有限,短期内易遗忘需求细节,无法准确回答需求成本、下线范围等问题;业务需迭代需求时,需重新溯源全部代码以还原开发过程,人力成本高。
②治理手段缺陷显著:当前治理依赖规则引擎(如通过表名、任务名识别),技术指标颗粒度仅集中于单点(如表结构、SQL 任务本身),难以回溯完整链路;人工维护存在滞后性,任务迭代后相关数据与文档更新不及时,且无主动维护触发机制。
③需求定义非语义化:需求的生命周期与业务逻辑未实现语义化表达,仅通过元数据或简单规则定义,导致治理局限性大,无法满足精细化管理需求。

综上,需求的生命周期与业务逻辑未实现“语义化”定义,仅通过简单元数据或规则描述,导致其灵活性和关联性不足,局限性大,进而引发上述开发与治理层面的一系列问题。


🎯 《面向Agent的大数据架构》白皮书发布
当智能体开始自主决策,数据基础设施正被重新定义。本白皮书整合腾讯、阿里、小红书等一线实战,聚焦智能体记忆、多模态治理与统一元数据三大核心议题,为技术决策者提供可参考的架构演进路径。
三大核心看点:
🔹 Memory Lake 分层记忆架构:解密智能体如何实现长期记忆可追溯、短期记忆可检索,支撑AI持续进化。
🔹 多模态数据语义化治理:从碎片化到语义层,让AI真正“读懂”业务。
🔹 统一元数据与血缘:基于Gravitino与OpenLineage,构建Data+AI的可信底座。
不是趋势预测,而是深度复盘。立即下载,把握下一代数据架构真实脉络。
[识别二维码,免费获取白皮书]


02
AI 驱动的数据治理范式设计
1. 技术路径:从“规则驱动”到“语义化重塑”
针对传统治理痛点,腾讯游戏构建以“语义化”为核心的 AI 治理框架,技术路径包括:
-
元数据语义化学习:基于游戏历史 SQL 日志、存量表结构,通过 AI 模型学习数据资产的命名规范、开发逻辑,实现“人可理解、机器可调用”的语义标注,例如自动解析 SQL 任务的字段提取、逻辑处理过程,生成结构化的业务逻辑描述。
-
需求链路智能反推:突破“业务需求→开发→资产”的正向链路局限,通过 AI Agent 调用接口与行业知识库,基于技术血缘(任务–表关联关系)反推已消亡或未关联的需求链路,形成“SQL to Text”的逆向解析能力。具体而言,通过聚合多任务(任务1-任务 3)的技术元数据(存储、计算成本、引用关系)、业务指标(看板 30 天 PV/UV),推测该链路对应的原始业务需求,实现“技术血缘→语义化需求包”的转化。

-
统一语义模型构建:整合“通用常识(大模型自带)–行业知识(游戏术语)–企业知识(内部黑话、数仓规范)”三级知识体系,确保跨团队对同一数据资产的语义理解一致,解决术语歧义问题,为协作效率提升奠定基础。
2. 两大治理场景落地
基于上述技术路径,腾讯游戏将 AI 治理范式落地于“资源管控”与“协作提效”两大场景,实现“治理即服务”的目标:
(1) 资源智能管控场景:
-
异动成本分析报告:将传统明细资源账单升级为“业务可理解”的分析报告,基于语义化链路标注,明确“新增需求 ABC→新增任务/表数量→资源增长占比”的关联关系,例如告知业务“本月国庆活动需求新增 10 个任务、5 张表,导致存储成本上升 15%”,替代传统“仅告知资源增长数据”的被动答疑模式。
-
无效链路主动识别:针对 180 天无访问的看板,通过语义化需求包(含链路 DAG、业务描述、资源消耗)推送至开发与业务负责人,替代“人工溯源确认”的被动模式,降低决策难度(明确链路对应的业务价值),推动无效链路下线效率提升。
(2)协作效率提升场景:
-
指标口径智能问答:构建问答式搜索系统,基于语义化资产库,快速响应“指标口径是什么”的需求,自动返回指标对应的需求背景、底层 SQL、成本信息与复用情况,无需人工溯源,口径对齐时间缩短 50% 以上。
-
需求开发智能辅助:结合行业知识库与语义化资产库,对新需求(如“国庆节目活动数据统计”)进行拆解与特征匹配,自动推荐复用度高的优质资产(人工标注+AI 解析的需求包),生成基础 SQL 并执行,实现需求开发时长从 1 小时缩短至30分钟。



🎯 《面向Agent的大数据架构》白皮书发布
当智能体开始自主决策,数据基础设施正被重新定义。本白皮书整合腾讯、阿里、小红书等一线实战,聚焦智能体记忆、多模态治理与统一元数据三大核心议题,为技术决策者提供可参考的架构演进路径。
三大核心看点:
🔹 Memory Lake 分层记忆架构:解密智能体如何实现长期记忆可追溯、短期记忆可检索,支撑AI持续进化。
🔹 多模态数据语义化治理:从碎片化到语义层,让AI真正“读懂”业务。
🔹 统一元数据与血缘:基于Gravitino与OpenLineage,构建Data+AI的可信底座。
不是趋势预测,而是深度复盘。立即下载,把握下一代数据架构真实脉络。
[识别二维码,免费获取白皮书]


03
协作效率提升
1. 实践背景与核心挑战
在游戏行业数据管理实践中,面临两大关键挑战,分别聚焦于资源与效率层面:
(1)资源层面挑战:数据资产维护依赖大量人工操作,存在重复表识别难、需求关联效率低等问题;同时数据存储增速过快,资源决策缺乏高效支撑,需投入大量人力进行分析。
(2)效率层面挑战:跨团队协作存在显著理解成本,需求对接中“对口径”耗时占比高(整体耗时呈“433”结构),且依赖人员经验与素质;不同业务团队对数据术语、资产命名存在差异,易产生理解歧义,跨团队确认难度大。

2. 实践路径与方案
(1)数据资产语义化建设
以游戏行业数据资产为核心,通过语义化学习实现资产重塑,具体路径如下:

①基础资产语义化:针对游戏历史 SQL 日志表、存量表等核心资产,提取基础命名规则、开发规范,确保人工可理解;同时将独立链路的表与任务封装为标准化资产形式,形成可复用的资产单元。
②资产评价模型构建:建立多维度资产评价体系,涵盖“资产有用性”“SQL 写法规范性”等核心维度,并融入人工反馈数据,筛选优质资产供业务复用,同时为数据治理提供依据。

③分层知识体系融合:构建“通用常识–行业知识–企业内部知识”三层语义理解体系:
-
底层:依托大模型自带的通用常识知识;
-
中层:融入游戏行业专属术语、业务逻辑等行业知识;
-
顶层:整合企业内部数据“黑话”、方言等专属表述,确保跨团队对数据资产的理解一致。

(2)跨团队协作效能提升
将资产语义化能力迁移至协作场景,解决跨团队理解成本问题:
①指标口径智能解答:基于语义化模型搭建问答式搜索系统(MCP 模式),用户提问后可自动调取指标对应的需求背景、底层 SQL、成本数据、复用情况等信息,无需人工溯源,避免链路分支导致的信息偏差。
②需求实现自动化辅助:结合行业知识库与语义化资产,对业务需求(如国庆活动数据需求)进行拆解与特征匹配:
-
匹配优质人工标注资产、通用指标模式;
-
关联已解析的血缘语义化资产,自动生成 SQL 并执行,缩短需求实现周期。

(3)资产应用模式创新
打破传统平台主导的资产应用模式,构建开放式探索体系:将标准化语义化资产以灵活形式开放,支持用户基于大模型自主创新应用,减少对平台或特定团队的依赖,整合全员力量拓展资产应用场景。
3. 实践成效
(1)资源与治理效能提升:语义化覆盖后,原本需人工维护的资产占比降低,人工维护成本减少约 30%;数据存储增速显著下降,资源决策效率大幅提升,无需专人持续分析资源情况。

(2)资产推荐与开发效率优化:资产推荐 Top3 准确率达 95%,满足高可用性需求;业务开发效率提升 50%,单个需求开发时间从 1 小时缩短至 0.5 小时。
(3)资产规模与质量:截至实践阶段,已完成 5500 个资产表、10 万个字段的语义化处理,并实现资产自动评估,形成标准化优质资产库。

该范式首次在游戏行业实现“治理即服务”的落地,突破“治理=成本中心”的传统认知,证明AI可将治理从“被动支撑”转化为“主动服务”,为海量数据场景下的行业治理提供可复用的技术路径(如元数据语义化、链路反推)。


🎯 《面向Agent的大数据架构》白皮书发布
当智能体开始自主决策,数据基础设施正被重新定义。本白皮书整合腾讯、阿里、小红书等一线实战,聚焦智能体记忆、多模态治理与统一元数据三大核心议题,为技术决策者提供可参考的架构演进路径。
三大核心看点:
🔹 Memory Lake 分层记忆架构:解密智能体如何实现长期记忆可追溯、短期记忆可检索,支撑AI持续进化。
🔹 多模态数据语义化治理:从碎片化到语义层,让AI真正“读懂”业务。
🔹 统一元数据与血缘:基于Gravitino与OpenLineage,构建Data+AI的可信底座。
不是趋势预测,而是深度复盘。立即下载,把握下一代数据架构真实脉络。
[识别二维码,免费获取白皮书]


04
行业趋势与未来规划
技术融合深化:加强“数据+AI”融合能力,探索智能数据治理、资源优化的基础能力创新,提升数据资产全生命周期智能化水平。
治理模式转型:推动数据治理从“成本支撑部门”向“数据服务提供者”转型,将治理能力转化为标准化数据服务,赋能业务发展。
业务创新引领:以语义化资产为核心,持续探索游戏行业数据应用新场景,引领行业数据驱动的业务创新实践。


🎯 《面向Agent的大数据架构》白皮书发布
当智能体开始自主决策,数据基础设施正被重新定义。本白皮书整合腾讯、阿里、小红书等一线实战,聚焦智能体记忆、多模态治理与统一元数据三大核心议题,为技术决策者提供可参考的架构演进路径。
三大核心看点:
🔹 Memory Lake 分层记忆架构:解密智能体如何实现长期记忆可追溯、短期记忆可检索,支撑AI持续进化。
🔹 多模态数据语义化治理:从碎片化到语义层,让AI真正“读懂”业务。
🔹 统一元数据与血缘:基于Gravitino与OpenLineage,构建Data+AI的可信底座。
不是趋势预测,而是深度复盘。立即下载,把握下一代数据架构真实脉络。
[识别二维码,免费获取白皮书]


05
结语
本文以腾讯游戏数据治理实践为案例,阐述了 AI 如何推动数据治理从“规则驱动的单点管控”向“语义化驱动的服务化范式”跃迁。
通过元数据语义化、链路智能反推与统一语义模型,解决了传统治理中的资源浪费、协作低效与手段局限问题,实现“治理即服务”的目标。
实践表明,该范式不仅能提升治理效率与资产质量,更能为业务创新提供支撑,其经验可为游戏及其他数据密集型行业的治理升级提供重要参考。


分享嘉宾
INTRODUCTION

张兴华

腾讯游戏

数据治理技术负责人

张兴华,拥有十年数据领域深耕经验,专注于平台架构设计与数据治理创新,主导构建 IEG 亿级玩家数据治理体系,在 Hadoop 生态与数据中台建设领域具备深厚技术积累。其成果包括攻克高并发场景下元数据智能治理难题,推动数据治理效率提升 50%,为腾讯游戏业务稳定迭代与高效运营提供技术支撑,同时在 AI 与数据治理融合应用方向有深入探索与实践,形成多项可落地的创新方案。

点个在看你最好看
SPRING HAS ARRIVED

夜雨聆风