AI时代,该重构数据平台了|爱分析访谈-夜雨聆风

AI时代,该重构数据平台了|爱分析访谈

AI正在把数据分析这件事从“看结果”变成“直接干活”。当报表展现、分析洞察，甚至执行都可以被AI接管，企业原有的数据平台体系已经不再适用。

构建适配AI需求的数据基础设施，成为每个数据平台厂商负责人的核心关注点。数据平台架构应该如何重构？数据平台厂商在A I时代的护城河是什么？

带着这些问题，爱分析对网易智企副总经理，数帆业务负责人封雷进行了深度访谈。网易智企·数帆依托网易在游戏、电商、内容等大规模业务中的长期数据实践，其团队既做平台产品，也深度参与企业数据治理与AI落地。

本次访谈重点讨论了四个核心问题：数据基础设施如何适配AI、数据软件为何需要重构、数据厂商的护城河在哪里，以及Data Agent如何走向执行闭环。

核心观点

数据基础设施要适配AI需求。

AI要真正用好数据，首先要解决AI认不认识数据、响应速度快、安全可控。

数据平台架构将深度重构。

数据厂商要把传统数据能力重新拆解，封装成AI可调用的原子化Skill，让AI接管重复性工作。

数据应用从决策走向行动。

Data Agent是数字员工，能把任务一步步执行完成，从洞察走向数据驱动执行闭环，本质是“用数据干活”。

数据厂商护城河在于业务Know-how、综合实力和前瞻性。

AI让软件门槛下降，但行业沉淀和前瞻性布局仍是核心优势。

AI Coding短期对数据厂商形成冲击，但长期是利好。

AI Coding将解构传统软件，企业付费方式将从购买整套软件转向为特定能力付费。

以下为本次访谈实录，在不改变原意基础上略有修改。

从有什么数据，转向AI需要什么

爱分析：AI时代，数据基础设施最核心的特征是什么？

封雷：这个问题可以换一个角度来看：不是数据要做什么，而是AI需要什么。

AI要真正用好数据，首先要解决的第一个问题，是AI认不认识数据。也就是说，数据有没有被治理成一种AI可以理解的形态。这是第一点。

第二个是时效性。你不能让AI去查询数据的时候，还要等几分钟甚至半小时，这在很多业务场景里是不可接受的，所以数据访问的实时性、响应速度，是一个非常关键的因素。

第三是数据合规和安全。数据本身就是企业的核心资产，如果AI在一个不受控的环境里去访问这些数据，其实风险是非常大的。所以权限控制、合规治理，一定是基础能力。

从大的框架来看，其实就是三件事：让AI看得懂、响应速度快、安全可控。

爱分析：这些能力在数据中台时代也需要，到了AI时代，变化更多体现在哪些地方？

封雷：你说得对，这些能力本质上不是新东西。无论是数仓、数据中台，还是数据湖、数据治理，这些能力在传统数据体系里都是存在的。

但AI带来了一个非常重要的变化，企业对数据的重视程度显著提升了。以前，数据治理更多是数据部门在推动，业务侧使用场景，很多还是报表、大屏，使用深度有限。但现在不一样了，AI出来之后，数据的消费方式发生了变化。

以前C-level管理者获取数据，往往要通过助理、业务部门、经管团队等人员层层汇报。但现在管理者可以直接通过智能问数的方式获取信息。这就意味着，C-level开始直接关注数据治理本身，甚至会把它当成AI应用落地的一个核心工程。

今年我们在和客户交流时，这个趋势特别明显，很多企业已经开始把预算直接投向数据治理。

爱分析：数据治理在AI时代有哪些新内涵？

封雷：从执行层面看，其实数据治理依然是一项依赖人的工作。比如数据清洗、数据标准化、从源头到数仓再到出仓的管理，这一整套流程，目前还是离不开人的参与。当然，未来会有一部分可以拆解出来交给AI，但从整体上看，还是人主导。

在方法上，它发生了一些变化。现在我们更强调一件事：要给AI构建一张数据导航地图。你可以把它理解成类似高德地图。AI要做分析、做归因，本质上就是在找路径。

举个例子，一个企业Q1利润很好，这个好是怎么来的？是某个产品卖得好，还是某个区域表现突出？还是因为竞争对手出了问题，还是定价策略优化了？这些因素之间是一个多维度的网络关系，从产品维度、区域维度、客户维度等构成了一张类似瀑布流的结构，AI需要理解这个结构。

现在比较通俗的说法，就是语义层。本质上，就是把数据的业务含义、结构关系，显式地表达出来，让AI能够顺着这张地图去做分析和推理。

爱分析：在数据连接和数据形态上，有没有新变化？

封雷：有，而且变化很大。

首先是互联互通。过去我们更多是围绕数据仓库来构建数据体系，但现在AI本身可以访问外部数据。比如说，一个企业想分析自己的利润增长，到底是自身能力提升，还是行业整体红利带来的。这时候，就需要引入外部数据进行对比。

这种跨域的数据调用，在AI时代会变得越来越普遍。这就带来了异构数据的问题。一方面是内部系统之间的异构，比如ERP、OA、HR这些系统；另一方面是外部数据源的不确定性和多样性。

第二个变化，是从结构化数据走向多模态数据。以前我们讲数据，基本默认是结构化的。但现在，AI可以处理文本、图片、语音等非结构化数据，这就意味着，数据基础设施必须支持结构化与非结构化数据的融合分析。

举个简单的例子，财务人员要检查发票连号，这里面其实就涉及一个过程：先把发票图像转成文字，再从文字里提取发票编号，最后做结构化分析。这就是一个非结构化到结构化的过程。未来，这种融合会成为常态。

爱分析：安全层面有没有新挑战？

封雷：安全在AI时代的重要性，是被进一步放大的。尤其是在金融、国企这些行业，数据安全和合规是第一优先级。比如信创要求、数据权限控制，这些都是必须严格执行的。

从技术上看，一方面是把原有的数据权限体系能力化，让AI在调用数据时，可以直接复用这些能力，类似一个标准化Skill。

另一方面，是要防范大模型学到不该学的东西。因为大模型是有记忆和自我进化能力的，如果不加控制，可能会带来数据泄露风险。目前比较主流的做法，还是本地化部署，确保数据不出域。此外，也会引入一些专门的AI安全产品，在AI运行过程中做实时监控和防护。

数据平台重构，将复杂数据能力封装成AI可调用的原子化能力

爱分析：在面向Agent的过程中，数帆这两年主要强化了哪些能力？

封雷：我们内部其实在做一件比较底层的事情，可以概括为重构，就是把传统的数据软件能力重新梳理和升级。因为AI出来之后，很多原来软件里的能力形态已经不适配了。

你可以看到，现在AI Coding已经很成熟了，只要你把需求描述清楚，很多开发工作是可以直接交给大模型完成的。这就意味着，原来软件里那些固定流程+人工操作的部分，是可以被重构的。

爱分析：不适配具体体现在哪些场景？

封雷：一个很典型的变化，是企业使用数据的方式变了。

以前是什么模式？业务提需求，信息化部门排期，可能半天、一天、几天之后，把报表做好、权限开好，任务就完成了。

现在，如果是AI参与，这件事情会变成实时发生。需求量会快速膨胀，而且是碎片化、即时化的。这时候，如果企业还依赖外部供应商来做数据运营，就会遇到两个问题：要么成本大幅上升，要么响应跟不上。

所以很多企业现在的选择是，把数据运营能力收回到内部。但问题也来了——人手够不够？成本怎么控制？答案其实很清晰：把大量重复性的工作交给AI。

爱分析：所以，核心变化是让AI接管这些工作？

封雷：对，而且不是简单的用AI，而是把能力拆解成AI可以调用的技能。

举个例子，像ETL这种能力，原来是一个完整的数据处理流程，现在我们会把它拆成一个个可以被调用的Skill。再比如生成报表、生成分析报告，这些原来属于BI工具里的能力，也都可以拆出来，变成“一键生成报告”的技能。

网易内部还有一个BI产品，叫网易有数BI，我们也在做类似的事情，把报表生成、可视化渲染、配色模板这些能力模块化、技能化。

这样一来，用户只需要把需求说清楚，比如帮我检查一下数据质量，把这批数据加载到某个系统里，AI就可以直接调用这些技能去完成，而不再依赖高成本的数据工程师。原来需要专业数据工程师投入大量时间的工作，现在很多可以交由AI来完成，让数据人员从重复性劳动中解放出来，聚焦更高价值的分析与决策支持工作。

爱分析：除了这些显性能力的拆解，在更底层的运维和优化层面，有没有变化？

封雷：有，而且变化非常实际。我们现在看到一个很现实的问题：企业的数据量在不断增长，但硬件成本也在上升，比如芯片、服务器、存储，都在涨价。同时，企业又不愿意删除历史数据，因为那是资产。这就导致一个矛盾：数据越来越多，资源越来越贵。

以前，这类问题是由数据库管理员来解决的，比如优化SQL、调整分区、优化索引、平衡服务器负载等等。但现在，这些工作其实非常适合交给AI。

比如，我们可以做一个数据性能监测Agent，去自动识别哪些脚本写得不好、哪些查询消耗了过多CPU、哪些分区策略不合理。很多优化动作，AI都可以直接完成。在一些实际案例中，这样做的结果很直接，企业不需要再额外购买服务器了，成本可以明显下降。

爱分析：除了重构，在数据形态上，有没有新的演进方向？

封雷：就是多模态。原来的NDH、EasyData BI产品，本质上都是围绕结构化数据构建的。但在AI时代，这是不够的。现在必须要支持非结构化数据，比如文本、图片、语音等，并且要把这些数据纳入统一的数据体系中。

举个例子。一个物业场景里，一套房子的信息不只是水电费这些结构化数据，还有照片、文本描述等非结构化数据。

我们要做的，是把这些信息统一成一组可理解的数据，让AI可以整体分析。这里面会涉及到一些技术处理，比如语音转文本、文本处理等等，但本质目标很简单：让结构化和非结构化数据融合，形成一张数据地图。

爱分析：在生态和平台策略上，有没有一些新的考虑？

封雷：我们现在的一个核心判断是：未来一定是开放的。现在很多平台都在开放自己的能力，比如企业微信、各种数据平台，甚至像同花顺这样的产品，也在开放数据接口。如果你还是用一种封闭系统的思路去做软件，其实是很危险的，因为软件的替代成本在AI时代变得非常低。

所以我们在做的事情，一方面是把能力做成API，可以对外开放；另一方面，也在强调系统之间的互联互通。只有能够连接、能够被调用，才能真正产生价值。否则的话，再好的能力，放在一个封闭体系里，也很难发挥作用。

AI实现技术平权后，数据厂商的护城河在于业务know-how和前瞻性

爱分析：刚才您提到，AI让做软件本身的门槛在下降。那么对于数据厂商来说，未来的护城河体现在哪些方面？

封雷：我觉得第一点还是业务Know-how。

因为数据最终是要服务业务的。以前是人找数据，现在正在变成数据找人，或者更准确说，是AI主动帮你干活。未来的形态，不是你问一句，AI答一句，而是AI自己去分析、去发现问题，然后主动提醒你。

比如说现在已经4月份了，华东区的业绩完成率还是偏低，AI分析了一下，可能是这些原因，AI问用户要不要继续往下处理？甚至再往前一步，AI可以问你，AI的判断是这样，你同不同意？如果同意，我可以直接往下执行。要做到这一点，前提就是，它必须理解业务。

而业务理解，不是靠模型本身就能解决的，它需要长期的行业沉淀。这也是为什么数据厂商在这一轮AI浪潮里，反而是有优势的——因为我们既做软件，也做数据治理服务，本身就在业务一线。

第二个，我认为是综合实力。

这里面其实包括几个层面。第一是技术积累，比如ASR、TTS、多模态处理这些能力，本身不算特别前沿，但问题在于——你能不能做到可商用。很多能力，用AI Coding也许能做出来，但离稳定、可靠、可规模化交付，还有很大差距。这一块，大厂的积累还是很明显的。第二是资源和行业优势。比如有的公司擅长流量运营，有的公司擅长电商，有的公司在内容和情绪理解上有积累。

以网易为例，我们在游戏、音乐、电商这些C端业务里，其实沉淀了很多对用户情绪的理解。游戏本质上就是一种情绪消费，这里面涉及大量的用户行为建模和反馈机制。这些能力，在AI时代其实很重要。

因为未来的人机交互，不会是一个冷冰冰的问答系统，而更像一个员工。不同的老板，对员工的期待是不一样的——有的人希望你少说多做，有的人希望你多沟通、多确认。这种“人设”和交互方式，本质上也是需要设计的。

第三个我觉得是前瞻性。简单说，就是你有没有在看两三年之后的格局，并且提前做投入。

比如像 Palantir，它其实是在国家安全这个垂直领域做深做透，通过数据建模、关系分析等能力，形成了很强的壁垒。再比如一些做实时计算的公司，原来只是提供数据处理能力，但现在因为算力的重要性提升，它们的定位也在变化。还有一些公司，是从数据治理往上走，叠加AI应用，形成一体化能力。

这些路径，本质上都是在做一件事：提前卡位。对于我们来说，也是一样的。很多能力，不是客户现在就明确提出需求，而是你要预判未来的方向，提前去做布局。

爱分析：刚才我们也提到了语义层，这其实是AI时代非常关键的一环。数帆在这方面的实践思路如何？

封雷：我们在语义层这件事情上，其实也经历了一个调整。一开始，我们是在各个产品里分别做语义管理，比如在EasyData里有指标平台，在BI里有指标门户，在数仓里也有相关能力。

但后来我们发现，这种方式不太适合AI时代。因为客户现在关心的不是你有多少个产品模块，而是我能不能把数据价值快速发挥出来。所以我们现在在做一件事情，可以理解为“旧房改造”，把原来分散在各个系统里的语义能力，统一抽出来，放到一个中心化的语义平台里。

爱分析：为什么要“抽出来”，而不是继续分布在各个系统中？

封雷：核心原因是：口径一致。

你想象一下，一个企业里，华东区域这个概念，在不同系统里可能定义都不一样。那AI怎么判断？如果没有统一语义，它很容易出错。

而未来，数据的调用入口会非常多——可能在报表里、在OA系统里、在企业门户里，甚至在手机端。这些入口背后，可能都是AI在调用数据。如果每个地方的语义不一致，那结果一定是混乱的。所以我们把语义层放在中枢位置，类似一个岔路口，所有的数据访问，都必须经过这里。

传统的语义层，本质上是一个人维护的指标体系，比如用表格去管理关键词、指标定义。但在AI时代，它更像一个会进化的知识系统。它有记忆能力，它也可以自我优化，甚至未来有可能自我生成新指标——也就是说，企业原本没有定义的分析维度，AI通过学习和推理，主动提出来。

从这个角度看，语义层本身，其实也是一个Agent，是由一系列Skill组成的系统。而这个语义中枢，我觉得会成为未来数据厂商非常关键的一道护城河。

数据驱动决策，走向数据驱动执行

爱分析：网易最近推出了Data Agent产品，哪些是最值得企业关注的高价值应用场景？

封雷：我们可以先把Agent这件事情说清楚。

在我们内部的定义里，Agent其实就是一个数字员工。它不是简单的问答工具，而是一个具备技能、由工作流驱动、可以把任务一步步执行完成的AI员工。它既有能力，就是技能，也有做事的方法，就是工作流，最终目标是把一件事情闭环做完。从数字员工视角来看，比较成熟的应用场景可以分两层来看。

第一层，是在数据底座，也就是一些基础岗位的数字员工。比如数据质量检查员工、数据调度员工、数据性能优化员工，这些本质上是在替代传统的数据运维和治理工作。

但如果往上看，到数据应用层，场景就更丰富了。

最基础的一类，还是报表。但报表也在发生变化，以前是你看报表，现在是你可以问报表。比如你看到某个月数据波动很大，可以直接问AI：这里面是出了问题，还是有新的机会？AI可以帮你做分析。

再往前一步，你甚至不需要先做报表，可以直接说：我想看某个业务情况，帮我生成一张报表。AI直接给你生成。这其实是从报表查看走向报表生成分析的一体化能力。

第二类典型场景，是写报告。企业里有大量的经营分析报告、月报、PPT，本质上都是基于数据做总结和洞察，这些事情其实是可以交给AI来完成初稿的，人可以在这个基础上做复核和优化。

而且有一点很有意思，AI有时候能提供一些人想不到的视角。因为人的经验是有限的，而AI可以从更多维度去做关联分析，这对管理者是有启发的。所以像一键生成经营分析报告这样的能力，我觉得会是一个长期存在的高频场景。

第三类，也是我认为更有价值的一类，从洞察走向行动，并形成闭环。

举个例子，我们有一个银行客户，在做绩效管理。比如一个支行有放贷、存款等KPI指标，行长和客户经理都有各自的目标。如果某个员工进度落后，过去是靠人去看报表、再去提醒。

但现在可以怎么做？AI可以直接根据数据发现问题，然后给员工下行动指令。比如告诉他：你当前的任务完成度不够，需要跟进这些客户，甚至可以监控执行情况，比如企业要求15分钟内必须联系客户，如果没有执行，AI可以继续跟进提醒。这其实就是用数据驱动具体行为，而不是停留在看数据的层面。

爱分析：这种数据驱动执行的模式，在其他行业也成立吗？

封雷：完全成立。比如在国企场景里，一个非常重要的需求是合规。像招投标是否合规、资金使用是否合理，这些其实都可以被数据化。只要能数据化，就可以被监测。AI可以在问题发生之前，就提前发现异常，并给出预警和建议，甚至指导后续的整改动作。

也就是说，它不只是一个事后审计的工具，而是一个事前和事中的实时监管助手。

爱分析：如果从技术演进来看，要实现这种从洞察到执行的闭环，还需要哪些关键能力？

封雷：我觉得可以从三个层面来看。

第一个，是AI员工管理平台。既然我们把Agent当成员工，那就需要一套类似HR系统的东西，去管理这些AI员工。比如它是谁、负责什么工作、有什么技能、KPI是什么、权限是什么，这些都需要统一管理。

第二个，是调度和协同机制。人和人之间是通过开会、沟通来分配任务的，Agent之间其实也需要类似的机制。它们可以相互协作、分解任务，达成一致后再执行。现在像一些Agent调度框架，其实已经在做这件事了——相当于大脑指挥手脚。

第三个，是执行和合规机制。AI可以发消息、发邮件、触发系统操作，但关键是——每一步都需要有确认、有记录。尤其是在企业场景里，很多操作是需要签字背书的，不能出现AI做错了，责任全在AI的情况。所以整个执行过程，必须嵌入到现有的流程体系中，比如OA审批、日志记录等。

爱分析：能不能举一个更完整的闭环执行场景？

封雷：可以。比如国资监管场景。上级单位发来一个问询函，说你这边有一笔资金闲置，需要解释原因。传统流程是人工去查数据、分析原因、写回复函。

但如果用Data Agent来做，可以是这样一个流程：AI先接收任务，核查是否真的存在闲置资金；然后分析原因；再生成一份回复函草稿；接着调用模板能力生成正式文件；最后走OA审批流程，由管理层确认并发送。

你会发现，这整个过程，其实就是一系列“技能”的组合：数据查询、分析、文档生成、流程审批。本质上，Data Agent的能力，就是把这些技能串起来，通过工作流自动执行。

爱分析：总结来看，您认为Data Agent未来最核心的价值是什么？

封雷：我觉得一句话可以概括：从“用数据”，走向“用数据干活”。过去，数据的价值主要体现在“看”和“分析”；但未来，它会直接驱动行动，甚至替代一部分执行工作。

而这背后，本质上是两件事：一是技能的不断积累，二是工作流的不断完善。当这两件事情成熟之后，Data Agent就真的会成为企业里的“数字员工”。

基模能力、Agent技术范式、客户真实场景，是Data+AI核心驱动力

爱分析：在Data+AI领域，您觉得有哪些值得重点关注的新技术或趋势？

封雷：如果从我们的视角来看，接下来有四个方向，是必须持续盯住的。

第一个，是基础大模型厂商的演进。比如像 DeepSeek、Kimi、智谱、MiniMax 这些厂商，它们能力的每一次提升，都会直接影响Data+AI这个赛道。

这种影响有两面性：

一方面是利好。比如模型能力更强了，成本更低了，那我们原来很难做的事情，现在可以更容易实现，整个应用层的能力会被放大；

另一方面，也可能是利空。如果基础模型已经强到可以直接完成一些数据应用，比如直接访问数据、一键生成报表，那对于我们这种数据厂商来说，就会形成降维打击。所以我们必须持续关注——模型能力的边界在哪里，以及我们自身的价值在哪里。

第二个是新的技术范式。比如像Agent调度、像龙虾这种机制，本质上是一种新的技术模式。它解决的是AI如何从理解走向执行的问题。但关键在于，这类技术到底是替代关系，还是增强关系？是会冲击现有体系，还是可以被我们吸收整合？未来一定还会不断出现新的技术范式，我们需要持续判断它们的位置和价值。

第三个是同行。不管是互联网大厂，还是垂直领域的专业厂商，我们都会持续去看他们在做什么。但我们关注的重点，不只是技术本身，而是它背后的商业逻辑。

比如，对方是在做一个自己有绝对优势的领域，还是在一个分散精力的方向上扩张？这会直接影响我们的策略。有点像打仗——如果对方在某个方向投入很大，那我们就不一定要正面硬碰，反而可以在局部场景里，用更集中资源建立优势。

第四个，也是我觉得最重要的，就是企业真实的应用场景。我们会持续去看，企业到底在怎么用Data+AI，以及用了之后产生了什么效果。不只是看我们自己的客户，也会看同行的案例。

虽然很多对外发布的内容可能有包装，但我们更关注的是背后的逻辑，为什么这个场景能成立，它的价值点在哪里。因为只要一个场景真正上线了，就说明它一定解决了某个问题。至于效果有没有达到预期，是另外一回事，但它至少是有用的。这些真实场景，会反过来影响我们的产品设计和能力布局。

爱分析：刚才您提到AI Coding，这个能力会不会对数据厂商形成直接冲击？

封雷：短期看是冲击，但长期看，我反而觉得是利好。为什么？因为它会解构软件。

以前企业要做报表，需要买一整套BI工具，还要有人会用，门槛其实不低。但现在有了AI Coding，你只需要用自然语言描述需求，就可以生成报表。这时候，企业不一定还愿意为软件本身买单，而是为能力买单。

也就是说，从买软件，变成按调用付费。你用到某个能力，就调用对应的API。这会带来一个变化——原有的软件市场格局会被打破。

这种变化，对企业本身的影响本质上是两件事：降本和增效。

一方面，企业可以减少对复杂系统和专业人员的依赖，很多工作可以直接由业务人员通过AI完成。比如在网易内部，原来一个部门要取数据，需要经过多层流程；现在通过AI，直接就能拿到数据、完成分析。

另一方面，数据的使用门槛降低之后，使用频率会大幅提升。原来只有少数人用数据，现在更多人可以参与进来。这会让数据真正产生价值，而不是停留在做几张报表的阶段。

爱分析：总结来看，这些变化对数据厂商意味着什么？

封雷：一句话：机遇和风险并存。像BI工具、数据中台这些产品，正在经历一轮深度重构和升级。但同时，也会催生新的机会，比如技能化能力、Agent体系、数据应用闭环等。关键在于，你能不能持续进化。如果跟不上变化，很容易掉队；但如果能抓住趋势，反而有机会引领下一轮行业变革。

关键在于，你能不能持续进化。如果跟不上变化，很容易被淘汰；但如果抓住趋势，反而有机会重新定义自己的位置。

注：点击左下角“阅读原文”，查看更多洞察内容。