当前时间: 2026-04-30 13:06:33
更新时间: 2026-04-30
分类:软件教程
评论(0)
AI时代,该重构数据平台了|爱分析访谈
AI正在把数据分析这件事从“看结果”变成“直接干活”。当报表展现、分析洞察,甚至执行都可以被AI接管,企业原有的数据平台体系已经不再适用。
构建适配AI需求的数据基础设施,成为每个数据平台厂商负责人的核心关注点。数据平台架构应该如何重构?数据平台厂商在A I时代的护城河是什么?
带着这些问题,爱分析对网易智企副总经理,数帆业务负责人封雷进行了深度访谈。网易智企·数帆依托网易在游戏、电商、内容等大规模业务中的长期数据实践,其团队既做平台产品,也深度参与企业数据治理与AI落地。
本次访谈重点讨论了四个核心问题:数据基础设施如何适配AI、数据软件为何需要重构、数据厂商的护城河在哪里,以及Data Agent如何走向执行闭环。
AI要真正用好数据,首先要解决AI认不认识数据、响应速度快、安全可控。
数据厂商要把传统数据能力重新拆解,封装成AI可调用的原子化Skill,让AI接管重复性工作。
Data Agent是数字员工,能把任务一步步执行完成,从洞察走向数据驱动执行闭环,本质是“用数据干活”。
-
数据厂商护城河在于业务Know-how、综合实力和前瞻性。
AI让软件门槛下降,但行业沉淀和前瞻性布局仍是核心优势。
-
AI Coding短期对数据厂商形成冲击,但长期是利好。
AI Coding将解构传统软件,企业付费方式将从购买整套软件转向为特定能力付费。
01
爱分析:AI时代,数据基础设施最核心的特征是什么?
封雷:这个问题可以换一个角度来看:不是数据要做什么,而是AI需要什么。
AI要真正用好数据,首先要解决的第一个问题,是AI认不认识数据。也就是说,数据有没有被治理成一种AI可以理解的形态。这是第一点。
第二个是时效性。你不能让AI去查询数据的时候,还要等几分钟甚至半小时,这在很多业务场景里是不可接受的,所以数据访问的实时性、响应速度,是一个非常关键的因素。
第三是数据合规和安全。数据本身就是企业的核心资产,如果AI在一个不受控的环境里去访问这些数据,其实风险是非常大的。所以权限控制、合规治理,一定是基础能力。
从大的框架来看,其实就是三件事:让AI看得懂、响应速度快、安全可控。
爱分析:这些能力在数据中台时代也需要,到了AI时代,变化更多体现在哪些地方?
封雷:你说得对,这些能力本质上不是新东西。无论是数仓、数据中台,还是数据湖、数据治理,这些能力在传统数据体系里都是存在的。
但AI带来了一个非常重要的变化,企业对数据的重视程度显著提升了。以前,数据治理更多是数据部门在推动,业务侧使用场景,很多还是报表、大屏,使用深度有限。但现在不一样了,AI出来之后,数据的消费方式发生了变化。
以前C-level管理者获取数据,往往要通过助理、业务部门、经管团队等人员层层汇报。但现在管理者可以直接通过智能问数的方式获取信息。这就意味着,C-level开始直接关注数据治理本身,甚至会把它当成AI应用落地的一个核心工程。
今年我们在和客户交流时,这个趋势特别明显,很多企业已经开始把预算直接投向数据治理。
封雷:从执行层面看,其实数据治理依然是一项依赖人的工作。比如数据清洗、数据标准化、从源头到数仓再到出仓的管理,这一整套流程,目前还是离不开人的参与。当然,未来会有一部分可以拆解出来交给AI,但从整体上看,还是人主导。
在方法上,它发生了一些变化。现在我们更强调一件事:要给AI构建一张数据导航地图。你可以把它理解成类似高德地图。AI要做分析、做归因,本质上就是在找路径。
举个例子,一个企业Q1利润很好,这个好是怎么来的?是某个产品卖得好,还是某个区域表现突出?还是因为竞争对手出了问题,还是定价策略优化了?这些因素之间是一个多维度的网络关系,从产品维度、区域维度、客户维度等构成了一张类似瀑布流的结构,AI需要理解这个结构。
现在比较通俗的说法,就是语义层。本质上,就是把数据的业务含义、结构关系,显式地表达出来,让AI能够顺着这张地图去做分析和推理。
首先是互联互通。过去我们更多是围绕数据仓库来构建数据体系,但现在AI本身可以访问外部数据。比如说,一个企业想分析自己的利润增长,到底是自身能力提升,还是行业整体红利带来的。这时候,就需要引入外部数据进行对比。
这种跨域的数据调用,在AI时代会变得越来越普遍。这就带来了异构数据的问题。一方面是内部系统之间的异构,比如ERP、OA、HR这些系统;另一方面是外部数据源的不确定性和多样性。
第二个变化,是从结构化数据走向多模态数据。以前我们讲数据,基本默认是结构化的。但现在,AI可以处理文本、图片、语音等非结构化数据,这就意味着,数据基础设施必须支持结构化与非结构化数据的融合分析。
举个简单的例子,财务人员要检查发票连号,这里面其实就涉及一个过程:先把发票图像转成文字,再从文字里提取发票编号,最后做结构化分析。这就是一个非结构化到结构化的过程。未来,这种融合会成为常态。
封雷:安全在AI时代的重要性,是被进一步放大的。尤其是在金融、国企这些行业,数据安全和合规是第一优先级。比如信创要求、数据权限控制,这些都是必须严格执行的。
从技术上看,一方面是把原有的数据权限体系能力化,让AI在调用数据时,可以直接复用这些能力,类似一个标准化Skill。
另一方面,是要防范大模型学到不该学的东西。因为大模型是有记忆和自我进化能力的,如果不加控制,可能会带来数据泄露风险。目前比较主流的做法,还是本地化部署,确保数据不出域。此外,也会引入一些专门的AI安全产品,在AI运行过程中做实时监控和防护。
02
数据平台重构,将复杂数据能力封装成AI可调用的原子化能力
爱分析:在面向Agent的过程中,数帆这两年主要强化了哪些能力?
封雷:我们内部其实在做一件比较底层的事情,可以概括为重构,就是把传统的数据软件能力重新梳理和升级。因为AI出来之后,很多原来软件里的能力形态已经不适配了。
你可以看到,现在AI Coding已经很成熟了,只要你把需求描述清楚,很多开发工作是可以直接交给大模型完成的。这就意味着,原来软件里那些固定流程+人工操作的部分,是可以被重构的。
封雷:一个很典型的变化,是企业使用数据的方式变了。
以前是什么模式?业务提需求,信息化部门排期,可能半天、一天、几天之后,把报表做好、权限开好,任务就完成了。
现在,如果是AI参与,这件事情会变成实时发生。需求量会快速膨胀,而且是碎片化、即时化的。这时候,如果企业还依赖外部供应商来做数据运营,就会遇到两个问题:要么成本大幅上升,要么响应跟不上。
所以很多企业现在的选择是,把数据运营能力收回到内部。但问题也来了——人手够不够?成本怎么控制?答案其实很清晰:把大量重复性的工作交给AI。
封雷:对,而且不是简单的用AI,而是把能力拆解成AI可以调用的技能。
举个例子,像ETL这种能力,原来是一个完整的数据处理流程,现在我们会把它拆成一个个可以被调用的Skill。再比如生成报表、生成分析报告,这些原来属于BI工具里的能力,也都可以拆出来,变成“一键生成报告”的技能。
网易内部还有一个BI产品,叫网易有数BI,我们也在做类似的事情,把报表生成、可视化渲染、配色模板这些能力模块化、技能化。
这样一来,用户只需要把需求说清楚,比如帮我检查一下数据质量,把这批数据加载到某个系统里,AI就可以直接调用这些技能去完成,而不再依赖高成本的数据工程师。原来需要专业数据工程师投入大量时间的工作,现在很多可以交由AI来完成,让数据人员从重复性劳动中解放出来,聚焦更高价值的分析与决策支持工作。
爱分析:除了这些显性能力的拆解,在更底层的运维和优化层面,有没有变化?
封雷:有,而且变化非常实际。我们现在看到一个很现实的问题:企业的数据量在不断增长,但硬件成本也在上升,比如芯片、服务器、存储,都在涨价。同时,企业又不愿意删除历史数据,因为那是资产。这就导致一个矛盾:数据越来越多,资源越来越贵。
以前,这类问题是由数据库管理员来解决的,比如优化SQL、调整分区、优化索引、平衡服务器负载等等。但现在,这些工作其实非常适合交给AI。
比如,我们可以做一个数据性能监测Agent,去自动识别哪些脚本写得不好、哪些查询消耗了过多CPU、哪些分区策略不合理。很多优化动作,AI都可以直接完成。在一些实际案例中,这样做的结果很直接,企业不需要再额外购买服务器了,成本可以明显下降。
爱分析:除了重构,在数据形态上,有没有新的演进方向?
封雷:就是多模态。原来的NDH、EasyData BI产品,本质上都是围绕结构化数据构建的。但在AI时代,这是不够的。现在必须要支持非结构化数据,比如文本、图片、语音等,并且要把这些数据纳入统一的数据体系中。
举个例子。一个物业场景里,一套房子的信息不只是水电费这些结构化数据,还有照片、文本描述等非结构化数据。
我们要做的,是把这些信息统一成一组可理解的数据,让AI可以整体分析。这里面会涉及到一些技术处理,比如语音转文本、文本处理等等,但本质目标很简单:让结构化和非结构化数据融合,形成一张数据地图。
封雷:我们现在的一个核心判断是:未来一定是开放的。现在很多平台都在开放自己的能力,比如企业微信、各种数据平台,甚至像同花顺这样的产品,也在开放数据接口。如果你还是用一种封闭系统的思路去做软件,其实是很危险的,因为软件的替代成本在AI时代变得非常低。
所以我们在做的事情,一方面是把能力做成API,可以对外开放;另一方面,也在强调系统之间的互联互通。只有能够连接、能够被调用,才能真正产生价值。否则的话,再好的能力,放在一个封闭体系里,也很难发挥作用。
03
AI实现技术平权后,数据厂商的护城河在于业务know-how和前瞻性
爱分析:刚才您提到,AI让做软件本身的门槛在下降。那么对于数据厂商来说,未来的护城河体现在哪些方面?
因为数据最终是要服务业务的。以前是人找数据,现在正在变成数据找人,或者更准确说,是AI主动帮你干活。未来的形态,不是你问一句,AI答一句,而是AI自己去分析、去发现问题,然后主动提醒你。
比如说现在已经4月份了,华东区的业绩完成率还是偏低,AI分析了一下,可能是这些原因,AI问用户要不要继续往下处理?甚至再往前一步,AI可以问你,AI的判断是这样,你同不同意?如果同意,我可以直接往下执行。要做到这一点,前提就是,它必须理解业务。
而业务理解,不是靠模型本身就能解决的,它需要长期的行业沉淀。这也是为什么数据厂商在这一轮AI浪潮里,反而是有优势的——因为我们既做软件,也做数据治理服务,本身就在业务一线。
这里面其实包括几个层面。第一是技术积累,比如ASR、TTS、多模态处理这些能力,本身不算特别前沿,但问题在于——你能不能做到可商用。很多能力,用AI Coding也许能做出来,但离稳定、可靠、可规模化交付,还有很大差距。这一块,大厂的积累还是很明显的。第二是资源和行业优势。比如有的公司擅长流量运营,有的公司擅长电商,有的公司在内容和情绪理解上有积累。
以网易为例,我们在游戏、音乐、电商这些C端业务里,其实沉淀了很多对用户情绪的理解。游戏本质上就是一种情绪消费,这里面涉及大量的用户行为建模和反馈机制。这些能力,在AI时代其实很重要。
因为未来的人机交互,不会是一个冷冰冰的问答系统,而更像一个员工。不同的老板,对员工的期待是不一样的——有的人希望你少说多做,有的人希望你多沟通、多确认。这种“人设”和交互方式,本质上也是需要设计的。
第三个我觉得是前瞻性。简单说,就是你有没有在看两三年之后的格局,并且提前做投入。
比如像 Palantir,它其实是在国家安全这个垂直领域做深做透,通过数据建模、关系分析等能力,形成了很强的壁垒。再比如一些做实时计算的公司,原来只是提供数据处理能力,但现在因为算力的重要性提升,它们的定位也在变化。还有一些公司,是从数据治理往上走,叠加AI应用,形成一体化能力。
这些路径,本质上都是在做一件事:提前卡位。对于我们来说,也是一样的。很多能力,不是客户现在就明确提出需求,而是你要预判未来的方向,提前去做布局。
爱分析:刚才我们也提到了语义层,这其实是AI时代非常关键的一环。数帆在这方面的实践思路如何?
封雷:我们在语义层这件事情上,其实也经历了一个调整。一开始,我们是在各个产品里分别做语义管理,比如在EasyData里有指标平台,在BI里有指标门户,在数仓里也有相关能力。
但后来我们发现,这种方式不太适合AI时代。因为客户现在关心的不是你有多少个产品模块,而是我能不能把数据价值快速发挥出来。所以我们现在在做一件事情,可以理解为“旧房改造”,把原来分散在各个系统里的语义能力,统一抽出来,放到一个中心化的语义平台里。
爱分析:为什么要“抽出来”,而不是继续分布在各个系统中?
你想象一下,一个企业里,华东区域这个概念,在不同系统里可能定义都不一样。那AI怎么判断?如果没有统一语义,它很容易出错。
而未来,数据的调用入口会非常多——可能在报表里、在OA系统里、在企业门户里,甚至在手机端。这些入口背后,可能都是AI在调用数据。如果每个地方的语义不一致,那结果一定是混乱的。所以我们把语义层放在中枢位置,类似一个岔路口,所有的数据访问,都必须经过这里。
传统的语义层,本质上是一个人维护的指标体系,比如用表格去管理关键词、指标定义。但在AI时代,它更像一个会进化的知识系统。它有记忆能力,它也可以自我优化,甚至未来有可能自我生成新指标——也就是说,企业原本没有定义的分析维度,AI通过学习和推理,主动提出来。
从这个角度看,语义层本身,其实也是一个Agent,是由一系列Skill组成的系统。而这个语义中枢,我觉得会成为未来数据厂商非常关键的一道护城河。
04
爱分析:网易最近推出了Data Agent产品,哪些是最值得企业关注的高价值应用场景?
在我们内部的定义里,Agent其实就是一个数字员工。它不是简单的问答工具,而是一个具备技能、由工作流驱动、可以把任务一步步执行完成的AI员工。它既有能力,就是技能,也有做事的方法,就是工作流,最终目标是把一件事情闭环做完。从数字员工视角来看,比较成熟的应用场景可以分两层来看。
第一层,是在数据底座,也就是一些基础岗位的数字员工。比如数据质量检查员工、数据调度员工、数据性能优化员工,这些本质上是在替代传统的数据运维和治理工作。
最基础的一类,还是报表。但报表也在发生变化,以前是你看报表,现在是你可以问报表。比如你看到某个月数据波动很大,可以直接问AI:这里面是出了问题,还是有新的机会?AI可以帮你做分析。
再往前一步,你甚至不需要先做报表,可以直接说:我想看某个业务情况,帮我生成一张报表。AI直接给你生成。这其实是从报表查看走向报表生成分析的一体化能力。
第二类典型场景,是写报告。企业里有大量的经营分析报告、月报、PPT,本质上都是基于数据做总结和洞察,这些事情其实是可以交给AI来完成初稿的,人可以在这个基础上做复核和优化。
而且有一点很有意思,AI有时候能提供一些人想不到的视角。因为人的经验是有限的,而AI可以从更多维度去做关联分析,这对管理者是有启发的。所以像一键生成经营分析报告这样的能力,我觉得会是一个长期存在的高频场景。
第三类,也是我认为更有价值的一类,从洞察走向行动,并形成闭环。
举个例子,我们有一个银行客户,在做绩效管理。比如一个支行有放贷、存款等KPI指标,行长和客户经理都有各自的目标。如果某个员工进度落后,过去是靠人去看报表、再去提醒。
但现在可以怎么做?AI可以直接根据数据发现问题,然后给员工下行动指令。比如告诉他:你当前的任务完成度不够,需要跟进这些客户,甚至可以监控执行情况,比如企业要求15分钟内必须联系客户,如果没有执行,AI可以继续跟进提醒。这其实就是用数据驱动具体行为,而不是停留在看数据的层面。
爱分析:这种数据驱动执行的模式,在其他行业也成立吗?
封雷:完全成立。比如在国企场景里,一个非常重要的需求是合规。像招投标是否合规、资金使用是否合理,这些其实都可以被数据化。只要能数据化,就可以被监测。AI可以在问题发生之前,就提前发现异常,并给出预警和建议,甚至指导后续的整改动作。
也就是说,它不只是一个事后审计的工具,而是一个事前和事中的实时监管助手。
爱分析:如果从技术演进来看,要实现这种从洞察到执行的闭环,还需要哪些关键能力?
第一个,是AI员工管理平台。既然我们把Agent当成员工,那就需要一套类似HR系统的东西,去管理这些AI员工。比如它是谁、负责什么工作、有什么技能、KPI是什么、权限是什么,这些都需要统一管理。
第二个,是调度和协同机制。人和人之间是通过开会、沟通来分配任务的,Agent之间其实也需要类似的机制。它们可以相互协作、分解任务,达成一致后再执行。现在像一些Agent调度框架,其实已经在做这件事了——相当于大脑指挥手脚。
第三个,是执行和合规机制。AI可以发消息、发邮件、触发系统操作,但关键是——每一步都需要有确认、有记录。尤其是在企业场景里,很多操作是需要签字背书的,不能出现AI做错了,责任全在AI的情况。所以整个执行过程,必须嵌入到现有的流程体系中,比如OA审批、日志记录等。
封雷:可以。比如国资监管场景。上级单位发来一个问询函,说你这边有一笔资金闲置,需要解释原因。传统流程是人工去查数据、分析原因、写回复函。
但如果用Data Agent来做,可以是这样一个流程:AI先接收任务,核查是否真的存在闲置资金;然后分析原因;再生成一份回复函草稿;接着调用模板能力生成正式文件;最后走OA审批流程,由管理层确认并发送。
你会发现,这整个过程,其实就是一系列“技能”的组合:数据查询、分析、文档生成、流程审批。本质上,Data Agent的能力,就是把这些技能串起来,通过工作流自动执行。
爱分析:总结来看,您认为Data Agent未来最核心的价值是什么?
封雷:我觉得一句话可以概括:从“用数据”,走向“用数据干活”。过去,数据的价值主要体现在“看”和“分析”;但未来,它会直接驱动行动,甚至替代一部分执行工作。
而这背后,本质上是两件事:一是技能的不断积累,二是工作流的不断完善。当这两件事情成熟之后,Data Agent就真的会成为企业里的“数字员工”。
05
基模能力、Agent技术范式、客户真实场景,是Data+AI核心驱动力
爱分析:在Data+AI领域,您觉得有哪些值得重点关注的新技术或趋势?
封雷:如果从我们的视角来看,接下来有四个方向,是必须持续盯住的。
第一个,是基础大模型厂商的演进。比如像 DeepSeek、Kimi、智谱、MiniMax 这些厂商,它们能力的每一次提升,都会直接影响Data+AI这个赛道。
一方面是利好。比如模型能力更强了,成本更低了,那我们原来很难做的事情,现在可以更容易实现,整个应用层的能力会被放大;
另一方面,也可能是利空。如果基础模型已经强到可以直接完成一些数据应用,比如直接访问数据、一键生成报表,那对于我们这种数据厂商来说,就会形成降维打击。所以我们必须持续关注——模型能力的边界在哪里,以及我们自身的价值在哪里。
第二个是新的技术范式。比如像Agent调度、像龙虾这种机制,本质上是一种新的技术模式。它解决的是AI如何从理解走向执行的问题。但关键在于,这类技术到底是替代关系,还是增强关系?是会冲击现有体系,还是可以被我们吸收整合?未来一定还会不断出现新的技术范式,我们需要持续判断它们的位置和价值。
第三个是同行。不管是互联网大厂,还是垂直领域的专业厂商,我们都会持续去看他们在做什么。但我们关注的重点,不只是技术本身,而是它背后的商业逻辑。
比如,对方是在做一个自己有绝对优势的领域,还是在一个分散精力的方向上扩张?这会直接影响我们的策略。有点像打仗——如果对方在某个方向投入很大,那我们就不一定要正面硬碰,反而可以在局部场景里,用更集中资源建立优势。
第四个,也是我觉得最重要的,就是企业真实的应用场景。我们会持续去看,企业到底在怎么用Data+AI,以及用了之后产生了什么效果。不只是看我们自己的客户,也会看同行的案例。
虽然很多对外发布的内容可能有包装,但我们更关注的是背后的逻辑,为什么这个场景能成立,它的价值点在哪里。因为只要一个场景真正上线了,就说明它一定解决了某个问题。至于效果有没有达到预期,是另外一回事,但它至少是有用的。这些真实场景,会反过来影响我们的产品设计和能力布局。
爱分析:刚才您提到AI Coding,这个能力会不会对数据厂商形成直接冲击?
封雷:短期看是冲击,但长期看,我反而觉得是利好。为什么?因为它会解构软件。
以前企业要做报表,需要买一整套BI工具,还要有人会用,门槛其实不低。但现在有了AI Coding,你只需要用自然语言描述需求,就可以生成报表。这时候,企业不一定还愿意为软件本身买单,而是为能力买单。
也就是说,从买软件,变成按调用付费。你用到某个能力,就调用对应的API。这会带来一个变化——原有的软件市场格局会被打破。
这种变化,对企业本身的影响本质上是两件事:降本和增效。
一方面,企业可以减少对复杂系统和专业人员的依赖,很多工作可以直接由业务人员通过AI完成。比如在网易内部,原来一个部门要取数据,需要经过多层流程;现在通过AI,直接就能拿到数据、完成分析。
另一方面,数据的使用门槛降低之后,使用频率会大幅提升。原来只有少数人用数据,现在更多人可以参与进来。这会让数据真正产生价值,而不是停留在做几张报表的阶段。
封雷:一句话:机遇和风险并存。像BI工具、数据中台这些产品,正在经历一轮深度重构和升级。但同时,也会催生新的机会,比如技能化能力、Agent体系、数据应用闭环等。关键在于,你能不能持续进化。如果跟不上变化,很容易掉队;但如果能抓住趋势,反而有机会引领下一轮行业变革。
关键在于,你能不能持续进化。如果跟不上变化,很容易被淘汰;但如果抓住趋势,反而有机会重新定义自己的位置。