乐于分享
好东西不私藏

AI从试点走向系统工程:13倍规模化差距背后,企业软件的新变量

AI从试点走向系统工程:13倍规模化差距背后,企业软件的新变量

字数 5422,阅读大约需 28 分钟

AI从试点走向系统工程:13倍规模化差距背后,企业软件的新变量

IBM商业价值研究院(IBM Institute for Business Value)和迪拜未来基金会最新发布的《AI in motion》报告,前瞻性的提出了AI应用端的问题:AI部署速度已经跑在治理体系前面。

IBM IBV 与迪拜未来基金会在2025年四季度至2026年一季度,对20个国家、23个行业的1,006名负责AI战略、交付或治理的企业高管做了一项问卷调研。结果显示,近七成受访高管表示,他们缺乏对团队正在使用哪些AI、以及这些AI在哪里运行的完整可见性;只有27%的组织知道AI资产具体部署在哪里,只有18%的组织维护完整的AI资产清单。对于一家年收入200亿美元的企业,AI异常、偏差、重复建设和治理缺口带来的隐藏损失,报告估算每年约1.4亿美元,其中约一半直接来自治理不足。

这不是“有没有AI”的问题了。企业过去两年忙着接入大模型、建设AI助手、上线Agent流程,现在开始进入下一阶段:这些AI资产能不能被看见、被控制、被切换、被审计,最后能不能稳定贡献利润。

最有意思的地方在于,它没有把AI治理写成一套合规清单,而是提出一个更偏工程化的概念:orchestration-led governance,可以理解为“编排式治理”。也就是说,治理不再只是PPT里的原则、审批表里的流程,而要进入模型调用、数据访问、Agent执行、工作流决策和跨境部署的运行层。AI真正规模化后,企业需要的不是多买几个模型,而是把模型、数据、Agent、权限、审计和业务流程编成一个能持续运行的系统。

AI规模化进入编排时代

报告里的关键信号:AI开始从“应用竞赛”进入“控制力竞赛”

这份报告的样本受访者包括Chief AI Officer、CIO、CTO、CDO、CISO、首席风险官、总法律顾问以及AI治理负责人。报告里有几个数字,可以作为理解企业AI下一阶段的起点。

使用编排式治理的组织,AI规模化的可能性高出13倍;AI异常成本低29%;AI带来的收入提升高15%;认为AI投入“物有所值”的概率高44%。在更靠后的章节里,报告还提到,采用这种方式的组织AI投资ROI高20%,员工信心和外部信任也明显更高。

图1:AI规模化的分水岭

这几个数字背后的含义比较清楚:企业AI正在从“点状工具”变成“数字劳动力组合”。过去,一个HR助手、一个营销文案模型、一个客服机器人,各自上线、各自看效果,问题还可以局部处理。现在很多企业开始接入Agent,让系统自动读数据、做判断、调用工具、跨部门推进任务,AI就变成了一套会不断扩张的操作系统。

一旦进入这个状态,原来的项目制治理就会失效。每个项目都能说自己合规,每个团队也都有合理理由上线AI工具,但合在一起,企业可能完全看不清自己到底有多少AI资产、哪些模型在处理敏感数据、哪些Agent有权限调用外部工具、哪些输出正在影响客户和员工。

报告把这种状态称为AI sprawl,直译是AI漫延。这个词很准确。它不是单个团队犯错,而是很多看似合理的局部选择叠加在一起,最后变成一个企业无法完整掌握的AI资产组合。

这里对投资者也有启发。过去市场讨论企业AI,常见问题是“谁的大模型更强”“谁的推理成本更低”“谁有更多AI应用”。但从企业采购预算看,接下来会越来越多出现另一类支出:如何把分散的模型、Agent、数据和权限管起来,如何证明AI带来的ROI,如何让AI系统在监管、主权和安全边界内稳定运行。

这会把机会从模型层,外溢到企业软件、混合云、身份安全、数据治理、模型观测、AI评测、工作流自动化和行业解决方案。

编排:AI系统需要一个运行中的控制层

报告对“编排式治理”的定义,有一个很实用的表达:把控制放在AI真正运行的地方。

过去企业治理AI,通常是先写原则,再建立审批,再做合规检查。这个模式在传统IT项目里还能工作,因为系统变化慢、流程边界清楚、责任人相对固定。到了Agentic AI阶段,系统会自主行动、实时调用工具、跨数据源协作,很多决策发生在机器速度下。单靠事后检查,很难跟上。

编排层做的事情更像AI系统的“空管中心”。它不只是记录谁用了哪个模型,还要决定请求该交给哪个模型、哪个Agent可以调用哪个工具、哪些数据能被访问、输出是否需要人工复核、是否触碰主权或合规边界、出了问题能否快速追溯并撤销权限。

报告提到,完整采用编排方式的组织,AI生产率影响是只重视合规路径的6倍。这个差距的解释并不复杂:合规能减少事故,但不能自动提高产出;编排把治理放进系统运行层以后,企业可以动态把预算分配给有效项目,淘汰低效模型,复用可信数据和流程,减少重复审批和重复开发。

IBM在报告里也举了自己的内部案例。IBM Office of Privacy and Responsible Technology把隐私审查、数据来源检查、AI风险管理等原本分散的治理能力集中起来,覆盖数据和模型从来源、审批、开发到复用的完整生命周期。结果是,第三方数据集的数据清理请求处理时间下降58%,内部数据下降62%,超过2000个数据集和模型被批准复用。

这说明治理不一定天然拖慢创新。治理如果只是在最后一道门口做拦截,确实会变成瓶颈;如果提前进入架构、进入平台、进入数据和模型生命周期,它反而会缩短团队寻找可信数据、重复审批和处理例外情况的时间。

这个变化对企业软件厂商很关键。未来的AI平台如果只是“能接大模型”,优势会越来越弱。企业更需要的是:能管理多模型、多Agent、多工具、多数据源、多权限,以及多区域监管要求的系统。

AI漫延的成本:看不见的资产,会吞掉ROI

企业AI预算上升很快,报告预计到2030年,组织管理的AI资产数量接近现在的4倍,平均AI投资预计增长138%。同时,三分之一左右的高管已经怀疑部分AI投资被浪费,当前投入使用的系统中,少于一半达到了预期业务效果。

这组数字放在一起看,会出现一个很现实的问题:AI投入越多,复杂性也越高;复杂性如果没有被治理和编排吸收,投入增加未必带来更高ROI。

图2:AI漫延的代价

报告把高蔓延、低可见性的组织和低蔓延组织做了比较:前者AI带来的收入影响低22%,经营利润影响低19%,生产率提升低17%,Agentic AI规模化成功率低11%。这几个指标更接近企业管理层和资本市场真正关心的结果。

也就是说,AI项目是否成功,不能只看上线数量。企业可能有很多AI助手、很多模型调用、很多试点项目,但如果缺少统一资产清单、统一身份权限、统一监控评测、统一数据治理和统一成本归因,最后会出现两个问题。

第一,低效资产难以及时下线。很多AI项目看起来有使用量,但没有清晰的ROI衡量,也不知道是否重复建设。企业会在多个团队之间重复采购、重复开发、重复接入相似能力。

第二,风险会从局部变成系统性问题。一个模型输出偏差,可能影响一个客服场景;一个Agent权限设计不当,可能跨越多个系统;一个数据驻留规则处理不清楚,可能直接影响跨境业务和客户交付。

报告里有一句判断很适合概括这个阶段:企业可以完全合规,同时仍然完全碎片化。每条规则都遵守了,但没有系统一致性,AI资产组合依然不可控。

这也是为什么“合规”不能被当成终点。合规是底线,编排才是让AI规模化持续产生价值的中间层。

主权AI为什么突然变重要:数据在哪里,业务边界就在哪里

这份报告由IBM和迪拜未来基金会共同发布,这个组合本身也有意味。迪拜未来基金会代表的是政府、城市和国家层面对AI治理、主权和未来基础设施的关注。报告开篇提到,主权意味着知道数据住在哪里、控制系统如何运行、保留不依赖外部的行动能力。

对普通企业来说,“AI主权”听起来像国家战略词汇,但落到业务上很具体:数据能不能离境,模型能不能在本地运行,客户数据是否进入外部模型,Agent调用外部工具时是否跨越监管边界,供应商是否能在不同司法辖区下提供一致的控制能力。

报告显示,93%的高管已经把主权因素纳入战略;70%的高管表示必须持续追踪数据所在地;71%预计到2026年这一点会更加重要。Agentic AI让这个问题更紧迫,因为Agent不会像传统项目那样等人逐项审批,它可能自动调用API、跨系统读取数据、把任务分派给不同模型或外部工具。

这会推动企业AI架构从单一云、单一模型、单一应用,走向更开放、更模块化、更混合云的结构。报告也提到,62%的高管认为开放、安全内建的架构是必要条件。开放不是放任,混合也不是分散;真正的目标是企业能在不同模型、不同部署环境、不同区域规则之间切换,同时保留统一身份、权限、审计和治理能力。

这条主线对投资者很重要。企业AI的长期预算,不一定全部流向基础模型。相当一部分会流向“主权可控”的基础设施:混合云、私有化部署、数据治理、访问控制、可观测性、审计、模型路由和跨区域合规能力。对于服务政府、大型金融、医疗、能源、制造等行业客户的软件和云厂商,这类能力会变成销售中的关键变量。

有效AI平台的八个标志:企业客户到底会买什么

报告列出了高管眼中有效AI平台的标志。排在最前面的,是“通过中央编排层管理数据和模型交互”,占比76%。后面依次是持续优化和整合AI Agent、监控单个Agent表现和影响、透明/互操作/可访问、开放且安全内建的架构、按任务动态选择和切换模型、代理与模型之间无缝集成和通信、自动把任务分配给合适Agent。

图3:有效AI平台的八个标志

这张图其实把企业AI平台的采购方向说得比较清楚。

企业不想被单一模型锁死。模型能力迭代很快,价格也在变化,业务场景对模型的要求并不一样:有的任务需要强推理,有的任务需要低成本,有的任务需要本地部署,有的任务需要可解释性更强。平台需要根据任务动态选择模型,也需要让企业保留切换能力。

企业需要管理非人类身份。每个Agent都可能像一个“数字员工”一样拥有权限:读数据库、调用工具、写入系统、触发流程。报告强调,每个Agent都需要非人类身份、明确所有者、委托权限和最小权限访问,并且可以实时撤销。这会让身份安全和访问管理从“人”的权限,扩展到“机器和Agent”的权限。

企业需要更细的观测和评测。传统软件监控关注系统是否可用、延迟多少、错误率多少。AI系统还要看输出质量、偏差、幻觉、漂移、成本、ROI、用户采纳、风险事件。Agent多了以后,还要看一个Agent在整个任务链条中的实际贡献和风险。

企业需要把治理嵌入流程。AI治理如果只是法务、合规和风控部门的文件,距离业务太远。真正能产生效果的治理,需要变成平台要求、工程规范、供应商合同条款和运行时规则。

从投资框架看,这意味着企业AI系统层会出现几个相对清晰的方向:AI编排平台、AI治理与风险管理、身份安全、数据治理和主权云/混合云、行业工作流自动化。

图4:企业AI的系统层机会

产业链映射:从“模型层想象力”到“系统层兑现”

过去两年AI行情的主线,更多集中在算力、GPU、云资本开支、基础模型和应用爆发。企业AI进入规模化阶段后,预算结构会更细。

第一类是平台和编排层。这个环节负责连接模型、Agent、工具、知识库、业务系统和审批流程。它的价值不在于自己生成内容,而在于让不同AI能力按业务目标协同运行。企业客户越大,场景越多,编排层越重要。

第二类是治理和风险层。AI资产清单、模型登记、版本管理、输出评测、偏差检测、审计追踪、合规报告、供应商风险管理,都会从“最好有”变成“必须有”。报告显示,只有18%的组织维护完整AI库存,这意味着未来补课空间很大。

第三类是身份和安全层。Agent数量增长后,非人类身份会变成新的攻击面。谁授权、授权多久、能否访问敏感数据、能否调用外部系统、能否被实时撤销,这些会影响企业是否敢把AI从辅助工具推进到核心流程。

第四类是数据和主权层。大型企业、政府客户和受监管行业,会更加重视数据驻留、私有化部署、混合云、跨区域规则适配和供应商可替换性。AI系统越深入业务,数据在哪里、模型在哪里运行、日志和审计如何保留,就越影响业务边界。

第五类是行业应用层。报告里的UFC案例很典型。UFC需要在直播和内容场景中,快速从几十年赛事数据中生成有依据的实时洞察。它采用的不是单一模型,而是由编排层在结构化查询、生成式模型、检索系统之间路由问题,并给出可解释和质量评分。早期估算显示,查询生成时间下降约40%,洞察数量接近增加3倍。

这个案例说明,行业AI应用真正进入生产环境,往往不是一个模型直接替代人工,而是多个工具协同:数据查询、检索、生成、评估、审核和发布。编排层把这些能力串起来,治理层保证输出可信。

财报里可以怎么验证:看收入质量,而不只看AI叙事

这类主题在资本市场里容易被讲得很虚。投资者后续可以看几个更具体的验证指标。

一是AI相关订阅收入或ARR增长。企业软件公司如果把AI编排、治理、观测能力打包进平台,最直接的体现是高阶版本、附加模块或AI相关订阅收入增长,而不只是发布更多AI功能。

二是大客户渗透率和续约率。编排式治理更适合大型企业、政府和受监管行业。如果相关产品能进入这些客户的核心流程,合同期限、续费率、扩容率会比普通工具型AI应用更有含金量。

三是安全、身份、数据治理产品的attach rate。AI功能如果带动身份权限、数据治理、风险管理、可观测性模块一起销售,说明客户真正开始把AI当成系统工程,而不是单点试验。

四是混合云和私有化部署订单。主权AI和数据驻留要求提升后,能够在公有云、私有云、本地环境之间提供一致治理能力的厂商,会更容易吃到受监管行业预算。

五是企业自身AI ROI披露。报告强调,低可见性和高蔓延会侵蚀收入、利润和生产率。上市公司如果能披露AI带来的成本节约、流程效率、客户转化、人员产能和风险下降,市场对其AI投入的信任度会更高。

风险:这个方向不会线性兑现

企业AI编排和治理的方向成立,不代表所有相关公司都会顺利兑现。

首先,客户预算可能延后。很多企业已经在AI试点上花了不少钱,短期会更谨慎,采购流程也可能拉长。治理类产品虽然必要,但通常需要跨IT、安全、法务、业务部门协同,销售周期不会短。

其次,平台竞争会很激烈。云厂商、传统企业软件厂商、安全厂商、数据平台、MLOps和新兴AI原生公司,都可能向编排和治理层延伸。最后谁能拿到预算,要看既有客户基础、集成深度、行业能力和生态位置。

第三,标准还在变化。AI评测、Agent权限、模型审计、跨境数据规则、行业监管要求都在演进。过早绑定某一套技术路线,可能带来迁移成本。

第四,ROI仍然难量化。报告给出了高层数据,但落实到单个企业、单个产品和单个行业,收益差异会很大。投资者不能只看“AI治理”标签,更要看客户是否真实付费、是否扩容、是否形成长期订阅。

阶段判断

《AI in motion》这份报告的价值,不在于告诉企业“应该重视AI治理”这么简单。它更像是给AI产业周期补了一块拼图:当企业AI从试点走向规模化,真正稀缺的能力会从单点模型能力,转向系统级协调和持续控制。

模型仍然重要,算力也仍然重要。但在企业真实场景里,一个AI系统能不能跑进核心流程,取决于它是否可见、可控、可切换、可审计,能否在不同地区、不同业务线、不同合作伙伴之间稳定运行。

这也是“编排式治理”值得关注的原因。它把AI从分散工具变成企业能力,把治理从制度语言变成平台行为。对于企业来说,这是AI从试点走向生产的必经阶段;对于投资者来说,这意味着企业软件的下一轮AI机会,可能更多藏在编排、治理、安全、数据和行业流程里。

后续市场会继续讨论更强的模型、更便宜的推理、更大的算力集群。与此同时,企业客户会用真金白银投票:谁能让AI在复杂组织里稳定运行,谁才更接近AI规模化的预算中心。


数据来源:IBM Institute for Business Value、Dubai Future Foundation,2026年4月《AI in motion: Orchestrating AI at scale for sovereignty and resilience》。

风险提示:本文为研报解读与产业链分析,不构成任何投资建议。文中涉及公司仅作为产业链和研报观点映射,投资需结合估值、财报、竞争格局和自身风险承受能力。