点击蓝字
关注要点AI Subscribe for More


AI正成为全球企业技术预算中增长最快的支出项,部分企业的AI投入已占据IT总支出的半壁江山。2025年企业云计算支出同比增长19%,生成式AI的规模化落地是核心驱动力,但与之形成鲜明对比的是AI投资回报的普遍滞后。德勤2025年美国技术价值调查显示,近半数企业领导者预计基础AI自动化的投资回报周期长达3年,仅28%的全球财务负责人表示其AI投资产生了清晰可衡量的价值。这种投入与产出的错位,不仅是财务层面的挑战,更是企业战略层面的考验。
许多企业迫于竞争压力不得不加大AI投入,但由于缺乏对AI经济规律的理解,导致成本失控而价值难以落地。本质上,这是传统总拥有成本(TCO)框架与全新AI经济体系的不匹配。随着词元(tokens)成为AI价值交换的核心单位,企业必须重构成本管理逻辑,将AI视为一个独立的经济系统进行治理,才能在AI时代实现可持续的价值创造。

01
词元:
AI经济的新通用货币
与云计算时代以订阅服务或虚拟机(VM)为计价单位不同,AI的所有经济活动都围绕词元展开。词元是AI模型处理数据的基本单元,从模型训练到推理(inference)的每一次交互,都以词元为计量标准,这使得AI成本天然具有高波动性和非线性特征,彻底打破了传统IT成本相对可预测的特性。词元成本的波动主要源于三大核心因素:一是非线性需求,复杂推理模型的性能提升往往伴随着词元消耗量的指数级增长,其单位任务的词元消耗远高于执行简单分类、检索任务的模型;二是使用量波动,企业在AI实验验证、工作负载迭代和提示词工程(prompt engineering)优化过程中,词元使用量会出现无规律的大幅波动;三是定价差异,不同能力等级的模型、不同基础设施提供商的算力效率差异,都会导致每百万词元的成本出现显著变化。
进一步拆解来看,词元成本并非单一的计算硬件成本,而是一系列底层技术决策的综合结果。首先是计算资源,现代GPU和高带宽内存(HBM)能够大幅缩短单词元处理时间,提升AI系统的吞吐量,但硬件采购和云租赁成本也随之大幅攀升;其次是存储系统,传统机械硬盘和普通固态硬盘的读写速度无法匹配GPU的运算节奏,会增加GPU处理延迟,进而推高单词元成本,高速分布式存储已成为降低词元成本的关键环节;第三是网络连接,GPU集群之间的超低延迟互联技术能够有效减少算力空闲周期,而传统以太网架构会导致大量算力浪费;最后是电力与设施,下一代GPU机架的功耗可达传统服务器的数倍,需要配套专用的高压供电和精密冷却系统,这些基础设施成本最终都会分摊到每一个被处理的词元中。只有理解这些底层技术与成本的传导关系,企业才能真正掌握 AI 经济的运行规律。

02
成本悖论
与AI消费模式的分化
当前AI产业出现了一个看似矛盾的核心现象:单位词元的价格持续下降,但企业的AI总支出却在快速攀升。这一悖论的本质在于,AI应用的普及带来了用户数量的爆发式增长、模型复杂度的持续提升以及工作负载强度的不断增加,三者共同推动了词元总消耗量的指数级增长,其增速远超单位词元价格的下降幅度。随着AI工作负载从试点走向规模化,企业逐渐形成了三种差异化的AI消费模式,每种模式都对应着截然不同的词元成本动态和管理逻辑。
第一种是通过打包软件(SaaS)消费AI能力。这种模式将词元消耗完全抽象化,企业只需支付固定的订阅费或按席位付费,成本可预测性最高,适合非核心业务的轻量级AI应用。但该模式的最大短板是透明度极低,企业几乎无法了解内部的词元使用效率,难以进行针对性的成本优化。第二种是通过API调用消费AI服务。这种模式下词元消耗完全透明,每一次查询都会被精确计量和计费,企业能够清晰看到每一笔支出的去向,但成本波动性也最大,提示词长度、上下文窗口大小、工作负载设计以及基础设施提供商的隐性技术选择,都会直接影响最终账单。第三种是自建基础设施运行AI模型,即“AI工厂(AI factory)”模式。在这种模式下,词元经济完全内部化,企业的词元成本由GPU配置、存储分层、网络架构和能源合同等一系列自主决策共同决定。
通过基于8GPU增量的模拟实验,量化了不同消费模式的长期成本差异:当词元处理量达到一定阈值后,本地部署的AI工厂成为成本最优的选择;在三年周期内,AI工厂相比API模式和新云(neocloud)解决方案能够节省超过50%的总成本;值得注意的是,在AI工厂的总成本中,GPU以外的成本占比约为50%,包括网络设备、电力冷却、机房设施和AI软件栈等,这一数据打破了“AI成本就是GPU成本”的普遍认知,也提醒企业在建设AI工厂时需要全面考量全栈成本。
03
企业AI成本优化
与治理的核心路径
为了避免AI成本失控,企业必须建立全流程的词元成本管理体系,从技术选型到组织治理多维度发力,实现AI支出与商业价值的精准匹配。首先是模型选型的精准适配,避免“大材小用”的资源浪费。企业应针对特定领域任务部署经过微调的小型模型,最大限度减少不必要的词元消耗,同时在数据安全和业务需求允许的场景下采用开源模型,大幅降低模型授权和调用成本。其次是工作负载设计的精细化优化,通过限制上下文窗口大小、采用提前终止(early stopping)和提示词截断等算法技术,在保证输出质量的前提下降低词元使用量。
第三是建立健全的AI治理体系,将成本管控嵌入AI全生命周期。企业应部署实时监控工具,跟踪不同业务线、不同项目的词元消耗情况,设置分级预算阈值和告警机制,并推行业务单元成本分摊(chargebacks)制度,让使用AI的业务部门承担相应的成本责任,形成内生的成本约束。第四是全面落地AI FinOps实践,将财务运营的理念深度融入AI管理。企业需要建立基于历史数据的词元需求预测模型,设定明确的AI项目ROI阈值,只有满足预设经济标准的项目才能获得审批和资源投入,确保每一笔AI支出都能产生可衡量的商业价值。
04
领导力协同:
将AI作为经济系统
进行战略治理
AI成本管理的成败,最终取决于企业领导层的认知升级和组织协同。传统的IT成本管理模式已经无法适应词元经济的高波动性和非线性特征,企业领导者必须将AI经济学提升到与能源管理、资本配置同等重要的战略高度。战略、技术和财务三大部门必须打破壁垒,实现深度对齐,共同制定AI投资策略、成本管控目标和价值衡量标准,避免出现 “技术部门盲目投入、财务部门事后算账” 的脱节局面。
混合基础设施架构将成为企业的必然选择,没有一种消费模式能够适配所有AI工作负载。企业需要根据不同任务的重要性、数据敏感度和词元消耗量,在SaaS、API和AI工厂之间进行动态调配,将工作负载部署到最具成本效益和战略价值的平台上。未来,词元经济学的掌握程度将成为企业核心竞争力的重要组成部分,那些能够熟练运用词元思维管理AI支出、将词元消耗转化为可衡量企业价值的组织,才能在AI时代的竞争中占据主动,真正实现AI技术与商业价值的深度融合。

扫码关注要点AI公众号
来源:公开信息,要点AI整理
提示:原创文章未经允许,请勿转载
免责申明:本文中所含内容乃一般性信息,包含的价格及观点仅供贵方参考,要点AI不对任何方因使用本文内容而导致的任何损失承担责任。


要点AI专注于人工智能在能源与工业领域的技术研发与应用,着力破解行业核心瓶颈与落地需求。我们通过数据赋能与深度洞察,协同产业伙伴系统研判人工智能在能源和工业系统的机遇与挑战,加速清洁能源转型。同步驱动AI算法模型、全栈技术在能源工业场景的创新研发,构建覆盖软件、硬件及系统解决方案的技术生态体系。
如您想获取更多关于能源与AI领域的最新消息,请添加相关人员或通过电子邮件,把您的要求发送给我们。

info@cycolpower.com

13884462608

你们点点“分享”,给我充点儿电吧~
夜雨聆风