
图片来源:豆包生成
随着token支出不断攀升,甚至远超预期,美国企业界整合和应用AI的方式正在发生改变。同时改变的还有企业AI支出模式。
过去两年,大多数企业一直默认使用最前沿的AI模型,无论处理的任务复杂程度如何。但随着AI支出远超预算,企业开始质疑是否每个任务都需要最顶级的模型。在此背景下,致力于解决低效AI支出问题的模型路由(model routing)受到企业界的关注。
一方面企业界的AI消费方式正在发生改变,另一方面,OpenAI和Anthropic等头部AI供应商的收入和估值或将面临负面影响。一些业内人士甚至预测,企业从不计成本追捧最前沿的AI模型转向模型路由或将重塑AI行业的竞争格局。
一、企业AI支出或将锐减
模型路由是一种将复杂程度不同的任务与不同模型相匹配的工具,将复杂任务分配给功能最强大(通常也是最昂贵)的模型处理,简单重复的任务则分配给更经济、更快捷的模型。这意味着如果模型路由在企业界得到普遍采用,企业AI支出将大幅下降。
推动模型路由兴起的主要因素是许多企业AI支出已经远超预算,甚至令一些大型科技公司感到措手不及。思科首席产品官Jeetu Patel举例称,假设每位员工每周使用token的成本约为 200 美元,那么每人每年大约需要花费1万美元。一家拥有9万名员工的公司,每年的token成本就高达9亿美元。
Patel表示,思科的实际token支出已经远超预算,目前有3万名工程师在开发主要基于AI的产品。思科已重新分配资源,在所有支出项目中,将优先考虑token支出。
开发编程智能体Devin的Cognition公司CEO Scott Wu近期对媒体表示,目前普通的模型完全可以胜任许多日常重复性工作,并实现五至十倍的成本效益提升。据Wu介绍,Cognition推出了一项名为“保障AI生产力”(AI productivity guarantee)的计划,旨在估算智能体实际节约的人类劳动时间,提高投资回报率。Wu指出,企业应该追求产出,而非以token用量或代码行数衡量的活动指标。
但当前大多数公司尚未采用模型路由。企业AI平台Glean CEO Arvind Jain估计,当前大约95%的企业AI应用仍运行在最昂贵的尖端模型上,包括那些使用低廉的AI模型也能轻松完成的任务。
二、AI巨头估值面临挑战
从经济角度来看,模型路由极具吸引力。OpenAI的GPT-4模型每百万token的输出成本可能高达60美元,但该公司较小的模型每百万token的成本低至0.40美元。当每天需要处理数百万次查询时,这种成本差异会更加明显。
但对于OpenAI和Anthropic而言,模型路由或将对其商业模式构成生存性挑战。两家公司的业务模式都建立在市场愿意持续为高端模型服务付费的基础上。但模型路由动摇了这一价值基础,直接影响了曾经支撑两家公司高估值的收入来源。
受到负面影响的不止AI供应商的收入。模型路由会促使企业与多家AI供应商保持合作关系,从而降低供应商锁定效应。如果企业已经在GPT-4、Claude和小型模型之间进行路由切换,那么更换供应商将变得轻而易举。
OpenAI和Anthropic原本以为自己正在构筑的护城河,即企业与其旗舰模型深度集成,可能会因为这些模型变成路由表中的众多选项之一而瞬间瓦解。
一些AI供应商已经开始调整策略。比如微软和谷歌在这方面具有天然优势,它们提供的集成解决方案,能够将模型路由功能嵌入更广泛的云平台。但像OpenAI和Anthropic这样的纯AI公司则面临更大的挑战——它们需要找到更好的AI变现模式,而不仅仅是依赖算力周期。
三、市场定价权转向买方
不过Patel表示,模型路由不会导致头部AI厂商被市场抛弃。相反,前沿模型仍将具有价值。但他认为AI服务的定价模式正在发生变化。头部AI厂商要想站稳脚跟,必须提高模型的使用效率,而非一味地提高收费。
随着AI成本不断攀升,企业的做法已从过去的“是否会继续投入”转向“找到更明智的支出方案”。这在一定程度上表明,AI市场的定价权正在从销售高端AI产品和服务的公司转向购买这些服务和产品的公司。
模型路由的兴起标志着企业级AI市场正在走向成熟——从试验阶段迈向优化阶段。头部AI企业依旧能够凭借复杂难题的攻克能力保持溢价,但问题是其他常规类任务的处理需求占比有多大?这个问题的答案将在很大程度上决定头部AI企业的估值。
文章仅供学习分享
参考资料
1.CNBC. Model routing is a fix for AI overspending. That’s a problem for OpenAI and Anthropic
2.The Tech Buzz. Model Routing Threatens OpenAI and Anthropic's Revenue Model
3.Frank’s World. The Rising Trend of Model Routing in AI: What It Means for the Industry
夜雨聆风