
最近,硅谷流传着一则让人既震惊又哭笑不得的消息:Uber在内部AI工具的应用上“用力过猛”,短短四个月就烧光了全年7000万美元的API预算。后果很直接——HR在接到招聘需求时,被要求必须追问业务部门一句话:“你招这个人,一个月打算烧多少token?”每位员工每月的AI工具预算也被强行压到了1500美元。与此同时,知名科技观察家“黄仁勋”抛出了一个更具冲击力的论断:“一个年薪50万美元的工程师,就应该额外给他配25万美元一年的token预算。”
这个看似段子的场景,撕开了一个横亘在所有企业面前的现实:当调用大模型的token费用,开始与人类员工的薪酬成本同台竞技、甚至反超时,我们的成本结构、组织形态乃至未来经济的支柱产业,都将被重写。
中国会“Token超支”吗
乍看之下,Uber的教训是美国科技公司过度“氪金”的极端案例。但细想之下,这股浪潮在中国的到来只会更猛烈、更底层。
首先,中国的人力成本虽然在绝对数值上低于硅谷,但顶尖AI工程师、算法专家的年薪同样在百万元级别,且行业内卷严重,企业提升人效的紧迫感远高于美国。当“勋子”提出给高薪工程师配发相当于年薪50%的token预算时,内在逻辑并非炫富,而是资本配置的理性拐点:一个顶级工程师的智力产能如果被AI工具成倍放大,那么为这种“智力杠杆”买单的token支出,就不再是消耗品费用,而应被视为对核心生产资料的资本性支出。
其次,中国企业对AI的落地节奏正在从“尝鲜”进入“深水区”。从互联网大厂的全员代码Copilot,到金融机构的智能投研、游戏公司的AIGC流水线,大模型正从辅助聊天框嵌入到每一个业务流程的毛孔中。一个中级开发工程师让AI全天候审查代码、自动生成单元测试;一个运营人员让Agent批量产出数千条个性化文案并自动投放——这些动作背后,token都在以毫秒为单位被高速消耗。杰文斯悖论在这里发挥得淋漓尽致:模型推理单价越来越低,但调用频次和场景呈指数级爆发,总账单最终失控。
可以预见,在中国,HR未来在核定部门预算时,“人力成本+token配额”打包核算将成为标配。如果一个业务单元只申请招人,却说不出预期的token消耗和智能体配置,那就像今天申请办公司却不报网费一样荒唐。而1500美元/月的个人AI预算,按国内高强度使用场景(尤其多模态、长上下文任务)来看,很可能只是一个起步价,后续会被各种“超额申请”打破。
Token大潮中的受益者
当整个社会都开始为token疯狂支出时,第一波确定性的受益者,是那些能够提供高性价比、高可靠性token的基础设施型企业。这类似于淘金热中卖铲子和牛仔裤的人,但它们中的佼佼者,会进化成新时代的能源寡头。
国产AI芯片与算力服务商受制于外部封锁,中国推理芯片和算力集群必须走自主化道路。未来谁能提供单位功耗下更高token吞吐、更低成本的芯片或算力方案,谁就掌握了印钞机。像海光、寒武纪,以及华为昇腾生态的深度合作伙伴,将承载全社会的token洪流。它们未必直接面向每一个开发者,但会是所有MaaS平台的“电力来源”,成为数字经济的底座。
云计算大厂与模型即服务(MaaS)平台阿里云、百度智能云、华为云、腾讯云和字节火山引擎等,已经把大模型API作为云服务的新核心入口。但更有潜力的,是一批专注做极致推理优化的“模型路由层”企业(例如无问芯穹、硅基流动等)。它们不一定要自己炼大模型,而是在应用和底模之间做智能调度、量化压缩和负载均衡,让企业用最少的钱跑最多的任务。这种帮企业“管住token账单”的平台,会在预算控制意识觉醒后异军突起。
AI FinOps与成本可视化工具Uber的狼狈恰好暴露了一个蓝海市场:企业对token的消耗几乎是“黑盒”。将来每一家公司都需要类似CloudHealth之于云计算那样的工具,实时监控每个部门、每个项目、甚至每个Agent的token消耗,设置预算预警,进行模型降级策略配置。能提供这类“AI财务控制面板”的创业公司,会变成大企业的刚需采购。
“用Token创造Token”的超级应用
卖铲子的人赚钱,但真正撑起一个时代经济的,永远是那些用铲子挖出金矿、并彻底改造了产业的群体。未来经济的支柱,不是那些拥有最多token的公司,而是那些能够将token高效转化为十倍、百倍商业价值的企业。 它们通常具备“高知识密度、高人效杠杆、高场景覆盖”的特征,分布在上、中、下游三个层级:
上游:掌握“模型飞轮”的全栈AI公司DeepSeek等企业已经证明,通过架构创新和极致工程优化,训练和推理成本可以指数级下降。这种能力使它们不只卖模型,而是在定义一个成本边界。未来凡能将模型迭代、推理成本控制和上层应用生态打通的企业,会成为规则的制定者。它们未必直接服务终端客户,但整个经济体的智能化成本,都被这类公司定下的基线所锚定,影响力足以贯穿所有行业。
中游:AI原生专业服务“超级个体组织”传统上,律师、咨询师、审计师、医生等按小时或按项目计费,人力成本极高且难以规模化。现在,一个有25万美元token加持的律师团队,可能只需要原来三分之一的人力就能处理跨国并购尽调、海量合同审查和诉讼策略推演。中国如果能涌现一批“AI律所”“AI投顾公司”“AI医疗影像联合体”,它们将用token重塑专业服务,把原本昂贵稀缺的顶级知识服务做成可复制、可订阅的标准化产品,并凭借成本优势出海,成为新经济的出海主力。
下游:将物理世界与AI深度融合的产业巨头智能汽车、机器人、智能制造是token消耗的无底洞,同时也是价值创造的终极高地。一台L4级自动驾驶车辆,每天感知、规划、决策消耗的token量惊人。但这些token不会白白烧掉,它们换来的是取代司机的运输效率、拯救生命的主动安全和大规模调度的城市交通优化。同样,在工厂里,为机器人配备的“视觉-语言-动作”多模态token,正把老师傅的技艺沉淀为可即时调用的大模型。能够率先跑通这些闭环的制造企业和解决方案商(如比亚迪、理想、华为车BU,以及一众机器人独角兽),将成为承载实体经济升级的核心柱石。
Token回报率管理能力
未来的顶梁柱企业,无论是做SaaS还是做实体产品,它们的CFO和CTO都必须协同回答同一个问题:每额外花费1万元token,能否带来超过1万元的人力节省、收入增长或风险降低?那些能将“Token ROI”做到行业顶尖,并内化为组织肌肉记忆的公司,会像今天善于投放信息流广告的DTC品牌一样,在效率战争中碾轧对手。
当Uber的HR把“一个月烧多少token”挂在嘴边时,它无意中揭示了一个历史性转折:人类社会的生产函数正在重新书写。 过去的资本是土地、设备和人力,现在,token作为一种可精确度量、可无限复制、可线性放大的“智力资本”,正式登上了财务报表的中央。
对中国而言,这既是挑战,也是弯道超车机遇。拥抱token经济、投资基础设施、培养“AI+token”复合人才的企业,将站在下一轮经济周期的顶端。毕竟,未来属于那些把计算成本转化为真实生产力跃迁的先行者。
夜雨聆风