写在前面:
6 月 2 日,OpenAI 办了一场面向企业客户的活动。Sam Altman 上台说了几句大实话——结果这几天科技媒体炸了锅。
他说:AI 运行成本已经成为企业客户的"巨大问题"(huge issue)。而且他给了个数据,我看完直接从椅子上坐直了——
OpenAI 最高消耗的用户,现在一个月烧 1000 亿个 Token。
Altman 给出的对比数据是:OpenAI 最高消耗的用户,从 10 万涨到 1000 亿。涨了 100 万倍。
这篇文章,我把 Altman 这次发言的完整逻辑拆给你。建议阅读 12 分钟。不需要 AI 技术背景。开搞。
一、100 万倍:Token 消耗是怎么炸的?

先给你一个时间线,你自己感受一下这个增长速度——
- Altman 提到的早期数据:OpenAI 内部消耗 Token 最多的用户,一个月只用 10 万个。
- 2026 年现在:全球人均每月消耗 Token 已经达到 10 万个。OpenAI 最高消耗的用户,一个月烧掉约 1000 亿个 Token。
从 10 万到 1000 亿,涨了 100 万倍。而且 Altman 说,如果按线性增长预测,未来全球人均每月 Token 消耗量会达到 1000 亿。
Sam Altman 原话:"今年年初的时候,成本根本不是个问题——人们完全对自己花的钱感到满意。但突然之间,这就成了一个巨大的问题。"
说白了:2026 年刚开始的时候,企业客户根本不担心 AI 花多少钱。现在,这已经是个"梗"了——企业客户都在抱怨"我一季度就把全年预算花完了"。
二、不是模型太贵,是你用 AI 的方式变了
你可能会想:是不是 OpenAI 又涨价了?
不是。是你自己用 AI 的方式变了。
早期大家用 ChatGPT,是一问一答。你问一句,它答一句,消耗几百个 Token。一个月下来,几十万 Token 顶天了。
但现在呢?AI 智能体(Agent)出现了。
- 你让 AI帮你写一份报告,它会自主地:查资料→读10篇网页→写草稿→自己审一遍→改一版→再审→输出最终版。
- 这一个任务,可能消耗几万甚至几十万 Token。
- 高盛的报告说:智能体 AI 相比普通 AI,Token 消耗量最高可达 1000 倍。
说白了:以前你是"打电话"给 AI,现在你是"雇了个实习生",它自己会反复打很多电话。账单当然不一样。
真实案例(报道披露的):
- OpenClaw 创始人 Peter Steinberger 的团队,单月消耗 OpenAI API Token 达 6030 亿个,对应花费 130 万美元。
- Uber 2026 年第一季度的 AI 预算就全部烧光,之后只能给员工设置硬性 Token 使用上限。
- 亚马逊直接关闭了内部 Token 消耗排行榜,不想再鼓励大家"比谁用得多"。
三、Altman 的三阶段论:下一个风口是"主动式 AI"

除了成本问题,Altman 这次还透了个底:OpenAI 认为 AI 产品的下一步是什么。
他提出了三阶段论:
- 第一阶段:聊天模型(ChatGPT 为代表)。你来问,它来答。这是 AI 落地的第一个产品形态。
- 第二阶段:AI 智能体(Codex 为代表)。AI 可以自主执行任务、调用工具、反复迭代。这是当前最热的方向。
- 第三阶段:主动式 AI(Proactive AI)。这类 AI 会持续在后台运行,不需要你主动发起请求,它自己会根据上下文判断"你现在需要什么",然后主动提供价值。
Altman 原话:"如果要为接下来一年的 AI 行业变化做准备,第三阶段是优先级最高的布局方向。"
但这里有个问题:如果当前"按请求触发"的 AI 成本已经让企业难以承受,那"持续在后台运行"的主动式 AI,成本会是什么量级?
Altman 没直接回答这个问题。但他承认:要实现主动式 AI,企业需要重新调整 AI 部署方式、重新设计安全协议、重新规划算力分配。而且这类 AI 对数据保护的要求,远高于单次对话类的 AI 请求。
说白了:主动式 AI 是下一个风口,但它会把成本问题再放大一个数量级。
四、为什么 AI 公司之前不涨价?因为他们在"买市场份额"

你可能会问:OpenAI 为什么不早点告诉客户成本会涨?
答案很简单:他们之前在亏本卖。
AI 热潮的大部分时间里,大模型公司都在把服务价格压低到运行成本之下。目的是为了换取市场份额。只要使用量有限,这个模式就能维持。
但使用量一暴涨,亏损就集中爆发了。
报道披露了一个关键数据:OpenAI 每获得 1 美元收入,约需支出 1.35 美元。亏损主要来自推理(inference)成本——也就是模型响应海量请求的成本,而不是新模型训练成本。
划个重点:AI 公司之前低价换市场的策略,在使用量有限时可以维持。但智能体出现后,Token 消耗不再线性增长,而是成倍放大,直接击穿了原有的商业模型。
现在 OpenAI 的应对方向是:优化模型性价比,帮助用户以更低的成本获得更高的 AI 使用收益。
但具体怎么做?Altman 没细说。不过从行业已经出现的变化来看,至少有三条路:
五、企业已经开始这么干了:三条降本路径

成本问题爆发后,企业并没有停止使用 AI——但用 AI 的方式变了。从"无约束扩张"转向"预算管理和效率评估"。
目前行业已经出现三类普遍变化:
路径 1:模型分层适配(智能路由)
不是所有任务都需要用 GPT-5 或 Claude Opus。
- 简单任务(日常写作、简单问答、常规代码辅助)→ 用低成本模型(GPT-4.1 Nano、Claude Haiku 等)
- 复杂推理任务(数据分析、代码生成、战略规划)→ 才调用高端模型
报道说,这种方式可以帮助团队节省 60%-80% 的成本。
路径 2:设置使用上限
- Uber 在预算耗尽后,直接给员工设置了硬性 Token 使用上限。
- 亚马逊关闭了内部 Token 消耗排行榜,不再鼓励单纯追求使用量。
- 企业开始压缩重复订阅,不再同时购买多个 AI 产品。
路径 3:优化采购策略
- 采购更重视模型匹配度、费用透明度和使用效率,而不是"谁最强"。
- 投资者关注的重点,也从"AI 采用率"转向"单位经济"(unit economics)—— 也就是每花 1 美元,能换回多少实际价值。
六、几个反共识的判断
我读完所有报道,提炼了 5 个反共识判断。这些判断,你可能不会在别处看到有人这么讲。
七、对你来说意味着什么
最后,给你几个具体建议——
如果你是企业决策者 / 产品经理:
- 立刻做一次 AI 成本审计:你们团队/公司每个月花多少 Token?花在哪些任务上?哪些可以用更便宜的模型?
- 开始设计"智能路由"策略:不是所有任务都需要用最强的模型。建立一个"任务-模型匹配矩阵"。
- 在采购 AI 服务时,把"费用透明度"和"使用效率"纳入评估指标,而不只是"模型能力"。
如果你是普通用户 / 学习者:
- 学会"提示词优化":同样一个任务,好的提示词可以用更少的 Token 完成。
- 不要盲目追求"最强模型"。很多日常任务,GPT-4.1 Nano 或 Claude Haiku 已经足够好了,但价格只有高端模型的 1/10 甚至 1/20。
- 关注"单位经济":你每花 1 美元 AI 费用,换回来多少实际价值?这个比例,会随着你"会用 AI"而大幅提升。
AI 不会变得更贵,但"不会用 AI"会变得更贵。
信息来源
- 活动:OpenAI 企业客户活动(Intelligence at Work),2026 年 6 月 2 日
- 发言人:Sam Altman(OpenAI CEO)
- 首次报道:Fello AI,2026 年 6 月 3 日
- 中文综合报道:华尔街见闻(腾讯新闻),2026 年 6 月 5 日
- 英文综合报道:The Decoder、Tom's Hardware,2026 年 6 月 4 日
明天见。
—— 慢读 AI · AI 跑得太快,我们慢一点。
夜雨聆风