AI 成本从＂无人在意＂到＂巨大问题＂,只用了一半的 2026

写在前面：

6 月 2 日，OpenAI 办了一场面向企业客户的活动。Sam Altman 上台说了几句大实话——结果这几天科技媒体炸了锅。

他说：AI 运行成本已经成为企业客户的"巨大问题"（huge issue）。而且他给了个数据，我看完直接从椅子上坐直了——

OpenAI 最高消耗的用户，现在一个月烧 1000 亿个 Token。

Altman 给出的对比数据是：OpenAI 最高消耗的用户，从 10 万涨到 1000 亿。涨了 100 万倍。

这篇文章，我把 Altman 这次发言的完整逻辑拆给你。建议阅读 12 分钟。不需要 AI 技术背景。开搞。

一、100 万倍：Token 消耗是怎么炸的？

先给你一个时间线，你自己感受一下这个增长速度——

Altman 提到的早期数据：OpenAI 内部消耗 Token 最多的用户，一个月只用 10 万个。
2026 年现在：全球人均每月消耗 Token 已经达到 10 万个。OpenAI 最高消耗的用户，一个月烧掉约 1000 亿个 Token。

从 10 万到 1000 亿，涨了 100 万倍。而且 Altman 说，如果按线性增长预测，未来全球人均每月 Token 消耗量会达到 1000 亿。

Sam Altman 原话："今年年初的时候，成本根本不是个问题——人们完全对自己花的钱感到满意。但突然之间，这就成了一个巨大的问题。"

说白了：2026 年刚开始的时候，企业客户根本不担心 AI 花多少钱。现在，这已经是个"梗"了——企业客户都在抱怨"我一季度就把全年预算花完了"。

二、不是模型太贵，是你用 AI 的方式变了

你可能会想：是不是 OpenAI 又涨价了？

不是。是你自己用 AI 的方式变了。

早期大家用 ChatGPT，是一问一答。你问一句，它答一句，消耗几百个 Token。一个月下来，几十万 Token 顶天了。

但现在呢？AI 智能体（Agent）出现了。

你让 AI帮你写一份报告，它会自主地：查资料→读10篇网页→写草稿→自己审一遍→改一版→再审→输出最终版。
这一个任务，可能消耗几万甚至几十万 Token。
高盛的报告说：智能体 AI 相比普通 AI，Token 消耗量最高可达 1000 倍。

说白了：以前你是"打电话"给 AI，现在你是"雇了个实习生"，它自己会反复打很多电话。账单当然不一样。

真实案例（报道披露的）：

OpenClaw 创始人 Peter Steinberger 的团队，单月消耗 OpenAI API Token 达 6030 亿个，对应花费 130 万美元。
Uber 2026 年第一季度的 AI 预算就全部烧光，之后只能给员工设置硬性 Token 使用上限。
亚马逊直接关闭了内部 Token 消耗排行榜，不想再鼓励大家"比谁用得多"。

三、Altman 的三阶段论：下一个风口是"主动式 AI"

除了成本问题，Altman 这次还透了个底：OpenAI 认为 AI 产品的下一步是什么。

他提出了三阶段论：

第一阶段：聊天模型（ChatGPT 为代表）。你来问，它来答。这是 AI 落地的第一个产品形态。
第二阶段：AI 智能体（Codex 为代表）。AI 可以自主执行任务、调用工具、反复迭代。这是当前最热的方向。
第三阶段：主动式 AI（Proactive AI）。这类 AI 会持续在后台运行，不需要你主动发起请求，它自己会根据上下文判断"你现在需要什么"，然后主动提供价值。

Altman 原话："如果要为接下来一年的 AI 行业变化做准备，第三阶段是优先级最高的布局方向。"

但这里有个问题：如果当前"按请求触发"的 AI 成本已经让企业难以承受，那"持续在后台运行"的主动式 AI，成本会是什么量级？

Altman 没直接回答这个问题。但他承认：要实现主动式 AI，企业需要重新调整 AI 部署方式、重新设计安全协议、重新规划算力分配。而且这类 AI 对数据保护的要求，远高于单次对话类的 AI 请求。

说白了：主动式 AI 是下一个风口，但它会把成本问题再放大一个数量级。

四、为什么 AI 公司之前不涨价？因为他们在"买市场份额"

你可能会问：OpenAI 为什么不早点告诉客户成本会涨？

答案很简单：他们之前在亏本卖。

AI 热潮的大部分时间里，大模型公司都在把服务价格压低到运行成本之下。目的是为了换取市场份额。只要使用量有限，这个模式就能维持。

但使用量一暴涨，亏损就集中爆发了。

报道披露了一个关键数据：OpenAI 每获得 1 美元收入，约需支出 1.35 美元。亏损主要来自推理（inference）成本——也就是模型响应海量请求的成本，而不是新模型训练成本。

划个重点：AI 公司之前低价换市场的策略，在使用量有限时可以维持。但智能体出现后，Token 消耗不再线性增长，而是成倍放大，直接击穿了原有的商业模型。

现在 OpenAI 的应对方向是：优化模型性价比，帮助用户以更低的成本获得更高的 AI 使用收益。

但具体怎么做？Altman 没细说。不过从行业已经出现的变化来看，至少有三条路：

五、企业已经开始这么干了：三条降本路径

成本问题爆发后，企业并没有停止使用 AI——但用 AI 的方式变了。从"无约束扩张"转向"预算管理和效率评估"。

目前行业已经出现三类普遍变化：

路径 1：模型分层适配（智能路由）

不是所有任务都需要用 GPT-5 或 Claude Opus。

简单任务（日常写作、简单问答、常规代码辅助）→ 用低成本模型（GPT-4.1 Nano、Claude Haiku 等）
复杂推理任务（数据分析、代码生成、战略规划）→ 才调用高端模型

报道说，这种方式可以帮助团队节省 60%-80% 的成本。

路径 2：设置使用上限

Uber 在预算耗尽后，直接给员工设置了硬性 Token 使用上限。
亚马逊关闭了内部 Token 消耗排行榜，不再鼓励单纯追求使用量。
企业开始压缩重复订阅，不再同时购买多个 AI 产品。

路径 3：优化采购策略

采购更重视模型匹配度、费用透明度和使用效率，而不是"谁最强"。
投资者关注的重点，也从"AI 采用率"转向"单位经济"（unit economics）—— 也就是每花 1 美元，能换回多少实际价值。

六、几个反共识的判断

我读完所有报道，提炼了 5 个反共识判断。这些判断，你可能不会在别处看到有人这么讲。

1. AI 行业并没有进入"需求收缩期"。Altman 自己也说，AI Token 的整体用量仍会持续增长。只是行业从"早期试点和无约束扩张"，进入了"预算纪律阶段"。客户仍对 AI 有能力需求，但不再愿意为无限增长的 Token 消耗无条件买单。

2. 成本问题不是"模型太贵"，是"你的用法太贵"。同样一个任务，如果你用智能路由把简单任务分配给低成本模型，成本可以差 10 倍甚至更多。未来"会用 AI"和"不会用 AI"的人，成本效率会差出数量和级。

3. 主动式 AI 会是下一个"成本炸弹"。如果当前按请求触发的 AI 已经让企业难以承受，那持续后台运行的主动式 AI，会把成本问题再放大一个数量级。但要实现它，企业还需要解决安全、隐私、算力分配等一系列问题。

4. AI 行业的竞争重点已经从"谁的模型最强"扩展到"谁能以更低成本完成足够好的任务"。成本管控能力，会成为下一阶段的核心竞争力之一。DeepSeek 之所以能打，不是因为它"最聪明"，是因为它"足够聪明但便宜得多"。

5. 这次成本危机，反而会让 AI 行业进入更健康、更可持续的发展周期。过去那种"无约束烧钱换增长"的模式本来就不可能永远持续。现在行业被迫转向"单位经济优先"，长远来看是好事。

七、对你来说意味着什么

最后，给你几个具体建议——

如果你是企业决策者 / 产品经理：

立刻做一次 AI 成本审计：你们团队/公司每个月花多少 Token？花在哪些任务上？哪些可以用更便宜的模型？
开始设计"智能路由"策略：不是所有任务都需要用最强的模型。建立一个"任务-模型匹配矩阵"。
在采购 AI 服务时，把"费用透明度"和"使用效率"纳入评估指标，而不只是"模型能力"。

如果你是普通用户 / 学习者：

学会"提示词优化"：同样一个任务，好的提示词可以用更少的 Token 完成。
不要盲目追求"最强模型"。很多日常任务，GPT-4.1 Nano 或 Claude Haiku 已经足够好了，但价格只有高端模型的 1/10 甚至 1/20。
关注"单位经济"：你每花 1 美元 AI 费用，换回来多少实际价值？这个比例，会随着你"会用 AI"而大幅提升。

AI 不会变得更贵，但"不会用 AI"会变得更贵。

信息来源

活动：OpenAI 企业客户活动（Intelligence at Work），2026 年 6 月 2 日
发言人：Sam Altman（OpenAI CEO）
首次报道：Fello AI，2026 年 6 月 3 日
中文综合报道：华尔街见闻（腾讯新闻），2026 年 6 月 5 日
英文综合报道：The Decoder、Tom's Hardware，2026 年 6 月 4 日

—— 下一期你想让我「慢读」哪个视频/播客？

明天见。

—— 慢读 AI · AI 跑得太快，我们慢一点。