
1971 年 8 月 15 日晚间,尼克松对着电视摄像机说了一句话,终结了一个时代。
「美国将暂停美元与黄金的兑换。」
35 美元换 1 盎司黄金的承诺,作废了。各国央行手里攥着的美元,再也换不回那块闪闪发光的金属。全球金融市场一片恐慌,但尼克松很淡定——因为他知道,黄金已经不够用了。全球贸易的体量,早就超出了黄金储备所能支撑的边界。
要么守着黄金继续当穷人,要么放开手脚让美元飞。
他选了后者。人类货币体系完成了一次不可逆的升级:从「金本位」到「美元本位」。
2026 年 5 月,AI 世界正在经历同样的事。
Token:AI 时代的「黄金」
回到 2023 年。ChatGPT 刚刚席卷全球,所有人都在学一个新词:Token。

Token 就是大模型的「黄金」。它是大模型处理信息的最小单位,是一切 AI 服务的计价基础。你问 GPT 一个问题,输入消耗多少 Token,输出消耗多少 Token,账单一清二楚。
这套体系简洁、透明、好用——就像 1944 年的布雷顿森林体系。35 美元 = 1 盎司黄金,1 百万 Token = X 元人民币。世界因此有了秩序。
在 GenAI 的「黄金时代」,Token 本位运转得很好:
你问一句,模型答一句,按 Token 数收费 输入 Token 一个价,输出 Token 一个价,缓存命中打折 简单的文本对话,消耗可预测、成本可控制
各家大厂围绕 Token 建起了完整的经济体系——阿里百炼、火山方舟、智谱 GLM、百度千帆,全都按 Token 定价,按 Token 结算。
Token 本位就是 AI 世界的金本位。它稳定,但脆弱。
「特里芬悖论」在 AI 世界重演

1960 年,耶鲁教授特里芬写了一本书叫《黄金与美元危机》,指出布雷顿森林体系有一个致命矛盾:
全球贸易要增长,就需要更多美元流通。美元要更多流通,美国就必须保持贸易逆差。但美国长期逆差,又会让人怀疑美元的含金量——凭什么 35 美元还能换 1 盎司黄金?
黄金的产量跟不上贸易的膨胀速度。最终,体系必然崩溃。
Token 本位面临一模一样的困境。
当 AI 的任务从「文本对话」升级为「全模态 Agent」,Token 这个计量单位就不够用了。
一个 Agent 任务可能长这样:
接收用户指令(文本输入,消耗 Prompt Token) 规划执行方案(推理模型,消耗 Reasoning Token) 搜索外部信息(联网搜索,消耗 API 调用 + 返回 Token) 调 Seedream 生成配图(图像生成,按「张」或按「像素量」计费) 调 Seedance 2.0 生成视频(视频生成,按「秒」或按「视频 Token」计费,15 秒约 30 万 Token,约 1 元/秒) 合成音频(语音合成,按「字符数」计费) 自我校验并输出最终结果
这七步里,每一步的计量单位都不一样。文本按 Token 算,图片按张算,视频按秒算,语音按字符算,联网按次算。
用 Token 来统一度量这一切,就像用黄金来结算石油、芯片、农产品和金融衍生品——理论上可以,但实际操作中,金价要么被高估,要么被低估。
这就是 AI 世界的「特里芬悖论」:
Agent 要发展,就需要更多模态的调用。更多模态意味着更复杂的计费。但 Token 作为单一计量单位,根本无法公平地度量不同模态的价值。
Token 的「含金量」,正在被全模态的贸易洪流冲垮。
Flow:AI 世界的「美元」
2026 年,裂缝终于出现了。
5 月 11 日,火山引擎悄悄上线了 Agent Plan,替代旧版 Coding Plan。V2EX 上有人算了一笔账:基础 Token 单价涨了 2~2.5 倍,长上下文(>128K)场景涨价 7.5 倍。
社区的第一反应是:「黑心商家又涨价了!」
但如果你理解货币史,你会看到一个不同的故事:这不是涨价,这是「脱钩」。
就像尼克松关闭黄金窗口不是为了让美元贬值,而是为了让美元摆脱黄金的桎梏,去支撑一个更大的经济体。火山引擎推出 Agent Plan,本质上是在宣告:Token 本位制不再适用于 Agent 经济。
而真正完成这套新货币体系设计的,是 ZenMux。
ZenMux 发明了一个概念叫 Flow。
Flow 是什么?ZenMux 官方文档写得很清楚:
Flow 是 ZenMux 的复合计费单位,综合了 Token 消耗量和 API 调用开销。你可以把它理解为一种货币——就像不同商品在美元中有不同的价格一样,不同的 AI 模型每次请求消耗的 Flows 数量也不同。
翻译成货币语言就是:
- Token = 黄金:
有实物对应(模型实际处理的信息量),但不同模态之间无法统一度量 - Flow = 美元:
一种抽象的复合计价单位,能把文本、图像、视频、音频的消耗折算到同一个标尺上
1 Flow ≈ $0.033(约 30 Flows = $1),这个「汇率」会根据市场状况周期性调整——就像美元不再盯住黄金,而是由市场供需决定。
Flow 本位的核心优势是:让 Agent 可以在一个统一的经济体系里,自由地调度任何模态。
你的 Agent 在规划阶段调 Claude Opus 4.6(消耗 X Flows),在生图阶段调 Seedream(消耗 Y Flows),在生视频阶段调 Seedance 2.0(消耗 Z Flows)——所有消耗都折算成 Flows,从同一个「钱包」里扣。
一个 API Key,一套计费体系,全模态自由流通。
这就是 Agent 时代的「美元体系」。
Seedance 2.0 × Seedream:全模态贸易的「石油」

在美元体系里,石油是最重要的大宗商品。美元之所以能维持霸权,很大程度上是因为全球石油贸易都以美元结算——所谓「石油美元」。
在 Flow 体系里,视觉内容生成就是「石油」。
为什么?因为视频和图像是 Agent 经济中消耗最大、价值最高、增长最快的「商品」。
字节跳动在 2026 年 2 月发布的 Seedance 2.0,是目前全球最强的 AI 视频生成模型。它的核心突破是统一的多模态音视频联合生成架构——文字、图片、音频、视频四种输入,一个模型端到端输出。马斯克看完直言「模型发展速度太快」,好莱坞导演说它「说不定真能搞砸整个行业」。
Seedream 4.0 则是字节的图像创作引擎,同样集成了 Agent 模式。通过火山引擎 API 接入后,它可以被 Agent 自动调度——先用 Seedream 生成关键帧,再用 Seedance 生成视频,全链路无人工干预。
把 Seedream 和 Seedance 串起来,你得到一条完整的视觉内容流水线:
[文本规划] → [Seedream 生成关键帧] → [Seedance 生成视频] → [音频同步]
↑ ↓
Agent 调度 ←←←←←←←←←←←←← 校验 + 交付 ←←←←←←←←←←←←←←←← 输出
在 Token 本位下,这条流水线没法跑——因为图像 Token 和视频 Token 和文本 Token 的价值根本不在一个量级。用文本 Token 去度量视频生成,就像用粮食价格去衡量石油价值一样荒谬。
但在 Flow 本位下,这一切顺理成章。每种模态的 API 调用都有自己的 Flow 价格,Agent 只需要管好自己的 Flow 余额,其他的交给市场。
套餐横评:三种「货币制度」的较量

现在市面上的 AI 套餐,本质上代表了三种不同的「货币制度」:
1. 金本位——国内 Coding Plan(正在崩塌)
阿里百炼、火山方舟、智谱 GLM、百度千帆、Kimi——这些 Coding Plan 都是 Token 本位的产物。
它们的特点:按 API 请求次数计费,只支持文本模型,严禁非编程场景使用。就像金本位时代的央行,死死守着黄金储备,限制资本流动。
当前状态:百炼 Lite 已停止新购,火山 Agent Plan 已上线涨价,智谱涨价 30%+,MiniMax 全面升级为 Token Plan。Coding Plan 正在经历自己的「黄金窗口关闭」时刻。
这些套餐月费从 ¥29(MiniMax Starter)到 ¥899 不等,但有一个共同的致命缺陷:你的 Agent 调不了生图、生视频、生语音。
2. 布雷顿森林体系——Token Plan(过渡形态)
MiniMax 的 Token Plan 和腾讯的 Hy Token Plan 是目前最先进的国内套餐。
MiniMax 是首个支持全模态的统一订阅——文本、图像、语音、音乐、视频生成,一个 Key 搞定。腾讯的 Hy3 Preview 面向 Agent 工作负载设计,支持 Coding Agent、文档自动化、多步工具调用。
这就像布雷顿森林体系——美元名义上还和黄金挂钩,但实际上已经开始往「信用货币」方向走了。Token 还是计量单位,但开始有了不同模态之间的「汇率」(比如文本模型走 5 小时滑动窗口,非文本模型走独立每日配额)。
进步了,但还不够彻底。
3. 美元本位——ZenMux Flow(新秩序)
ZenMux 的 Builder Plan 直接跳过了「金本位」和「布雷顿森林」,建立了一套完整的 Flow 经济体系:
- 统一计价:
所有模型、所有模态,统一折算为 Flows - 自由路由:
200+ 模型,一个 API Key,系统自动选择最优模型 - 弹性汇率:
Flow/USD 汇率动态调整(当前锚定 1 Flow ≈ $0.033) - 故障保险:
provider 宕机自动切换,Agent 永远看不到错误 - 套餐分级:
Pro $20/月、Max $100/月、Ultra $200/月
Agent 在 ZenMux 里跑任务,就像跨国企业在美元体系里做全球贸易——不需要关心每个国家的汇率,不需要管每种商品用什么货币结算,一切折算成美元,对账清清楚楚。
这才是 Agent 经济的终态。
Agent 调用的「外汇管制」:五条硬规则
不管你选哪套「货币制度」,有些规则是通用的:
第一,专属 Key 和通用 Key 不能混用。 百炼 Coding Plan 的 Key 以 sk-sp- 开头,走 coding.dashscope.aliyuncs.com。用错 Key 就像拿人民币去美国超市结账——系统不拦你,但会按最贵的按量价格扣你一笔。有人因此一个月多花了 5 倍。
第二,5 小时滑动窗口是真正的「外汇管制」。 几乎所有套餐都限制每 5 小时的调用量。这不是自然小时,是从你第一次调用开始计时。下午两点开始跑 Agent,三点额度用完,七点才能恢复。你的 Agent 调度器必须感知这个窗口。
第三,长上下文倍率是「关税」。 火山 Agent Plan 的 >128K 上下文 7.5 倍倍率,智谱 GLM-5 的高峰期 3 倍抵扣——这些都是针对高消耗场景的额外成本。就像进口奢侈品要缴高额关税,你的 Agent 处理大型代码仓库时,实际成本远高于表面 Token 数。
第四,视觉模态走独立计费通道。 即使你买了 Agent Plan 或 Token Plan,Seedance 生视频、Seedream 生图通常是独立计费。MiniMax 的非文本模型有独立日配额。这些视觉「大宗商品」有自己的市场价格。
第五,不是所有工具都能接所有套餐。 百炼明确禁止 OpenClaw 使用 Coding Plan,违规封号。选套餐前先确认你的 Harness 在白名单里。
我的判断:Token 是过去,Flow 是未来

货币史告诉我们一个规律:
从金本位到美元本位,不是黄金不好,是世界变大了。
黄金作为价值储存的工具依然有效,但作为全球贸易的结算单位,它的产量和流动性撑不住了。美元通过摆脱黄金的桎梏,才获得了支撑全球经济的弹性。
从 Token 到 Flow,不是 Token 不对,是 Agent 的世界变大了。
Token 作为衡量模型推理消耗的基本单位依然有意义,但作为全模态 Agent 经济的结算单位,它的单一性撑不住了。Flow 通过把不同模态的消耗折算到一个复合指标上,才获得了支撑 Agent 经济的弹性。
Seedance 2.0 和 Seedream 已经证明了全模态生产链路是可行的。当这条链路被封装进 Agent 的自动化工作流,视频制作的成本会降低一个数量级,内容生产的效率会提升一个量级。
但这一切的前提是:你的 Harness 必须支持全模态调用,你的计费体系必须能处理多模态的复杂性。
Coding Plan 做不到。Token Plan 是过渡。Flow 才是终局。
1971 年尼克松关闭黄金窗口的时候,大多数人只看到了美元贬值。少数人看到了新秩序的诞生。
2026 年 Agent Plan 上线的时候,大多数人只看到了涨价。
你看到了什么?

夜雨聆风