从投资视角学习 “B站 硅谷101《Token经济学:AI时代的新货币战争》” 视频地址: https://www.bilibili.com/video/BV1Ah556JEMC/
今天想聊一个最近在科技圈和投资圈同时引爆的话题——token 经济学。说白了就是,AI 时代的钱到底怎么流动,机会又在哪里。
我们先从一个让我觉得特别有意思的现象说起。硅谷最近流行一种新的炫富方式。不是晒豪车,不是晒期权,而是晒自己每天烧了多少 token。还有个专门的词,叫 Token-maxxing,意思是"把 token 用量拉到极限"。
这件事的导火索,是 Meta 内部曝光的一个排行榜。他们把 8 万多名员工的 AI 使用数据公开化,列出 token 消耗量最高的 250 个超级用户。上个月,这群人加起来烧了多少?60 万亿 token。粗换算一下,大概 9 亿美元的价值。排名第一的那位员工,一个人烧掉的 token 折合价值几百万美元。
几百万美元。一个人。这已经不是"用 AI 提效"了,这是用 AI 在烧钱。
但我想说,这件事从投资的角度来看,给了我一个非常强的信号 —— AI 使用的成本量级,已经大到可以影响公司盈亏了。它不再是技术预算里的一个小项,而是开始重塑整个软件行业成本结构的核心变量。一种生产要素,正在从工具变成资产。这种转变,历史上每次发生,都会带来新的产业机会。
当然,围绕疯狂烧 token 这件事,硅谷内部也有两派在吵。
支持派的代表是 Writer 的 CEO,她说这是"生死存亡级别的问题",公司内部同样设有 token 消耗排行榜,她本人亲自盯数据。Uber 的表态更具体——他们的 CTO 说,公司后端已经有 11% 的新代码由 agent 完成,三个月前这个比例还不到 1%,他的愿景是把整个软件工程转型为 agent 软件工程。
反对派的旗手是 HubSpot 的 CEO,她在 LinkedIn 上说了一句广泛流传的话:"Outcome maxxing 比 Token maxxing 更重要。"意思是,你烧再多 token,最终看的是你做出了什么结果。
这场争论本身,我觉得并不是重点。重点在于它揭示出来的结论 —— 这两派,没有任何一家公司在讨论"要不要用 AI"。他们争的,只是怎么更聪明地用。Token 的需求是真实的、不可逆的。这意味着整条供应链上,都有值得认真看的投资机会。
好,我们来说说 token 到底怎么收费,这里面有很多人不知道的细节。
很多人以为 token 计费就是单价乘数量,其实一张账单上,至少有三种不同定价的 token 在同时跑。第一种是 input token,就是你发给模型的内容,这是基础价。第二种是 cached input token —— 如果你的 prompt 之前被系统缓存过,再次调用价格只要基础价的十分之一。第三种是 output token,模型生成回答的部分,价格是 input 的整整 6 倍。
为什么 output 要贵 6 倍?因为生成是真正的算力消耗,每产生一个 token,GPU 要实时运算一次。而读取 input 相对便宜得多。所以这三者的价格比,大概是 1 : 0.1 : 6。懂得善用 cache、控制 output 长度的开发者,和不懂的人,账单差距可以到十倍以上。
而且到了 agent 任务,情况更难预测。跑一个稍微复杂的任务,token 消耗轻松达到几千万。Uber 的 CTO 自己说,公司 2026 年的 AI 预算在开年几个月内就用完了,主因就是工程师对 Claude Code 的使用量暴增。
这里还有一个很有意思的细节 —— 一家专门做 token 计费基础设施的公司,叫 Metronome,融资了 1.28 亿美元,今年 1 月被 Stripe 收购。100 人团队,做计费工具,估值追上了很多做模型本身的公司。这说明什么?在 token 经济里,"怎么算钱"本身,已经变成了一门独立的大生意。
好,现在我们来聊最核心的部分:中国模型出海。这是最近投资圈讨论最多的叙事之一,我也花了不少时间在上面。
OpenRouter 是一个聚合了 400 多个 AI 模型的调用平台,全球超过 500 万名开发者在上面,中国开发者只占 6%。但是今年 2 月,中国模型的单月 token 调用量,历史上首次过半,超过了所有美国模型加起来。而且这些调用,主要来自海外用户。
原因只有一个:价格。DeepSeek V3.2 每百万 output token 约 0.42 美元,Claude Opus 4.6 是 75 美元 —— 差距超过 170 倍。Qwen 3.5-Plus 比 OpenAI o1 便宜 23 到 45 倍。当全球开发者发现跑一个 agent 任务一夜之间可能产生数千美元账单的时候,他们开始疯狂寻找替代品,中国模型带着更便宜的成本出现了。
这让一个更大的叙事升温了:中国 token 能不能像光伏、电动车一样,成为下一个结构性出口产业?如果上一代中国出口衬衫,这一代出口电动车,下一代会是 token 吗?
背后的成本优势是系统性的。华泰证券有一句话说得很到位:"电力加算力占 token 成本结构 70% 以上,中国的低电价优势正在转化为全球 AI 服务定价权。"中国工业用电大概 0.4 到 0.6 元一度,美国要贵一倍,欧洲贵四到五倍。新疆沙漠的绿电成本甚至低至 0.2 元。通过"东数西算"战略,大量算力被引导至电力富余的西部地区,绿电被转化成 token,通过光缆传向全世界。
逻辑链条很清晰:便宜的电,变成便宜的算力;便宜的算力,变成便宜的 token;便宜的 token,出口到全世界。
市场已经开始行动了。阿里巴巴今年 3 月成立了 Alibaba Token Hub(ATH)事业群,和电商、云智能并列,CEO 吴泳铭亲自带队,整个事业群就围绕一件事:创造 token、输送 token、应用 token。就在昨天, 有新闻报道称无锡将使用国产GPU建立算力中心. 商业数据上也有验证 —— 月之暗面 2 月的 20 天收入,超过了 2025 年全年总收入;Kimi 的 ARR 已经超过 1 亿美元;MiniMax 去年营收 7904 万美元,同比增长 159%,其中 73% 来自海外。
但是,作为投资人,只看机会是不够的。风险必须正视,而且要认真看。
我说四个。
第一个是"古德哈特定律"的陷阱。经济学里有个经典概念:当一个度量标准变成目标,它就不再是好的度量标准了。已经有观察者注意到,电商平台上买方的 AI 砍价机器人和卖方的 AI 回复机器人在互相对话,双方疯狂消耗 token,平台数据看起来很好看,但这两个机器人什么交易都没达成,没有创造任何真实的商业价值。所以在做被投企业尽调的时候,token 用量一定要穿透——它背后有没有真实对应的业务产出。
第二个是对中国模型出海规模的误判。OpenRouter 能统计到的 token 消耗,只占全球大约 3%。谷歌一家公司,2025 年三季度披露的月均 token 消耗就有 1300 万亿,而中国头部模型公司在 OpenRouter 的月消耗才到几万亿量级。用 OpenRouter 的数据直接推断"中国模型全面超越美国",会造成严重的战略误判。增速是真实的,但绝对量这两点,要分开讲。
第三个是收入的脆弱性。目前 token 出海的收入,主要来自中小开发者和创业公司,这批用户切换 API 的成本极低 —— 哪个模型便宜用哪个,忠诚度很弱。每 3 到 6 个月的模型迭代周期内,必须持续保持性能领先,稍微落后,收入就可能断崖式下滑。
第四个是政策和地缘风险。token 出海本质上是数字服务贸易,数据跨过海底光缆,在中国的数据中心完成推理后再传回去,这种形式绕开了传统关税,但不代表完全规避了监管风险。中美科技博弈持续,任何对数据跨境流动或算力出口的限制,都可能影响这个商业模式。
好,最后说说我的基本判断。
token 正在成为 AI 时代真正意义上的大宗商品。人类围绕大宗商品发明过的所有商业模式 —— 期货、套利、批发零售、聚合平台、计量计费 —— 都会在 token 身上重演一遍。产业链上来看:上游的算力和电力基础设施,是最先确定受益的环节;中游的基础模型层,能持续保持性能领先的会变成真正的基础设施,落后的会被快速替换(这一层就不用说了吧, 市场会用脚投票, 看看过去涨疯的头部厂商);下游应用层和计费基础设施,离用户最近,离货币化也最近。
定价模式本身也在进化 —— 从按 token 数量计费,到按任务复杂度计费,再到按任务完成度计费。这和能源行业从原油定价到汽油定价再到按续航里程定价的演进路径,惊人地相似。谁先完成从"卖 token"到"卖结果"的跨越,谁就拿到了这个市场的定价权。
唯一不同的是速度。石油产业这套演化用了几十年,token 经济的相同演化,正在几个月内发生。
这场游戏才刚开始,但产业结构的雏形,已经清晰了。
本文不构成投资建议。
夜雨聆风