对AI token工厂的理解

前言

黄仁勋在GTC 2026主题演讲中宣告：AI已全面迈入“推理与智能体时代”，未来数据中心将成为生产Token的“AI工厂”，每瓦电力生成的Token数量将决定商业命脉，预计到2027年英伟达将实现至少1万亿美元营收。怎么理解这个AI token工厂呢？

Token的供应商 – 云

主要有三类

•

传统云厂商主要针对消费市场，token便宜比模型能力更重要。就像是10-15万元的家用汽车市场。主要供应商是互联网厂商，有主业造血功能，有云建设和运营经验，可以依托自有业务，把AI嵌进去。例如字节可以做AI短视频，腾讯可以做AI助手，阿里可以AI带货，都可以互相渗透。

这样就可以理解，为什么说剩下的某些厂商，会被淘汰了。

北美也是如此。Google的token消耗量全球断层领先 (2025/6，巴克莱报告，google token消耗一年增长50倍，是微软/ChatGPT的6倍)。但是实际上，他是把AI嵌入后台业务，并非用户主动选择，用户是用也得用，不用也得用。

•

专门的GPU云例如某厂商，号称对标coreweave.当Token工厂的软硬件逐渐成熟，标准化，这些厂商会越来越没有前途。因其本质上，跟建房招租没有任何区别。除非，他利用风口赚到的钱，及时转型。在早期，必然是用赚到的钱，继续建新机房。但是后期，大概率要走上自己建机房，自己运营，精耕细作的道路。

•

普惠算力政府主导，国产替代，由于EUV光刻机的技术瓶颈限制，被制约了实际应用。但是，这是催熟国产必须付出的代价。

Token工厂的客户 – AI应用

•

传统的客户分类大家习惯粗略的按照企业市场和消费市场来划分

•

企业市场：各种公司

•

消费市场：普通消费者实际上这种划分是延续了以前电子产品，软件产品等的客户划分方式。但是对于token工厂，这样划分是不合理的，并没有充分考虑其独特的技术特点。

•

影响AI应用落地的主要技术特点 – 数学上不可解释大模型数学上的不可解释性问题，过于学术，不细说了。那么，针对此现状，要怎么办呢？大模型是一匹脱缰的野马，Claude最新大模型Mythos号称在未经专项安全训练的情况下，涌现出发现数千个零日漏洞，并自主编写完整利用链的能力，覆盖所有主流操作系统和浏览器，就是典型的案例。现在能做的，就是给他套上马具(Harness)。

AI发展到如今，已经迭代过至少三代了。大模型：RNN->transformer->MoE工具软件：webpage(仅对话)->app(仅建议)->agent(直接操作文件)软件控制：prompt(怎么对话)->context(怎么长久对话)->harness(怎么有效对话)可以看到，能力是越来越强，但是约束也越来越多。

既要AI跑，又要Harness，就是因为在绝大多数领域，AI暂时还是锦上添花。在效率改进和风险这一对矛盾中，风险暂时还是矛盾的主要方面。即，我可以不用，但是用了，千万不能捅个大漏子。

怎么去评估到底能不能用呢？这里有一个现成的思路：制造业的FMEA - Failure Mode and Effects Analysis

给它评一个风险指数=风险概率x风险后果，风险指数不同，用户使用AI的意愿完全不一样。

•

娱乐业例如视频生成，简直就是完美的试验场，就算视频有点穿模了，都成了六指，有什么关系呢？相比砍掉大牌明星的代言费，这点小事是可以忽略不计的。谁看个15秒的广告，还关心主角是五指还是六指，大家想看什么，是很清楚明白的。

•

自动驾驶很多人谈到自动驾驶，就认为人命关天，一定是小心谨慎的使用AI，但是这又与观察到的事实不符。原因是，自动驾驶把汽车和障碍物，都看做刚性的黑盒子，不需要柔性处理(例如用机器手去拿一个丝巾，丝巾在风中形状不断变化)，所以技术相对简单，只要你算的够快就行(虽然算的够快也不是那么容易)。路边窜出一条狗，只有3秒的响应时间，你算的够快，刹车够快，就没有问题。

•

制造业工厂只是在产线照相，OCR识别不良品，大不了就是良率下降，影响不大。但是要用在工厂数据底座上，例如数据库，那还是要谨慎，整个工厂全宕机的经济风险，或者数字底座整体迁移的痛苦，实在承受不了。

•

医疗，法律后果严重，分析一下，写个报告是可以，但是用于诊断就算了。

因此，个人认为应按照风险指数=风险概率x风险后果来对客户需求分类，才能更清楚的看到，AI应用落地的顺序。同样是制造业工厂，OCR识别实际上已经落地了，但是敢把数据库交给AI的，还不多。

结论

从上述分析，可以看出AI应用将会在哪个行业最先出现独角兽：AI短剧

目前在这个赛道上是seedance 2.0抢占了先机，于 2026年2月12日 正式发布，但是推广规模远不如预期，市场传言有说是因为版权问题，有说因为转向付费意愿强烈的企业市场。但是实际上，个人比较怀疑是因为大模型的反蒸馏问题。如果辛辛苦苦搞出来的独角兽基座，被对手轻轻松松蒸馏走了，那就不是栽一个大跟头，是直接掉马里亚纳海沟了。

ℹ️

Info

北美三大AI巨头——OpenAI、Anthropic 和 Google 在2026年4月罕见地放下了竞争，通过“前沿模型论坛”（Frontier Model Forum）组建了专项联盟，共同围剿“对抗性蒸馏”。