
各位老铁,最近是不是感觉AI这玩意儿,已经从“未来可期”变成了“扑面而来”?没错,这不是微风,是海啸。当你还在纠结ChatGPT能不能帮你写周报时,巨头们已经在一个更底层的维度上卷疯了——Token吞吐量。
啥是Token?简单说,就是AI处理信息的最小原子单位。你问大模型一个问题,它吭哧吭哧“吃”进去一堆Token,再“吐”出来一堆Token。这个过程,消耗的就是算力。所以,AI的核心是算力,算力的核心,就是Token的吞吐效率。这玩意儿直接决定了成本、速度和产业竞争力。
你可以把整个AI产业想象成一个巨大的“Token工厂”:
- 模型层是流水线,负责生产Token。
算力基础设施是厂房和电力,提供生产环境。
硬件底座是机器设备,决定生产效率。
这场战争里,谁在闷声发大财?咱们扒一扒。
一、Token“印钞机”:模型层的巨头与独角兽
互联网大厂是头号玩家。阿里想当“Token最大批发商”,通义千问+阿里云形成闭环;腾讯的混元大模型在社交、游戏里疯狂“吞Token”;百度的文心一言守着搜索和云的老地盘;字节的豆包大模型,凭借1.5亿日活,成了“C端吞吐机”,日均消耗量据说国内第一。
但更凶猛的可能是大模型独角兽。智谱AI(GLM)是国内ToB API龙头,周调用破万亿Token,政企订单接到手软。MINIMAX更是Token出海一哥,旗下OpenRouter全球调用量第一,周吞3.07万亿Token,市场份额22%,赚的都是美金(海外收入占73%)。还有月之暗面(Kimi),专攻长文本,用户暴增,堪称“Token消耗引擎”。
垂直领域也有狠角色。昆仑万维的天工大模型,日均处理超200亿Token,海外收入占七成,2025年API收入32亿,同比暴涨210%,是妥妥的出海龙头。科大讯飞的星火大模型,在政企、教育、医疗场景深耕,日均处理Token超3万亿,2025年AI开放平台收入135亿。
二、Token“发电厂”与“机床”:算力与硬件底座
光有流水线不行,还得有厂房和电。这就是算力基础设施。润泽科技是字节、智谱的核心IDC;鸿博股份是MINIMAX的独家算力伙伴;首都在线是智谱的算力底座,按Token消耗实时计费,堪称“算力界的滴滴”。数据港、万国数据这些,则是阿里、腾讯的“物理承载者”。
厂房里的机器——硬件底座,更是命脉所在。浪潮信息,国内AI服务器老大,是字节、百度、阿里的核心供应商。中科曙光,国产算力龙头。工业富联,全球AI服务器代工之王(市占超40%),是英伟达的核心伙伴,可以说是“Token工厂设备基石”。
最核心的“发动机”是AI芯片。海光信息是国产AI芯片龙头,大模型训练推理都靠它。寒武纪是云端AI芯片代表。它们的目标就一个:用更低的成本,榨出更多的Token。
三、未来已来:算力之后,电力是终极瓶颈
AI的背后是算力,算力的背后是电力。全球算力军备竞赛已经白热化,但物理规律摆在那儿:电不够用。于是,液冷技术成了标配,甚至有人把算力中心建到电价更便宜的地方。
更有想象力的方案是——太空算力。星链技术成熟了,把算力中心扔到太空去?太阳能板效率是地面的5倍,太空天然低温靠辐射散热,完美解决能源和冷却两大难题。这可能是大国竞争的下一个赛道。
AI引领的新一轮康波周期已经启动,超级应用正在爆发。这场以Token吞吐量为核心的算力战争,是中国科技力量崛起的关键一役。识别产业链上的核心玩家——那些“印钞机”、“发电厂”和“机床”的供应商,或许就是我们这代人最重要的机遇。
海啸之下,要么造舟,要么上岸。你,准备好了吗?
夜雨聆风