当前,AI俨然已经上升为了国家战略,重要性自然是不言而喻。本期我们从宏观视角看看如火如荼的AI大战到底有哪些精彩看点,我们又有哪些竞争优势,胜算几何?能否弯道超车?
本期仅做科普,客观公正评价,不带任何主观色彩。

厘清几个至关重要的概念
Token
国家数据局已经为 Token 确定了官方中文名“词元”,并将其定义为大模型处理信息的最小信息单元。Token(词元)不仅可以被量化,而且“可计量、可定价、可交易”正是它在AI时代最核心的特征。无论是你向 AI 提问(输入),还是 AI 给你生成回答(输出),都会双向消耗 Token 并产生费用。
总结来说,Token 就像工业时代的“千瓦时(度)”或互联网时代的“流量(GB)”一样,是 AI 智能时代最基础、最清晰的量化单位。企业可以通过消耗多少 Token 来核算 AI 应用的成本,甚至将 Token 预算写入员工的考核指标中。
Token 的调用量已经成为衡量一个国家或地区 AI 产业活跃度和价值的关键指标。以中国为例,2024年初,全国日均 Token 调用量仅为 1000 亿;而到了 2026 年 3 月,这一数字已经突破 140 万亿,两年间增长了超过 1000 倍。
Token 经济学
老黄在 2026 年 GTC 大会上提出了“Token 经济学”。Token 既是 AI 思考的最小单元,也是未来商业世界衡量智能价值的通用货币。
三个核心维度:
1. 核心定位:Token 是 AI 时代的“数字石油”,成为了未来数字世界最核心、最值钱的大宗商品。未来的数据中心就是日夜不停运转的“AI 工厂”,这些工厂不再只是存放文件的仓库,而是生产 Token 的轰鸣工厂。这些 Token 就是智能机器人和 AI 智能体赖以生存和工作的“食物”与“燃料”。
2. 定价体系:Token 的分层定价
老黄在演讲中首次公开了 Token 的分层定价体系,将 Token 变成了可以像水电煤一样明码标价的商品。价格由生成 Token 的速度、模型质量和任务难度决定。
3. 竞争标准:AI 工厂的“每瓦 Token 吞吐量”
未来的竞争核心是“在固定的物理功耗下,谁能生产出更多的 Token”。
Token定价
那么问题来了,为什么不同的大模型,Token的定价不一样?这个问题很关键,后文都会有关联。
目前 Token 并没有统一的“官方定价”,不同大模型厂商、不同模型版本之间的价格可能相差数倍,甚至几十倍。这主要是因为各家厂商的模型能力、技术架构和算力成本各不相同。
国产模型与海外模型的“价格鸿沟”
目前,国产大模型在国际市场上最大的优势之一就是极致的性价比。在性能相近的情况下,中美主流大模型的价格存在巨大的断层:
输入价格(Input):美国主流模型(如 GPT-5.4、Claude Opus 4.6)的输入价格约为每百万 Token 2.5 至 5 美元;而中国主流模型(如 DeepSeek V3.2、MiniMax M2.5)通常仅为 0.3 美元左右。美国模型的价格大约是国产模型的 10 到 20 倍。
输出价格(Output):差距更为悬殊。美国主流模型的输出价格可达每百万 Token 15 至 25 美元,而国产模型通常在 0.4 至 2.2 美元之间,价差最高可达 60 倍。
输入与输出的“计价不对等”
在同一个 AI 产品中,你“问”和它“答”的计价标准也是完全不同的。
输出通常比输入贵得多:因为 AI 生成内容(Output)需要消耗更多的计算资源。在大多数模型中,输出 Token 的单价通常是输入(Input)Token 的 6 倍左右。
缓存输入最便宜:如果你发给 AI 的内容(如长文档、固定提示词)之前已经被系统缓存过,再次调用时这部分 Token 的价格会大幅打折,通常只需普通输入价格的 1/10。
智能体(Agent)带来的“隐形高消费”
除了单价差异,不同应用场景下的 Token 消耗量级也完全不同。
普通的聊天对话单次可能只消耗几百个 Token。但现在的 AI 智能体(Agent)在完成编程、写报告、做视频等复杂任务时,需要反复调用模型、读取代码、分析日志,单次任务的 Token 消耗量可能是普通对话的 10 到 100 倍。
Token 的消耗量直接反映了算力的消耗程度。算力决定了 Token 的物理成本,而 Token 则让算力变得可以被计量、被定价、被交易。然而更重要的是第四个原因。
算法能力溢价
国外的旗舰模型在复杂推理、专业代码生成、深度分析等任务上表现极强。厂商定价时,卖的不是底层的算力消耗,而是“更聪明的智能等级”。就像企业愿意花高薪聘请资深顾问而不是初级助理一样,用户愿意为更精准、更可靠的 AI 结果支付高额溢价。
研发分摊:高昂的价格也包含了前期巨额的模型训练成本(顶级人才、海量高质量数据、庞大的算力投入)。这部分是一次性投入,最终会分摊到每一个 Token 的售价中。
目前国产大模型(如 DeepSeek、小米 MiMo 等)正在掀起“价格战”,Token 价格极低(甚至只有海外模型的几十分之一)。这是因为逻辑推理不严谨还是算法效率高,目前也无法给出肯定的判断。
国产AI到底是弯道超车还是虚有其表,且拭目以待。真金不怕火炼,时间会给出答案。此处应有豆包作为反面教材。
但是不可否认,国产大模型的性价比是得到一致认同的,甚至硅谷的开发者们也会考虑Token成本,在不追求极致推理准确性的前提下大量调用国产大模型。
开发者和企业在选用 AI 产品时,需要根据具体的任务需求来精打细算,而不是盲目追求最贵或最便宜的模型。

算力
AI大模型公司的算力布局变化
过去十几年AI行业竞争核心是算力规模,GPU越多、集群越大,训练出的模型性能更强。
转变的核心原因:大模型进入应用阶段后,企业最关注的问题从算力规模转向了算力成本,核心指标变为单位成本能产出的Token数量。
当前的竞争逻辑:算力竞争核心已经从峰值算力转变为能效比,更省电、成本更低的芯片会在竞争中获胜。
TPU是谷歌专门为AI计算设计的芯片架构,符合图灵奖得主DAVID PATTERSON提出的"让数据离计算更近"的技术方向。同样算力下,TPU的功耗仅为GPU的40%到50%,大模型推理成本可以降低一半。
格局演变方向:AI算力世界正在从英伟达一家独大的单极格局,转向GPU+TPU+专用芯片的多极混合格局。头部公司的具体动作:Anthropic花费210亿美元采购谷歌TPU算力系统,Meta签下数十亿美元订单大规模租用谷歌TPU,OpenAI已将部分模型任务部署到非GPU芯片上。
硅谷头部大模型公司都在主动分散算力来源,以此打破英伟达的市场垄断。所以你以为老黄躺赢吗?其实他现在慌得一匹。三十年河东,三十年河西,随时有可能掉队。
另一方面,HBM内存巨头海力士、三星、美光三足鼎立,更是吃尽了AI的红利。单靠海力士和三星就撑起了半个韩国股市。谁又能想得到,十年前的海力士还是韩国财阀避之不及的赔钱货,如今飞上枝头变凤凰。篇幅所限,就不赘述了。
同样,华为的韬定律也是一条技术路线,只不过制约它能叠几层的是散热。弯道超车还算不上,只能算另辟蹊径。毕竟折叠芯这事,实现起来要比EUV光刻机容易得多。
在过去,限制 AI 发展的是芯片造不造得出来(摩尔定律);而现在及未来,限制 AI 发展的是电够不够用。设想在不远的将来,GPU也好,TPU也好,不论2纳米,还是韬定律都遭遇了瓶颈,制造工艺已无突破空间。
现在的超大规模数据中心(AI 工厂)已经成了名副其实的“电老虎”。
一座顶尖的 AI 数据中心,其功率需求往往以“吉瓦(GW)”为单位。1 吉瓦的电力,大约相当于100万户普通家庭的用电量,或者一座中型核电站的满负荷输出。这些 GPU 集群需要 24 小时不间断地高速运转来生成 Token,同时还要消耗大量的电力用于液冷或风冷系统散热。
电力短缺危机:全球科技巨头(如微软、亚马逊、谷歌)都在疯狂抢购数据中心用地和电力配额。在很多地区,电网的扩容速度远远跟不上 AI 算力扩张的速度,甚至出现了“为了等电,数据中心建好了却不敢全开”的尴尬局面。全球高压变压器产能缺口达到60%,交付周期从50周延长到120周以上,美国本土唯一能生产765千伏超高压变压器的工厂订单已经排满未来两年;AI数据中心耗水耗电高,项目所在地德州连年干旱,政府削减了大半水电配额。
算力的背后,也是“碳”的挑战
AI 算力的能源属性,还直接挂钩全球的气候与环保议题。
碳排放压力:如果 AI 消耗的电力主要来自煤炭等化石能源,那么 AI 越智能,地球的碳排放负担就越重。这也是为什么现在的科技巨头都在拼命投资核能、风能、太阳能等清洁能源。
未来的 AI 竞争,不仅仅是算法和芯片的竞争,更是谁先掌握了稳定、廉价且绿色的能源的竞争。
新的竞争格局雏形:AI接近通用水平后,资源丰富经济体可通过持续供给资源实现产量正循环,资源匮乏地区即使拥有顶尖AI技术,也会因为上游瓶颈无法释放潜力。

算法
前文Token定价讲到,算力可量化,而算法更多体现为品牌溢价,短时间无法准确量化。
故事还要从2026年Anthropic Claude Code代码泄露事件讲起。
2026年冲刺IPO的Anthropic刚完成300亿美元融资,整体估值达到3800亿美元。其核心盈利产品Claude Code九个月已经吸金25亿美元,拿下AI编码赛道一半的市场份额。本次共泄露51.2万行工业级代码,泄露源于员工操作失误。泄露发生短短几小时内,代码就被镜像到全网。Anthropic发起版权下架请求,但已经无法收回泄露内容, Anthropic CEO阿莫代此前曾公开称公司90%代码由AI生成,这导致其根据美国版权法难以维权。
AI技术优势的护城河本质
技术优势的保鲜期变化:主动或被动开源后,AI技术优势的保鲜期已经从几年缩短到几个月、几天,本次泄露后完成复刻仅用了几个小时。技术优势本身不是护城河,只是建造护城河的窗口期。
历史案例佐证:全球首个爆款网页浏览器开发商网景(NETSCAPE)曾凭借技术领先拿下90%的市场份额,最终被掌握Windows系统和分发渠道的微软淘汰。该案例证明,掌握渠道和用户资源比技术领先更重要。
过往泄露事件的规律:2023年Meta的Llama泄露开源后,几个月就催生了7000多个衍生模型,谷歌内部备忘录直接承认"我们没有护城河,OpenAI也没有"。2025年初DeepSeek用不到600万美元训练成本,性能就逼近GPT-4,当天全球科技股蒸发超1万亿美元市值。
所以,结论是中美AI行业最终赢家将是手握算力与用户渠道的大厂
纯血AI公司对大厂的依赖
全球头部纯血AI公司都依赖大厂的算力基础设施,Anthropic80%算力运行在亚马逊AWS上,OpenAI几乎全部依赖微软Azure。根据OpenAI和微软最新的协议,OpenAI需要将总收入的20%上交给微软,该协议持续到2032年,按当前收入计算每年需要上交50亿美元。
大厂的竞争优势碾压:谷歌Gemini的市场份额已经从5%上涨到18%,大厂自身拥有基建和流量,开启价格战后,纯血AI公司面临毁灭性的生存风险。本次泄露的51.2万行工程代码直接公开,相当于为所有大厂省下了巨额研发学费。
腾讯正在开发微信内置Agent,拥有14亿月活的分发优势,没有纯血AI公司可以对抗;阿里春节砸30亿红包推广,把日活推高了7000多万,这种烧钱力度也没有纯血AI公司可以承受。最终中国AI行业站到最后的同样是手握算力和渠道的大厂。
纯血AI的最佳出路,要么是在垂直赛道上优先完成商业闭环,要么选择转型,创业者实现体面上岸。这一幕在近年来互联网经济残酷的竞争中已经屡见不鲜。

应用数据
面对美国芯片封锁,算法创新是中国AI突围最现实有效的路径。竞争会倒逼中国公司开发出用更少算力完成更多任务的算法,淘汰堆砌算力的旧生产方式。
以AI视频为例
2022年9月清华大学研究团队发表论文,首次将扩散模型的卷积unit换成transformer,打通了AI视频生成的技术路径。三个月后facebook研发团队也发布了相同思路的论文。
2023年4月,前字节跳动AI lab总监王长虎在北京创立爱施科技,进军AI视频生成赛道,目标是推出面向全球C端用户的平价先进AI视频生成软件Pixverse。
2024年2月OpenAI发布Sora预览片,业界将其评为多模态大模型顶级水准,国内舆论普遍认为中国在该赛道已经彻底输掉AI竞赛,有专家称中国未来两三年都拿不出像样产品。
Sora直到2025年9月才正式上线,爱视科技联合创始人谢旭章评价其成品和预览片差距极大,相当于差了10个Pixverse,用户吐槽Sora如同人工智障。
2026年3月26日OpenAI宣布关停Sora,Sora一周留存率仅2%,月留存跌破1%,75%用户生成一次后永久卸载,仅存活半年就退出赛道。
目前全球AI视频生成赛道几乎被中国公司瓜分,Pixverse全球用户规模突破1亿,快手可灵用户突破6000万。
产品定位与价格优势:Sora会员最高版本折合人民币每月约1400元,最低版本每月140元;国内即梦最高版本每月499元,最低版本每月69元,可灵最高版本每月1314元,最低版本每月58元。
产品定位差异:可灵偏B端,在画质清晰度上优势明显,可制作高质量商业片;即梦偏C端,适合生产对画质要求不高的AI动漫剧,Sora没有清晰定位,找不到自身长板。
特别声明:数据都是AI扒的,就别较真了。但国产AI视频生成赛道这一块是真强。
Sora失败的核心原因固然有其自身的原因,但很关键的一点在于产业数据优势的体现。
字节跳动、快手本身就是头部视频平台,拥有量大管饱的高质量视频数据,Sora被美国影视行业抵制后失去优质影视数据,视频质量快速下滑。与之类似,美国制造业空心化,无法生成庞大丰富的工程数据集,中国拥有全球最完整的工业体系,积累了海量工程经验数据。
产业基础优势:在AI视频生成爆发前,中国已经形成成熟的网络小说推书视频产业链,为AI漫剧、AI短剧提供了产业迁移基础和消费场景。2025年中国微短剧市场规模预计接近680亿元,其中AI短剧占比接近三分之一。
中国的产业基础覆盖面可以用“全球唯一拥有全部工业门类的国家”来高度概括。经过长期的发展,中国已经建立起全球规模最庞大、门类最齐全、配套最完善的工业体系。作为世界第一制造大国:中国制造业增加值约占全球的30%,总体规模已连续16年稳居世界第一。在世界500多种主要工业产品中,中国有四成以上(超过220种)产品的产量位居世界第一。
强大的产业配套能力:一个产品从原材料、零部件到整机制造、物流服务的全流程生产,基本都能在国内完成。这种高效、低成本的配套能力,极大缩短了产品的研发和生产周期。
现在的AI已经将所有的开源数据都吃进去了。但更关键的数据还是闭源的产业数据。无法获取第一手的底层应用数据,再强大的AI算法也只能是空中楼阁。

结论
综上,算力、算法、应用数据是AI的三大要素。
Token 定价,不同大模型厂商、不同模型版本之间的价格可能相差数倍,甚至几十倍。这主要是因为各家厂商的模型能力、技术架构和算力成本各不相同。
结论:这场跨国大战中,中美AI行业最终赢家将是手握算力与用户渠道的大厂
AI竞争下半场的无责任猜想
AI既然上升为国家战略,考验的就是国家竞争力。
劣势:
硬件算力:中国虽然在芯片、存储方面有劣势,这是先天不足,我们正在迎头赶上。
算法优势:国内的豆包等大模型虽然不如Anthropic Claude Code等靠谱。但别忘了国产AI的性价比相当优秀。
优势:
马斯克提出,能源是AI的本质,AI上半场比拼芯片拥有量,下半场比拼电力供应能力。
那这下半场可不就是我们的主场了吗?拼基建,中国怕过谁!
中美电力产能对比:当前中国电力装机容量为3.75太瓦,美国为1.3太瓦,中国是美国的三倍;马斯克预测,到2026年中国发电量将是美国的2.5倍,未来会达到3-4倍。
中国的核心竞争力来源:中国在特高压传输、光伏、储能领域已经取得突破性发展,充足的电力供给是AI时代中国经济的硬底牌。
产业数据数据对AI的核心价值:任正非提出,算法本质掌握在各行业专家手中,芯片是锅,算法是烹饪方法,数据才是原材料,没有对应数据就无法训练出优质模型。目前大模型训练只用了人类知识库的冰山一角。
AI竞争进入下半场后,高价值闭源数据将成为核心竞争力,中国拥有14亿劳动者创造的海量产业数据,当中国将TOKEN成本打到白菜价后,AI将迎来真正的应用大爆发,诞生大量行业模型。
综上,未来可期。
但是,
集中力量办大事,一直都是我们的优势,助力我国在基建等领域无往而不利。当然,任何事都是有代价的。换个角度讲,科技的进步如果不能转化为人民的福祉,那又有何意义。
AI就是创新,和基建毕竟不一样。不能让骗补、低效产能重复建设、劣币驱逐良币的事再次重演。可能,我就说可能啊,那些一窝蜂上马的算力中心是不是都能派上用场,那些披着AI外衣的投机者是不是在挂羊头卖狗肉。试错并不可怕,错了没有纠正机制才真正危险。点到即止。
这场旷日持久的大战已然开打,鹿死谁手,犹未可知。

下期预告:
美丽的泡沫,虽然一刹花火。
你所有承诺,虽然都太脆弱。
但爱像泡沫,如果能够看破。
有什么难过!

夜雨聆风