AI杂谈:全球变局与竞争优势

当前，AI俨然已经上升为了国家战略，重要性自然是不言而喻。本期我们从宏观视角看看如火如荼的AI大战到底有哪些精彩看点，我们又有哪些竞争优势，胜算几何？能否弯道超车？

本期仅做科普，客观公正评价，不带任何主观色彩。

厘清几个至关重要的概念

Token
国家数据局已经为 Token 确定了官方中文名“词元”，并将其定义为大模型处理信息的最小信息单元。Token（词元）不仅可以被量化，而且“可计量、可定价、可交易”正是它在AI时代最核心的特征。无论是你向 AI 提问（输入），还是 AI 给你生成回答（输出），都会双向消耗 Token 并产生费用。

总结来说，Token 就像工业时代的“千瓦时（度）”或互联网时代的“流量（GB）”一样，是 AI 智能时代最基础、最清晰的量化单位。企业可以通过消耗多少 Token 来核算 AI 应用的成本，甚至将 Token 预算写入员工的考核指标中。

Token 的调用量已经成为衡量一个国家或地区 AI 产业活跃度和价值的关键指标。以中国为例，2024年初，全国日均 Token 调用量仅为 1000 亿；而到了 2026 年 3 月，这一数字已经突破 140 万亿，两年间增长了超过 1000 倍。

Token 经济学

老黄在 2026 年 GTC 大会上提出了“Token 经济学”。Token 既是 AI 思考的最小单元，也是未来商业世界衡量智能价值的通用货币。

三个核心维度：
1. 核心定位：Token 是 AI 时代的“数字石油”，成为了未来数字世界最核心、最值钱的大宗商品。未来的数据中心就是日夜不停运转的“AI 工厂”，这些工厂不再只是存放文件的仓库，而是生产 Token 的轰鸣工厂。这些 Token 就是智能机器人和 AI 智能体赖以生存和工作的“食物”与“燃料”。

2. 定价体系：Token 的分层定价
老黄在演讲中首次公开了 Token 的分层定价体系，将 Token 变成了可以像水电煤一样明码标价的商品。价格由生成 Token 的速度、模型质量和任务难度决定。

3. 竞争标准：AI 工厂的“每瓦 Token 吞吐量”
未来的竞争核心是“在固定的物理功耗下，谁能生产出更多的 Token”。

Token定价

那么问题来了，为什么不同的大模型，Token的定价不一样？这个问题很关键，后文都会有关联。

目前 Token 并没有统一的“官方定价”，不同大模型厂商、不同模型版本之间的价格可能相差数倍，甚至几十倍。这主要是因为各家厂商的模型能力、技术架构和算力成本各不相同。

国产模型与海外模型的“价格鸿沟”
目前，国产大模型在国际市场上最大的优势之一就是极致的性价比。在性能相近的情况下，中美主流大模型的价格存在巨大的断层：

输入价格（Input）：美国主流模型（如 GPT-5.4、Claude Opus 4.6）的输入价格约为每百万 Token 2.5 至 5 美元；而中国主流模型（如 DeepSeek V3.2、MiniMax M2.5）通常仅为 0.3 美元左右。美国模型的价格大约是国产模型的 10 到 20 倍。

输出价格（Output）：差距更为悬殊。美国主流模型的输出价格可达每百万 Token 15 至 25 美元，而国产模型通常在 0.4 至 2.2 美元之间，价差最高可达 60 倍。

输入与输出的“计价不对等”

在同一个 AI 产品中，你“问”和它“答”的计价标准也是完全不同的。

输出通常比输入贵得多：因为 AI 生成内容（Output）需要消耗更多的计算资源。在大多数模型中，输出 Token 的单价通常是输入（Input）Token 的 6 倍左右。

缓存输入最便宜：如果你发给 AI 的内容（如长文档、固定提示词）之前已经被系统缓存过，再次调用时这部分 Token 的价格会大幅打折，通常只需普通输入价格的 1/10。

智能体（Agent）带来的“隐形高消费”

除了单价差异，不同应用场景下的 Token 消耗量级也完全不同。

普通的聊天对话单次可能只消耗几百个 Token。但现在的 AI 智能体（Agent）在完成编程、写报告、做视频等复杂任务时，需要反复调用模型、读取代码、分析日志，单次任务的 Token 消耗量可能是普通对话的 10 到 100 倍。

Token 的消耗量直接反映了算力的消耗程度。算力决定了 Token 的物理成本，而 Token 则让算力变得可以被计量、被定价、被交易。然而更重要的是第四个原因。

算法能力溢价

国外的旗舰模型在复杂推理、专业代码生成、深度分析等任务上表现极强。厂商定价时，卖的不是底层的算力消耗，而是“更聪明的智能等级”。就像企业愿意花高薪聘请资深顾问而不是初级助理一样，用户愿意为更精准、更可靠的 AI 结果支付高额溢价。

研发分摊：高昂的价格也包含了前期巨额的模型训练成本（顶级人才、海量高质量数据、庞大的算力投入）。这部分是一次性投入，最终会分摊到每一个 Token 的售价中。

目前国产大模型（如 DeepSeek、小米 MiMo 等）正在掀起“价格战”，Token 价格极低（甚至只有海外模型的几十分之一）。这是因为逻辑推理不严谨还是算法效率高，目前也无法给出肯定的判断。

国产AI到底是弯道超车还是虚有其表，且拭目以待。真金不怕火炼，时间会给出答案。此处应有豆包作为反面教材。

但是不可否认，国产大模型的性价比是得到一致认同的，甚至硅谷的开发者们也会考虑Token成本，在不追求极致推理准确性的前提下大量调用国产大模型。

开发者和企业在选用 AI 产品时，需要根据具体的任务需求来精打细算，而不是盲目追求最贵或最便宜的模型。

算力

AI大模型公司的算力布局变化

过去十几年AI行业竞争核心是算力规模，GPU越多、集群越大，训练出的模型性能更强。

转变的核心原因：大模型进入应用阶段后，企业最关注的问题从算力规模转向了算力成本，核心指标变为单位成本能产出的Token数量。

当前的竞争逻辑：算力竞争核心已经从峰值算力转变为能效比，更省电、成本更低的芯片会在竞争中获胜。

TPU是谷歌专门为AI计算设计的芯片架构，符合图灵奖得主DAVID PATTERSON提出的"让数据离计算更近"的技术方向。同样算力下，TPU的功耗仅为GPU的40%到50%，大模型推理成本可以降低一半。

格局演变方向：AI算力世界正在从英伟达一家独大的单极格局，转向GPU+TPU+专用芯片的多极混合格局。头部公司的具体动作：Anthropic花费210亿美元采购谷歌TPU算力系统，Meta签下数十亿美元订单大规模租用谷歌TPU，OpenAI已将部分模型任务部署到非GPU芯片上。

硅谷头部大模型公司都在主动分散算力来源，以此打破英伟达的市场垄断。所以你以为老黄躺赢吗？其实他现在慌得一匹。三十年河东，三十年河西，随时有可能掉队。

另一方面，HBM内存巨头海力士、三星、美光三足鼎立，更是吃尽了AI的红利。单靠海力士和三星就撑起了半个韩国股市。谁又能想得到，十年前的海力士还是韩国财阀避之不及的赔钱货，如今飞上枝头变凤凰。篇幅所限，就不赘述了。

同样，华为的韬定律也是一条技术路线，只不过制约它能叠几层的是散热。弯道超车还算不上，只能算另辟蹊径。毕竟折叠芯这事，实现起来要比EUV光刻机容易得多。

在过去，限制 AI 发展的是芯片造不造得出来（摩尔定律）；而现在及未来，限制 AI 发展的是电够不够用。设想在不远的将来，GPU也好，TPU也好，不论2纳米，还是韬定律都遭遇了瓶颈，制造工艺已无突破空间。

现在的超大规模数据中心（AI 工厂）已经成了名副其实的“电老虎”。

一座顶尖的 AI 数据中心，其功率需求往往以“吉瓦（GW）”为单位。1 吉瓦的电力，大约相当于100万户普通家庭的用电量，或者一座中型核电站的满负荷输出。这些 GPU 集群需要 24 小时不间断地高速运转来生成 Token，同时还要消耗大量的电力用于液冷或风冷系统散热。

电力短缺危机：全球科技巨头（如微软、亚马逊、谷歌）都在疯狂抢购数据中心用地和电力配额。在很多地区，电网的扩容速度远远跟不上 AI 算力扩张的速度，甚至出现了“为了等电，数据中心建好了却不敢全开”的尴尬局面。全球高压变压器产能缺口达到60%，交付周期从50周延长到120周以上，美国本土唯一能生产765千伏超高压变压器的工厂订单已经排满未来两年；AI数据中心耗水耗电高，项目所在地德州连年干旱，政府削减了大半水电配额。

算力的背后，也是“碳”的挑战
AI 算力的能源属性，还直接挂钩全球的气候与环保议题。

碳排放压力：如果 AI 消耗的电力主要来自煤炭等化石能源，那么 AI 越智能，地球的碳排放负担就越重。这也是为什么现在的科技巨头都在拼命投资核能、风能、太阳能等清洁能源。

未来的 AI 竞争，不仅仅是算法和芯片的竞争，更是谁先掌握了稳定、廉价且绿色的能源的竞争。

新的竞争格局雏形：AI接近通用水平后，资源丰富经济体可通过持续供给资源实现产量正循环，资源匮乏地区即使拥有顶尖AI技术，也会因为上游瓶颈无法释放潜力。

算法

前文Token定价讲到，算力可量化，而算法更多体现为品牌溢价，短时间无法准确量化。

故事还要从2026年Anthropic Claude Code代码泄露事件讲起。

2026年冲刺IPO的Anthropic刚完成300亿美元融资，整体估值达到3800亿美元。其核心盈利产品Claude Code九个月已经吸金25亿美元，拿下AI编码赛道一半的市场份额。本次共泄露51.2万行工业级代码，泄露源于员工操作失误。泄露发生短短几小时内，代码就被镜像到全网。Anthropic发起版权下架请求，但已经无法收回泄露内容， Anthropic CEO阿莫代此前曾公开称公司90%代码由AI生成，这导致其根据美国版权法难以维权。

AI技术优势的护城河本质

技术优势的保鲜期变化：主动或被动开源后，AI技术优势的保鲜期已经从几年缩短到几个月、几天，本次泄露后完成复刻仅用了几个小时。技术优势本身不是护城河，只是建造护城河的窗口期。

历史案例佐证：全球首个爆款网页浏览器开发商网景（NETSCAPE）曾凭借技术领先拿下90%的市场份额，最终被掌握Windows系统和分发渠道的微软淘汰。该案例证明，掌握渠道和用户资源比技术领先更重要。

过往泄露事件的规律：2023年Meta的Llama泄露开源后，几个月就催生了7000多个衍生模型，谷歌内部备忘录直接承认"我们没有护城河，OpenAI也没有"。2025年初DeepSeek用不到600万美元训练成本，性能就逼近GPT-4，当天全球科技股蒸发超1万亿美元市值。

所以，结论是中美AI行业最终赢家将是手握算力与用户渠道的大厂

纯血AI公司对大厂的依赖

全球头部纯血AI公司都依赖大厂的算力基础设施，Anthropic80%算力运行在亚马逊AWS上，OpenAI几乎全部依赖微软Azure。根据OpenAI和微软最新的协议，OpenAI需要将总收入的20%上交给微软，该协议持续到2032年，按当前收入计算每年需要上交50亿美元。

大厂的竞争优势碾压：谷歌Gemini的市场份额已经从5%上涨到18%，大厂自身拥有基建和流量，开启价格战后，纯血AI公司面临毁灭性的生存风险。本次泄露的51.2万行工程代码直接公开，相当于为所有大厂省下了巨额研发学费。

腾讯正在开发微信内置Agent，拥有14亿月活的分发优势，没有纯血AI公司可以对抗；阿里春节砸30亿红包推广，把日活推高了7000多万，这种烧钱力度也没有纯血AI公司可以承受。最终中国AI行业站到最后的同样是手握算力和渠道的大厂。

纯血AI的最佳出路，要么是在垂直赛道上优先完成商业闭环，要么选择转型，创业者实现体面上岸。这一幕在近年来互联网经济残酷的竞争中已经屡见不鲜。

应用数据

面对美国芯片封锁，算法创新是中国AI突围最现实有效的路径。竞争会倒逼中国公司开发出用更少算力完成更多任务的算法，淘汰堆砌算力的旧生产方式。

以AI视频为例

2022年9月清华大学研究团队发表论文，首次将扩散模型的卷积unit换成transformer，打通了AI视频生成的技术路径。三个月后facebook研发团队也发布了相同思路的论文。

2023年4月，前字节跳动AI lab总监王长虎在北京创立爱施科技，进军AI视频生成赛道，目标是推出面向全球C端用户的平价先进AI视频生成软件Pixverse。

2024年2月OpenAI发布Sora预览片，业界将其评为多模态大模型顶级水准，国内舆论普遍认为中国在该赛道已经彻底输掉AI竞赛，有专家称中国未来两三年都拿不出像样产品。

Sora直到2025年9月才正式上线，爱视科技联合创始人谢旭章评价其成品和预览片差距极大，相当于差了10个Pixverse，用户吐槽Sora如同人工智障。

2026年3月26日OpenAI宣布关停Sora，Sora一周留存率仅2%，月留存跌破1%，75%用户生成一次后永久卸载，仅存活半年就退出赛道。

目前全球AI视频生成赛道几乎被中国公司瓜分，Pixverse全球用户规模突破1亿，快手可灵用户突破6000万。

产品定位与价格优势：Sora会员最高版本折合人民币每月约1400元，最低版本每月140元；国内即梦最高版本每月499元，最低版本每月69元，可灵最高版本每月1314元，最低版本每月58元。

产品定位差异：可灵偏B端，在画质清晰度上优势明显，可制作高质量商业片；即梦偏C端，适合生产对画质要求不高的AI动漫剧，Sora没有清晰定位，找不到自身长板。

特别声明：数据都是AI扒的，就别较真了。但国产AI视频生成赛道这一块是真强。

Sora失败的核心原因固然有其自身的原因，但很关键的一点在于产业数据优势的体现。

字节跳动、快手本身就是头部视频平台，拥有量大管饱的高质量视频数据，Sora被美国影视行业抵制后失去优质影视数据，视频质量快速下滑。与之类似，美国制造业空心化，无法生成庞大丰富的工程数据集，中国拥有全球最完整的工业体系，积累了海量工程经验数据。

产业基础优势：在AI视频生成爆发前，中国已经形成成熟的网络小说推书视频产业链，为AI漫剧、AI短剧提供了产业迁移基础和消费场景。2025年中国微短剧市场规模预计接近680亿元，其中AI短剧占比接近三分之一。

中国的产业基础覆盖面可以用“全球唯一拥有全部工业门类的国家”来高度概括。经过长期的发展，中国已经建立起全球规模最庞大、门类最齐全、配套最完善的工业体系。作为世界第一制造大国：中国制造业增加值约占全球的30%，总体规模已连续16年稳居世界第一。在世界500多种主要工业产品中，中国有四成以上（超过220种）产品的产量位居世界第一。

强大的产业配套能力：一个产品从原材料、零部件到整机制造、物流服务的全流程生产，基本都能在国内完成。这种高效、低成本的配套能力，极大缩短了产品的研发和生产周期。

现在的AI已经将所有的开源数据都吃进去了。但更关键的数据还是闭源的产业数据。无法获取第一手的底层应用数据，再强大的AI算法也只能是空中楼阁。

结论

综上，算力、算法、应用数据是AI的三大要素。

Token 定价，不同大模型厂商、不同模型版本之间的价格可能相差数倍，甚至几十倍。这主要是因为各家厂商的模型能力、技术架构和算力成本各不相同。

结论：这场跨国大战中，中美AI行业最终赢家将是手握算力与用户渠道的大厂

AI竞争下半场的无责任猜想
AI既然上升为国家战略，考验的就是国家竞争力。

劣势：
硬件算力：中国虽然在芯片、存储方面有劣势，这是先天不足，我们正在迎头赶上。

算法优势：国内的豆包等大模型虽然不如Anthropic Claude Code等靠谱。但别忘了国产AI的性价比相当优秀。

优势：
马斯克提出，能源是AI的本质，AI上半场比拼芯片拥有量，下半场比拼电力供应能力。

那这下半场可不就是我们的主场了吗？拼基建，中国怕过谁！

中美电力产能对比：当前中国电力装机容量为3.75太瓦，美国为1.3太瓦，中国是美国的三倍；马斯克预测，到2026年中国发电量将是美国的2.5倍，未来会达到3-4倍。

中国的核心竞争力来源：中国在特高压传输、光伏、储能领域已经取得突破性发展，充足的电力供给是AI时代中国经济的硬底牌。

产业数据数据对AI的核心价值：任正非提出，算法本质掌握在各行业专家手中，芯片是锅，算法是烹饪方法，数据才是原材料，没有对应数据就无法训练出优质模型。目前大模型训练只用了人类知识库的冰山一角。

AI竞争进入下半场后，高价值闭源数据将成为核心竞争力，中国拥有14亿劳动者创造的海量产业数据，当中国将TOKEN成本打到白菜价后，AI将迎来真正的应用大爆发，诞生大量行业模型。

综上，未来可期。

但是，
集中力量办大事，一直都是我们的优势，助力我国在基建等领域无往而不利。当然，任何事都是有代价的。换个角度讲，科技的进步如果不能转化为人民的福祉，那又有何意义。

AI就是创新，和基建毕竟不一样。不能让骗补、低效产能重复建设、劣币驱逐良币的事再次重演。可能，我就说可能啊，那些一窝蜂上马的算力中心是不是都能派上用场，那些披着AI外衣的投机者是不是在挂羊头卖狗肉。试错并不可怕，错了没有纠正机制才真正危险。点到即止。

这场旷日持久的大战已然开打，鹿死谁手，犹未可知。

下期预告：

美丽的泡沫，虽然一刹花火。
你所有承诺，虽然都太脆弱。
但爱像泡沫，如果能够看破。
有什么难过！