All in AI第三年,这笔账为何算不明白?——中国AI算力困局与十大破局法则深度解读

核心议题：三年前，阿里、腾讯、字节集体喊出"All in AI"。两年国内头部公司砸入约 2 万亿，而兴业银行测算 2025-2030 年全国算力基础设施投资将达 9.2 万亿元。然而OpenAI 年亏 80 亿美元、字节净利润下滑超 70%、全国智算中心平均利用率仅 32%——这笔账，为何怎么也算不明白？

一、算力投资全景：近十万亿为何听不见响

1.1疯狂的资本开支

厂商/机构	投入规模	时间范围	产出/回报
阿里巴巴	3800 亿元	三年计划	调整后净利仅0.86 亿
字节跳动	1500 亿 → 2000+ 亿/年	2025-2026	净利润同比下滑超70%
腾讯	千亿级/年（同比 +221%）	2025	利润承压但未崩
OpenAI	~400 亿美元/年	2025	营收131 亿，亏 80 亿
全国算力基建	9.2 万亿元	2025-2030	智算中心利用率仅32%

1.2算力黑洞：投入越大，亏损越大

国内AI公司亏损惨烈

•智谱AI：营收7.24 亿，净亏 31.82 亿

•MiniMax：营收5.43 亿，净亏 17.5 亿

•字节：净利润同比下滑超70%

•阿里：调整后净利仅0.86 亿

结构错配荒诞图景

•全国已上线智算中心算力平均利用率仅32%

•大量智算中心被迫"压价、退租"求生

•平均出租率仅20%-30%

•92% 企业却认为算力是最大挑战

「大厂算力荒」与「智算中心卖卡求生」并存

困局的本质：92% 的受访企业将算力不足视为大模型落地最大挑战，但供给侧的智算中心却大量闲置。这不是简单的"量不够"，而是 典型的结构性错配——需求端嗷嗷待哺，供给端门可罗雀。根源在于，AI 行业至今未找到"可销售的产品形态"。

二、三大巨头的路径分化与各自困局

2.1阿里：旧模式被 AI 亲手拆掉

阿里面临"左右手互搏"——AI 购物体验的升级直接把核心盈利模式（商家竞价排名）推向了悬崖。用户直接对千问说"找 500 块以内送妈妈的生日礼物"，千问推荐并附上链接——竞价展位消失了，模型直接决定了推荐结果。

吴泳铭回归后喊出「3年内持续加码，不算短期账」。但新盈利模式尚未成型，旧业务正被 AI 加速侵蚀——边拆旧模式边建新模式，这是一场跟时间的赛跑。

2.2字节：规模第一，留存无解

字节走的是最进攻性的路线：不做克制性投入，而是用多款AI 应用快速圈地。

应用	月活/数据	赛道	核心挑战
豆包	3.45 亿月活，token 调用占国内 86%	AI 对话	用户粘性弱，付费习惯未养成
即梦	快速增长	AI 图像/视频	算力成本极高
Coze	生态建设中	AI Agent 平台	商业化路径未通
Seedance	国内同类最贵	AI 视频生成	成本太高

豆包赔付承诺书事件的启示：官方辟谣说"没有资格承诺赔偿"，反而放大了不信任。用户开始质疑：AI 说的话能不能信？出了问题谁负责？这恰恰说明——没有信任基础设施，AI 代理这套东西玩不转。

2.3腾讯：不见兔子不撒鹰

马化腾坦言「之前的AI 战略是有失误的」。混元 3.0 Preview 登顶全球开发者调用榜让腾讯信心倍增，但产品落地依然缓慢——微信智能体计划过去快一年也没上线，AI 功能仍停留在搜一搜、读书、输入法等小方面。

腾讯的赌注：微信13 亿月活，把实名支付、线下消费、企业关系、小程序生态全部串在一起——这是中国唯一的"信任操作系统"。腾讯在等全社会意识到只有依托被广泛认可的信任底座，AI 代理才能真正落地。

三、DeepSeek掀起的效率革命

3.1用卡效率 > 卡的数量

2025年 1 月，DeepSeek-V3 发布，将 AI 行业笃信多年的"算力至上"信条炸得粉碎：

模型	训练成本	API 输入定价（每百万 token）	性能对标
GPT-4	~1 亿美元	~30 美元	基准
Llama 3.1 405B	~6000 万美元	~0.6 美元	接近GPT-4
DeepSeek-V3	557.6 万美元	~0.14 美元	GPT-4 级

三重算法创新叠加效应：

•MoE 架构 → 训练成本降低 50%

•稀疏化技术→ 减少 70%无效计算

•量化压缩→ 不牺牲精度将模型"瘦身" 50%+

DeepSeek 用算法优化证明：用卡效率比卡的数量更重要。

3.2杰文斯悖论：成本越降，需求越爆

微软CEO 纳德拉在 DeepSeek 发布后直接喊出：「杰文斯悖论再次上演！」一个反直觉的逻辑正在全面兑现——成本每下降一级，就打开一个更大的市场。尽管DeepSeek 将单次训练能耗降低 90%，英伟达 2025 年数据中心 GPU 出货量仍同比增长 13%。

3.3国产替代：从被迫选择到性价比优选

国产AI 芯片市占率从 2020 年的 12%飙升至2025 年的 41%，华为昇腾以约81.2 万颗出货量占据国产阵营半壁江山。

年份	国产芯片市占率	英伟达市占率	关键节点
2020	12%	~95%	起步期
2023	~20%	95%	出口管制倒逼自主化
2025	41%	55%	昇腾910C 发布

华为昇腾910C 的 FP16 稠密算力达 800TFLOPS，已接近英伟达 H100 的 80%。单卡性能差距从"代际鸿沟"收窄至"一代以内"。

四、推理经济：从"卖矿机"到"收电费"

4.1训推拐点已到

2025年是中国 AI 的"训推拐点"——推理数据量首次超越训练数据量，达到 101.34EB。全国日均 Token 调用量在年末突破 100 万亿。

年份	推理算力占比	关键里程碑
2023	~33%	训练主导期
2025	~50%	推理首超训练
2026（预测）	66%	推理成为绝对主力
2028（预测）	73%	推理工作负载占绝对主导

训练vs 推理的本质差异：

训练是CapEx（资本支出）——一次性重投入，回报周期不确定推理是 OpEx（运营支出）——按需调用、按量计费、持续消耗

商业模式从「卖矿机」转向「收电费」。更重要的是，推理持续运行，可能占生产AI 系统生命周期成本的 80%-90%——训练只是偶发性投资，推理则产生永不间断的成本流。

4.2推理基础设施的新范式

训练追求极致吞吐量，推理需要贴近用户的低延迟响应。从"中心化训练集群"到"分布式推理网络"的演进，意味着算力需要从"集中供能"走向"网格化配电"——哪里产生 Token 调用，算力就要在毫秒级时间内流动到哪里。

中国推理算力市场2025 年达 438.5 亿元，年均复合增长率66.3%，2028 年将突破 2931 亿元。

五、服务化转型：从"卖瓦特"到"卖服务"

5.1三层价值金字塔

维度	资源服务（算力租赁）	平台服务（算力平台）	生态服务（产业运营）
毛利率	10%-15%	50%-60%	50%-70%
核心产品	GPU/服务器租赁	大模型平台、训推一体	园区运营、数据服务、行业方案
客户黏性	低，可替换性强	中，依赖平台工具链	高，深度嵌入业务

底层资源服务只是入场券，真正的利润区在平台和生态层。同一座智算中心，卖"裸算力" vs "算力+平台+生态"，盈利水平相差 3 到 5 倍。谁能把"算力+模型+数据"打包成行业解决方案交付，谁就能从毛利率 10% 的红海游到毛利率 60% 的深蓝。

5.2成功案例

润泽科技：从IDC 到 AIDC

•在手订单超60 亿元

•与字节跳动签有50 亿元长单

•头部企业毛利率达55%-60%

•远超纯租赁的10%-15%

利通电子：绑定巨头

•与腾讯签50 亿元 3 年长单

•2026 Q1 净利 2.71 亿

•同比增长821%

•风险：80% 收入来自腾讯

六、算力网络与垂直深耕

6.1全国算力一张网

工信部2026 年提出"单点提质、创新强链、连算成网、全面赋能"十六字方针，核心诉求只有一个：把已经建好的算力用起来，而不是继续盲目堆硬件。

指标	数据
全国智能算力总规模	188 万 PFLOPS
国家级平台接入占比	72%（137 万 PFLOPS）
八大枢纽节点占比	>80%
枢纽间时延圈	20 毫秒已实现
超算互联网加速卡	15 万+

工信部首次提出探索"算力银行""算力超市"创新业务模式，推行按"卡时""核时"及 Token 计费。这意味着算力资源有望像银行存款一样，随存随取、按量计息。

6.2垂直深耕：放弃万能平台的幻想

垂直领域	AI 渗透率	核心落地场景	标杆成效
金融	92%	风控建模、智能客服	120+ 算法模型覆盖 840 场景
制造	65%	智慧配煤、AI 质检	盘古32 场景落地，效率提升 35%
医疗	58%	AI 辅助诊断、药物研发	研发周期缩短78%

弃"万能平台"的幻想。XX大模型不搞"万能问答"，扎进 30 多个行业、500 多个场景——从高铁巡检 3.2 万个项点、350 余种故障识别（准确率 99%），到宝钢每年降本超10 亿元。这套"行业 know-how + 算力"的组合拳，打的不是技术参数战，而是产业价值战。

七、算力金融化与十大破局法则

7.1算力 REITs 与算力券

算力REITs

•2025 年 6 月首批数据中心公募 REITs 获批

•万国数据中心REIT 募集 16.09 亿元

•收益率4%-6%，但"有通道"就是革命性的

•算力投资从"一锤子买卖"变成"可循环金融闭环"

算力券政策

城市	年度额度	智算补贴
上海	10 亿元	按比例
贵州	1.4 亿元	30%
成都	≥1 亿元	按比例
北京	最高3000 万/家	最高50%

7.2十大破局法则

法则	核心要义	关键数据	破局逻辑
一、效率优先	算法优化> 堆卡	DeepSeek 训练成本仅为GPT-4 的 1/20	用卡效率取代卡的数量
二、推理为王	从训练驱动转向推理驱动	推理数据量首超训练训推比达3:1	商业模式从"卖矿机"变"收电费"
三、国产降本	自主可控是降本路径	国产市占率12% → 41%	供应链安全+性价比驱动
四、服务升级	从资源租赁到平台+生态	租赁10-15% → 生态 50-70%	Token 经济重构计费单元
五、网络协同	全国一张网消灭孤岛	调度平台接入137 万 PFLOPS	算力银行让沉睡算力流动
六、垂直深耕	行业know-how 是护城河	87% 企业不满通用模型	算力+模型+数据一体化
七、金融赋能	REITs 和算力券打通资本循环	首批数据中心REITs 超 64 亿	重资产"投建管退"闭环
八、边缘突破	端侧算力开辟新蓝海	AI 智能终端 2025 年 5347 亿	2030 年边缘算力占比 70%
九、软硬一体	绑定硬件量产稀释成本	一体机市场三年翻四倍至5208 亿	"开箱即用"缩短部署周期
十、运营为王	投建营一体化提升效率	预制化模块缩短建设周期50%	运营效率决定生死，用好>建好

十大法则横跨算法、硬件、网络、金融、运营五个维度，指向同一个终局——谁能把算力更高效地转化为客户价值，谁就能在这轮洗牌中活下来。法则1-3 解决"成本怎么降"，法则 4-6 回答"需求怎么接"，法则 7-10 回应"资本怎么转"——三层递进，构成完整的破局闭环。

八、终局：从军备竞赛到价值创造

算力商业的终局，不是谁拥有最多的GPU，而是谁能让算力像电流一样无处不在、即插即用。从"军备竞赛"到"价值创造"，从"资源为王"到"运营为王"——这不是温柔的演进，而是一场残酷的淘汰。

摩根大通预测，到2030 年仅中国日均 Token 调用量就将从当前的 140 万亿攀升至 10700 万亿——两个数量级的跃升。算力消费将从"企业采购"变成"日常水电煤"。

近十万亿砸下去，响声终将到来，但它只回应那些真正懂得"用卡"而非"囤卡"的人。

本文综合整理自微信公众号「智慧城市运营研究」沈永洲《国内三大互联网巨头的AI布局拆解》与「MOOC」Tom的猴毛《All in AI第三年，这笔账还是算不明白》两篇文章，IDC《2025年中国人工智能计算力发展评估报告》、国家数据局、中国信通院、兴业银行研报、各上市公司财报等公开资料，结合阿里、腾讯、字节跳动公开财报及行业研究报告整理而成。