乐于分享
好东西不私藏

算力租赁+AI竞争:算力突然告急!揭秘算力系统3大瓶颈,国产算力凭什么逆袭?

算力租赁+AI竞争:算力突然告急!揭秘算力系统3大瓶颈,国产算力凭什么逆袭?

算力租赁+AI竞争:算力突然告急!揭秘算力系统3大瓶颈,国产算力凭什么逆袭?中国为何成全球算力需求中心?

算力租赁与AI竞争正愈演愈烈。

过去的大模型大多仅用于聊天,如今AIGC已能执行写代码、改bug、查资料、跑流程等任务,一个任务往往触发几十甚至上百次模型调用。其中最关键的单位是token,2024年中国每天调用约1000亿token,到2026年已飙升至140万亿token/天,两年增长超1400倍。

大模型正从低频工具转向高频生产工具,而token的本质就是算力消耗。算力为何突然紧张?问题不只是GPU数量,更在于算力使用方式的转变。过去是单任务模型,现在是多任务Agent模型。一个AI编程任务可能连续运行6小时,消耗约4000万token,若7×24小时运行,一个月算力成本可达数千美元。这意味着算力从固定成本变为变量成本,使用频率越高,算力需求增长越快。

算力不是单一的GPU,而是系统工程。真正的算力系统由芯片、网络、电力、机房四部分组成,任一环节出现瓶颈,算力都无法充分发挥。当前最关键的瓶颈集中在以下三个环节:

– 第一,AI芯片(算力源头)

全球高端算力主要由英伟达掌控,其核心优势是CUDA软件生态,开发者长期依赖,难以替代。国外算力模式以单卡性能领先为核心,代表企业有英伟达和AMD。而中国算力走的是不同路径,当前关键是HW昇腾体系,尤其是昇腾910系列。本轮国产算力的不同之处并非单卡性能,而是系统级能力,涵盖光互联、高速集群网络、芯片与服务器协同设计、软件系统整体优化。以往国产芯片侧重追赶单卡性能,此次更强调整机效率和集群效率。随着算力规模进入万卡级别,系统效率的重要性已超过单卡性能,这是国产算力策略变化的核心原因。

– 第二,高速互联(决定集群效率)

GPU并非单独运行,一台服务器通常配置8张GPU,大规模训练集群甚至可达上万张卡。此时系统性能常受限于GPU之间的数据通信速度,高速光互联的重要性由此凸显。博通、迈威尔等代表企业的核心能力是高速数据传输。若通信速度不足,GPU会等待数据,导致算力利用率下降。因此,光模块正从800G升级到1.6T,核心目标是降低通信延迟、提高整体计算效率,而非单纯提升带宽。未来算力竞争不仅是计算能力的比拼,更是计算与通信协同能力的较量。

– 第三,AIDC算力基础设施

GPU只是计算单元,必须部署在专用基础设施——AIDC智算中心中。与传统IDC相比,AIDC算力密度更高、功耗更大,一个万卡集群的耗电量通常是普通IDC的数倍。因此,真正限制算力扩张的是电力资源,关键约束包括绿电供应、能耗指标、能效。国外AIDC建设较早,电力体系成熟;而中国算力需求近年快速增长,电力指标成为重要瓶颈,许多项目推进缓慢并非因资金不足,而是电力资源有限。

算力租赁为何增长?其核心在于GPU获取能力,能持续获得英伟达H100、H200等高端GPU,就具备了供给能力。价格传导路径为GPU价格→算力价格→token成本,最终由应用端承担。但算力租赁属于强周期行业,长期竞争取决于稳定卡源、资金能力和客户资源。行业正呈现明显趋势:订单向头部集中,小规模企业逐步退出。

中国为何成为算力需求中心?2026年中国大模型token调用量占全球约36%,核心原因并非芯片领先,而是应用模型领先。中国在自动编程、无人驾驶、工业机器人、无人机等领域推进迅速,这些应用属于持续运营系统,对算力的需求远高于传统对话模型。国外算力优势仍在模型训练能力,而中国正形成应用驱动型算力需求结构,这是全球算力格局变化的重要因素。

国产算力这次有何不同?过去国产算力的主要问题是单芯片性能落后、生态不足,而此次变化在于竞争方式的转变,不再单纯追求单卡性能,而是强调系统级优化能力,包括芯片设计、光互联、网络架构、软件调度等,通过整体协同提高大模型集群效率。未来算力竞争将从单点技术竞争逐步升级为系统工程竞争,国产算力+算力租赁+AIDC构成token经济,未来算力差距的核心不在于是否拥有算力,而在于谁拥有更高效的算力系统。

“本文仅为个人观点/知识分享,不构成任何投资建议”。“市场有风险,投资需谨慎”。