H100租赁价格上涨40%,AI算力进入卖方市场

Anthropic的Claude Opus 4.6和Claude Code需求激增。Anthropic的年度经常性收入（ARR）在短短一个季度内翻了三倍以上，从去年年底的90亿美元增长至如今超过300亿美元。

诸如智谱GLM和Kimi K2.5等模型推动了开源模型应用场景的爆发。同时，像Anthropic、OpenAI等多家公司进行融资对GPU提出了需求。

这一拐点意味着需求激增，超大规模云服务商（Hyperscalers）和新兴云服务商（Neoclouds）上出现了GPU"抢购潮"。

这种新的需求来源推动了整个供应链中产品和服务价格的上涨，从DRAM和NAND存储，到光纤电缆、数据中心托管以及燃气轮机等基础设施。

GPU租赁价格成为众多算力相关产品和服务中，最新出现供给紧张、价格大幅上涨的领域。H100 GPU一年期租约合同价格已从2025年10月的低点每小时每GPU 1.70美元急升至2026年3月的2.35美元，涨幅接近40%。

与此同时，按需GPU租赁容量（On-Demand）在所有GPU类型中均已售罄，那些已经锁定按需实例的用户，尽管近期价格上涨，仍不愿将这些容量释放回资源池。2026年初寻找GPU算力就像抢最后一班飞机票：价格高昂、可用性几乎为零。

来源：SemiAnalysis GPU租赁价格

本报告将讨论GPU租赁市场的最新趋势、案例与数据点，分析更广泛的GPU租赁市场结构，并探讨未来租赁价格可能的发展方向。

一、GPU租赁市场进入"动态加价"时代

单看H100一年期租赁价格的图表不足以完全体现市场趋势，SemiAnalysis实际采购算力的亲身经历以及市场反馈显示的情况更加严峻。

需求来自多种异构场景，没有统一的解决方案。例如，大规模专家混合（MoE）推理等推理负载，在GB300 NVL72这类最新大规模系统上表现最佳；而训练负载在H100上依然具备最佳性价比，这使得即便是较老的GPU卡，需求仍然旺盛。

客户正在争相以每GPU每小时14美元的价格竞购Amazon EC2 P6-B200实例，一些Neocloud巨头甚至不再提供单节点销售；H100的续约价格与2-3年前签约时完全相同，甚至有部分合同已续签到2028年。

想要获得哪怕8个节点（64块GPU）的H100或H200都非常困难，一半供应商已经完全售罄，大多数供应商则直接表示没有任何Hopper架构GPU即将释放的产能。

甚至有一些算力租赁方将其集群拆分并转租，就像在Monaco Grand Prix期间转租公寓一样。或许，"Neocloud包租公"的时代即将到来？

Blackwell架构的供应同样非常紧张。我们了解到，由于开源模型需求强劲以及推理需求持续爆发，新一批Blackwell部署的交付周期已经延长至6月至7月，而且这些集群几乎全部被预订。

事实上，从现在到2026年8月至9月上线的全部产能，已经被市场提前锁定。

二、GPU租赁价格为何"逆势上涨"？

仅在六个月前，大多数市场观察者还对GPU的长期价值持怀疑态度，并认为GPU租赁价格会随着时间的推移大幅下滑。金融分析师甚至批评任何采用6年折旧周期的新兴云服务商与超大规模云服务商。

在讨论未来趋势如何演变之前，让我们快速回顾一下过去的发展路径。

在2025年底之前，业内普遍预期是随着Blackwell部署的推进（其计算成本更低），Hopper架构（即H100和H200）的租赁价格将显著下降。

然而，2025年末的实际情况却恰恰相反：H100需求不仅保持稳定，在许多情况下甚至进一步增强。当时，开源模型的快速普及以及推理需求的加速增长，首次显现出市场对算力"无止境"的需求浪潮。

2026年1月成为下一个关键拐点：内存价格（DRAM和NAND）在连续多个季度上涨后，开始呈现"指数级爆发"。根据SemiAnalysis的存储模型，LPDDR5和DDR5的合同价格预计将分别上涨约4倍和5倍。

为了应对组件成本快速上涨而带来的利润风险，原始设备制造商（OEM）开始大幅上调AI服务器价格，其涨幅远高于组件成本的增长。这使得集群资本投资过程变得更加复杂，服务器采购成本的上升压缩了项目预期回报，迫使部分运营商放缓甚至放弃部署计划。

实际上，原本会上线的部分供给被延后，进一步加剧了租赁市场的紧张局势。

来源：SemiAnalysis AI TCO模型

在这场由"AI服务器定价"引发的服务器采购混乱之中，GPU租赁需求明显加速，大多数剩余的闲置算力在1月和2月被消化殆尽。到了3月，几乎已经不可能找到任何期限H100、H200或B200租赁资源。

一年期合同的租赁价格在1月底突破了2美元/小时/GPU，随后在2月中下旬较1月底飙升了15-20%，并预计到3月底将再环比上涨15-20%。

今年年初推动需求增长的一个重要因素来自Seedance和Nano Banana，它们正在推动Token吞吐量的大幅增长，因为用户正在大规模生成和优化图像与视频。

但最明显的需求驱动力是执行多步骤工作流、高并发运行并持续迭代的"多智能体工作负载"（multi-agent workloads）的出现，这导致了Token和算力消耗的指数级增长。

据悉，SemiAnalysis 在过去7天内消耗了数十亿个Token，平均成本约为5美元/百万Token，但节省的时间回报以及工作流和能力的扩展远超这一成本。

来源：SemiAnalysis Tokenomics Dashboard

随着越来越多主体开始意识到AI工具所带来的惊人投资回报，并加入这股浪潮，Token消耗量将持续出现"阶跃式"上升。关于使用AI真实回报的争论已经尘埃落定：使用AI工具所创造的价值可以达到其成本的一个数量级以上。

Token需求曲线持续向右上方移动，这一强劲且相对缺乏弹性的需求力量，正在推动GPU租赁价格不断上涨。

简而言之，如果AI工具的投资回报率达到5–10倍，那么GPU租赁价格显然还有很大的上涨空间，远未达到抑制需求的程度。如果租赁价格的上涨进一步对服务器和组件成本施加额外压力，我们不会感到惊讶。

三、GPU租赁市场结构

在2025年底之前，由于运营商拥有更充足的GPU库存，而终端需求尚未全面爆发，GPU租赁价格竞争较为激烈。多个GPU云厂商可以提供极具竞争力的报价，优先考虑提高利用率，避免在下一代GPU迭代前未能充分消化已有算力资产。

此后，GPU租赁提供商的策略发生了180度转变。新兴云服务商与超大规模云服务商如今掌握主导权，可以争取更有利的条款，例如更高预付款、更优价格、更长合同期限，甚至可以根据库存情况挑选合同的开始和结束日期。

他们可以按照自己的时间规划部署，利用不断上涨的价格环境，随着时间的推移为给定的集群建立最佳的客户组合。

GPU租赁市场可分为三大细分领域，各自服务不同类型客户：

短期租赁：按需（On-Demand）、现货（Spot）以及3个月以内合约

中期合约：3个月至3年以上的合约

长期协议：4至5年（其中5年最常见）的合约

短期租赁

短期租赁处于期限结构最前端，通常代表剩余产能。尽管许多厂商（如 Runpod 和 Lambda）非常成功地专注于提供大量灵活的按需或竞价容量。按需定价的运作方式往往与合同 GPU 租赁市场的其余部分截然不同。提供商通常为按需容量设置固定价格，并且仅极少调整价格。

来源：Lambda Labs

算力租赁提供商会根据利用率进行一次性价格调整：若利用率过低，则降价吸引需求；若利用率达到上限，则提高价格。

因为提供商认定即使在更高的价格水平下，利用率也将保持在高位。这就是为什么新兴云服务商公示的按需价格时间序列会长期持平，然后突然跳升或跳降。在按需市场中，利用率是需求最好的高频指标，而非价格。

来源：Lambda Labs，SemiAnalysis

中期合约

从经济意义上看，最重要的是合约市场，大部分GPU租赁价值在此实现。其中，1年期合约捕捉了非AI实验室客户的边际需求以及大客户溢出需求，因此对市场紧张程度最为敏感。

AI原生公司与中小型AI实验室主要集中在1–3年期限，但他们越来越多开始锁定4年以上长期算力，并接受超过20%的高额预付款，这在过去并不常见。

长期协议

最后，在4–5年这一期限区间，市场主要由人工智能实验室主导，它们会提前锁定大规模算力容量。这类交易通常涉及50MW、100MW甚至更大规模的算力集群——大致相当于约24,000至48,000块NVIDIA GB300 NVL72。总体来看，这些交易在整个Neocloud GPU租赁市场中占据了非常大的比重。

人工智能实验室偏好此类合同，因为它们可以一次性锁定大量算力资源，以满足快速增长的终端需求。同时，人工智能实验室在集群设计方面也拥有较强的话语权，能够对存储、网络、CPU算力等关键环节进行决策。

这类交易通常以裸金属（bare metal）形式为主，因为AI实验室具备工程能力，可以对技术栈进行更深层次的定制，从而在总体拥有成本（TCO）下实现最高性能。

Neocloud厂商同样青睐这类交易，因为相比处理数十个小规模订单，他们可以将销售资源集中在少数几个大型承购项目上，并获得相同规模的收入。他们可以基于这些合同以更有利的条件进行债务融资，并使融资期限与合同周期匹配，从而在很大程度上消除期限风险和GPU租赁价格波动风险，同时在大多数情况下锁定约十几个百分点的项目内部收益率（IRR）。

此外，由超大规模云服务商（Hyperscaler）为这些交易提供兜底支持也十分常见——即由其作为Neocloud的直接承购方，再将算力转售给人工智能实验室。

这种结构对各方而言是多赢的：Neocloud由于承购方为AAA评级的超大规模云服务商，可以获得更优惠的融资条件；而超大规模云服务商则无需扩大自身资产负债表，就可以通过提供信用背书，从项目收入中获取一部分收益。

下表展示了一些大型承购交易。SemiAnalysis对这些交易进行了深入分析，以测算其隐含定价（以美元/小时/GPU计）以及项目内部收益率（IRR）、息税前利润率（EBIT Margin）等盈利指标。

来源：SemiAnalysis AI TCO模型

在当前市场环境下，大多数正在建设的大型集群都被AI实验室"锁定"，同时这些实验室也在参与4年以下市场，通过续约现有H100与H200集群来抑制供给回流。随着GB200与GB300超级集群扩张，1–3年市场的供需关系将变得尤为关键。

四、未来趋势

最引人注目的是基本面与市场情绪之间的脱节。尽管供给收紧、价格上涨，这本应利好Neocloud企业利润扩张与资产寿命延长，但资本市场对CoreWeave、Nebius、IREN等公司的情绪却持续偏负面，其股价处于过去6–12个月区间的低位。

市场仍然执着于"供给与商品化"，而忽视了当前现实：GPU持续短缺与定价权意味着几乎所有算力都将保持高需求。

三大观察指标：决定价格趋势的关键变量

SemiAnalysis列出了判断GPU租赁价格能否持续高位的三项核心观察指标。

1GB300集群的放量节奏

新增算力容量能否缓解当前的算力短缺，还是算力消耗增速将继续超越新增供给——这将决定AI实验室参与4年以下合约市场的程度，进而左右该区间的定价走势。

2硅片短缺的恶化程度

SemiAnalysis在此前报告中已指出台积电N3制程逻辑晶圆产能以及HBM、DRAM、NAND存储器的供应紧张状况，复杂的制造流程意味着执行风险随时存在。

3AI实验室ARR的增长轨迹

用户采纳速度的快慢以及Token消耗的持续增长，是决定整体需求曲线斜率的根本变量。

综合来看，SemiAnalysis的结论清晰：在上述三项指标出现明显转向之前，算力价格的方向只有一个：向上。

五、结论：价格仍将继续上涨

综合来看，GPU租赁价格更可能继续上涨而非下跌。

这一趋势具有自我强化效应：供应趋紧与价格上涨促使Neocloud提前采购更多硬件，从而进一步收紧供给并推高价格。

SemiAnalysis将此与2023至2024年的GPU短缺周期相提并论，但认为此次服务器市场已足够成熟，OEM获取超额利润的空间可能受限。

GPU租价上涨对Neocloud的财务影响是双重的：

一方面，已部署资本的利润率得以扩张，改善投资资本回报率（ROIC）；

另一方面，更高的租赁价格延长了现有GPU的经济使用寿命，使既有资产在需要再投资之前能够产生更长时间的现金流。

目前最直接的受益者包括：合约期限较短（可快速重新定价）的供应商；拥有大量H100存量的公司；近期有新增产能的厂商。

短期合约供应商可以迅速以更高价格续约，从而立即提升利润率。而锁定长期下一代算力的Hyperscaler与Neocloud同样将受益。