乐于分享
好东西不私藏

Neocloud:AI算力基础设施的新革命

Neocloud:AI算力基础设施的新革命

一、引言:从传统云到Neocloud的范式转变

当生成式AI和大语言模型(LLM)的浪潮席卷全球技术行业时,传统云计算巨头——Amazon Web ServicesMicrosoft AzureGoogle Cloud Platform——发现自身的基础设施架构正面临一个根本性的挑战:它们为通用计算(CPU密集型任务)设计的数据中心网络,在面对GPU集群的突发指数级需求时完全力不从心。在传统云平台上获取大规模GPU算力的等待时间可能长达数周,而在新兴的Neocloud平台上,这个时间可以缩短到几天。这种巨大的时间差,对于以速度为生命的AI竞赛而言,是决定性的。

Neocloud(新型云服务商)应运而生。它们是一类专门为AI工作负载设计的新型云计算基础设施提供商,专注于提供高性能、以GPU为中心的计算能力。如果说传统云巨头是百货超市,提供从计算、存储、数据库到各种软件服务的数百种商品,那么Neocloud就是专卖店,它们不卖所有的东西,而是专注于解决AI的问题。这种专注带来了更高的性能密度、更快的部署周期以及更高效的AI工作负载扩展能力,正在从根本上重塑云计算的竞争格局。

 Synergy Research Group 数据显示,2025年全年 Neocloud 收入超过250亿美元,第四季度同比增长223%,预计到2031年市场规模将接近4000亿美元,年复合增长率达58%。这一数据充分说明,我们观察到的不仅仅是新一类云提供商的崛起,而是计算架构本身更深层次的结构性调整。本文将从技术架构、市场规模、竞争格局和未来挑战四个维度,对Neocloud进行全面解析。

二、核心概念与技术架构

2.1 Neocloud的定义与定位

NeocloudAI基础设施领域中兴起的新型基础设施服务商,其核心业务是提供GPU即服务(GPUaaS)、生成式AI平台服务和高密度数据中心容量。与传统超大规模云提供商改造CPU为中心的架构不同,Neocloud提供商从零开始构建绿地环境,专门为AI性能而设计。它们的客户群体主要包括AI初创公司、大模型研发团队、企业AI应用开发者以及需要大规模推理能力的企业。

2.2 三大核心技术优势

第一,裸金属架构带来更高性能与低延迟。Neocloud抛弃了传统云厂商为实现多租户隔离而引入的虚拟化层(Hypervisor),直接向客户提供裸金属Bare Metal)服务器。客户可以直接访问物理硬件,减少了软件开销,从而获得更低的延迟和更高的计算性能。对于需要进行大规模、紧密耦合计算的AI模型训练来说,这一点至关重要。

第二,精简的业务模型实现成本效益。由于业务模型精简,Neocloud省去了传统云巨头在通用服务上的大量研发和运营成本,可以将资源完全集中在优化GPU集群上,从而以更低的价格提供算力。它们通过硬件精简、网络与软件调优、运维升级等方式,降低单节点总体拥有成本(TCO),提升GPU利用率与训练效率,形成技术壁垒。

第三,灵活的商业模式适应AI创业需求。面对AI初创公司快速迭代的需求,一些Neocloud公司如Nebius可以提供更短、更灵活的合同,从312个月的短期合约,甚至是按小时计费。这与传统云巨头动不动12年以上的合同锁定相比,对很多AI创业公司来说是刚需。

2.3 技术架构特点

Neocloud的技术架构融合了云原生(Cloud-Native)和AI原生(AI-Native)技术。在网络层面,它们采用InfiniBand和高速以太网技术,专门优化了GPU节点间的数据传输,能够支撑大规模分布式训练。在存储层面,采用高启吐吐量存储系统和对象存储服务,确保训练数据的高速访问。在软件栈层面,它们提供Kubernetes容器编排、专用调度器和自动缩放工具,让开发者能够将更多精力集中在模型开发本身。此外,2025年以来,部分Neocloud平台开始拥抱无服务器架构(Serverless+强化学习(RL技术栈,进一步提升了资源利用率和开发效率。

三、市场规模与增长趋势

Neocloud市场正在经历前所未有的增长。根据 Synergy Research Group 的最新数据,2025年第四季度Neocloud收入达到90亿美元,同比增长223%,全年收入超过250亿美元。ABI Research 预测,到2030年,Neocloud提供商仅在GPUaaS领域的收入就将超过650亿美元。而 Synergy 更是预测到2031年整个市场将接近4000亿美元,年复合增长率高达58%

这一爆发式增长的背后,是AI基础设施需求激增与传统云供应结构性受限之间的巨大裂谷。英伟达H100从下单到交货的周期曾一度拉到52周,H200B200发布时直接被预订一空。OpenAIAnthropicxAI这些前沿实验室每季度的资本支出都是以十亿美元为单位在跳。AWSAzureGCP三家超大规模云虽然在疑狂扩产,但供应依然追不上需求,这给了Neocloud们一个巨大的市场窗口。

1Neocloud市场关键指标概览

指标

2025年数据

预测目标

全年收入

超过250亿美元

2031年接近4000亿美元

Q4同比增长率

223%

年复合增长率58%

市场窗口

GPU算力供不应求

持续扩大

GPUaaS收入(2030年)

超过650亿美元

1:数据来源为 Synergy Research GroupABI Research

四、主要玩家与竞争格局

4.1 头部玩家概览

Neocloud赛道已经嵌现出明确的头部格局。领军企业包括CoreWeaveCrusoeCore ScientificLambdaNebiusNscale。其中,CoreWeave脏得最为突出,成为传统超大规模云提供商最直接的挑战者。此外,OpenAIAnthropic代表了一个独特但日益重要的类别——它们提供类似云的基础模型访问和AI开发环境,进一步模糊了基础设施层与平台层的竞争边界。

2:主要Neocloud玩家对比

公司

核心定位

亮点

CoreWeave

AI原生云基础设施

英伟达支持,43座数据中心,已上市

Lambda

GPU算力租赁

英伟达战略投资15亿美元,性价比优势

Nebius

欧洲AI云平台

Yandex分拆,获微迟近200亿美元订单

Crusoe

可持续GPU算力

清洁能源赋能,环保差异化

Core   Scientific

AI基础设施服务

挖矿转型标杆,拥有大量电力资源

2:数据来源为各公司官网及公开披露文件

4.2 CoreWeave:赛道领头羊

CoreWeaveNocloud赛道当之无愧的领导者。该公司成2017年成立,前身是一家以太坊挖矿建设基础设施的公司,2019年正式转型为基于GPU的高性能计算云服务。截至2024年底,CoreWeave已拥有超过25万张英伟达GPU,运营32座数据中心,2024年营收达19亿美元,同比增长737%,其中微软贡献62%收入。20253月,CoreWeave成功在纳斯达克上市,市值一度冲到千亿美元量级。目前公司已扩展到43座活跃数据中心,已签约超过3GW的服务器电容量,客户矩阵已实现对头部AI模型厂商的全面覆盖,包括微软、Meta、英伟达和Anthropic

4.3 传统巨头与Neocloud的关系

值得注意的是,传统云巨头与Neocloud并非纯粹的竞争关系。事实上,微软既是CoreWeave的最大客户(承诺在2023-2030年间以近100亿美元租用其服务器),又是Nebius的重要合作伙伴(200亿美元多年期协议)。英伟达则同时是CoreWeaveLambda等多家Neocloud的芯片供应商、股东和最大客户,形成了独特的循环式财务安排。英伟达通过扶持这些新型云服务商,构建BI产业链内循环:既巩固自身技术壁垒,又为行业新玩家铺路,共同制衡传统云势力。

五、挑战与未来展望

5.1 当前面临的主要挑战

高杠杆扩张模式的财务风险。Neocloud的商业模式本质上是一门金融与基础设施的混合生意:拿债务或股权融资,买GPU,和客户签25年的租约,用租约现金流去覆盖债务。这种模式在AI需求爆发期表现优异,但一旦AI投资退潮或英伟达释放新芯片导致GPU性能大幅提升,现有硬件可能迅速贬值,企业将面临巨大的财务压力。

传统巨头的反击。AWSGoogle GCPAzure以前所未有的力度投资建设自己的GPU集群,它们拥有庞大的客户基础和生态优势,未来的竞争策略可能包括正面竞争、收购合并或将Neocloud纳入混合云战略。这场巨头的反击战,将决定Neocloud最终是成为一个独立的、与传统云并行的市场,还是会被后者吸收和整合。

电力与能源约束。GPU集群的能耗极其庞大,电力可用性已成为制约部署决策的关键因素。如何在保证算力供应的同时实现可持续发展,是所有Neocloud企业必须回答的问题。部分企业如Crusoe已开始探索清洁能源赋能的路径,但大规模推广仍面临成本和技术挑战。

5.2 未来展望

尽管存在诸多挑战,Neocloud的未来仍然充满希望。随Synergy Research Group 创始人 Jeremy Duke 所言,我们观察到的是计算架构本身更深层次的结构性调整。传统的超大规模系统是围绕通用弹性概念设计的,而AI工作负载则在并行性、数据本地性和计算密度方面施加了更为严格的约束。随着AI从探索阶段进入持续的大规模部署阶段,这些根本性的差异将不再是次要问题,而是决定计算系统演进方向的关键因素。

展望未来,我们认为Neocloud将在以下几个方向持续演进:一是硬件层面,随着英伟达Blackwell及后续架构的推出,单芯片算力密度将进一步提升,降低单位算力成本;二是软件栈层面,ServerlessRL技术的融合将让AI开发更加便捷,进一步降低使用门槛;三是竞争格局层面,我们可能会看到传统云巨头通过收购或战略投资深入Neocloud赛道,进一步模糊两者的边界。对于投资者和技术决策者而言,理解Neocloud这一新兴赛道的技术逻辑和竞争动态,已经成为把握AI时代机遇的必修课。