当前时间: 1970-01-01 08:00:00
分类:办公文件
评论(0)
AI爆发带动CPU需求全面升级!·CPU增量需求与采购情况:当前CPU需求增长核心驱动为Agentic AI,其落地带动云厂商CPU利用率明显提升。中国数据中心70%的CPU供应给云厂商,最近两个季度云厂商CPU采购提升超50%,未实现翻倍。需求从2025年Q4开始进入稳健增长通道,单季度涨幅约20%,暂无爆发式需求出现,相关概念性炒作与实际需求存在偏差,增长具备较强稳定性。·CPU与GPU配比现状与预期:当前市场服务器主要分为三类,不同机型CPU/GPU配比存在差异:a. 标配GPU服务器为2颗CPU搭配8颗GPU,对应配比1:4;b. 推理用GPU服务器为2颗CPU搭配16颗GPU,对应配比1:8;c. 标准服务器无GPU配置,仅搭载CPU。当前全量服务器CPU/GPU整体配比为1:3-1:4,暂未明显向1:2甚至1:1收窄。若未来Agent AI大规模落地,其任务编排、分发、协调需求需要大量通用CPU算力支撑,将带动配比收窄,短期一两个季度配比无明显变化,两个季度后或出现调整。·CPU供需与产能规划情况:当前CPU缺货程度低于内存,无特别紧俏情况,短期缺货与股价上涨无明显关联。半导体产能通常提前1年锁定,单季度产能浮动最高仅20%,即使需求短期大增,产能也难以及时跟进。海外头部云厂商CPU需求虽有所紧俏,但紧俏程度与股价翻倍涨幅不匹配,二者无线性对应关系。·英伟达整机柜解耦方案特点:传统CPU-GPU互联方案采用固定配比模式,典型配置为两颗CPU搭配八个GPU,该模式存在明显局限性:若CPU配置不足,会导致GPU闲置;且传统解耦方案无法通过NVLink直接互联,会牺牲一定带宽。在Agentic AI发展趋势下,GPU需求仍保持快速增长,但CPU需求增速将快于GPU,传统固定配比方案已无法适配业务负载变化需求。英伟达最新Roving整机柜解决方案实现CPU与GPU解耦,核心优势主要包括两点:a. 配置灵活性大幅提升,客户可根据自身业务负载单独扩容CPU或GPU,适配不同业务需求;b. 底层仍采用NVLink架构实现互联,未牺牲带宽,解耦效果更优。·CPU阵营划分与算力对比:当前数据中心CPU分为两大阵营:x86阵营核心厂商为AMD、英特尔,ARM阵营主流通用型为英伟达方案,AWS、谷歌等自研ARM产品属于特定场景非通用型,不属于通用主流产品。不同场景算力差异显著:低精度运算(如INT8、FP4场景)下,1颗GPU算力约等于50颗CPU,GPU具备显著优势,适配AI相关token计算场景;标准精度运算(如FP32,对应数据库、存储、网页等普通场景)下GPU标准精度算力极低,相关运算均采用CPU完成。横向对比三家主流CPU标准精度算力,以英伟达ARM CPU算力为基准值100,AMD最强CPU算力达250-300,英特尔最强CPU算力为150-200,x86 CPU标准精度算力是英伟达ARM的2-3倍。此外英伟达ARM方案独有互联优势:其ARM CPU可与自家GPU通过NVLink直接互联,互联带宽是传统CPU与GPU间PCIe协议的3-4倍,在非纯算力要求场景下具备明显竞争力。·AMD份额提升核心原因:2026年一季度AMD在数据中心x86 CPU市场份额已超过50%,成为x86阵营主流选择,份额提升核心优势可分为三点:一是性能优势,AMD最新及待发布CPU核心数可达192-256核,英特尔当前大核仅100余核,二者单核性能相近前提下,AMD单颗CPU算力较英特尔高50%-60%;二是价格优势,AMD产品过往价格仅为英特尔的6-7折,当前同性能产品价格约为英特尔的9-9.5折,仍有成本优势;三是适配云厂商TCO优化需求,云厂商核心盈利模式为售卖算力(虚拟机、容器等),AMD CPU核心数更多带来更高算力密度,同样搭载2颗CPU的服务器可卖出更多虚拟机/容器,能够大幅降低单算力对应的网络、电力、空调、管理等全生命周期综合TCO,因此广受云厂商偏好,成为份额提升核心推动力。·CPU产品趋势与下游选型:当前CPU需求呈现明显两极化特征:云厂商对高核数CPU需求持续提升,未来产品将向256核、512核甚至更高核数迭代;传统企业级应用(如ERP、OA等)需求以30-60核CPU为主,随着混合云架构普及,企业弹性负荷多采购公有云服务,自有数据中心对高算力密度产品需求较低。中低端CPU当前处于紧缺状态,核心原因是英特尔、AMD的新款CPU均采用chiplet架构,高低端CPU共用底层核心积木,高端产品占用核心积木较多,直接导致中低端CPU核心积木供应紧缺,行业无独立的中低端CPU产线。下游云厂商选型偏好高度一致:国内外头部云厂商均优先选择Top-bin旗舰款CPU,国内厂商中腾讯偏好192核超高密度款,阿里、字节偏好128核高密度款;海外AWS、Meta、谷歌等厂商选型逻辑一致,均选择最新一代旗舰产品,不会选择96核等非旗舰型号。·国产CPU性能与替代现状:不同厂商CPU核心数计算规则存在差异,部分CPU产品采用1物理核心对应4线程的计算方式统计核心数,英特尔、AMD等海外主流x86厂商采用1物理核心对应2线程的标准超线程规则,二者公示的核心数数值差异较大,未经过测试的产品性能不便直接评论。出口管制层面,当前英特尔、AMD、英伟达ARM架构CPU等主流CPU产品均不受出口管制,理论上可自由采购。替代需求层面,目前仅信创类项目有强制使用国产化CPU的要求,除此之外客户暂无主动替换国产CPU的诉求,核心原因是国产CPU与海外同类产品的性能差异较为明显,若非政策强制要求,客户不会主动选用国产x86或ARM架构CPU。·英伟达Vera CPU定位与竞争力:Vera为数据中心级CPU,与苹果M系列消费级芯片不存在竞争关系。算力层面,当前AMD最强x86 CPU的算力为300,Vera的算力仅为100,单颗x86 CPU的算力可达Vera的3倍。Vera的核心竞争力并非CPU本身性能,而是其与GPU之间的互联带宽,该项指标比传统x86 CPU高3-4倍,这一优势无法通过单纯的算力提升弥补,是其当前的核心卖点。·AI PC CPU产品布局对比:AI PC所用SOC采用10余核ARM架构+CUDA单元,搭载LPDDR5统一寻址架构,最高支持128G显存。AMD同生态位产品为AMX 395,同样支持128G显存内存融合,成本约2000美金;英伟达同规格方案成本为3000-4000美金,AMD方案成本仅为英伟达的一半。目前英伟达AI PC SOC已有多款原型机产出,但尚未正式批量上市,后续上市节奏仍需观察。·大厂自研CPU与RISC-V发展:当前多数大厂自研CPU采用购买ARM IP后做深度定制的模式,除高通等本身对CPU核有深度定制能力的厂商外,其余厂商产品性能仍以ARM本身IP为基础。ARM下场直接推出自有CPU后,Meta、Google等厂商的ARM架构自研CPU投入节奏放缓,转向开源RISC-V指令架构做布局,不过目前RISC-V的生态仍不完善,相关厂商的技术路线规划尚未完全明确。性能层面,英伟达Vera为当前ARM架构CPU中的顶级产品,其余厂商自研的ARM架构CPU性能仅为Vera的60%-70%,算力约60-70,远低于x86 CPU最高300的算力水平。·边缘端CPU发展情况:边缘端CPU主要分为消费级、嵌入式系统方案两大场景,目前主流产品为面向工控、嵌入式、车机场景的定制化解决方案。边缘端CPU整体市场占比不足5%,不属于CPU需求的核心来源,并非市场主流产品,整体需求规模有限。·大模型对CPU需求的拉动作用:大模型对CPU需求的拉动可分为设计端与应用端两个维度:a. 设计端:大模型可用于优化CPU的设计、性能测试流程,相较纯人工模式研发效率明显提升,AMD、英特尔、台积电等产业链核心厂商均已在相关环节应用大模型技术。b. 应用端:大模型厂商的存储需求呈现爆发式增长,采购的SSD、HDD等存储硬件需要配套CPU作为管理机头,对应配比约为20块SSD搭配2-4颗CPU,40块HDD搭配对应数量的CPU;大模型厂商的CPU采购需求不止来自运算环节,更大的增量来自存储节点配套,包括上下文存储、训练推理、数据库相关存储场景均需要配套CPU支撑。·CPU价格与供应链卡点情况:CPU价格走势与供应链情况可分为两部分:a. 价格走势:头部云厂商与CPU供应商签订长期意向性采购协议,当前无直接涨价情况,仅原有较深的采购折扣收窄,实际采购成本略有提升;渠道端CPU价格完全随供需关系潮汐波动,不受CPU厂商指导价约束,价格变动弹性更大。b. 供应链卡点:此前CPU生产曾出现底座substrate等PCI相关零部件缺货问题,目前相关环节产能投资已跟上,无明显供应链卡点;与GPU受CoWoS封装产能限制的情况不同,CPU当前无核心产能瓶颈,交付稳定性更高。·Agent AI对CPU的需求影响:Agent AI与CPU需求的关联及实际增长预期如下:a. 需求关联逻辑:Agent AI的每个任务对应一个沙箱/容器,带动对应CPU需求增长,此前GPU需求率先爆发,当前CPU需求也呈上涨态势。b. 超卖技术的平抑作用:头部云厂商可实现1份CPU资源超卖4-5倍,通过时间片切片、热迁移、动态资源调度技术,在客户无感知前提下提升CPU复用率;举例来看,1颗具备100个核心、200个线程的CPU,原本最多可支撑200个性能完好的沙箱,通过超卖技术可服务800个客户,技术能力不足的厂商超卖会导致客户感知性能下降。c. 实际增长预期:短期来看云厂商现有CPU冗余仍可满足当前上涨的需求,但冗余规模正在收窄,云厂商已在加速CPU采购;短期CPU需求增速为20%-30%,不存在市场传言的倍数级增长。·晶圆产能分配与自研CPU门槛:台积电先进制程客户优先级清晰,前四大客户依次为英伟达、苹果、AMD、高通,中小厂商及自研CPU厂商无法拿到优先产能。自研CPU核心门槛可从三个维度拆解:a.流片成本约束,3nm流片成本接近1亿美金,7nm流片成本约为百万美金,先进制程流片投入极高;b.产能约束,头部厂商占据绝大多数先进制程产能,中小自研厂商难以获得足够产能支撑大规模流片需求;c.成本分摊逻辑,自研CPU需要足够出货量分摊高额研发及流片成本,只有流片规模达到一定量级,单位研发成本分摊后自研才具备商业合理性,当前多数中小自研厂商不满足该条件,因此除英伟达的Arm CPU外,其余厂商的自研Arm CPU短期内不构成迫切的市场竞争。·ARM架构与CPU产品规划趋势:ARM架构进军数据中心市场已是第三次,前两次推广均未成功,当前虽有大厂推进自研Arm CPU,但多为短期投入数千台到小一万台的样品级规模,尚未出现除英伟达Vera方案外的十万、百万级上量的主流应用,ARM在数据中心市场的份额尚未出现长期稳健的提升,部分厂商采取ARM、RISC-V双线定制的布局。CPU产品规划存在明确时间差,未来3年的CPU、GPU等半导体产品均已完成设计,下两代产品已进入早期流片阶段,当前的AI需求仅能影响4年后的产品设计与优化,短期内各厂商的产品路线图不会出现大幅调整,公开的产品规划具备较高参考性。·国产x86 CPU发展瓶颈与前景:国产x86 CPU的技术基础为获授权的老版本架构,如海光等厂商的x86 CPU基于Zen1架构魔改演进,当前海外AMD已迭代至Zen6,二者性能存在代际差距。性能量化对比来看,海光作为当前性能最强的国产x86 CPU,过去三四年单核性能仅提升15%-18%,核心数提升2倍,单核性能仅为海外最新产品的40%,整体迭代速度为四五年仅提升10%-20%,性能提升幅度十分有限。国产x86 CPU的核心发展瓶颈在于未完全吃透所获授权的底层架构,国内在芯片设计研发的工程师资源投入不足,当前AI尚未将CPU、GPU设计的核心机密内容纳入训练语料,暂无法为底层架构研发提供助力,若10年内仍未吃透底层架构,产品将丧失商业价值。chiplet技术属于封装工艺,可灵活组合不同晶圆Die提升部分性能,但海外厂商同样在应用该技术,无法弥补单核性能的核心差距,缩小代际差距的核心仍在于吃透底层架构。此外先进制程的商业门槛也构成约束,先进制程流片成本过高,没有足够出货量支撑的话商业模型无法跑通,当前海光采用4nm、7nm的IO Die与CCD分离设计,尚未应用3nm等最新制程。
基本
文件
流程
错误
SQL
调试
- 请求信息 : 2026-06-20 18:32:49 HTTP/1.1 GET : https://www.yeyulingfeng.com/a/770820.html
- 运行时间 : 0.094670s [ 吞吐率:10.56req/s ] 内存消耗:4,803.38kb 文件加载:145
- 缓存信息 : 0 reads,0 writes
- 会话信息 : SESSION_ID=7badceb8a848b29a81ae734f8725eed1
- CONNECT:[ UseTime:0.000553s ] mysql:host=127.0.0.1;port=3306;dbname=wenku;charset=utf8mb4
- SHOW FULL COLUMNS FROM `fenlei` [ RunTime:0.000921s ]
- SELECT * FROM `fenlei` WHERE `fid` = 0 [ RunTime:0.000395s ]
- SELECT * FROM `fenlei` WHERE `fid` = 63 [ RunTime:0.000271s ]
- SHOW FULL COLUMNS FROM `set` [ RunTime:0.000514s ]
- SELECT * FROM `set` [ RunTime:0.000223s ]
- SHOW FULL COLUMNS FROM `article` [ RunTime:0.000527s ]
- SELECT * FROM `article` WHERE `id` = 770820 LIMIT 1 [ RunTime:0.000480s ]
- UPDATE `article` SET `lasttime` = 1781951569 WHERE `id` = 770820 [ RunTime:0.000886s ]
- SELECT * FROM `fenlei` WHERE `id` = 64 LIMIT 1 [ RunTime:0.000236s ]
- SELECT * FROM `article` WHERE `id` < 770820 ORDER BY `id` DESC LIMIT 1 [ RunTime:0.000464s ]
- SELECT * FROM `article` WHERE `id` > 770820 ORDER BY `id` ASC LIMIT 1 [ RunTime:0.001281s ]
- SELECT * FROM `article` WHERE `id` < 770820 ORDER BY `id` DESC LIMIT 10 [ RunTime:0.002034s ]
- SELECT * FROM `article` WHERE `id` < 770820 ORDER BY `id` DESC LIMIT 10,10 [ RunTime:0.002822s ]
- SELECT * FROM `article` WHERE `id` < 770820 ORDER BY `id` DESC LIMIT 20,10 [ RunTime:0.003607s ]
0.096507s