当前时间: 2026-05-11 11:13:23
分类:办公文件
评论(0)
AI带动CPU行业观点更新海内外CPU涨价情况:当前全球CPU市场价格普遍上浮,不同品类涨幅差异明显:高密度多核服务器CPU涨幅超30%,通用服务器CPU涨幅15%-20%,消费级PC CPU涨幅8%-12%。海外涨价节奏较快,印度已连续发布两次CPU涨价公告。国产CPU价格调整节奏慢于海外,鲲鹏、海光、飞腾等国内主流CPU暂未明显上调价格,但原有价格优惠政策明显收缩:国产CPU原有折扣普遍为5个点左右,此前配套的返利、特价等优惠目前已基本取消。受全球CPU供应紧缺影响,预计2026年下半年国产CPU价格存在上浮趋势。·CPU供应缺口与交期:2026年全球CPU整体供应缺口较大,受产能不足限制,CPU拿货周期已从原先的8-12周延长至12-24周。当前下游CPU需求紧迫,供应缺口压力突出,若海外CPU供给无法满足市场需求,下游客户存在转向采购国产CPU的可能性。·供需紧缺的短期影响:CPU价格上涨、交期拉长会直接影响云数据中心业务拓展规划,延缓算力中心建设进度,项目拖期将带来额外成本压力。当前国内云厂商已在加速推进国产CPU适配:五斗云等厂商已与鲲鹏开展长期定制化合作,天翼云、阿里云、腾讯云等作为信创云供应商,一方面针对信创业务需求完成国产CPU适配,另一方面其自用的GDM/JDM服务器已纳入鲲鹏、飞腾、海光等国产CPU选项。云厂商技术适配能力较强,适配进度快于金融、运营商、能源等其他行业,预计2026年下半年国内互联网厂商或将启动国产CPU大规模采购。·国内外CPU性能差距:当前主流CPU架构分为x86与ARM两类,针对实际应用场景,国内外CPU的性能差距已经不大。目前云厂商、金融行业等客户对国产CPU的性能要求为不低于x86架构产品的85%,现有国产CPU已基本可达到该指标。海光及ARM架构国产CPU,在金融核心交易场景下性能可达英特尔同类产品的85%,在分布式存储等场景下性能最高可达90%,可满足云厂商及下游终端客户的实际应用需求,随着国产芯片技术持续迭代,性能达标表现将更为稳定。·海外CPU分核数定价:海外CPU的定价受采购模式影响存在差异,当前涨价后的实际出货价已低于官方标价,具体分核数定价水平为:144核的英特尔、AMD CPU定价约9万元,96核产品定价约7万元,64核产品定价约4万元。互联网厂商、CSP大厂、云厂商等下游客户的采购核数选择与应用场景高度绑定:a. AI等对算力密度要求较高的场景,主流采购规格为96核、128核、144核的高密度CPU;b. 通用计算场景,主流采购64核CPU。·国产CPU价格与良率:同性能的国产CPU价格低于海外同类产品,国内市场中,64核ARM架构CPU价格较英特尔、AMD的x86架构产品更低。国产CPU刚推出时受良率限制价格偏高,后续良率稳定后价格仍有下降空间。目前国产CPU产线的良率处于爬坡提升阶段,初期交付阶段良率相对偏低,爬坡完成后可稳定在85%以上,后续随着良率进一步提升,成本有望进一步下降。·Agent场景CPU需求逻辑:前期AI需求主要集中在大模型训练场景,GPU配套增速较快,相关场景尚未大规模落地。当前随着AI Agent等应用快速落地,其影响覆盖服务器、终端PC、工作站、边缘设备等多类硬件,带来新增爆发式需求。AI Agent运行过程中,仅2-3个环节需要GPU参与,其余大部分工作,包括外部信息获取、API调用、数据爬取、文件读取、数据库对接、大模型调用的任务拆解、调度以及全流程数据处理等,均由CPU与内存完成,CPU成为AI Agent场景下的主要计算载体,对CPU的核数密度、内存容量、响应延时均提出较高要求。同时AI Agent推理场景对GPU配置要求较低,服务器端仅需搭配1-2张GPU即可配合双路CPU运行,AI PC等端侧设备仅需CPU搭配小算力GPU即可满足运行要求。·智算服务器CPU配比趋势:当前大模型相关场景本身对高密度CPU的需求量已持续增长,目前智算服务器中CPU与GPU的配比约为1:4至1:2。随着AI Agent场景需求持续释放,CPU在智算服务器中的配比将进一步提升,由于AI Agent运行对CPU依赖度更高、对GPU配置要求更低,未来智算服务器硬件配置结构将逐步向CPU倾斜,长期来看,在GPU数量不变的前提下,CPU与GPU的配比将向1:1的趋势发展,AI Agent也将成为后续CPU需求增长的核心增量拉动场景。·CSP采购CPU考核标准:AI产业迭代后,CSP大厂采购CPU的考核标准较此前出现调整,核心考核计算密度即CPU核数。具体参数要求为CPU核数至少64核、主频至少2.1G以上,除此之外,考核指标还覆盖内存速率、内存容量、NVMe规格数量三类核心计算相关参数。目前国产CPU基本可满足上述主流参数要求,能够适配CSP大厂当前的采购标准,不存在明显的技术参数瓶颈。·Agent应用场景划分:Agent落地普及速度较快,产品与技术端均具备规模化推广基础,主要覆盖三类应用场景,各场景因算力差异存在功能与部署区别:a. 服务器端:算力充足,属于高并发Agent载体,可支撑电商行业分析、企业智能办公、智能客服、商业决策等To B类场景,能够同时承载数百至数千个Agent并行运行;b. PC端:属于轻量化部署的AI PC,采用CPU搭配小GPU的架构,目前相关产品已落地,主要作为个人办公助手,可处理日程排配、报告整理、资料分析、本地文件事务等个性化需求;c. 边缘端:部署在网关、工控机等嵌入式设备上,目前产品已开发完成,技术落地推进迅速。·智算集群与Agent的关系:智算集群算力提升与Agent落地属于不同的增量环节,二者为相互依存、正向牵引的循环关系。智算集群的算力越强,支撑的大模型智能化水平越高,能够推动AI产业快速爆发;而AI产业需求增长后,又会对大模型的智能化水平提出更高要求,反向拉动智算集群的算力持续升级,二者形成的正向循环将共同拉动CPU需求持续增长。·AI场景CPU性能要求:Agent场景以逻辑运算为主,整体运行属于软件类场景,运行过程中GPU仅在初始分析决策环节发挥少量作用,数据整理、拷贝、下载等核心运作环节均由CPU承担,对CPU的需求远高于GPU。AI服务器对CPU的性能要求随技术发展变化:早期GPU算力、网络带宽需求相对较低时,CPU仅承担调度功能,因此对CPU性能要求不高;伴随GPU算力、互联带宽大幅提升,CPU调度能力成为影响整体性能释放的关键因素,CPU性能越高,AI服务器的整体性能发挥效果越好。·国内服务器市场规模:2026年国内服务器市场整体规模约500万台,其中国产服务器增长势头迅猛。近3-4年国产服务器渗透率快速提升,市占率从此前10%左右提升至当前的20%-30%,实际出货量从20万台增长至近100万台。国产服务器规模快速扩张主要源于三方面核心支撑:a. 国产芯片经过多轮技术迭代,已可基本满足国内客户需求;b. 国产芯片技术迭代持续推进,性能不断提升,得到下游客户端的广泛认可;c. 国内ARM生态适配迁移工作逐步完善,软硬件配套生态已较为完整,后续国产服务器增长速度将进一步加快。·架构市占率趋势与差异:国内x86与ARM架构的市占率将出现较大变化,海外ARM架构的市场增速也处于较高水平。两类架构核心差异体现在多维度:安全层面,x86架构经测试确认存在后门,安全因素是国内市场架构选择的核心考量;性能与功耗层面,ARM架构单核性能弱于x86,但在分布式存储、数据库等场景下具备适配优势,且随着工艺升级,ARM的功耗低于x86;AI应用场景层面,两类架构表现差异不大,AI集群中CPU仅负责调度工作,核心计算任务由GPU完成,架构属性不会对计算效率产生明显影响。·CPU核数提升配套要求:CPU核数提升后,对内存相关配套组件的技术要求最为突出,可通过三类路径优化适配:a. 扩充内存通道数量,匹配多核数据交互需求;b. 提升内存速率,减少数据传输瓶颈;c. 引入低延时技术优化传输效率,例如CXL技术可有效降低数据交互延时,适配多核CPU运行需求。·ARM生态与架构优劣势:ARM此前以IP授权为核心业务,当前下场自研CPU,将进一步推动ARM生态完善。两类架构核心优劣势对比清晰:x86指令集迭代时间久,单核性能表现更强,且上下游软硬件生态成熟,开发者与使用者接受度更高;ARM为原生多核架构,对芯片架构设计、微架构设计及应用调优的要求更高,前期市场推广进度较慢,随着近年生态持续完善,在分布式等场景的适配优势逐步显现。当前ARM生态已较为完善,云厂商适配速度较快,AI场景下ARM与x86在使用适配、调优层面基本无明显差异,不存在GPU与特定架构绑定的情况。·市场增量与国产替代展望:a. 全球CPU缺口方面,2025年全球服务器CPU出货量为3000多万片,2026年受智能体场景爆发、原有云业务及智能数据中心业务增长需求驱动,全年CPU供需缺口达800-1000万片。b. 国产替代进程方面,叠加国内信创产业加速迭代的催化,国产服务器市场份额持续提升,当前已达到20%-30%的水平,未来三年有望进一步提升至50%。c. 性能追赶进度方面,不单一以技术参数作为国内外CPU的对标标准,而是以能否满足金融、运营商等主体的核心应用场景业务需求为核心判定依据,随着技术迭代,国内CPU性能预计2年左右即可追上海外水平,甚至可能在部分特性上实现技术突破。·制程差距的影响分析:a. 制程差距的核心影响方面,当前国内CPU普遍采用7nm左右的先进制程,而海外英特尔已做到3nm-5nm制程,二者的制程差距主要影响芯片体积与功耗,不会直接影响下游客户的采购意愿,一般客户不会刻意关注制程参数。b. 功耗问题的解决方案方面,针对制程带来的功耗问题,行业已有对应技术方案,可通过业务传输自动降频、功耗封顶等优化手段,将服务器功耗控制在客户需求范围内,仅对整机商的设计工艺提出一定要求,相关影响不会传递至客户端。c. AI场景的功耗敏感度方面,在AI场景下,GPU为主要高功耗组件,且当前智算中心普遍采用液冷方案,CPU功耗敏感度较低,制程带来的功耗差异不会产生明显影响。·缺口测算与核心数趋势:a. CPU缺口测算逻辑方面,CPU供需缺口核心测算逻辑为智能体(Agent)落地与智算集群建设的相互牵引作用,智能体场景的加速落地将驱动CPU核心需求增长4倍,同时带动内存带宽需求增长2-4倍,结合核心数增长的对应关系即可推算出整体缺口规模。b. 核心数增长趋势方面,CPU核心数扩张存在两大限制因素:一是核心数增长与制程工艺直接相关,特定制程工艺可支撑的核心数存在物理上限,无法无限提升;二是核心数越多芯片面积越大,单块十二寸晶圆可切割的芯片数量越少,会显著推高生产成本,因此核心数不会持续翻倍增长。
基本
文件
流程
错误
SQL
调试
- 请求信息 : 2026-05-11 13:43:56 HTTP/1.1 GET : https://www.yeyulingfeng.com/a/603696.html
- 运行时间 : 0.218239s [ 吞吐率:4.58req/s ] 内存消耗:4,671.66kb 文件加载:145
- 缓存信息 : 0 reads,0 writes
- 会话信息 : SESSION_ID=1de7f27782adf3f1f6f45dcb4106ddb4
- CONNECT:[ UseTime:0.000418s ] mysql:host=127.0.0.1;port=3306;dbname=wenku;charset=utf8mb4
- SHOW FULL COLUMNS FROM `fenlei` [ RunTime:0.000578s ]
- SELECT * FROM `fenlei` WHERE `fid` = 0 [ RunTime:0.000261s ]
- SELECT * FROM `fenlei` WHERE `fid` = 63 [ RunTime:0.000269s ]
- SHOW FULL COLUMNS FROM `set` [ RunTime:0.000618s ]
- SELECT * FROM `set` [ RunTime:0.000220s ]
- SHOW FULL COLUMNS FROM `article` [ RunTime:0.000568s ]
- SELECT * FROM `article` WHERE `id` = 603696 LIMIT 1 [ RunTime:0.000432s ]
- UPDATE `article` SET `lasttime` = 1778478236 WHERE `id` = 603696 [ RunTime:0.020038s ]
- SELECT * FROM `fenlei` WHERE `id` = 64 LIMIT 1 [ RunTime:0.000293s ]
- SELECT * FROM `article` WHERE `id` < 603696 ORDER BY `id` DESC LIMIT 1 [ RunTime:0.000495s ]
- SELECT * FROM `article` WHERE `id` > 603696 ORDER BY `id` ASC LIMIT 1 [ RunTime:0.003113s ]
- SELECT * FROM `article` WHERE `id` < 603696 ORDER BY `id` DESC LIMIT 10 [ RunTime:0.023764s ]
- SELECT * FROM `article` WHERE `id` < 603696 ORDER BY `id` DESC LIMIT 10,10 [ RunTime:0.000790s ]
- SELECT * FROM `article` WHERE `id` < 603696 ORDER BY `id` DESC LIMIT 20,10 [ RunTime:0.003550s ]
0.220067s