CXL芯片行业:CXL方案优化AI存储架构,头部厂商有望加速应用

点击上方

蓝字

关注我们

PART 01

核心摘要

CXL，即Compute Express Link，是面向高性能计算、AI服务器、云计算和数据中心的新一代高速互连协议。其核心价值在于，在CPU、GPU、DPU、存储设备和内存扩展设备之间建立具备缓存一致性和内存语义的高速互连通道，使不同计算单元能够以更低延迟、更高带宽、更灵活的方式访问共享内存资源。相较传统PCIe主要承担I/O连接功能，CXL在PCIe物理层基础上进一步引入CXL.io、CXL.cache、CXL.mem等协议层能力，使设备间可以实现更精细的内存访问、内存扩展和内存池化。

本报告认为，CXL芯片行业正处于从标准成熟、产品验证向规模化应用过渡的关键阶段。过去，数据中心的主要瓶颈集中在算力扩展、GPU数量提升、HBM带宽提升以及网络通信性能增强；但随着大模型训练和推理持续发展，内存容量、内存调度效率、KV Cache管理、存储层级协同和TCO优化正成为AI基础设施新的核心矛盾。CXL并不是单纯的接口升级，而是AI服务器存储架构和内存资源管理方式的系统性重构。

从需求端看，AI推理进入高并发、长上下文、多模态和Agent化阶段后，对内存容量和缓存管理的要求显著提高。模型权重、激活值、KV Cache、上下文状态、历史会话记忆、检索增强生成中的中间数据，都需要在不同层级存储介质之间频繁调度。传统"HBM—DDR DRAM—SSD"分层结构虽然能够实现容量扩展，但不同介质之间的带宽和延迟差异巨大，且缺乏统一内存语义，容易造成数据搬运冗余、链路带宽浪费、吞吐率下降和资源错配。CXL内存池化方案通过在服务器节点之间、CPU/GPU与外部内存之间引入统一寻址、统一调度和透明访问能力，可以有效缓解这一问题。

从供给端看，CXL相关标准、芯片、模组、服务器和软件生态正在加速完善。CXL 2.0引入交换和内存池化能力，CXL 3.0进一步支持Fabric架构和更灵活的组网，CXL 4.0将数据速率提升至128GT/s，并推动多级交换和动态设备管理能力增强。英伟达、英特尔、AMD、三星、SK海力士、谷歌、微软、Meta、阿里巴巴等企业均已进入CXL生态。国内方面，阿里云已推出基于CXL 2.0 Switch技术的PolarDB数据库专用服务器，浪潮信息推出元脑服务器CXL内存扩展方案，并在MantaKV中将CXL内存池化技术用于KV Cache集中管理。北京大学联合阿里云等提出基于CXL内存池的Engram架构，并集成至SGLang框架，实现接近本地DRAM的端到端性能。这些案例说明，CXL正在从概念验证走向真实工作负载优化。

从产业链看，CXL芯片行业的价值量主要集中在四类环节：

第一，CXL内存扩展控制器芯片，即连接主机与后端DDR内存的关键控制芯片；

第二，CXL Switch芯片，用于实现多主机、多设备、多内存资源之间的交换连接；

第三，CXL内存模组与扩展卡，包括基于DDR5的CXL Memory Module以及未来可能结合DRAM与NAND的混合存储模组；

第四，面向eSSD和CXL内存扩展模组的VPD、SPD、EEPROM等配套管理芯片。

除此之外，服务器整机、云厂商、操作系统、数据库、AI推理框架和内存池化管理软件也是CXL生态落地不可或缺的组成部分。

投资层面，CXL产业并非短期主题，而是AI服务器内存架构升级的中长期赛道。CXL的核心催化因素包括：AI推理对长上下文和高并发的需求持续提升；CXL 3.0/4.0标准推动互联性能提升；英伟达、阿里云、浪潮等头部厂商加速应用；服务器DRAM中CXL相关份额提升；CXL内存扩展控制器和模组进入客户验证及量产导入。根据资料中的预测，CXL在服务器DRAM中的份额有望从2024年近乎为零提升至2030年约15%，这意味着CXL功能未来可能逐步成为中高端服务器的标准配置之一。

PART 02

行业定义与研究范围

2.1 CXL的定义

CXL是Compute Express Link的缩写，是一种基于PCIe物理层的开放式高速互连协议。它面向数据中心和高性能计算场景，旨在解决CPU、GPU、加速器、内存扩展设备和存储设备之间的低延迟、高带宽、缓存一致性和内存共享问题。与传统I/O接口不同，CXL的关键特征是引入了内存语义和缓存一致性机制，使外部设备能够以更接近内存访问的方式与主机交互。

CXL主要包括三类协议子集：

第一，CXL.io。该部分与PCIe类似，主要负责设备发现、枚举、配置、中断和基础I/O通信，是CXL设备接入系统的基础。

第二，CXL.cache。该协议允许设备访问主机内存并保持缓存一致性，适用于GPU、DPU、FPGA、AI加速器等需要共享主机内存或缓存数据的设备。

第三，CXL.mem。该协议允许主机访问设备侧内存，使外部内存扩展设备成为系统内存层级的一部分，是CXL内存扩展和内存池化的核心协议基础。

2.2 CXL芯片行业的范围

本报告所研究的CXL芯片行业，并不局限于单一芯片品类，而是覆盖CXL互连生态中与芯片及硬件模块直接相关的环节，包括：

第一，CXL内存扩展控制器芯片。该类芯片位于主机CXL链路与后端DDR DRAM之间，负责协议转换、内存访问调度、错误校验、带宽管理和安全隔离，是CXL内存扩展模组的核心芯片。

第二，CXL Switch芯片。该类芯片承担多主机、多设备和多内存池之间的交换连接功能，是从点对点内存扩展走向多节点内存池化、Fabric架构和资源动态调度的关键。

第三，CXL内存模组与扩展卡。包括基于DDR5 DRAM的CXL Memory Module、E3.S形态的CXL内存扩展模块、PCIe插卡形态的CXL扩展卡，以及未来结合DRAM、NAND、SCM等介质的混合内存模组。

第四，配套管理芯片。包括SPD、EEPROM、VPD等芯片，用于设备识别、参数管理、系统级校验、固件信息存储和可靠性管理。随着CXL内存扩展模组进入服务器平台，配套管理芯片的价值也将同步提升。

第五，服务器与系统级方案。CXL最终需要在服务器整机、云基础设施、数据库系统、AI推理框架、操作系统内存管理和调度软件中落地，因此服务器厂商和云厂商是CXL产业化的重要推动者。

2.3 CXL与传统内存扩展方式的差异

传统服务器内存扩展主要依赖CPU直连DDR通道。CPU插槽数量、内存通道数量、DIMM插槽数量和单条DIMM容量共同决定单机内存上限。随着服务器算力不断提升，CPU和GPU能够处理的数据规模快速增加，但内存扩展能力受到物理插槽、功耗、成本和主板设计限制。若通过增加服务器节点来扩展内存，容易带来资源碎片化、跨节点访问复杂、数据迁移成本高等问题。

CXL提供了一种新的扩展路径：通过CXL链路把外部内存扩展设备纳入系统可寻址内存空间，使服务器可以在不显著改变CPU内存通道结构的情况下扩展内存容量。同时，CXL Switch和Fabric架构可以进一步支持多台服务器共享内存池，实现内存资源按需分配。对于AI推理和数据库等内存密集型应用而言，这种架构能够提升内存利用率，降低高容量DIMM带来的成本压力，并缓解部分节点内存不足而其他节点内存闲置的资源错配问题。

PART 03

行业发展背景：AI推理重塑存储架构需求

3.1 AI基础设施瓶颈从"算力不足"走向"算力与内存协同不足"

过去几年，大模型训练推动GPU、HBM、高速互联和数据中心电力基础设施快速发展。市场关注的核心往往是GPU数量、单卡算力、HBM带宽、训练集群规模和网络通信能力。然而，当大模型逐步从训练阶段进入推理部署阶段，系统瓶颈开始发生变化。推理不同于训练，训练更强调大规模矩阵计算和模型参数更新，推理则更强调低延迟、高吞吐、高并发、长上下文和成本效率。

在大模型推理过程中，模型权重需要常驻高速存储层级，用户输入和历史上下文需要转化为中间状态，KV Cache会随着上下文长度和并发请求数量增长而快速膨胀。尤其是在长文本处理、代码库理解、法律金融文档分析、多轮智能体任务成为重要应用后，单次请求需要保存和访问的上下文状态显著增加。若所有模型权重、上下文缓存和中间状态都放在HBM中，成本难以承受，也会限制并发规模。若将部分数据卸载到DDR DRAM或SSD，则会面临带宽下降和延迟上升。因此，未来AI基础设施的竞争不仅是GPU算力竞争，也是不同存储层级之间如何协同、如何减少冗余搬运、如何提升缓存复用率、如何用更低成本支撑更大模型和更高并发的系统工程竞争。

3.2 传统"HBM—DRAM—SSD"分层架构的局限

在当前服务器架构中，通常存在多个存储层级：GPU本地HBM提供最高带宽和较低延迟，但容量有限且成本最高；CPU侧DDR DRAM容量较大、成本相对较低，但带宽与延迟不及HBM；NVMe SSD容量更大、成本更低，但访问延迟进入微秒级；HDD容量最低成本但延迟更高，主要用于冷数据或低频数据。

AI推理任务需要在这些层级之间频繁搬运数据。例如模型参数和激活值可能需要从SSD加载到DRAM，再进入GPU HBM；KV Cache可能在不同推理阶段被写入、读取、迁移或卸载；Prefill阶段和Decode阶段对计算与内存的需求结构不同，静态资源配置容易导致部分节点算力闲置、部分节点内存不足。由于不同层级之间缺乏统一内存语义，数据搬运往往需要软件栈显式管理，既增加开发复杂度，也会带来重复传输和链路浪费。

CXL内存池化的价值在于，在DRAM与SSD之间增加一个高性能、可扩展、可共享的容量层。根据资料中的描述，CXL内存访问延迟约为200ns，虽然高于直接附载DRAM约100ns的水平，但远低于最快NVMe SSD的微秒级延迟和HDD毫秒级延迟。因此，CXL内存并非要取代本地DRAM或HBM，而是作为中间容量层和共享内存层，承担大容量、低延迟、可池化的存储角色。

3.3 AI推理需求对CXL形成结构性拉动

AI推理对CXL的拉动主要体现在四个方面。

第一，长上下文推理提升KV Cache容量需求。模型上下文窗口越长，KV Cache占用越大。随着长文本处理、代码库理解、法律金融文档分析、多轮智能体任务成为重要应用，单次请求需要保存和访问的上下文状态显著增加。若完全依赖GPU HBM保存KV Cache，将限制并发数量并提高成本；若频繁卸载到SSD，又会导致延迟放大。CXL内存池可以作为KV Cache的高性能共享存储层，提高容量弹性。

第二，高并发推理要求资源动态调度。推理请求具有明显波动性，不同任务对算力、内存和带宽的需求差异较大。传统静态绑定资源的方式容易导致资源利用率下降。CXL内存池化可以将内存资源从单机绑定中释放出来，按业务负载动态分配，提高资源利用效率。

第三，Prefill和Decode阶段分离催生共享缓存需求。大模型推理通常可分为Prefill和Decode阶段。Prefill阶段更偏计算密集，Decode阶段更偏访存和串行生成。若两类节点分离部署，KV Cache需要在节点之间传输。浪潮MantaKV方案的思路是将Prefill节点产生的海量KV Cache集中存储在CXL池化共享内存中，Decode节点可直接访问，从而减少重复搬运。

第四，AI基础设施TCO压力推动更经济的内存扩展方案。高容量DIMM价格存在显著溢价。资料中提到，在单路4TB内存配置示例中，传统方案需要16条256GB DIMM，而CXL方案可采用"16条128GB本地DIMM加16条128GB CXL附加DIMM"的组合。由于128GB DIMM单价更低，CXL方案在满足同等容量情况下有望带来约16%的TCO节省。对于大规模数据中心而言，内存成本优化具有显著商业价值。

PART 04

CXL技术演进与架构分析

4.1 CXL协议版本演进

CXL的发展路径体现为带宽提升、功能扩展和组网能力增强。

CXL 1.x阶段主要实现设备直连和基础内存扩展能力，适用于单主机与单设备之间的低延迟连接。该阶段的意义在于验证CXL协议在CPU与加速器、内存扩展设备之间的可行性。

CXL 2.0阶段引入Switch和内存池化能力，是CXL从点对点扩展走向共享资源架构的关键一步。通过CXL Switch，多台主机可以连接到多个CXL设备，内存资源可以被池化，并根据需求动态分配给不同服务器。这一能力对云计算、数据库和AI推理具有重要意义。

CXL 3.0阶段进一步支持Fabric架构，提高组网灵活性，并将数据速率提升至64GT/s。Fabric能力意味着CXL可以从单机或单机柜内部扩展，向更复杂的数据中心资源互联架构演进。对于超大规模AI集群而言，Fabric化是实现资源解耦和弹性调度的基础。

CXL 4.0阶段将数据速率进一步提升至128GT/s，相较CXL 3.0翻倍，并增强多级交换和动态设备管理能力。随着速率提升，CXL在带宽层面的短板将进一步缩小，其在高性能内存扩展和跨设备互联中的适用范围将扩大。

4.2 CXL设备类型

CXL生态中通常可将设备分为三类。

Type 1设备通常是不带本地内存或不暴露本地内存给主机的加速器，主要使用CXL.cache与主机进行缓存一致性访问。

Type 2设备通常是带有本地内存的加速器，如GPU、FPGA、DPU等，既可能访问主机内存，也可能让主机访问设备侧内存，因此会同时涉及CXL.cache和CXL.mem。

Type 3设备主要是内存扩展设备，不具备复杂计算能力，核心作用是向主机提供额外内存容量。CXL内存扩展控制器芯片和CXL Memory Module多属于Type 3相关范畴。澜起科技发布的基于CXL 3.1 Type 3标准设计的内存扩展控制器芯片，正是该方向的代表性产品。

4.3 CXL内存池化的工作逻辑

CXL内存池化的核心是将原本绑定在单台服务器上的内存资源抽象为共享资源池。服务器通过CXL链路连接到CXL Switch，再由Switch连接多个CXL内存扩展设备。系统软件可根据负载需求，将不同容量的池化内存分配给不同主机。对于应用而言，理想状态下，CXL内存可以像本地内存一样被访问，只是在延迟和带宽上存在一定差异。

这种架构带来三点变化。

第一，内存从"服务器私有资源"变成"可调度资源"。在云数据中心中，内存使用率往往存在不均衡现象。一些节点内存不足，另一些节点内存闲置。CXL内存池可以提高整体资源利用率。

第二，服务器配置从"峰值静态配置"转向"按需动态配置"。传统服务器需要按照最极端负载配置内存，导致平时资源浪费。CXL池化后，部分峰值需求可以由共享内存池承接。

第三，系统设计从"节点级优化"走向"集群级优化"。AI推理、数据库和云原生应用越来越强调跨节点资源协同。CXL为内存资源的集群级调度提供硬件基础。

4.4 CXL与RDMA、NVLink、PCIe的关系

CXL并不是孤立存在的技术，需要放在数据中心互连体系中理解。

PCIe是CXL的物理层基础。CXL利用PCIe的高速信号通道和生态基础，但在协议层增加了内存语义和缓存一致性能力。因此，CXL可以被理解为在PCIe之上面向内存扩展和一致性互连的增强协议。

RDMA主要解决远程直接内存访问问题，广泛用于节点间高速网络通信。RDMA适合跨服务器网络传输，但其访问粒度、延迟特征和软件栈与CXL不同。CXL更强调本地或近端互连中的低延迟内存语义访问。资料中提到，北大联合阿里云的Engram方案认为，与RDMA相比，CXL能够提供Engram所需的最小化、离散检索模式下的细粒度和低延迟访问。

NVLink是英伟达GPU生态中的高速互连技术，主要用于GPU之间以及GPU与CPU之间的高带宽连接。NVLink在英伟达系统内部具有强大性能优势，但生态相对封闭。CXL则是开放标准，更适合跨厂商、跨设备、跨内存资源池的互操作。

从长期看，CXL、RDMA、NVLink、PCIe不会简单相互替代，而是共同构成AI数据中心多层次互连体系。NVLink解决GPU间高带宽计算互联，RDMA解决跨节点网络通信，PCIe提供通用I/O基础，CXL则承担内存扩展、内存池化和一致性访问的重要角色。

4.5 CXL与主要互连技术对比

从技术定位看，CXL、PCIe、NVLink、RDMA和以太网并非同一层级的完全替代关系，而是在不同距离、不同设备类型和不同数据访问语义下分别发挥作用。CXL最大的差异化优势不在于单点最高带宽，而在于其提供了内存语义、缓存一致性和资源池化能力。

以下从核心定位、主要连接对象、典型优势、主要局限以及与CXL关系五个维度，对上述技术进行逐一比较。

PCIe：核心定位是通用高速I/O互连，主要连接CPU与SSD、网卡、GPU等外设。其典型优势在于生态成熟、兼容性强、成本较低；主要局限是主要承载I/O语义，缺乏内存一致性能力。PCIe与CXL的关系是：CXL基于PCIe物理层演进而来。

CXL：核心定位是一致性内存互连，主要连接CPU、加速器、内存扩展设备、Switch。其典型优势是支持内存扩展、缓存一致性、内存池化；主要局限是生态仍处早期，软件适配复杂。CXL是数据中心内存架构升级的核心技术。

NVLink：核心定位是GPU高速互连，主要连接GPU与GPU、GPU与CPU。其典型优势是带宽高、适合GPU计算集群；主要局限是生态偏封闭，主要依附英伟达平台。NVLink与CXL形成互补关系，服务GPU内部及近端互联。

RDMA：核心定位是远程直接内存访问，主要连接跨服务器节点。其典型优势是网络范围广，适合分布式系统；主要局限是延迟高于近端内存互连，软件栈复杂。RDMA与CXL共同构成跨节点与近端内存体系。

以太网与InfiniBand：核心定位是数据中心网络，主要连接服务器集群。其典型优势是覆盖距离长、生态成熟；主要局限是延迟较高，不适合内存级访问。以太网与InfiniBand和CXL处于不同互连层级。

对于AI数据中心而言，未来并不是某一种互连技术独占全部场景，而是不同互连技术形成分层体系。GPU内部和GPU之间的高带宽计算互联依赖NVLink、NVSwitch等技术；服务器之间的分布式通信依赖InfiniBand、RoCE或以太网；SSD和网卡仍依赖PCIe；而当需要把外部内存纳入可寻址资源池、让CPU或加速器以低延迟方式访问共享内存时，CXL具备独特价值。

4.6 CXL在AI推理存储层级中的位置

AI推理存储层级可以被划分为五层：第一层是GPU本地HBM，带宽最高、延迟最低，但容量有限且成本最高；第二层是CPU本地DDR DRAM，容量较大、延迟较低，但受内存通道和插槽数量约束；第三层是CXL扩展内存，延迟略高于本地DRAM，但远低于SSD，容量可弹性扩展并具备池化能力；第四层是NVMe SSD，容量大、成本低，但延迟进入微秒级；第五层是对象存储或HDD，主要承担冷数据和持久化存储。

CXL的位置介于本地DRAM和SSD之间。它既不是最高速的计算内存，也不是最低成本的容量存储，而是一个兼顾容量、延迟、带宽和可共享能力的中间层。这个中间层在AI推理中非常重要，因为KV Cache、上下文状态、热数据缓存和模型运行中间数据并不总是需要放在HBM中，但也不适合频繁下沉到SSD。CXL能够承接这部分"热度较高但容量很大"的数据。

在传统架构下，AI系统面临两难选择：要么把更多数据留在HBM和本地DRAM中，牺牲成本和容量；要么把数据卸载到SSD，牺牲延迟和吞吐。CXL提供第三种选择：通过外部可扩展内存池，以接近内存的方式承载部分高价值数据。这也是CXL被认为能够优化AI存储架构的关键原因。

4.7 CXL的技术难点

虽然CXL具备显著架构价值，但其落地并不简单，主要难点包括以下几方面。

第一，延迟控制。CXL访问延迟虽然远低于SSD，但仍高于本地DRAM。对于延迟极敏感应用，如果软件没有做好数据冷热分层和访问调度，CXL可能带来性能波动。因此，CXL的价值需要结合负载特征判断，不能简单将其视为本地DRAM的完全替代。

第二，带宽与拥塞管理。多主机、多设备共享CXL内存池时，可能出现链路争用和热点访问。CXL Switch需要具备优秀的QoS、拥塞控制和隔离能力，系统软件也需要避免多个高负载应用同时争抢同一内存资源。

第三，缓存一致性和安全隔离。CXL引入一致性机制后，系统复杂度上升。云计算场景中，不同租户之间的内存隔离、安全访问和故障隔离非常关键，任何一致性错误、越权访问或数据泄露都可能造成严重后果。

第四，软件栈适配。硬件支持CXL只是第一步，操作系统、虚拟化平台、数据库、AI推理框架和调度系统都需要理解CXL内存的性能特征，并将其纳入内存分配和数据放置策略。没有软件栈配合，CXL可能只是一块昂贵的外部内存。

第五，生态互操作。CXL涉及CPU、BIOS、操作系统、控制器、Switch、内存颗粒、模组、服务器主板和管理软件。任一环节兼容性不足，都可能影响客户部署。早期市场中，合规测试、客户验证和跨厂商互通将是决定产品能否量产的关键。

4.8 未来技术趋势预测

未来CXL技术将沿着高带宽、低延迟、池化、智能化和多介质融合五个方向演进。

高带宽方面，CXL 4.0将速率提升至128GT/s，未来随着PCIe物理层继续演进，CXL链路带宽仍有提升空间。带宽提升有助于扩大CXL在高性能AI推理、HPC和数据库场景中的适用性。

低延迟方面，控制器芯片、Switch芯片和软件栈将持续优化访问路径，减少协议处理、地址转换和调度开销。对于CXL而言，延迟优化与带宽提升同样重要，因为其定位接近内存层级而非传统存储层级。

池化方面，CXL将从单机内存扩展逐步走向多主机共享内存池、机柜级内存池和数据中心级资源组合。内存池化是CXL最大商业价值之一，有助于提升云数据中心资源利用率。

智能化方面，CXL控制器和系统软件可能引入更多数据冷热识别、访问预测、压缩、纠删、QoS调度和故障预测功能。未来CXL设备可能不只是被动提供内存，而是具备一定智能内存管理能力。

多介质融合方面，DRAM、NAND、持久化内存和未来新型存储介质可能通过CXL被统一纳入系统内存层级。三星CMM-H所代表的混合存储模组正体现出这一方向。长期看，CXL可能成为连接多种存储介质、构建分层内存系统的重要协议基础。

PART 05

市场空间与增长逻辑

5.1 CXL市场处于导入期，长期渗透空间可观

CXL当前仍处于产业导入期。从服务器大规模出货角度看，CXL功能尚未成为所有服务器平台的标配，应用场景仍集中在高端服务器、AI服务器、云计算、数据库和高性能计算等领域。但从产业发展规律看，一旦CXL在头部云厂商和AI基础设施中验证出明确的性能收益和TCO收益，其渗透率有望较快提升。

资料中提到，根据TechInsights预测，CXL在服务器DRAM中的总份额将从2024年近乎为零，快速增长至2030年约15%。这一预测虽然仍需结合后续实际产品导入验证，但已经反映出产业界对CXL内存扩展需求的判断：CXL不会仅停留在实验室或少数样机阶段，而有望成为服务器内存体系的重要组成部分。

从产业生命周期看，CXL大致可分为四个阶段。第一阶段是标准制定和协议验证阶段，主要由CPU厂商、存储厂商、IP厂商和测试设备厂商推动，目标是实现协议互通和基础设备识别。第二阶段是样品导入和客户验证阶段，代表性产品包括CXL内存扩展控制器、CXL Memory Module、CXL Switch和CXL Retimer等，客户以头部云厂商、服务器厂商和存储原厂为主。第三阶段是重点场景规模化部署阶段，CXL率先在AI推理、云数据库、高内存容量服务器和HPC等场景落地。第四阶段是标准化配置阶段，当CXL相关功能在主流CPU平台、服务器主板、操作系统和管理软件中成熟后，将有机会从高端场景向更多企业级服务器扩散。

当前行业大致处于第二阶段向第三阶段过渡期。其特征是：标准持续升级，芯片产品逐步送样，存储原厂完成部分客户验证，头部云厂商和服务器厂商开始围绕真实负载推出系统级方案，但行业尚未进入大规模收入兑现阶段。因此，判断CXL市场空间不能只看当前出货，而应重点观察未来三至五年AI推理基础设施和数据中心资源池化的演进方向。

5.2 市场空间测算逻辑：市场规模数据、测算口径与数据出处

CXL市场规模目前仍处于产业导入期，不同第三方机构对市场口径的定义存在差异，因此公开预测值差异较大。具体而言，有的机构统计"CXL Component Market"，覆盖CXL Switch、Memory Expander、Controller、Retimer、CXL NIC及其他组件；有的报告聚焦"CXL互连芯片"，主要对应控制器、Switch、Retimer等芯片价值量；也有报告从"CXL在服务器DRAM中的份额"角度判断渗透率。基于报告严谨性，本节采用"多来源交叉验证"的方式，分别给出总市场、互连芯片市场和服务器DRAM渗透率三类数据。

5.2.1 全球CXL组件市场规模：第三方机构预测差异较大，但均指向高增长

根据Strategic Market Research公开披露，全球CXL组件市场规模预计由2024年的19亿美元增长至2030年的123亿美元，期间复合增速约32%。该口径下的CXL组件市场覆盖范围较宽，通常包括CXL交换芯片、内存扩展器、控制器、Retimer、CXL网卡及其他相关组件，因此市场规模相对较大。

根据Global Market Insights公开披露，全球CXL组件市场规模2024年为5.673亿美元，2025年为7.101亿美元，2026年预计为8.911亿美元，并预计2031年达到29亿美元、2035年达到79亿美元，2026年至2035年复合增速为27.5%。该口径同样覆盖CXL Switch、Memory Expander、Controller、Retimer、NIC及其他组件，但其统计边界和收入确认方式较Strategic Market Research更为保守。

从两组数据看，虽然2030年前后市场规模预测存在较大差异，但方向一致：CXL组件市场正从不足10亿至20亿美元的早期市场，向数十亿美元乃至百亿美元级别市场演进。差异的核心原因在于：第一，是否将CXL模组、板卡和系统级组件纳入统计；第二，是否将CPU/SoC集成CXL相关模块计入；第三，是否对CXL Switch和内存扩展模组采用更积极的渗透率假设；第四，是否把AI服务器和云数据中心的大规模部署提前纳入预测。

以下对上述两组预测数据进行直观对比。Strategic Market Research口径下，2024年市场规模为19亿美元，2030年预计达到123亿美元，复合增速约32%，该口径偏积极，适合反映CXL全生态组件空间。Global Market Insights口径下，2024年市场规模为5.673亿美元，2025年为7.101亿美元，2026年预计为8.911亿美元，2031年预计为29亿美元，2035年预计为79亿美元，2026年至2035年复合增速为27.5%，该口径相对保守，适合作为底部参考。

数据出处：Strategic Market Research《Compute Express Link Component Market》；Global Market Insights《Compute Express Link Component Market Size, Forecast 2026-2035》。

5.2.2 CXL互连芯片市场：2030年有望达到17亿美元

根据东方证券引用澜起科技2025年报的披露，预计至2030年CXL互连芯片市场规模将达到17亿美元，2025年至2030年复合增速高达170%。这一口径更贴近本报告关注的"CXL芯片行业"，主要对应CXL控制器、CXL Switch、Retimer及相关高速互连芯片，而不完全等同于包含模组和系统级板卡的CXL组件总市场。

若按照2030年17亿美元、2025年至2030年复合增速为170%进行反推，则2025年CXL互连芯片市场规模约为0.12亿美元，即约1,200万美元。该反推结果说明，CXL互连芯片市场在2025年仍处于极早期导入阶段，收入基数较低；但随着CXL控制器送样、内存模组客户验证、CXL Switch应用于内存池化方案，其增长曲线可能呈现前低后高的特征。

以下按上述假设进行逐年反推测算：

2025年市场规模约0.12亿美元，为基准年，按2030年17亿美元、2025年至2030年复合增速170%反推得出；
2026年约0.32亿美元，同比增长170%，对应产品从样品验证进入小批量导入阶段；
2027年约0.86亿美元，同比增长170%，对应内存扩展控制器和部分Switch需求开始放大；
2028年约2.33亿美元，同比增长170%，对应AI服务器、云数据库等场景批量部署提升；
2029年约6.30亿美元，同比增长170%，对应CXL模组渗透率进一步提升；
2030年约17.00亿美元，同比增长170%，对应公开预测目标值。

数据出处：东方证券《AI存储需求强劲，关注CXL内存池方案进展》引用澜起科技2025年报相关预测；2025年至2029年数据为基于2030年规模和复合增速的反推测算。

5.2.3 CXL在服务器DRAM中的渗透率：2030年有望达到约15%

根据东方证券引用TechInsights的预测，CXL在服务器DRAM中的总份额将从2024年近乎为零，提升至2030年约15%。该数据并非直接等同于CXL芯片市场规模，而是反映CXL内存扩展方案在服务器DRAM配置中的渗透率。其意义在于，一旦CXL内存成为服务器DRAM的重要组成部分，CXL控制器、CXL模组、CXL Switch和配套管理芯片均将受益。

该渗透率预测可以理解为CXL市场规模测算的核心"量"假设。若服务器DRAM需求持续增长，且CXL在服务器DRAM中的份额达到15%，则CXL相关内存模组将从边缘配置转向重要配置；同时，CXL控制器芯片将随模组数量增长而放量，CXL Switch则在多主机内存池化场景中获得更高价值量。

以下对CXL服务器DRAM份额变化进行逐年判断：

2024年份额接近0%，处于样品、验证和早期试点阶段；

2025年至2026年份额进入低个位数，仍以试点为主，头部云厂商、数据库和AI推理场景先行验证；

2027年至2028年渗透率进入加速期，随CXL 2.0/3.0生态完善，内存扩展模组放量；

2030年份额达到约15%，CXL有望成为中高端服务器DRAM配置的重要组成部分。

数据出处：东方证券《AI存储需求强劲，关注CXL内存池方案进展》引用TechInsights预测。

5.2.4 基于公开数据的市场空间判断

综合上述数据，本报告对CXL芯片行业市场空间形成以下判断：

第一，从CXL全组件口径看，公开机构给出的2030年前后市场空间存在较大差异，保守口径约为20亿至30亿美元量级，积极口径可达百亿美元级别。考虑到CXL生态仍处于早期，短期更适合采用Global Market Insights相对保守口径作为底部参考，同时将Strategic Market Research口径作为乐观情景参考。

第二，从CXL互连芯片口径看，2030年17亿美元的市场规模更贴近控制器、Switch、Retimer等芯片公司的可服务市场。该数据对于澜起科技等控制器厂商、以及潜在CXL Switch和高速互连芯片厂商更具参考意义。

第三，从服务器DRAM渗透率看，2030年约15%的份额意味着CXL内存扩展并非小众功能，而可能成为AI服务器和高端云服务器的重要内存配置方式。该渗透率将直接决定CXL模组、控制器芯片和配套管理芯片的出货弹性。

第四，市场规模测算应采用"总市场—芯片市场—渗透率"三层框架：CXL组件总市场反映行业天花板，CXL互连芯片市场反映芯片企业收入空间，CXL在服务器DRAM中的份额反映产业落地深度。三者结合，才能更准确判断行业投资价值。

5.5 增长驱动因素

CXL行业增长主要由五类因素驱动。

第一，AI推理规模扩张。随着大模型应用从训练竞赛进入推理变现，推理基础设施的成本效率成为核心问题。CXL可在内存容量、缓存复用和TCO优化方面提供支撑。训练阶段往往强调单次大规模计算任务，而推理阶段强调持续服务能力、低延迟响应、高并发请求和单位Token成本。CXL对推理场景的价值，正是在于用更合理的内存层级承载推理过程中的热数据、温数据和共享缓存。

第二，长上下文和Agent应用普及。长上下文对KV Cache容量需求极高，Agent任务又会引入更多历史状态、工具调用数据、检索结果和中间计划，对共享内存和缓存管理提出新要求。如果未来模型上下文窗口继续扩大，CXL内存池的边际价值会同步提升。

第三，CXL标准持续升级。CXL 3.0、4.0在速率、Fabric、多级交换和动态管理方面持续增强，为更大规模部署提供基础。标准升级的意义不仅是带宽提升，更重要的是让CXL从单设备扩展能力，逐渐演进为可管理、可组合、可池化的数据中心基础设施。

第四，头部厂商示范效应。英伟达、阿里云、浪潮、三星、SK海力士等企业的产品和方案会影响行业采用节奏。头部厂商一旦在实际部署中验证经济性，将带动上下游加速投入。CXL行业具有明显生态属性，单一芯片厂商很难独立推动行业爆发，必须依赖CPU平台、存储原厂、服务器厂商和云客户共同完成闭环。

第五，国产化和供应链安全。国内AI服务器和数据中心建设需要自主可控的内存扩展、控制器和模组方案。CXL作为新兴架构，为国内厂商提供了在新标准下建立先发优势的机会。与一些成熟赛道相比，CXL格局尚未完全固化，国内企业若能在客户验证和产品迭代中跑在前列，有望获得更高参与度。

5.6 CXL与AI服务器价值量的关系

AI服务器价值量主要由GPU、HBM、CPU、DRAM、网络设备、PCB、电源、散热和整机集成构成。CXL不会改变GPU和HBM作为核心算力部件的地位，但会改变服务器内存与存储层级的配置方式。在AI服务器中，CXL的增量价值主要体现在三方面：

一是增加CXL控制器和相关接口芯片。每个CXL内存模组都需要控制器芯片，高速链路中还可能需要Retimer、时钟、电源管理和管理存储芯片。

二是增加CXL内存扩展模组。传统服务器以内存条直连CPU为主，CXL则增加外部内存扩展设备，使服务器内存配置更加灵活。

三是增加CXL Switch和系统级资源池化设备。当服务器从单机扩展走向机柜级共享内存池时，CXL Switch、线缆、背板、管理软件和系统集成价值量将上升。

因此，CXL不是单点芯片增量，而是可能带动AI服务器硬件架构中的一组新价值链。对于投资研究而言，既要关注芯片单价和出货量，也要关注CXL带来的系统级配置变化。

PART 06

产业链分析

6.1 产业链结构

CXL芯片产业链可分为上游、中游和下游。

上游主要包括EDA工具、IP授权、先进制程晶圆制造、封装测试、DDR5 DRAM颗粒、NAND颗粒、PCB、连接器、电源管理芯片、时钟芯片和散热材料。其中，高速SerDes IP、PCIe/CXL协议IP、DDR控制器IP和先进封装能力是CXL控制器和Switch芯片设计的重要基础。

中游主要包括CXL控制器芯片厂商、CXL Switch芯片厂商、内存模组厂商、eSSD厂商、VPD/SPD/EEPROM芯片厂商和服务器板卡厂商。该环节承担协议实现、模组设计、硬件验证、固件开发和系统适配，是产业链价值集中的核心环节。

下游主要包括云计算厂商、AI服务器厂商、数据库厂商、HPC客户、互联网公司、金融机构、科研机构和企业级数据中心用户。下游客户的真实工作负载验证决定CXL产业能否从样品走向量产。

6.2 上游关键环节

CXL芯片设计对高速接口和协议实现能力要求较高。随着PCIe 5.0、PCIe 6.0和CXL 3.x/4.0演进，芯片需要支持更高速率的SerDes、更复杂的链路训练、更严格的信号完整性、更低功耗以及更强的RAS特性。对于控制器芯片而言，还需要处理DDR5高速内存控制、错误校验、地址映射、安全隔离、QoS管理和固件升级。

DRAM颗粒供应也是CXL模组成本和交付能力的关键。CXL内存模组通常基于DDR5 DRAM构建，因此三星、SK海力士、美光等存储原厂的产品节奏会影响CXL生态。资料中提到，SK海力士已完成基于CXL 2.0的CMM-DDR5 96GB产品客户验证，该产品相较现有DDR5模组容量增长50%、带宽扩展30%，可处理每秒最多36GB的数据。这说明存储原厂已经将CXL作为企业级DRAM解决方案的重要方向。

6.3 中游核心价值环节

CXL控制器芯片是当前国内厂商最值得关注的环节之一。该类芯片技术门槛较高，既需要高速接口能力，也需要内存控制和协议栈能力。澜起科技在该领域具备代表性，其CXL MXC芯片已获得三星电子、SK海力士采纳，并进入CXL合规供应商清单。2025年，澜起科技推出基于CXL 3.1 Type 3标准设计的MXC芯片M88MX6852，采用PCIe 6.2物理层接口，支持最高64GT/s传输速率，内置双通道DDR5内存控制器，支持高达8000MT/s速率。

CXL Switch芯片则是未来内存池化规模化的关键。目前市场对CXL控制器关注较多，但若CXL从单机扩展走向多机共享和资源池化，Switch的重要性会明显提升。CXL Switch要求更高端口数、更低延迟、更强隔离和更复杂的管理能力，未来有望成为CXL生态中的高价值芯片品类。

VPD芯片等配套管理芯片也具备成长机会。资料中提到，VPD芯片已成为新一代eSSD模组及CXL内存扩展模组的关键组件，用于关键参数管理、设备识别和系统级校验。聚辰股份已与牵头制定行业标准及产品规范的全球领先存储厂商建立合作，成为首家进入设计验证阶段、支持该公司新一代eSSD模组和CXL内存扩展模组的VPD开发商。虽然单颗价值量可能低于主控制器芯片，但在服务器标准升级和模组出货放量过程中，配套芯片具备确定性增量。

6.4 下游应用场景

CXL下游应用场景主要包括AI推理、云数据库、内存数据库、虚拟化、HPC和企业级存储。

AI推理是最具成长弹性的场景。CXL可用于扩展KV Cache存储、支持Prefill/Decode解耦、提升缓存复用率和降低推理成本。浪潮MantaKV和北大联合阿里云的Engram方案均体现了CXL在AI推理软件栈中的应用潜力。

云数据库是较早具备商业化逻辑的场景。阿里云基于CXL 2.0 Switch技术的PolarDB数据库专用服务器，通过CXL高速互连构建分布式内存池，实现百纳秒级延迟和数TB/s带宽的远程内存访问，使内存资源池化共享、按需调度。数据库对内存容量、延迟和一致性要求较高，是CXL验证价值的重要场景。

HPC和科研计算也适合CXL。高性能计算任务常常存在大内存需求，传统扩展方式成本较高。CXL可以为HPC提供更加灵活的内存容量层。

虚拟化和云原生场景同样具备潜力。云服务商可通过CXL内存池改善不同租户、不同实例之间的内存配置效率，降低资源碎片化。

PART 07

竞争格局与国内机会

7.1 全球竞争格局

全球CXL生态参与者主要包括四类企业。

第一类是CPU、GPU和加速器厂商，包括英特尔、AMD、英伟达等。这些企业决定服务器平台是否支持CXL协议，也决定CXL在主流AI和数据中心平台中的可用性。CPU平台支持是CXL普及的基础，GPU和加速器支持则决定其在AI场景中的深度。

第二类是存储原厂，包括三星、SK海力士、美光等。这些企业具备DRAM颗粒和内存模组能力，是CXL Memory Module的重要推动者。三星推出CMM-H混合存储CXL模组，将DRAM和NAND结合，为AI推理等场景提供兼具大容量、高性能和持久性的方案。SK海力士完成CXL 2.0 DDR5客户验证，表明主流存储厂商正在推动产品化。

第三类是互连芯片和控制器厂商，包括澜起科技、Astera Labs、Microchip、Marvell等。该类厂商提供CXL控制器、Retimer、Switch或相关连接芯片，是CXL硬件生态的核心。

第四类是云厂商和服务器厂商，包括阿里云、谷歌、微软、Meta、浪潮等。这些企业既是CXL方案的客户，也是应用创新的推动者。CXL最终是否具备商业价值，需要在这些企业的真实数据中心负载中得到验证。

7.2 海外主要参与者分析

从全球视角看，CXL产业仍处于开放竞争期，但部分海外企业已经形成较强先发优势。

英特尔是CXL生态的重要推动者。英特尔在服务器CPU领域长期具备平台影响力，其服务器平台对CXL的支持直接影响行业普及节奏。CXL作为开放互连协议，与英特尔推动数据中心可组合基础设施、内存扩展和异构计算的战略方向一致。由于服务器CPU是CXL链路中的主机侧核心，英特尔平台生态、BIOS支持、验证工具和合作伙伴资源对CXL发展具有基础性意义。

AMD同样是CXL生态的重要参与者。随着AMD EPYC服务器CPU在云计算和高性能计算市场份额提升，其平台对CXL的支持将推动更多云厂商和服务器厂商采用CXL方案。AMD在高核心数CPU和AI服务器平台中具备较强增长势头，因此其对CXL的支持也是行业扩散的重要变量。

英伟达在AI服务器生态中具有极强话语权。虽然英伟达体系中NVLink、NVSwitch和HBM是核心互连与内存方案，但随着AI推理对容量和成本优化提出更高要求，CXL仍可能在CPU侧内存扩展、外部共享内存池和系统级存储架构中发挥作用。英伟达是否在未来平台中更深度支持CXL，将显著影响AI服务器CXL应用速度。

三星、SK海力士和美光代表全球DRAM原厂力量。CXL内存模组本质上仍需要高质量DDR5 DRAM颗粒和企业级内存模组能力，因此存储原厂是CXL生态中不可替代的参与者。三星CMM-H和SK海力士CMM-DDR5等产品说明，存储原厂不希望CXL仅成为控制器厂商和服务器厂商的机会，而是希望通过CXL将DRAM产品从单纯颗粒供应升级为系统级内存解决方案。

Astera Labs是高速互连芯片领域的代表性公司，产品覆盖PCIe/CXL连接、Retimer和相关数据中心互连芯片。该类企业的优势在于高速SerDes、信号完整性、云客户验证和完整连接解决方案。随着AI服务器中高速链路数量增加，Retimer、CXL连接芯片和Switch芯片价值提升，Astera Labs等企业具备较强生态卡位。

Marvell、Microchip等企业也在数据中心互连、控制器和交换芯片领域具备长期积累。它们的优势在于企业级客户、网络和存储控制器能力，未来可能围绕CXL Switch、控制器、桥接芯片和系统方案进行布局。

7.3 竞争壁垒分析

CXL行业壁垒主要来自技术、客户、生态和可靠性四个方面。

技术壁垒方面，CXL控制器和Switch芯片需要高速SerDes能力、PCIe/CXL协议能力、DDR控制器能力、缓存一致性处理能力和系统级调试能力。随着CXL 4.0速率提升至128GT/s，信号完整性、功耗控制、链路训练和误码控制难度进一步上升。普通芯片设计企业很难快速进入高端CXL芯片市场。

客户壁垒方面，CXL产品主要面向服务器、云厂商和存储原厂，客户验证周期长，认证要求高。进入头部客户供应链后，产品稳定性和长期供货能力成为关键。由于CXL涉及基础设施核心架构，客户通常不会频繁更换供应商。

生态壁垒方面，CXL设备需要与CPU平台、BIOS、操作系统、服务器主板、内存颗粒、模组固件和应用软件配合。单一环节领先并不等于产品可用，厂商必须具备跨生态协同能力。能够参与CXL联盟测试、进入合规供应商清单、与内存原厂共同开发产品的企业具备明显优势。

可靠性壁垒方面，CXL面向企业级和数据中心场景，对RAS能力要求极高。内存扩展设备一旦出现错误，可能影响数据库、AI服务和云实例稳定性。因此，ECC、错误隔离、热插拔、故障恢复、固件升级和安全管理能力都是客户评估重点。

PART 08

重点应用案例分析

8.1 阿里云PolarDB CXL数据库服务器

阿里云在云栖大会上推出基于CXL 2.0 Switch技术的PolarDB数据库专用服务器。该方案通过CXL高速互连构建分布式内存池，使内存资源能够池化共享并按需调度。数据库场景对内存访问延迟、数据一致性、吞吐和可靠性要求极高，因此该案例具有较强示范意义。

传统数据库服务器通常需要为峰值负载配置大量本地内存，但不同数据库实例之间内存使用率并不均衡。CXL内存池化可以将部分内存资源从单机中解耦出来，提高整体资源利用率。在云数据库场景下，如果CXL方案能够同时实现较低延迟、高带宽和较好的隔离能力，将有助于降低数据库专用服务器的TCO。

8.2 浪潮MantaKV方案

浪潮元脑服务器操作系统KOS基于CXL内存池化技术推出MantaKV，将其用于大模型推理中的KV Cache管理。MantaKV采用Prefill阶段和Decode阶段解耦方式，将Prefill节点产生的KV Cache集中存储在CXL池化共享内存中，Decode节点可以直接访问，无需再次传输，也无需卸载至Prefill节点本地SSD。

该方案的核心价值在于减少数据搬运。传统PD分离推理架构中，Prefill节点生成的KV Cache需要传输给Decode节点，或者通过SSD等介质进行中转，容易造成带宽浪费和延迟上升。CXL内存池提供共享缓存层后，KV Cache可以写入一次、多方访问，将两次独立搬运合并为单次写入，从而提升推理效率。

MantaKV说明CXL并非只对硬件架构有意义，也需要软件系统协同。只有当操作系统、推理框架和调度系统能够识别并利用CXL内存池时，硬件价值才能充分释放。

8.3 北大联合阿里云Engram CXL内存池架构

北京大学联合阿里云等提出使用CXL内存池存储Engram，并将基于CXL的Engram内存池集成到SGLang框架中，实现接近本地DRAM的端到端性能。该案例强调CXL在细粒度、低延迟、离散检索场景中的价值。

Engram类机制可理解为大模型长期记忆、历史状态或结构化上下文管理的一部分。此类数据访问往往不是大块顺序读取，而是更细粒度、更随机、更低延迟敏感。与RDMA相比，CXL在近端内存语义和细粒度访问方面具备优势，因此适合承载此类推理增强存储层。

该案例还说明，CXL可能成为大模型推理框架的重要底层能力。当SGLang、vLLM、TensorRT-LLM等推理框架逐步考虑多层级存储管理时，CXL内存池可作为介于HBM、本地DRAM和SSD之间的关键资源。

8.4 三星CMM-H混合存储CXL模组

三星CMM-H将DRAM和NAND结合在基于CXL协议的混合存储模组中。其设计思路是利用DRAM提供内存级访问速度，保障关键数据和KV Cache高速存取，同时利用NAND扩展容量，以更低成本承载海量模型参数和历史状态。

这种混合模组体现了CXL未来可能的方向：不只是简单扩展DDR内存，而是将多种存储介质纳入统一访问和管理框架。对于AI推理而言，热数据可放在DRAM层，温数据可放在NAND层，通过CXL控制器和软件调度实现更细致的分层管理。这有望进一步降低单位容量成本，并扩大CXL适用范围。

PART 09

成本结构与降本路径

9.1 CXL方案的成本结构

CXL内存扩展方案成本主要由以下部分构成。

第一，DRAM颗粒成本。CXL内存模组通常仍需使用DDR5 DRAM，DRAM颗粒是主要成本项。不同容量、速率和封装的颗粒价格差异较大。

第二，CXL控制器芯片成本。控制器负责协议转换、内存控制和可靠性管理，是模组的核心增量成本。随着量产规模提升和制程成熟，控制器成本有望下降。

第三，PCB、连接器和电源管理成本。CXL模组可能采用E3.S、PCIe插卡或其他形态，对PCB高速布线、信号完整性和供电设计要求较高。

第四，散热和系统集成成本。高带宽CXL设备会带来功耗和散热挑战，需要服务器系统配合设计。

第五，软件和运维成本。内存池化需要操作系统、虚拟化层、调度系统和应用软件适配，初期会增加开发和运维成本，但成熟后可通过提高资源利用率摊薄成本。

9.2 CXL降低TCO的路径

CXL降低TCO主要依赖四条路径。

第一，使用更经济的DIMM组合替代高价大容量DIMM。资料中的示例显示，为达到4TB内存容量，传统方案需要使用16条256GB DIMM，而CXL方案可采用本地128GB DIMM加CXL附加128GB DIMM的组合。由于超大容量DIMM价格溢价明显，CXL方案可降低系统成本。

第二，提高内存利用率。数据中心中内存资源存在闲置和碎片化，CXL池化可以减少过度配置，使内存按需分配。

第三，减少数据搬运和重复存储。AI推理场景中，CXL共享内存池可减少KV Cache在节点之间重复传输和多份复制，提高系统吞吐。

第四，延长服务器平台生命周期。通过CXL扩展内存容量，部分服务器无需更换CPU平台或主板即可获得更大内存能力，从而延长资产使用周期。

9.3 成本下降节奏判断

CXL初期成本较高，主要因为控制器芯片、Switch芯片、模组设计和系统软件均处于导入阶段，规模效应尚未形成。随着协议稳定、客户验证完成、模组出货量提升和供应商增多，成本有望逐步下降。

但需要注意，CXL并不是所有场景都一定更便宜。对于低内存需求、延迟极敏感或软件无法适配的场景，本地DRAM仍是更直接方案。CXL的经济性最容易在大容量、高并发、内存利用率不均衡、可容忍略高于本地DRAM延迟的场景中体现。

PART 10

结论

CXL芯片行业处于AI基础设施升级、服务器内存架构重构和数据中心资源池化三重趋势交汇点。其价值并不只是增加服务器内存容量，而是通过内存语义互连、缓存一致性、内存扩展和内存池化，改变计算资源与内存资源的组织方式。随着AI推理进入高并发、长上下文和成本优化阶段，CXL有望成为支撑下一代AI服务器和云基础设施的重要技术。

从产业阶段看，CXL已经从早期标准和概念验证走向软硬件逐步完善阶段。CXL 4.0速率提升至128GT/s，CXL 2.0/3.0推动内存池化和Fabric能力成熟；阿里云、浪潮、北大联合阿里云、三星、SK海力士等案例表明，CXL正在进入数据库、AI推理和企业级存储的真实应用场景。

从产业链机会看，CXL控制器芯片、CXL Switch、CXL内存模组和VPD等管理芯片均具备增量空间。其中，澜起科技在CXL内存扩展控制器领域具有先发优势；聚辰股份切入VPD芯片设计验证环节；江波龙发布CXL 2.0内存拓展模块；佰维存储等企业有望受益于企业级存储升级。

总体判断，CXL行业短期仍需验证客户导入和规模化经济性，中长期则具备成为AI服务器标准化内存扩展方案的重要潜力。后续行业投资应重点关注头部厂商采用进度、CXL模组量产节奏、CXL控制器芯片客户验证、AI推理框架适配和数据中心TCO优化效果。若上述变量持续向好，CXL芯片产业链有望迎来从主题预期到业绩兑现的阶段性转变。

PART 11

附录一：核心术语解释

CXL：Compute Express Link，计算快速连接协议，基于PCIe物理层，用于CPU、加速器和内存扩展设备之间的高速一致性互连。

CXL.mem：CXL协议子集之一，允许主机访问设备侧内存，是CXL内存扩展的基础。

CXL.cache：CXL协议子集之一，允许设备访问主机内存并保持缓存一致性。

CXL.io：CXL协议子集之一，提供类似PCIe的设备发现、配置和I/O能力。

CXL Memory Module：基于CXL协议的内存扩展模组，通常通过CXL控制器连接DDR内存。

CXL Switch：CXL交换芯片，用于连接多个主机和多个CXL设备，支持内存池化和资源调度。

KV Cache：大模型推理过程中保存Key和Value张量的缓存，用于加速后续Token生成，是长上下文推理的重要内存消耗来源。

Prefill：大模型推理中对输入上下文进行初始计算的阶段，通常计算量较大。

Decode：大模型推理中逐步生成输出Token的阶段，通常对缓存访问和低延迟要求较高。

DRAM：动态随机存取存储器，服务器主内存主要形式。

HBM：高带宽内存，常用于GPU和AI加速器，带宽高但成本高、容量有限。

VPD：Vital Product Data，用于存储设备关键参数、身份信息和系统校验数据的芯片或数据区域。

TCO：Total Cost of Ownership，总拥有成本，包括采购、运维、能耗、部署和生命周期成本。