
全球存储产业正在经历一场由AI驱动的深刻变革。除了供应缺口,更本质的变革发生在技术架构层面。AI大模型的爆发不仅带来了数据量的指数级增长,更重塑了存储架构。当上下文长度从4K扩展至128K tokens,KV缓存(Key-Value Cache)的内存占用呈32倍增长,单机需求可达TB级,使得行业重新审视NAND闪存的角色定位——它不再只是"存储介质",而是正在向"温数据计算层"演进。
在这一背景下,QLC(四层单元)技术的成熟为企业级存储提供了关键解法。TrendForce数据显示,QLC SSD在企业级市场的渗透率预计2026年将达到30%,而在AI推理场景中,其替代HDD的速度远超预期——毕竟,当HDD的交期已延长至52周,且每GB成本优势被功耗和机柜空间成本侵蚀时,QLC SSD的"每瓦性能密度"优势开始凸显。
超级周期下NAND的三重机遇
行业格局的重塑也为技术路线多元化的参与者提供了战略窗口。作为全球闪存及先进存储技术的创新企业,闪迪(Sandisk)在CFMS | MemoryS 2026峰会上展示的"从云到端"全场景布局,恰好映射了当前存储产业试图破解AI存储瓶颈的技术演进路径。

闪迪亮相CFMS | MemoryS 2026峰会

闪迪公司全球产品高级副总裁Eric Spanneut
峰会期间,闪迪公司全球产品高级副总裁Eric Spanneut在发表《闪存创新赋能全域》主题演讲时表示,"我们正站在NAND超级周期的起点。"在这个AI狂飙突进的时代,存储行业正在经历一场前所未有的价值重估——NAND闪存不再只是"存储介质",而是正在蜕变为"AI基础设施的核心组件"。他明确指出NAND市场的三重机遇:
第一重机遇来自AI工作负载的持续攀升。随着大语言模型参数规模从百亿级跃升至万亿级,训练和推理过程中产生的数据量呈指数级增长,NAND凭借其高吞吐、低延迟的特性,成为AI时代的首选存储技术。
第二重机遇是NAND日益填补HDD的市场缺口。HDD在容量供应上的瓶颈正在加速NAND的替代进程。
第三重机遇则是系统级创新带来的应用场景拓展。系统级创新正在加速,KV缓存、内存使用场景等新兴需求正在扩展NAND的应用边界。
闪迪公司产品市场总监张丹在媒体圆桌会议上进一步解读了这一趋势:"本质上来讲,人工智能在行业的爆发式增长带来了数据应用领域的需求。企业大量留存原始资料来增加数据湖的体量,以往沦为冷数据的内容现在变成有价值的温数据,用于建设高速数据湖以满足未来数据分析的需求。"

闪迪公司产品市场总监张丹
从云到端的"树干与枝叶"生态
在闪迪的战略蓝图中,存储生态被形象地比喻为一棵树——云系统是数据生态的根源,承载各类数据,为整个生态提供逻辑基础;边缘系统则如同生态的枝叶,是数据在现实生活场景中的具体呈现。
"云和边缘系统相互连接,两者之间持续进行数据交互,共同提升运行的表现。"Eric Spanneut强调,"对于闪迪而言,我们必须同时布局这两大领域,在全球范围内的云和边缘市场打造业务布局。"
这一战略的背后,是闪迪独特的融合平台架构——自研主控+BiCS8 NAND+开放生态的协同组合。张丹表示:"我们一定有一个赛道是用自研主控去覆盖的,但同时也要知道外面的世界发生了什么。我不但要对客户开放,要知道所有客户的需求;也要对方案开放,要知道现在市场上什么样才是最优的方案。"这种开放而灵活的架构策略,使闪迪能够支撑跨场景的一致性体验。从超大规模数据中心到智能手机,闪迪的产品矩阵正在实现真正的“全域覆盖”。

闪迪公司副总裁兼中国区总经理蔡耀祥
闪存的巨大市场不仅仅存在于AI数据中心,闪迪公司副总裁兼中国区总经理蔡耀祥进一步解释了为什么存储生态中除了树干,还需要枝叶:"AI应用加速普及,智能手机与智能网联汽车持续发展,数据中心基础设施不断完善。这些都带来了日益激增的数据量和更为复杂严苛的工作负载,从而对先进闪存存储技术产生巨大需求。"
AI工作流重构:从训练到推理的存储挑战
大模型应用的落地正在推动人工智能数据周期(AI Data Cycle)的复杂化。与以顺序写为主的训练阶段不同,推理阶段的工作负载特征发生了根本性转变——随机读取比例激增、时延敏感度提升、数据热度分层细化。这一变化直接影响了存储技术的选择逻辑。
(一)RAG架构催生大容量温存储需求
检索增强生成(RAG)已成为企业级AI应用的主流部署范式。其核心机制在于通过向量嵌入(Vector Embedding)将企业私有知识库转化为高维向量空间,供大模型实时检索调用。这一过程中,原始数据经过向量化后通常会产生3-10倍的容量膨胀,形成对高速、大容量存储的刚性需求。
值得注意的是,RAG场景对存储的性能要求介于传统OLTP数据库与冷数据归档之间:既需要支持毫秒级的向量检索响应,又需承载数百TB级的数据湖容量。QLC SSD凭借其在BiCS8等先进制程下的密度优势(单盘可达256TB),恰好填补了这一"温数据"层级的市场空白。目前,包括SANDISK®SN670NVMeSSD在内的多款大容量QLC SSD,已开始替代传统的"HDD+TLC缓存"混合架构,成为AI数据湖的存储底座。
(二)KV缓存卸载:破解推理阶段的内存墙
大模型推理的延迟瓶颈正在从计算密集型向内存密集型转移。与训练阶段主要依赖顺序写带宽不同,推理阶段的KV缓存(Key-Value Cache)机制对存储系统提出了"小颗粒、高并发、低延迟"的严苛要求。
在Transformer架构的推理过程中,KV缓存用于存储历史注意力机制的键值对,避免解码阶段重复计算。随着上下文窗口从早期的4K扩展至128K甚至1M tokens,KV缓存的容量需求呈指数级增长。这一"内存墙"问题在智能体(Agent)应用中尤为突出:当AI需要长期保留用户交互历史以维持上下文连贯性,传统"计算完即丢弃"的模式已不可持续。
行业正在探索分层卸载(Offloading)策略以缓解这一矛盾。将KV缓存从HBM/DRAM下沉至SSD,虽会引入微秒级延迟,但可换取两个数量级的容量扩展。长远来看,KV缓存卸载只是过渡方案。随着HBM4容量提升和存算一体(CIM)技术的成熟,存储层级可能进一步融合。但在2026-2028年的时间窗口内,支持高并发随机读的PCIe Gen 5/6 SSD,仍是解决长文本推理瓶颈的最务实选择。
(三)小块、高频、低延迟:SSD架构的新挑战
面对KV缓存对"小块、高频、低延迟"的需求,传统SSD设计面临挑战。张丹阐述了闪迪的优化方向:"第一,要从系统上面思考这件事情,我们会优化数据通路,到SSD怎么把数据pass掉,怎么去分流数据。第二,从NAND行业本身来讲,我们现在也在用先进的BiCS8产品,NAND性能本身的提升对这件事情也是相当大的助力。第三,行业标准追求更高的接口速度。"
闪迪全场景闪存解决方案
在本届峰会上,闪迪展示了覆盖数据中心、移动设备、智能汽车、智慧视频等全场景的产品矩阵。

闪迪CFMS | MemoryS 2026展台
(一)数据中心:双轨并行策略
数据中心正经历从"HDD主存+SSD缓存"向"QLC SSD主存"的架构迁移。TrendForce数据显示,2026年企业级QLC SSD渗透率将达30%,驱动因素并非单纯成本下降,而是AI数据湖对"温数据"访问延迟的严苛要求——当RAG向量检索需毫秒级响应,52周交期的HDD已难以满足。

SANDISK®SN861NVMeSSD

SANDISK®SN670NVMeSSD
这催生了两种差异化技术路线:大容量型主攻RAG向量库存储,高性能型主攻KV缓存卸载。SANDISK®SN670NVMeSSD与SANDISK®SN861NVMeSSD恰好对应这两类场景。
在耐久性设计方面,SANDISK®SN861NVMeSSD支持1次或3次每日全盘写入(DWPD),面向高频KV缓存刷新;而市面上其他产品则在RAG场景主推1DWPD以降低成本。这种分化反映出AI存储仍处于"场景定义标准"的早期阶段——究竟需要多大写入强度,取决于模型迭代频率与数据新鲜度的博弈。
(二)移动设备:QLC进军高端市场
消费级存储市场正经历QLC技术的上行渗透。长期以来,QLC因耐久性(P/E周期约1000-3000次)和写入性能劣势,主要应用于低端机型。然而,随着3D NAND堆叠层数突破200层(如闪迪BiCS8),QLC的位密度和可靠性已大幅提升,为其进军高端市场提供了技术基础。
在本届CFMS峰会上,闪迪发布了旗下首款面向智能移动端的QLC UFS 4.1产品---SANDISK®iNAND®MCEU721嵌入式闪存驱动器,试图打破"QLC仅限低端"的市场刻板印象。该产品采用SmartSLCTM缓存技术(数据优先写入SLC区域再迁移至QLC),在1TB容量下实现了4,500MB/s的顺序读取速度,甚至在多项基准测试中超越了前代TLC产品。

SANDISK®iNAND®MCEU721嵌入式闪存驱动器
这一产品动向反映出移动端存储的两大趋势:其一,随着手机本地AI模型(如7B参数端侧大模型)的部署,设备对存储带宽的需求已从UFS 3.1的1,200MB/s向UFS 4.0/4.1的4,000MB/s+跃升;其二,在256GB以上容量段,QLC的耐久性(以TBW计)已能满足旗舰机型5年生命周期需求。不过,市场教育仍需时间——正如PC市场QLC SSD历经两年才被广泛接受,移动端QLC的普及仍需头部原厂共同推动。
(三)车载存储:智能座舱与智驾域的差异化博弈
汽车电动化与智能化正在重塑车规级存储的市场格局。然而,与消费电子不同,车规级存储面临AEC-Q100认证、-40℃~105℃宽温工作、功能安全(ISO 26262 ASIL-B/D)等多重门槛,形成了相对封闭的供应链体系。
当前车载存储呈现明显的域控制器分化趋势。智能座舱域追求极致的读取带宽与启动速度——类似于高端智能手机,需要支持多屏4K显示、AR导航、车载大模型等应用的秒级加载;自动驾驶域(ADAS)则更强调读写均衡与数据完整性,需持续记录传感器原始数据(用于模型回灌与事故追溯)和系统日志,对写入耐久性(TBW)和异常掉电保护(PLP)要求严苛。

闪迪公司产品市场经理耿华
闪迪公司产品市场经理耿华补充道,"目前,车载存储主要分为座舱和智驾两大场景。座舱应用场景对启动速度、地图加载及内容读取性能要求较高;而智驾应用场景则需同时兼顾读写性能,因为系统运行中产生的日志和视频数据需要及时存储。"
这种分化直接反映在技术路线的选择上。UFS 4.1凭借低功耗(<2W)和小型化封装优势,已成为智能座舱的主流选择,闪迪等原厂均已推出车规级产品。例如SANDISK®iNAND®AT EU752 UFS 4.1嵌入式闪存驱动器(1TB容量规格,4,300MB/s读取速度),性能较前代UFS 3.1提升超两倍,可满足座舱AI大模型本地部署的带宽需求。

SANDISK®iNAND®AT EU752 UFS 4.1嵌入式闪存驱动器
而在ADAS领域,PCIe NVMe SSD正逐步取代e.MMC成为中央计算平台(HPC)的存储底座。由于该域需支持宽温范围与高强度写入,部分Tier 1供应商甚至采用工业级或企业级SSD方案(如M.2 1620 BGA封装的SANDISK®iNAND®AT EN610NVMeSSD,支持SLC模式配置)。

SANDISK®iNAND®AT EN610NVMeSSD
更具挑战性的是"舱驾一体"(中央计算架构)趋势。当座舱与智驾共享同一计算平台,存储系统需在"高带宽多媒体流"与"高可靠数据记录"之间实现动态切换,这对存储控制器的QoS(服务质量)调度能力提出了更高要求。未来,支持SR-IOV(单根I/O虚拟化)的车规级SSD可能成为跨域融合的关键硬件。
(四)智慧视频:1.5TB microSD刷新容量纪录
闪迪还展出了SANDISK®Video VD QD131 microSD™高耐久视频存储卡,支持7×24小时连续写入,适应极端工作环境,并具备智能健康监测功能。Eric Spanneut介绍道:"我们将封装技术优化至极限,将控制器和超薄闪存芯片堆叠在极其微小的外形尺寸之中。"

SANDISK®Video VD QD131 microSD™高耐久视频存储卡
存储架构重构:从容量竞争到分层优化
AI时代的存储产业正面临范式转移。传统以$/GB为核心的成本评价体系正在失效,取而代之的是"每瓦性能密度"(Performance per Watt per Density)和"场景匹配度"的综合考量。当HBM占据GPU周边物理空间,当DDR5内存带宽难以跟上算力膨胀,存储层级必须在DRAM与SSD之间裂变出新的形态——无论是HBF对内存墙的填补,还是CXL内存池化对数据局部性的重构,NAND技术的价值正在被重新定义。
这一重构过程也暴露出产业的分化风险。闪迪提出的"全域"策略(从256TB企业级SSD到1.5TB microSD卡的全线QLC渗透),不仅关注训练阶段的暴力写带宽,更重视推理阶段的随机读延迟与边缘端的能效比。
对于闪迪而言,其BiCS8技术节点与融合平台架构提供了参与下一轮竞争的技术底牌。在AI重构存储逻辑的进程中,存储技术的终极价值不在于比特密度本身,而在于如何以更低的能耗、更高的带宽、更灵活的分层策略,支撑起智能体对长时记忆与实时推理的无限渴求——这正是整个NAND产业,包括闪迪在内,正在书写的下一个篇章。
THE END
关注“电子工程专辑”加小编微信
现已开放地区群,请发送消息【深圳】【上海】【北京】【成都】【西安】到公众号

夜雨聆风