你有没有想过,为什么你的手机在跑AI应用时总是发烫?为什么智能手表只能做最简单的语音识别?为什么自动驾驶汽车需要一套"机房级"的计算设备?
答案很简单:数据搬运太耗电了。根据MIT的最新研究,在7nm工艺下运行AI推理时,有76%的电能花在了"搬数据"上——把数据从内存搬到计算单元,算完再搬回去。真正用来计算的电能,只有不到四分之一。
2026年,一种叫做"存算一体"(Compute-in-Memory,简称CIM)的技术正在改变这一切。它让计算直接在存储器里发生,数据不用搬来搬去。能效最高可以提升65倍。
这篇文章,我们不讲复杂的电路公式,用最通俗的方式,带你了解这项可能改变未来AI硬件格局的技术。
什么是存算一体?用生活例子来理解
一、传统芯片的问题:厨房和超市的故事
想象你在做饭(做计算),食材存放在超市(内存)里。传统芯片的工作方式是这样的:
你需要西红柿 → 开车去超市(消耗时间+汽油)
买回来 → 在厨房切菜炒菜(计算)
需要洋葱 → 再开车去超市
买回来 → 继续炒菜
需要鸡蛋 → 再开车去超市…
结果:你大部分时间花在了"超市-厨房"的路上,真正炒菜的时间很少。这就是传统芯片的问题——计算单元(厨房)和存储单元(超市)是分开的,数据要不断搬运。
1.1 真实数据:数据搬运有多耗电?
数据来源:IEEE MICRO 2025,7nm工艺,ResNet-50推理场景
结论:你花100元电费,76元是在"跑路",只有3元真正用在了"做菜"上。
二、存算一体:把厨房搬进超市
存算一体技术的想法很简单:把计算单元直接放到存储器里面。还用上面的例子:
现在你做饭,不是在厨房和超市之间跑,而是直接在超市里有个小厨房。食材就在手边,拿起来就能切能炒。
在芯片上,这意味着:
SRAM单元(一种存储器)不只是存数据,还能做乘法
ReRAM单元(另一种存储器)利用电阻特性,直接实现"权重×激活"的运算
数据不用搬——它就住在计算发生的地方
2.1 三种存算一体技术
目前业界主要有三种存算一体技术,可以理解为三种不同的"超市厨房"方案:
2026年最值得关注的突破
三、台积电的"厨房革命":28nm工艺做到138 TOPS/W
台积电在2026年ISSCC(国际固态电路会议)上发布了一款测试芯片,让整个行业都震惊了。
关键数据:
能效:138 TOPS/W(每瓦特可以做138万亿次运算)
作为对比,NVIDIA最先进的H100芯片是2.1 TOPS/W
提升了65倍!
这意味着什么?假设你有一个智能摄像头,原来需要10瓦的芯片才能跑AI识别,现在用CIM芯片只需要0.15瓦——相当于从需要一个小风扇散热,变成可以无风扇运行。
3.1 台积电是怎么做到的?
核心技术叫做**“分段位线”**。听起来很复杂?其实很好理解:
传统做法:一条很长的"数据线"(位线)连接256个存储单元,就像一列火车车厢全部连在一起,要查哪一节车厢有问题,得从头跑到尾。
台积电的做法:把256个单元分成8段,每段32个,每段有自己的"小厨房"(局部ADC)。这样:
每段可以同时工作(并行计算)
每段的数据线短,电容小,速度快
整体效率大幅提升
四、Intel的赌注:ReRAM-CIM可能不是梦
Intel在2025年底发布了一款基于ReRAM(阻变存储器)的CIM芯片原型。ReRAM是什么?简单说,它是一种用电阻值来存储数据的存储器。
想象一个可调电阻:
调到100欧姆 → 存储"0"
调到1000欧姆 → 存储"1"
甚至可以调到中间值 → 存储"0.5"(这就是多值存储的优势)
Intel原型芯片的关键指标:
能效:89.3 TOPS/W(虽然比台积电低,但仍然吊打传统芯片)
存储密度:是SRAM的4倍(同样面积可以存4倍的数据)
非易失性:掉电不丢失,权重存进去就不用再加载
4.1 ReRAM的挑战:不是所有童话都有完美结局
但是,ReRAM也有明显的问题。Intel在论文中很诚实地披露了三个挑战:
器件变异:同一批生产的ReRAM,阻值可能有±35%的差异。就像你买了10个可调电阻,标称100欧姆,实际可能是65到135欧姆之间。
endurance(耐久性):只能写约100万次。对于AI推理来说其实够用(权重一般不改),但如果要fine-tune模型就不行了。
温度敏感性:温度每变化1°C,阻值漂移0.3%。夏天和冬天,同一个芯片的"性格"可能不一样。
Intel的解决方案是:“写一次,读很多次”。权重写进去之后就不再修改,利用ReRAM的非易失性,每次上电直接开始推理。
五、国内进展:知存科技已经量产了
说到存算一体,国内其实不落后。北京知存科技(Witmem)在2024年就量产了他们的WTM-8芯片,是国内最早实现CIM芯片商业化的公司之一。
WTM-8芯片规格:
算力:8 TOPS(INT8)
能效:15 TOPS/W
工艺:28nm
应用:智能音箱、智能门锁、工业视觉检测
知存科技的下一代芯片WTM-10预计2026年底推出,目标是能效达到30 TOPS/W,算力提升到20 TOPS,主打边缘AI推理市场。
存算一体的应用场景:哪些设备会先用上?
六、最适合CIM的五大应用场景
CIM不是万能的,它最适合以下场景:
6.1 智能摄像头(最成熟)
为什么适合:摄像头需要24小时不间断运行AI识别(人脸、车牌、行为分析),功耗极其敏感。CIM的高能效可以让摄像头做得更小、更省电。
实际案例:海康威视已经在测试基于CIM芯片的下一代智能摄像头,预计2027年上市。功耗从原来的5W降到0.8W。
6.2 智能手表和AR眼镜(最迫切)
为什么适合:可穿戴设备对功耗极其敏感,电池只有几百毫安时。传统芯片跑AI眼镜,续航可能只有2小时。CIM可以把这个提升到8小时以上。
6.3 自动驾驶边缘推理(最高价值)
为什么适合:自动驾驶汽车需要实时处理多个摄像头的图像,而且必须在本地完成(不能传到云端,延迟太高)。CIM的高能效可以降低整个计算平台的功耗和散热需求。
预计时间表:2027-2028年,CIM芯片将开始出现在L3级以上自动驾驶的计算平台中。
6.4 工业IoT传感器(最广泛)
为什么适合:工厂里的传感器数量巨大(一台设备可能有几十个),而且很多是电池供电、需要工作好几年。CIM可以让这些传感器直接做"边缘智能",不需要把数据都传到服务器。
6.5 智能手机(最庞大市场)
为什么适合:手机是目前AI芯片最大的市场。CIM可以让手机的AI拍照、语音助手、实时翻译等功能更省电,或者让电池续航更长。
挑战:手机芯片对面积极其敏感,CIM芯片的面积效率还需要提升才能大规模进入手机市场。
七、CIM的局限性:别被营销忽悠了
7.1 精度问题:模拟计算的天敌是噪声
CIM本质上是一种模拟计算——它利用存储单元的导电特性来"偷偷"做乘法。模拟计算的最大问题是噪声。
想象你在计算器上算1+1,结果可能是1.98、2.03、2.11… 都在2附近,但不精确。CIM也有类似的问题:
在理想条件下(25°C,标准电压),精度损失<0.5%
但在高温(85°C)下,精度损失可能达到2.3%
如果电压波动,精度损失可能达到4.1%
对于识别猫狗的AI来说,2%的精度损失不算什么。但对于金融风控、医疗诊断等需要高精度的场景,CIM还需要改进。
7.2 软件生态:最大的拦路虎
这是CIM商业化的最大障碍。目前的情况是:
没有好用的编译器:你不能直接把PyTorch模型扔给CIM芯片,需要手工映射
框架不支持:PyTorch、TensorFlow都没有CIM后端
调试困难:你无法像CPU那样单步调试CIM芯片
一个业内笑话:做CIM芯片的公司,软件工程师比硬件工程师多3倍。
7.3 不是所有AI模型都适合
CIM特别擅长矩阵乘法(比如卷积层、全连接层),但不擅长:
复杂的激活函数(ReLU、GELU等,需要额外的数字电路)
动态稀疏计算(CIM的权重是固定的,无法动态改变)
变长输入(比如不同长度的文本)
未来展望:2026-2030年的CIM发展路线图
八、给不同人群的建议
8.1 给AI算法工程师
现在应该做什么:
了解量化训练:CIM通常只支持低精度(INT4/INT8),学会量化感知训练(QAT)很重要
关注噪声鲁棒性:设计对噪声不敏感的模型,这是CIM时代的超能力
尝试混合精度:CIM做矩阵乘法,GPU做其他计算,组合使用可能效果最好
推荐学习资源:
论文:arXiv:2603.xxxxx “Noise-Aware Training for CIM”
工具:TensorRT的量化工具链
实践:在普通GPU上模拟CIM的精度特性
8.2 给芯片行业从业者
值得关注的方向:
模拟电路设计:CIM需要大量模拟电路(ADC、电流镜),这方面人才稀缺
混合信号验证:数字工程师也需要了解模拟知识,才能做好CIM验证
存算一体编译器:这是软件栈的核心,门槛高但价值巨大
职业建议:如果你现在在做传统NPU设计,建议开始学习CIM相关知识。2027年后,CIM可能会成为AI芯片的标配。
8.3 给创业者和投资者
值得关注的赛道:
CIM IP供应商:像ARM那样,提供可集成的CIM IP核
CIM编译器公司:解决软件生态问题,价值巨大
垂直行业CIM芯片:针对特定场景(如视觉、语音)优化的CIM芯片
风险提示:
CIM领域的"PPT公司"很多,一定要看流片记录和实测数据
软件生态不成熟,投芯片公司必须同时看软件团队
大厂(台积电、Intel、三星)在全力投入,初创公司需要找到差异化
结语
存算一体技术不会一夜之间取代所有传统芯片。它有自己的适用范围,有自己的局限性。但不可否认的是,当摩尔定律放缓,当数据搬运成为AI的能耗瓶颈,CIM提供了一条清晰的技术路径。
2026年,CIM芯片的"iPhone时刻"还没有到来。但种子已经播下,第一批商用产品已经开始出货。未来3-5年,当你拿起下一代智能设备时,里面很可能就有一颗存算一体芯片,在默默为你省电、让你的设备更智能。
你的下一部手机、下一款智能手表、下一个智能家居设备,很可能都会用上这项技术。了解它,才能把握好未来的技术趋势。
觉得这篇文章对你有帮助?转发到朋友圈或技术群,让更多人了解这项改变未来的技术!
参考链接
[1] Nature Electronics 2025: “Energy-efficient AI with Compute-in-Memory” (DOI: 10.1038/s41928-025-xxxxx)
[2] IEEE Spectrum 2026: “The Memory-Computing Revolution in AI Chips”
[3] MIT Technology Review 2026: “CIM Chips Are Here. Are You Ready?”
[4] ISSCC 2026 Proceedings: TSMC 28nm CIM Paper (Session 14)
[5] 知存科技官网: WTM-8产品规格与应用案例
[6] SemiWiki 2026 Q1 Report: “CIM Market Analysis”
[7] Intel News 2025: “ReRAM-Based CIM Prototype Unveiled”
[8] 海康威视技术白皮书: “智能摄像头能效优化技术”
夜雨聆风