
2026年4月13日,据《新闻晨报》报道,近日,上海棣山科技有限公司对外公布其自研2nm高端AI GPU芯片的最新研发进展。
据悉,该款芯片已达到国际前沿设计水平,目前核心研发工作仍处于原型验证关键阶段。据行业分析人士评估,该芯片距离正式流片、量产及规模化商用仍需约1至2年时间。

(图片来源:上海棣山科技有限公司官网)
作为国内专注高端芯片研发的科技企业,棣山科技始终坚持“传感器芯片+高算力芯片”双轮驱动战略,重点聚焦AI GPU领域核心技术突破。2025年,公司宣布首款自研2nm AI GPU原型芯片顺利完成设计第三阶段,标志着其在高端AI芯片设计领域取得实质性突破,跻身国内乃至国际先进行列。
核心技术架构与性能指标
据悉,该款2nm AI GPU原型芯片采用FinFET/GAA混合制程工艺与Chiplet异构集成架构,搭载自研“棣山智核(DS-Core)”,核心晶体管数量达1700亿颗,芯片面积约800mm²,并采用2.5D CoWoS-L先进封装技术。
经多轮严谨仿真测试验证,该芯片算力表现突出:FP32单精度算力可达50 TFLOPS,FP16半精度算力达100 TFLOPS,FP4低精度算力高达400 TFLOPS,可灵活适配大模型训练与推理等不同精度需求的高端算力场景。其中FP32单精度算力可与NVIDIA H100、H200系列高端AI GPU芯片同台较量,有效打破国际巨头在高端AI算力设计领域的技术垄断壁垒。
能效表现:典型功耗控制在350W以内,每瓦算力达142 GFLOPS,较上一代产品能效提升40%,实现了性能与功耗的良好平衡。
需要客观指出的是,高端AI GPU产业的竞争是全链条综合实力的比拼,除设计技术外,还涉及量产能力、软件生态、产品可靠性等多个维度。目前,棣山科技与国际巨头在上述领域仍存在阶段性差距。
突破三大核心瓶颈,构建高速互联生态
研发团队已成功攻克高带宽内存封装互联、超低延迟片间通信(<0.25ns/mm)以及微流道高效热管理三大核心技术瓶颈:
内存与带宽:搭载的HBM4内存,单颗容量达48GB,引脚速率超11Gb/s,内存带宽高达3.2TB/s,较上一代HBM3E提升约2.5倍,可充分满足大模型训练的海量数据吞吐需求。
互联与生态兼容:支持NVLink 6兼容互连协议,单链路带宽达1.6TB/s,可实现多芯片无瓶颈协同扩展。同时,芯片兼容主流CUDA软件生态,大幅降低下游客户的技术迁移成本。
热管理:采用微流道热管理技术,芯片热失控风险降低68%,工作温度稳定控制在85℃以下,为长期稳定运行提供坚实保障。
研发聚焦原型验证,四大方向稳步推进
当前,棣山科技研发工作已全面转入原型验证阶段的攻坚环节,重点围绕四大关键领域有序推进:
芯片系统级验证
时序收敛优化
量产良率提前优化
软件生态同步适配
研发团队正细化验证流程、优化技术方案,全力推动原型验证各项任务落地见效,为后续正式启动流片测试及加快量产进程奠定坚实基础。
— 深度智库研究 —
— 高端咨询服务 —
— 前沿资讯快报 —
免责声明:
本公众号所发布的内容(涵盖文字、图片、音频、视频、图表、数据等各类形式),均通过合法途径获取,来源包括但不限于互联网公开信息渠道(如行业官方网站、权威新闻媒体、官方发布平台等)、用户主动投稿以及合作方正式授权。发布内容的目的在于传递行业动态、分享知识经验,供广大用户学习、交流与参考,仅记载微信公众号的观点与见解,不代表任职机构的立场。如有侵权,联系删除。
夜雨聆风