上海棣山科技披露2nm AI GPU最新进展:原型验证关键阶段,达国际前沿设计水平

2026年4月13日，据《新闻晨报》报道，近日，上海棣山科技有限公司对外公布其自研2nm高端AI GPU芯片的最新研发进展。

据悉，该款芯片已达到国际前沿设计水平，目前核心研发工作仍处于原型验证关键阶段。据行业分析人士评估，该芯片距离正式流片、量产及规模化商用仍需约1至2年时间。

（图片来源：上海棣山科技有限公司官网）

作为国内专注高端芯片研发的科技企业，棣山科技始终坚持“传感器芯片+高算力芯片”双轮驱动战略，重点聚焦AI GPU领域核心技术突破。2025年，公司宣布首款自研2nm AI GPU原型芯片顺利完成设计第三阶段，标志着其在高端AI芯片设计领域取得实质性突破，跻身国内乃至国际先进行列。

核心技术架构与性能指标

据悉，该款2nm AI GPU原型芯片采用FinFET/GAA混合制程工艺与Chiplet异构集成架构，搭载自研“棣山智核（DS-Core）”，核心晶体管数量达1700亿颗，芯片面积约800mm²，并采用2.5D CoWoS-L先进封装技术。

经多轮严谨仿真测试验证，该芯片算力表现突出：FP32单精度算力可达50 TFLOPS，FP16半精度算力达100 TFLOPS，FP4低精度算力高达400 TFLOPS，可灵活适配大模型训练与推理等不同精度需求的高端算力场景。其中FP32单精度算力可与NVIDIA H100、H200系列高端AI GPU芯片同台较量，有效打破国际巨头在高端AI算力设计领域的技术垄断壁垒。

能效表现：典型功耗控制在350W以内，每瓦算力达142 GFLOPS，较上一代产品能效提升40%，实现了性能与功耗的良好平衡。

需要客观指出的是，高端AI GPU产业的竞争是全链条综合实力的比拼，除设计技术外，还涉及量产能力、软件生态、产品可靠性等多个维度。目前，棣山科技与国际巨头在上述领域仍存在阶段性差距。

突破三大核心瓶颈，构建高速互联生态

研发团队已成功攻克高带宽内存封装互联、超低延迟片间通信（<0.25ns/mm）以及微流道高效热管理三大核心技术瓶颈：

内存与带宽：搭载的HBM4内存，单颗容量达48GB，引脚速率超11Gb/s，内存带宽高达3.2TB/s，较上一代HBM3E提升约2.5倍，可充分满足大模型训练的海量数据吞吐需求。

互联与生态兼容：支持NVLink 6兼容互连协议，单链路带宽达1.6TB/s，可实现多芯片无瓶颈协同扩展。同时，芯片兼容主流CUDA软件生态，大幅降低下游客户的技术迁移成本。

热管理：采用微流道热管理技术，芯片热失控风险降低68%，工作温度稳定控制在85℃以下，为长期稳定运行提供坚实保障。

研发聚焦原型验证，四大方向稳步推进

当前，棣山科技研发工作已全面转入原型验证阶段的攻坚环节，重点围绕四大关键领域有序推进：

芯片系统级验证
时序收敛优化
量产良率提前优化
软件生态同步适配

研发团队正细化验证流程、优化技术方案，全力推动原型验证各项任务落地见效，为后续正式启动流片测试及加快量产进程奠定坚实基础。

— 深度智库研究 —

— 高端咨询服务 —

— 前沿资讯快报 —

免责声明：

本公众号所发布的内容(涵盖文字、图片、音频、视频、图表、数据等各类形式)，均通过合法途径获取，来源包括但不限于互联网公开信息渠道(如行业官方网站、权威新闻媒体、官方发布平台等)、用户主动投稿以及合作方正式授权。发布内容的目的在于传递行业动态、分享知识经验，供广大用户学习、交流与参考，仅记载微信公众号的观点与见解，不代表任职机构的立场。如有侵权，联系删除。