【香山双周报 101】昆明湖 V3 文档逐步公开
【香山双周报 101】20260427 期
欢迎来到香山双周报专栏,我们将通过这一专栏定期介绍香山的开发进展。本次是第 101 期双周报。
昆明湖 V3 的设计文档已经逐步公开,欢迎大家阅读并与我们讨论!目前,新版设计文档包含 ICache 和 BPU 两个模块,其他模块的设计文档将随着开发的进行陆续发布。设计文档仍然在 https://docs.xiangshan.cc/projects/design/zh-cn/,如果大家对昆明湖 V2 的设计文档感兴趣,可以通过网页右下角切换分支来查看。
关于香山核近期开发进展,前端着重优化了 BPU 的时序,后端和访存实现了多个新特性,并且修复了一些功能 bug。
近期进展
前端
-
• RTL 新特性 -
• 启用 SC Backward 表(#5796) -
• Bug 修复 -
• 修复 S1 级 RAS 在 S3 override 时栈顶地址用错的问题(#5680) -
• PPA 优化 -
• 去除存储在 FTQ 的 SC 训练元数据,改为更新时读,节省面积(#5819) -
• 解耦 TAGE 跳转计数器和 useful 计数器的写入,节省功耗(#5782) -
• 修复 BPU S3 多条时序路径(#5797) -
• 修复 SC 预测时序路径(#5843) -
• 修复 FTQ 重定向及分支 resolve 时序路径(#5835) -
• 代码质量 -
• 删除未使用的 V2 工具类(#5821)
后端
-
• RTL 新特性 -
• (V2) 允许通过 CSR 配置“提交停滞”(commit stuck)关键错误检查 (#5806) -
• 新增开关,用于禁用分派负载均衡优化 (#5815) -
• 解决因主流水线资源不足导致的误报问题 (#5803) -
• PPA 优化 -
• 优化分派策略以提升性能 (#5801) -
• Bug 修复 -
• 修复间接 CSR RegOut 问题 ((V2) #5823, 5833)
访存与缓存
-
• RTL 新特性 -
• 完成新版 StoreUnit 设计(#5760) -
• 持续推进新版 L2 设计 -
• Bug 修复
XSAI
-
• RTL 新特性 -
• 正在测试矩阵模块的 FP8 精度支持 -
• 正在评估矩阵模块的 8 通道访存 -
• 正在与后端组配合实现 BF16 标量与向量 -
• 代码质量 -
• 优化了 XSAI 的参数系统(XSAI #59) -
• 调试工具 -
• NEMU 新增 BF16 扩展支持(NEMU #995) -
• HBL2 测试兼容多核环境
性能评估
处理器及 SoC 参数如下所示:
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
性能数据如下所示:
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||
|
|
|
|
|||
|
|
|
|
|||
|
|
|
|
|||
|
|
|
|
编译参数如下所示:
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
注:我们使用 SimPoint 对程序进行采样,基于我们自定义的 checkpoint 格式制作检查点镜像,Simpoint 聚类的覆盖率为 100%。上述分数为基于程序片段的分数估计,非完整 SPEC CPU2006 评估,和真实芯片实际性能可能存在偏差。
相关链接
-
• 香山技术讨论 QQ 群:879550595 -
• 香山技术讨论网站:https://github.com/OpenXiangShan/XiangShan/discussions -
• 香山文档:https://xiangshan-doc.readthedocs.io/ -
• 香山用户手册:https://docs.xiangshan.cc/projects/user-guide/ -
• 香山设计文档:https://docs.xiangshan.cc/projects/design/
编辑:徐之皓、吉骏雄、陈卓、余俊杰、孙际儒、李衍君
夜雨聆风