链接:
https://pan.baidu.com/s/15_JLbYpVQ2kZ9r--lMYb7w?pwd=kpah
提取码:kpah
或者
www.cae-sim.com

适合人群:
1.研究大规模线性方程组
2.各种求解器研发人员
3.研究,比较,探索各种线性方程组求解三方库
4.研究线性方程组分布式加速,GPU加速
5.线性代数学习应用
说明:
1. windows平台,绿色解压即用,无需注册试用期60天
2. 文件7z大小1.5G
3. 作为一款常用求解器开发工具,后续会保持1-2月更新一次


用户使用说明
1. 文档目的
用于对稀疏线性方程组 Ax=b 执行以下工作:
导入矩阵与向量数据 生成问题画像 诊断潜在瓶颈 推荐求解方案 执行求解并验证结果 导出报告、解向量和项目文件
本文档重点说明:
如何正确准备输入 如何使用当前界面完成一次完整分析和运行 如何理解主要页面与关键参数 当前 Windows V1 的使用边界和注意事项
2. 启动前准备
2.1 程序文件
常见发包目录中的关键文件包括:
app_axb.exe:主程序 axb_worker.exe:后台求解工作进程 PACKAGE_README.txt:发包说明 ENVIRONMENT_VARIABLES.txt:环境变量说明 快速上手.md:简要使用说明 用户使用说明.md:正式使用说明
如果启用分布式流程,正式包中还可能包含:
mpiexec.exeimpi.dlllibfabric.dll其它 Intel MPI 运行所需文件
2.2 License
程序启动时会检查 License 状态。
2.3 推荐首次使用方式
第一次使用建议采用最稳妥的配置:
使用随包基准用例或一组较小的 A/b保持 启用 Distributed关闭保持 启用 GPU关闭保持默认内存预算、稳定性阈值和最大迭代次数 不手工裁剪第三方后端范围
3. 界面总览
主界面由左、中、右、下四个区域组成。
3.1 左侧:输入/约束
负责:
选择矩阵 A选择右端向量 b选择参考解 x载入随包基准用例 设置运行约束 筛选后端库 触发 画像 + 诊断 + 推荐
3.2 中部工作区
中部是 4 个主页面:
矩阵剖析瓶颈诊断推荐方案报告
3.3 右侧:属性 与 结果
属性 面板显示当前选中方案的预测和参数。
结果 面板显示运行后 Ax-b 验证信息,并允许导出解向量。
3.4 底部:输出日志
统一显示:
数据加载信息 分析过程日志 求解过程日志 导出信息 失败原因和异常提示
遇到问题时,优先查看 输出日志。
4. 输入数据准备
4.1 最常用的数据组成
一次标准求解通常包含:
矩阵 A向量 b可选参考解 x_ref
其中:
A为必填 b为可选;不提供时,程序按默认/单位 RHS 流程处理 x_ref为可选;仅在需要结果校验时使用
4.2 支持的常用文件格式
当前已确认支持的主要格式:
MatrixMarket: .mtx、.mmCOO: .coo文本/表格: .csv、.tsv、.txtCSR: .csrNumPy: .npy、.npzHDF5: .h5MATLAB: .matHarwell-Boeing: .hbPETSc Binary: .bin(仅带 PETSc 支持的构建)
建议优先使用:
.mtx/ .mm保存矩阵.mtx/ .txt保存向量
这样最容易排查问题,也最利于与其他工具互通。
4.3 文件准备建议
建议采用如下命名:
foo.mtxfoo_b.mtxfoo_x_ref.mtx
这样更便于和测试工具、报告及人工检查对齐。
5. 使用随包基准用例
如果不想先准备自己的数据,可以直接使用随包基准用例。
操作步骤:
在 输入/约束面板中找到基准用例区域。从下拉框选择一个用例。 保持格式为 自动检测,或手工指定格式。点击 加载 基准用例。
程序会自动填写:
矩阵 A向量 b有条件时的参考解 x_ref
适用场景:
首次试用 培训演示 回归验证 排查环境问题
6. 运行约束说明
运行约束 会同时影响:
推荐方案生成 候选方案过滤 实际运行的执行边界
6.1 内存预算
含义:
用于指导推荐阶段估算候选方案是否超出可接受内存峰值
建议:
新用户可保持默认值 机器内存较小或需强制过滤大内存方案时再调低
6.2 最小稳定性 S
含义:
作为推荐方案的稳定性分数下限
影响:
值越高,候选方案更保守、更稳定 值越低,候选方案可能更激进,速度可能更快,但风险更高
6.3 最大迭代次数
含义:
作为迭代法运行的上限
建议:
正常情况下保持默认 若某类问题接近收敛但被过早截断,再考虑上调
6.4 启用矩阵分区
含义:
在分析/求解前启用矩阵重排或分区能力
可选策略:
自动(优先 METIS)METIS k-wayUniform k-way
说明:
一般不需要在首次使用时手工开启 对超大规模或明显带块结构的问题可再尝试
6.5 MPI 实现与 MPI 进程数
当前 Windows V1 正式支持:
Intel MPI
注意:
Distributed关闭时,MPI 进程数不会参与实际运行 即使界面存在相关选项,也不表示所有 MPI 组合都进入正式支持范围
6.6 CPU 线程模式
可选:
自动SerialOpenMP
适用场景:
做基线对比时可使用 Serial使用多线程 CPU 路径时可选 OpenMP
6.7 启用 Distributed
作用:
允许程序进入分布式运行路径
建议:
仅在 MPI 运行环境已经准备好时开启 首次使用或客户演示时建议保持关闭
6.8 启用 GPU
作用:
允许推荐和运行阶段使用 GPU 相关后端
建议:
只有在确认 GPU 驱动、运行库和对应后端都已匹配时再开启 Windows V1 默认建议先走 CPU 路线
7. 第三方后端说明
第三方后端 区域用于控制候选后端范围。
常见可见后端包括:
EigenPETSchypreTrilinosSuiteSparse (KLU/UMFPACK/CHOLMOD/ParU)SuperLUMUMPSAMGXcuSOLVERcuDSSGinkgoMKL (PARDISO)
注意:
是否显示为可用,以当前构建实际编译结果为准 某些后端即使已编译,也可能因当前运行模式不匹配而显示受限 鼠标悬停到后端勾选项上,可以查看能力说明和不可用原因
特别说明:
SuiteSparse在某些构建中默认关闭,需要设置 AXB_ENABLE_SUITESPARSE=1cuSOLVER/ cuDSS适合 GPU direct 路径,不支持当前分布式流程AMGX可能受到 GPU 架构匹配影响,正式交付前需确认目标机器兼容性
8. 标准工作流程
推荐按下面顺序完成一次完整使用:
导入 A/b或加载基准用例保持默认约束,点击 画像 + 诊断 + 推荐查看 矩阵剖析查看 瓶颈诊断在 推荐方案中选择一个可运行方案查看右侧 属性点击 运行所选在 结果面板查看验证结果在 报告页面查看摘要并导出需要复用时保存为项目文件
9. 页面详细说明
9.1 矩阵剖析
该页面用于展示问题基本画像,包括:
Profile IDn / nnz平均每行/列非零元 矩阵密度 估计矩阵内存 稀疏度 对称性得分与分类 SPD 概率 条件数估计与分类 规模分类 块模式、块形状、主导块大小 块密度、块占用率 物理标签、硬件标签 二维块特征图
作用:
帮助判断问题属于对称、SPD、病态、稀疏、块结构明显等哪一类 为后续推荐和调参提供依据
9.2 瓶颈诊断
该页面从 4 个方面描述风险:
计算 内存 通信 收敛
同时给出:
诊断依据 优化建议 历史驱动诊断置信提示
适用方式:
若 收敛比例高,优先关注求解器/预条件器稳健性若 内存比例高,优先控制直接法和大规模 fill-in 风险若 通信比例高,说明分布式成本可能偏高
9.3 推荐方案
该页面是实际运行前最重要的工作区。
每条方案会显示:
求解库 求解器 预条件器 状态 类型
状态可能为:
可运行不可用
类型可能为:
推荐自定义
页面支持:
仅显示可运行方案 复制方案 删除自定义方案 双击查看推荐详情 执行当前所选方案 查看运行历史 双击运行历史查看详细指标和回退事件
自定义方案
如果推荐方案接近你的目标,但你想试验其它组合:
先选中一条方案 点击 复制方案在新增的自定义方案行中修改: 求解库 求解器 预条件器 再点击 运行所选
说明:
推荐方案本身不能删除 只有自定义方案可以删除
9.4 属性
右侧 属性 面板会随着当前所选方案变化。
内容包括:
求解库 参数串 预测时间 预测内存 预测加速比 置信度 推荐原因 方法参数
基础方法参数包括:
收敛精度 最大迭代次数 重启步长 平滑器 Schur 模型 收缩加速
点击 高级参数... 后:
若当前求解库存在参数模板,会打开高级参数编辑器 若不存在模板,程序会给出提示
使用建议:
非必要不改高级参数 先跑默认方案确认可用,再进行调优
9.5 结果
运行完成后,结果 面板提供 Ax-b 验证:
||Ax-b||2||Ax-b||2 / ||b||2max|Ax_i - b_i|结果结论
若当前运行记录保存了解向量,可点击:
导出当前结果解向量...
导出格式:
MatrixMarket (*.mtx)Text (*.txt)
9.6 报告
报告 页面用于查看和整理当前任务摘要。
特点:
会自动汇总输入、约束、画像和运行记录 可在导出前手工编辑备注
导出格式:
Markdown JSON CSV HTML 文本
常见用途:
给测试报告归档 给客户提供求解记录 作为复盘材料
10. 运行与运行历史
点击 运行所选 后,程序会进入执行状态。
运行期间可观察到:
当前阶段状态 已耗时 运行指标 输出日志
运行完成后,推荐方案 页面下方会追加运行历史表。
运行历史通常包含:
运行名称 求解库 求解器 预条件器 参数 状态 验证 迭代次数 残差 耗时 内存 后向误差 回退次数
双击某条运行历史后,可查看:
方案详情 推荐原因 运行结果 故障类别 回退事件
11. 项目保存与恢复
程序支持项目文件保存与恢复。
常用操作:
新建项目打开项目...保存项目项目另存为...
推荐后缀:
.dzp.json
项目文件通常会保存:
matrixPathrhsPathxRefPath当前约束 是否已有分析 当前画像 当前瓶颈报告 推荐方案 运行历史 最新结果
适用场景:
中途暂停,后续继续 不同人员之间交接分析结论 保留客户现场配置
12. 报告与交付建议
如果目的是对外输出,请优先保留以下材料:
项目文件 .dzp.json导出的 Markdown 或 HTML 报告 关键运行结果的解向量文件 输出日志中的关键错误信息
对外演示时建议采用:
单机 CPU 默认约束 已验证可运行的基准用例
13. Windows V1 当前使用边界
请按当前版本边界理解功能,不要把“界面可见”直接等同于“正式支持”。
13.1 MPI
当前 Windows V1 正式支持:
Intel MPI
建议优先验证的 MPI 后端:
hypreMUMPS
说明:
Distributed打开前,应确认 MPI 运行文件齐全 第一次分布式验证建议从 2个进程开始
13.2 GPU
当前版本具备 GPU 相关入口,但正式交付前需确认:
GPU 型号与运行库匹配 驱动环境稳定 对应后端已在目标环境完成验证
建议:
客户默认配置优先 gpu=off只有明确验证通过后再打开 GPU 路径
13.3 后端可用性
不同构建下,可用后端组合可能不同。
因此应以界面中的以下信息为准:
勾选框是否可用 工具提示中的可用性说明 推荐方案中的 可运行 / 不可用
14. 环境变量
当前较常见的用户侧环境变量:
AXB_ENABLE_SUITESPARSE=1AXB_TRIAL_DAYS=<天数>(通常仅测试/受控部署使用)
说明:
其它 OMP_*、MKL_*、MPI 相关变量更偏运维/调试用途不建议普通用户在不了解影响时手工修改
如需详细说明,请参考同目录的:
ENVIRONMENT_VARIABLES.txt
15. 常见问题
15.1 点击“画像 + 诊断 + 推荐”后没有结果
检查顺序:
矩阵A是否已填写 文件路径是否真实存在 文件格式是否在支持列表中 输出日志中是否存在加载失败信息
15.2 方案显示“不可用”
常见原因:
当前构建未包含该后端 当前约束与后端能力冲突 需要 GPU,但 启用 GPU未打开需要分布式,但 启用 Distributed未打开该后端在当前模式下被桥接策略限制
15.3 运行失败或发散
建议:
先换一个同类但更稳健的推荐方案 降低激进配置,保持默认参数 检查矩阵是否病态或存在零行/弱对角问题 查看 瓶颈诊断中的收敛项建议查看 输出日志
15.4 想做严格数值校验
建议:
提供 x_ref运行后查看 结果面板中的Ax-b验证同时导出报告和解向量留档
15.5 想确认是不是环境问题
建议优先使用:
随包基准用例 默认约束 单机 CPU 路径 一个明确 可运行的推荐方案
如果这一步都不稳定,再排查环境、依赖和运行库。
16. 推荐使用顺序
如果你只需要一个最稳妥的操作顺序,请照下面做:
启动程序并完成授权 加载一个随包基准用例 保持默认约束 点击 画像 + 诊断 + 推荐在 推荐方案中选择第一条可运行方案点击 运行所选查看 结果导出 报告保存为 .dzp.json
以上流程确认无误后,再逐步尝试:
自己的数据 更大的矩阵 自定义方案 分布式流程 GPU 路径
夜雨聆风