conv_thr的默认值1e-6 Ry。你觉得QE官方默认值应该是够用的——毕竟官方给的嘛。但AiiDA-QE团队不这么想。他们的balanced协议对10原子体系设置的conv_thr是2e-9 Ry,比QE默认值严格500倍。stringent协议更狠,严格1000倍。
这不是拍脑袋定的。这背后是Marzari团队对数百种材料、数万次计算的系统性基准测试。今天我们就来拆解:AiiDA-QE的协议到底比QE默认值严多少?为什么需要这么严?严了500倍之后计算量涨了多少?
01 500倍是怎么算出来的?
1.1 关键参数逐项对比
先看数据。QE的默认值和AiiDA-QE三个协议的对比:
| conv_thr | ||||
| etot_conv_thr | ||||
| forc_conv_thr |
注:N = 体系中的原子数。AiiDA协议的SCF能量和离子能量阈值是按原子数缩放的。
1.2 以10原子体系为例
以一个典型的10原子体系为例,计算实际阈值:
| 500倍 | |||
500倍严格的核心来源是conv_thr——SCF自洽收敛的能量阈值。
对于不同原子数的体系,严格倍数也不同:
注意:原子数越多,AiiDA的阈值越宽松(因为是按原子缩放的),但即便100原子体系,conv_thr仍然比QE默认值严50倍。
1.3 不仅仅是conv_thr:k点和截断能也被加码
AiiDA-QE协议对k点采样和赝势截断能也有严格要求:
k点采样密度:
大多数用户随手设的k点网格可能只有4×4×4或6×6×6,而AiiDA balanced协议要求约7×7×7,stringent协议要求约10×10×10——k点数差了3-6倍。
赝势和截断能:
AiiDA协议使用SSSP(Standard Solid-State Pseudopotential)库,每个元素都有经过严格测试的ecutwfc和ecutrho推荐值。fast和balanced协议用SSSP efficiency版本,stringent用SSSP precision版本——截断能通常比赝势文件中"建议最小值"高20-50%。
02 为什么需要这么严?
2.1 QE默认值的历史包袱
QE的默认值(conv_thr=1e-6, forc_conv_thr=1e-3)是在上世纪90年代设定的。当时的计算资源有限,这些默认值是"够用就行"的折中——对大多数体系能收敛,但精度不保证。
问题是:30年过去了,计算能力涨了几个数量级,但QE的默认值从未更新。
2.2 conv_thr=1e-6到底够不够?
不够。至少对以下场景不够:
声子计算:DFPT声子计算对SCF收敛极度敏感。conv_thr=1e-6 Ry可能导致声子频率误差达数个cm⁻¹,特别是低频声学支。AiiDA的aiida-quantumespresso声子工作流自动将conv_thr收紧到1e-10 Ry/atom级别。
力常数和弹性常数:力的精度直接受conv_thr影响。conv_thr=1e-6对应的力精度约1e-3 Ry/bohr量级,这意味着力常数可能有10%以上的误差。
结构优化:如果SCF收敛不够紧,离子步之间的能量差可能被数值噪声淹没,导致结构优化提前终止或陷入伪极小值。
高通量计算:当你要算几千种材料时,需要统一的精度标准。QE默认值对不同体系精度不一致(小体系误差小,大体系误差大),而AiiDA的per-atom缩放确保了精度的一致性。
2.3 Marzari团队的基准测试
2025年,Nascimento、dos Santos、Bercx、Grassano、Pizzi和Marzari发表了系统性基准测试论文(arXiv:2504.03962),对数百种晶体材料测试了不同k点密度、展宽参数和收敛阈值对总能、力、应力的影响。
核心结论:
• k点密度是影响精度的第一因素:从kpoints_distance=0.30到0.10,总能误差从10 meV/atom降到1 meV/atom • 展宽参数需要和k点密度匹配:粗k点网格需要更大的展宽来平滑Fermi面,细k点网格可以用小展宽 • conv_thr必须足够紧:否则k点和展宽的收敛测试结果不可靠
这些基准测试直接催生了AiiDA-QE的三个协议:fast(粗筛)、balanced(标准)、stringent(高精度)。
03 严500倍,计算量涨多少?
3.1 SCF迭代步数增加
conv_thr从1e-6收紧到2e-9,SCF迭代步数通常增加2-5倍。但这是"最便宜"的代价——SCF迭代是线性增长的,不是指数增长的。
实际影响:
• 原来SCF需要15步收敛,现在可能需要30-50步 • 每步的计算量不变(矩阵对角化、电荷混合等) • 总SCF时间增加2-3倍
3.2 k点密度增加的代价
这才是真正的计算量来源。k点从4×4×4增加到7×7×7:
• k点数从64增加到343,增加5.4倍 • 但由于对称性约化,不可约k点数的增加通常只有2-3倍 • 总计算时间增加2-3倍
k点从4×4×4增加到10×10×10:
• k点数从64增加到1000,增加15.6倍 • 对称性约化后约5-8倍 • 总计算时间增加5-8倍
3.3 综合代价估算
以10原子体系为例,对比QE默认参数和AiiDA balanced协议的总计算量:
| 综合 | 5-10x |
结论:AiiDA balanced协议的总计算量约为QE默认参数的5-10倍。 不是500倍——conv_thr严格500倍不等于计算量涨500倍。
stringent协议的综合代价约为QE默认的15-30倍。
3.4 这5-10倍的代价值不值?
值不值取决于你的需求:
04 AiiDA-QE协议的全景
4.1 三个协议的定位
精度 ↑
│ stringent (1e-10 Ry/atom, k=0.10 Å⁻¹)
│ │
│ balanced (2e-10 Ry/atom, k=0.15 Å⁻¹) ← 推荐默认
│ │
│ fast (4e-10 Ry/atom, k=0.30 Å⁻¹)
│
─────┼──────────────────────────────→ 速度• fast:快速测试,验证输入文件和计算流程是否正确。不适合发表 • balanced:标准精度,适合大多数发表级计算。Nascimento等人2025年论文的核心协议 • stringent:高精度,推荐用于含镧系/锕系金属、声子计算、力场训练数据
4.2 协议的完整参数表
4.3 展宽参数的联动设计
AiiDA协议的一个精妙之处:展宽(smearing)和k点密度是联动的。
• 粗k点网格(fast)用大展宽(0.0275 Ry),避免金属体系的Fermi面锯齿 • 密k点网格(stringent)用小展宽(0.0125 Ry),减少展宽对总能的系统性偏移 • 这不是随意搭配,而是基准测试优化的结果
很多用户设k点时只关注密度,不调展宽,导致金属体系总能收敛困难或精度不足。AiiDA协议自动解决了这个问题。
05 你该怎么用?
5.1 不用AiiDA也能用这些参数
你不需要安装AiiDA也能受益于这些协议。直接在QE输入文件中手动设置即可:
balanced协议(10原子体系)示例:
&CONTROL
etot_conv_thr = 1e-4 ! 1e-5 × 10 atoms
forc_conv_thr = 1e-4
/
&ELECTRONS
conv_thr = 2e-9 ! 2e-10 × 10 atoms
/k点设置:使用Materials Cloud的QE输入生成器,选择balanced协议,自动生成k点网格和截断能。
5.2 逐步收紧策略
如果你担心计算量,可以分步收紧:
Step 1: 用QE默认参数做初步结构优化
Step 2: 用balanced协议的k点和截断能重新SCF
Step 3: 用balanced协议的conv_thr做最终结构优化
Step 4: 用balanced协议做性质计算(声子、能带等)这样前几步的计算量可控,只在最终优化和性质计算时才付出高精度代价。
5.3 什么时候可以放宽
以下情况可以适当放宽AiiDA协议的参数:
• 大超胞(>50原子):k点可以只取Γ点或2×2×2,因为实空间已经很大 • 分子/团簇:不需要密k点,Γ点only即可 • MD模拟:每步的力不需要极致精度,conv_thr可以放宽到1e-8 • 初步筛选:用fast协议快速过滤,只对候选材料用balanced/stringent
5.4 什么时候必须加严
以下情况必须用balanced或更严的协议:
• 声子计算:conv_thr至少1e-10 Ry/atom • 弹性常数:力精度要求高,forc_conv_thr至少1e-4 • 力场训练:所有参数必须最严(stringent) • 含f电子金属:k点必须密(stringent的0.10 Å⁻¹) • 发表级数据:至少balanced
06 其他软件的协议对比
AiiDA-QE不是唯一做这件事的。其他工作流框架也有类似的协议:
Materials Project (MP) 的VASP协议也采用了类似的per-atom缩放策略,conv_thr约1e-5 eV(≈7e-7 Ry),比VASP默认值(1e-4 eV)严约10倍。但AiiDA-QE的balanced协议比MP的VASP协议还要严约3-10倍。
这说明AiiDA-QE团队对精度的要求在业界是最激进的。
总结:三条核心认知
认知一:QE默认值是30年前的妥协,不是精度标准。 conv_thr=1e-6 Ry对大多数发表级计算不够,特别是声子、弹性常数和力场训练。
认知二:AiiDA协议的"500倍严格"主要来自conv_thr,综合计算量增加5-10倍。 不是500倍——SCF步数增加2-3倍,k点增加2-3倍,截断能增加1-1.5倍,综合5-10倍。
认知三:per-atom缩放是关键创新。 QE默认值不区分1原子和100原子体系,而AiiDA协议按原子数缩放,确保小体系和大体系有相同的精度水平。这是高通量计算的基础。
一句话:QE默认值是"能跑就行",AiiDA协议是"跑准了才行"。5-10倍的代价换来的是可发表、可复现、可信赖的计算结果。
参考资料:
• Nascimento et al., arXiv:2504.03962 (2025) — SSSP协议基准测试 • AiiDA-QE Protocol文档: https://aiida-quantumespresso.readthedocs.io/en/latest/topics/protocol.html • SSSP赝势库: https://www.materialscloud.org/discover/sssp/table/efficiency • QE输入生成器: https://qeinputgenerator.dev.materialscloud.cscs.ch/ • Prandini et al., Sci. Data 5, 180129 (2018) — SSSP赝势基准 • Wang et al., arXiv:2507.19670 (2025) — AiiDAlab QE App • QE INPUT_PW文档: https://www.quantum-espresso.org/Doc/INPUT_PW.html
夜雨聆风