AI4PDEs|精选·论文推荐 71|基于小波的富化物理信息神经网络用于近似固体力学中的局部和非均匀解

AI4PDEs｜精选 · 论文推荐

AI for Science｜第七十一期

基于小波的富化物理信息神经网络用于近似固体力学中的局部和非均匀解

Wavelet-based enrichment for physics informed neural networks to approximate localized and heterogeneous solutions in solid mechanics

作者： Duc‑Vinh Nguyen✉, Mohamed Jebahi, Francisco Chinesta

第一署名单位: 法国洛林大学

发表期刊：Comput. Methods Appl. Mech. Engrg.

论文主页：

https://linkinghub.elsevier.com/retrieve/pii/S0045782526000423

论文｜PDF 下载 ↓

https://www.jianguoyun.com/p/DQaU1YkQ7P3jDRiG9qoGIAA

开源代码 ↓

未开源

点击打印论文信息

Published 2026-01

想象一块被拉伸的薄板，中间开了一个小孔，在外力作用下孔边缘出现了巨大的应力集中。如果用传统有限元网格加密可以捕捉这些细节，但一旦试图用深度神经网络求解这样的边值问题，局部的剧烈变化常常被光滑的激活函数抹平，导致预测的应力分布过于平滑。那么，物理信息神经网络能否同时兼顾全局平滑和局部尖锐结构？这正是本文要解决的问题。

研究背景 · 问题意识

研究背景

物理信息神经网络（Physics‑Informed Neural Networks，简称 PINN）近年来成为求解偏微分方程的一种热门方法。与传统网格法不同，PINN 不需要构建离散网格，而是通过在定义域内随机采样的训练点使网络输出同时满足 governing equation、边界条件和 constitutive relation，从而直接逼近未知的连续场。这种方法简洁灵活，在逆问题、参数研究等场景展现出优势。但在固体力学中面对多尺度或高度异质的场，PINN 的优势尚未完全发挥：

① PINN 使用的激活函数（如 tanh）本身是连续光滑的，模型更倾向于学习全局平滑的解，而对局部存在的应力集中、裂尖奇异或材料界面处的断裂往往表现不佳；

② 常见的损失函数会平均所有训练点的残差，当训练点在空间上均匀分布时，网络对小范围内的误差不敏感，从而忽视局部高频信息；

③ 通过在局部区域增加更多采样点虽然可以增强对局部特征的约束，但会使不同区域贡献不均衡，导致模型在其它区域的误差增大。

针对这些痛点，传统计算力学已有诸多成熟手段，例如自适应网格加密、扩展有限元、梯度增强模型等。这些方法的共同特征是在具有显著变化的局部加入额外的空间自由度或引入高阶梯度项。但在 PINN 框架中，如何优雅地引入局部自由度、同时保持自动微分和无网格的特性，是目前领域的一个空缺。

问题意识

本文关注的核心问题是：如何让物理信息神经网络有效捕捉固体力学问题中的局部异质性和高频信息？特别是当应力或位移场在某些小区域内陡然变化，而在其余部分相对平滑时，传统 PINN 往往无法兼顾两种尺度。作者选择一个带圆孔的板在拉伸中的基准问题作为切入点，洞口附近的应力集中为研究提供了鲜明的“高频–低频”对比。

研究意义 · 方法论 · 创新点

研究意义

能够在神经网络框架下高效、准确地模拟局部异质性，对工程实践具有深远意义。例如复杂材料的微观结构、裂纹尖端的应力场、复合材料界面的位移跳跃等，都涉及高梯度或不连续的局部行为。若能利用 PINN 快速获得这些场的高精度解，将为设计优化和快速评估打开新的可能。同时，从科研角度看，如何将经典数值方法中的“局部加密”思想移植到 PINN，是理论与实践交汇的前沿问题。

方法论

作者提出两项关键改进以应对上述挑战：

1. 密度感知加权的损失函数 传统 PINN 的损失函数对每个训练点采用简单平均，意味着稠密区域会对训练起更大作用。为了在需要提高采样密度的局部区域避免“喧宾夺主”，作者引入了密度感知加权策略。具体而言，通过 Voronoi 分割或固定半径邻域估算每个采样点的局部密度，再用密度的倒数作为权重，使不同区域的物理残差在总损失中贡献更均衡。这样的处理允许在孔洞附近投入更多训练点，同时不牺牲远处解的准确度。Fig. 11 展示了孔边界的加密采样，而 Fig. 10 对比了均匀采样与局部加密采样的差异。

2. 小波基的局部富化 受扩展有限元“局部富化”思想启发，作者设计了一套基于小波的富化函数。小波是一类同时具有空间和频率局部化特征的函数，可以通过伸缩和平移构建多尺度基底。

在一维中，选择一阶 Gaussian 小波作为母小波，构造多尺度与多平移的基；在二维中利用张量积构造出水平、垂直和对角三个方向的小波。

作者将这些小波定义在参考单元上，并通过仿射变换映射到物理空间的局部区域。

对于实际问题，只需在应力高频的局部设置一块矩形“富化区”，通过矩阵 A 和向量 b 将物理坐标映射到参考空间，就可以调用对应的小波基来描述局部高频成分。

3. 富化 PINN 的整体架构 整合上述思路，作者提出了富化物理信息神经网络（Enriched PINN）。整体架构如 Fig. 7 所示：基网络输出位移和应力的平滑部分，附加的富化层在预定义的局部区域使用小波基来表达高频补偿项。训练过程中分两阶段进行：首先仅优化基网络，在全域随机采样训练点以获得初始解；然后激活富化层，并在富化区投入更多采样点，利用密度权重更新小波系数和网络参数。损失函数在传统物理残差基础上增加了 L1 正则项，防止过多冗余小波系数引起过拟合。

创新点

① 加权损失针对局部采样不均衡进行校正。借助 Voronoi 密度或邻域计数估算采样密度，公平地评估局部残差，使增加训练点不再导致其他区域忽略。

② 提出连续可微的小波富化函数。选用快速衰减但非严格紧支撑的 Gaussian 小波，既保证自动微分的可行性，又兼顾局部特性，区别于 XFEM 常用的非连续富化基。Fig. 5 直观展示了在参考空间内各级别小波的位置分布。

③ 将富化区通过仿射映射灵活嵌入任意物理区域，并在损失函数中引入 L1 正则化自动挑选有效的小波模式。这种模块化设计使富化PINN可以扩展到多个子域或更高维度的问题。

实验结果 · 研究结论 ·

实验结果

1. 基准问题：带孔拉伸试件作者首先在一个带圆孔的矩形试件上验证方法。该试件在上下表面施加位移边界条件，左右自由，孔边界也自由。

实验设计了多种采样策略和模型配置：

均匀采样 + 非加权损失：传统 PINN 对孔附近的应力集中预测显著不足，误差集中在孔缘。

局部加密采样 + 非加权损失：虽然在孔附近训练点增加，损失函数过度关注局部区域，导致远处解劣化。

局部加密采样 + 加权损失：通过密度加权平衡各区域贡献，整体误差有所改善，但在孔边仍存在高频残差。损失演化如 Fig. 15 所示。

局部加密采样 + 富化PINN：在加权策略基础上激活小波富化，孔边的高频应力得到显著改善，相对误差大幅下降。进一步分析富化PINN的预测可以分解为基网络输出和平滑高频补偿。

这些结果表明，在总训练点相同的情况下，富化PINN通过引入局部小波基能有效捕捉尖峰，应力峰值与 Abaqus 的对比更加契合。

2. 多孔介质的均匀化 随后作者将方法应用于含多个椭圆孔的多孔材料在单轴拉伸下的均匀化分析。

不同于单孔问题，这里三个孔形状和方向不同，对应三个富化区。训练点沿外边界均匀采样，孔附近密集采样。

比较传统PINN与富化PINN的结果可以发现：

Abaqus/Standard 的基准应力场如 Fig. 19 所示，孔周产生复杂的应力分布；

传统 PINN 在孔周预测不足，尤其是剪应力分量模糊不清；

富化PINN 显著改善了孔周的应力集中和剪切分布，误差均匀降低；

损失演化显示富化层激活后物理残差迅速下降。

3. 双材料复合的界面问题 最后，作者考察了三相复合材料单元，其中三个椭圆区域为弹性模量提高 25% 的嵌入物。

在此问题中，位移在界面处连续而应力不连续，对 PINN 构成更大挑战。训练点分布如 Fig. 25。

结果显示： 传统PINN由于采用单一网络逼近两相域，无法准确刻画界面应力跳跃，相比基准解，界面附近误差较大；

富化PINN利用小波在界面区域表达高频贡献，更好地捕捉应力突变。

沿黑线截取的应力剖面对比进一步说明富化的优势：富化PINN能够逼近界面处的阶跃变化，误差明显小于传统模型。

研究结论

总体而言，作者提出的密度加权和小波富化策略显著提升了 PINN 在固体力学异质问题中的表现：

① 在不增加总训练点的前提下，局部加密采样配合密度加权可避免训练偏向高密度区域，提供更均衡的全局解；

② 小波基能够有效表示局部高频或尖峰，富化PINN成功捕捉了孔洞周围的应力集中、孔间相互作用，以及复合材料界面的不连续；

③ 训练过程采用两阶段策略，通过先预训练再联合优化富化系数，保证了收敛稳定性和可解释性；

④ 实验表明，即便使用相对简单的网络架构和有限的采样点，富化PINN的预测与有限元基准结果接近，误差大幅减少。

论文评价 · 未来展望

领域贡献

这一工作在 PINN 领域填补了局部异质性处理的空白：它将经典的局部加密思想和多尺度小波分析引入物理信息网络，构建了一个灵活可扩展的框架。该框架不仅适用于二维线弹性问题，也为未来在三维、动态、非线性问题中应用提供了模板。它显示了神经网络技术与传统数值方法结合的潜力，为科学机器学习在工程应用中的落地迈出一大步。