这里我们先给出核心论点:AI方法的选择不是"哪种最先进",而是"你的任务结构是什么"。这个区别在我们平时选文献时很容易被忽略——大家看到某个方法精度高就想用,但精度高的前提条件往往和自己的场景不匹配。
下面五个方向,从最成熟到最前沿依次排列。
正向代理模型:先解决仿真太慢的问题
超表面设计里最基础的性能瓶颈是仿真速度。一次全波仿真(COMSOL、CST)从几分钟到几小时不等,遇到结构参数多的优化任务,迭代成本非常高。
代理模型的思路是:训练一个神经网络模拟仿真器的输出,以此替代仿真器。输入结构参数,输出S参数或反射/透射幅度相位。推理一次的时间从分钟级压缩到毫秒级。
这里有个具体的参照系。An等人提出的CNN代理模型[1],单次预测约3 ms,比商业仿真软件快约40,000倍。在10,000个测试样本上,幅度MSE=0.0011,相位MSE=0.0113。另一方向是用编码器-解码器网络对三角形和随机柱阵列超表面建模,同样实现毫秒级的电磁响应预测,同时涵盖了局部和全局耦合效应。

需要说清楚的是:代理模型本身不做逆向设计。它是优化循环里的一个组件——把遗传算法或粒子群优化里的仿真调用替换成代理模型,整个优化过程才能加速。单独使用代理模型解决不了"给目标响应、求结构参数"的问题。
适合场景:结构参数空间明确、需要大量迭代优化的任务,比如单元结构参数调优、周期阵列的扫参优化。
判别式逆向网络:精度最高,但不是万能的
从代理模型(结构→响应)直接翻转:训练一个网络,输入目标响应,输出结构参数。这是判别式逆向网络的基本逻辑,也是目前文献里用得最多的方案。
精度数据相对可信。基于CNN的编码超表面深度学习框架,一项针对超宽工作频段(覆盖多个波段)的DNN逆向方案,平均精度90%[2]。可编程超表面波束生成任务上,深度CNN精度超过95%[3]。


精度高、推理快、训练流程清晰——理论上这应该是首选。
但这里有一个结构性的限制,叫"一对多"问题。给定一个目标响应,满足条件的合法结构可能有很多个。判别式网络在训练时面对这种映射关系,会学习到各合法结构的"均值",生成的结构趋向训练数据的中心分布,多样性差。
换个说法:它能高精度复现训练分布内的设计,对分布外的结构探索能力有限。如果你的任务需要找到多个满足条件的结构方案,或者希望探索训练数据以外的设计空间,判别式逆向网络在这里就不够用了。
生成对抗网络GAN:解决"一对多",但有三个坑
GAN的出发点是:不学确定性映射,学整个设计分布。生成器从目标响应出发产生候选结构,判别器判断生成结果是否合理,二者博弈,最终生成器能产出分布多样的合法设计。
这个逻辑上确实比判别式网络更适合处理"一对多"映射。速度也没有明显损失。
非对称GAN方案(AGAN),使用101个特征点描述超表面几何结构,从响应输入到结构输出约3秒,速度比仿真快45,000倍[4]。RCS定向设计任务上,GAN逆向方案平均精度91%,同样是毫秒级推理[5]。(来源:Advanced Composites and Hybrid Materials;ScienceDirect)
然后是那三个坑。
模式崩溃(mode collapse)。生成器找到几个能持续骗过判别器的结构,锁死在上面,输出的多样性实际上是缩小的。这在超表面任务里出现频率不低,因为目标响应空间本身有很强的局部聚类特征,生成器容易找到局部最优解并停在那里。
训练不稳定。GAN的质量高度依赖超参数——学习率、批大小、训练轮数,以及生成器和判别器的架构平衡。同样的数据集和架构,不同随机种子的结果可以差很多。这个不稳定性在工程应用里是实际成本,调参时间不可忽视。
梯度消失。判别器太强时生成器梯度趋近于零,训练停滞。WGAN等改进方案缓解了这个问题,但没有完全消除。
值得注意的点是:GAN的优势(多样性)在实际项目里有多大价值,取决于任务对结构多样性的真实需求。如果你的最终目标只是找到一个满足条件的结构,判别式DNN其实更稳。
变分自编码器VAE:更可控的潜空间逆向
VAE是生成模型里训练过程更稳定的选择。它把结构参数压缩进一个连续的隐空间(latent space),在隐空间里进行概率采样,再解码回结构参数。目标响应作为条件变量,引导隐空间里的采样方向。
Ma等人的方案:编码器输入结构图像和对应的光学响应,输出隐变量分布;解码器结合采样的隐变量和目标频谱生成新的超表面设计。这个框架对"一对多"问题的处理更自然——隐空间是连续分布,在上面采样不同的点就能生成不同的合法设计,不依赖生成器-判别器博弈。
另一种组合:VAE建立隐空间,进化优化算法在隐空间里搜索。原始结构参数空间里的优化通常是高维非凸的,隐空间比参数空间更平滑,搜索效率有实质提升。(Liu等人;ACS Photonics方向综述)
混合方案QGAN+VAE(量子生成对抗网络结合VAE),验证精度约90%,同时部分解决了GAN的模式崩溃问题。(arXiv 2025)
训练稳定性上,VAE比GAN好处理。不确定性表达上,隐空间的概率性采样本身就提供了一种自然的多方案输出。
这个方案的主要限制是:隐空间的质量高度依赖编码器的设计,如果压缩过程损失了关键的结构信息,后续的生成质量会受影响。这个问题在结构几何复杂度高的超表面任务里更明显。
适合场景:需要多方案探索、希望优化过程更可控的任务。结合进化算法的组合方案,适合有具体性能约束的工程设计。
基础模型与小样本方向:走向跨任务泛化
2025年开始出现几个值得记录的新方向,现在还不是主流,但方向相对清晰。
MetasurfaceViT(arXiv: 2504.14895, Jiahao Yan等):用Jones矩阵表征超表面的完整光学响应,通过掩码波长和偏振通道的预训练任务(类似NLP的BERT)学习超表面的通用物理规律,微调后支持不同类型的逆向设计任务。预期价值在于跨任务迁移——同一个预训练模型通过少量标注数据适配到新任务,而不是从头训练一个专用模型。
小样本学习方向:上海科技大学林丰涵课题组的"构效映射"双向编码解码网络,在几分钟内生成数百万种候选结构,在小样本条件下精度超过90%。(上海科技大学,2024)这个路线的核心价值是降低数据门槛——传统方法需要大规模仿真数据集,小样本框架可以用更少的训练数据完成有效学习。
CNN-Transformer混合架构(AIP Advances,2025):CNN特征提取结合Transformer全局注意力,在4-16 GHz宽带极化转换器设计任务上,平均MSE=0.00331,仿真结果和实验结果一致。高斯噪声数据增强在小训练集条件下显著提升了泛化能力。
这个方向目前的主要限制:预训练数据集的构建和质量控制没有成熟规范;跨任务泛化的边界在哪里没有实验证据;物理约束(如互易性、能量守恒)如何有效注入到基础模型里,是开放问题。
现有数据支持关注,不支持立即转入这个方向——除非你的任务刚好是多任务、小数据集的场景,并且有足够的算力做预训练实验。(该判断的置信度中等,随2025-2026年陆续公开的实验数据可能需要修正。)
方法横向对比
隐藏推荐:如果任务对设计多样性要求不高、有足够的训练数据(至少几千条仿真结果)、时间压力明显,判别式DNN是最省心的起点——精度最高,训练流程最稳,上手成本最低。
GAN和VAE的优势在"一对多"场景里是真实的。但真正需要多样性输出的任务,在实际项目里占多大比例,值得先评估一下,再决定是否为此承担额外的训练复杂度。
论文信息
[1]Sensong An, Bowen Zheng, Mikhail Y. Shalaginov, Hong Tang, Hang Li, Li Zhou, Jun Ding, Anuradha Murthy Agarwal, Clara Rivero-Baleine, Myungkoo Kang, Kathleen A. Richardson, Tian Gu, Juejun Hu, Clayton Fowler, and Hualiang Zhang, "Deep learning modeling approach for metasurfaces with high degrees of freedom," Opt. Express 28, 31932-31942 (2020)
[2]Ghorbani, F., Beyraghi, S., Shabanpour, J. et al. Deep neural network-based automatic metasurface design with a wide frequency range. Sci Rep 11, 7102 (2021). https://doi.org/10.1038/s41598-021-86588-2
[3]T. Shan and M. Li, "Coding Programmable Metasurfaces Based on Deep Learning Techniques," 2019 IEEE International Symposium on Antennas and Propagation and USNC-URSI Radio Science Meeting, Atlanta, GA, USA, 2019, pp. 1-2, doi: 10.1109/APUSNCURSINRSM.2019.8889025.
[4] INVERSE DESIGN OF PLASMON-INDUCED TRANSPARENCY IN STRIPE-CIRCULAR AGGREGATE STACKING ARRAYS VIA DEEP LEARNING WITH FEWER FEATURE POINTS. https://www.sciencedirect.com/science/article/abs/pii/S138694772500164X
[5] A DUAL-PATH GENERATIVE ADVERSARIAL NETWORK-BASED INVERSE DESIGN OF BROADBAND RCS REDUCTION METASURFACE ELEMENTS. https://www.sciencedirect.com/science/article/abs/pii/S0143816624004445
夜雨聆风