AI 能不能自动改变镜片数量和类型,设计出更好的复合镜头?

【一句话核心】复合镜头设计最难的地方，不只是调曲率、厚度、间隔这些连续参数，而是要不要加镜片、删镜片、合并镜片、拆分双胶合镜片这些“结构级决策”。本文提出一种离散—连续联合优化方法，把梯度优化和 MCMC 采样结合起来，让算法能够自动探索镜头拓扑结构，从而在清晰度和通光量之间找到更好的设计。

一、背景

复合镜头设计本质上是一个高度复杂的优化问题。一个镜头系统里包含多个折射元件，每个元件又涉及曲率、口径、厚度、间隔、折射率等参数。传统光学设计软件虽然可以优化这些连续参数，但通常默认镜头的整体结构已经给定，例如有几个镜片、哪些是单透镜、哪些是胶合双透镜。

问题在于，很多时候镜头性能的进一步提升，并不是单纯把已有参数再调一调就能实现的。

比如：

视场扩大时，原有结构可能无法同时保持边缘清晰；

想提高进光量时，仅靠调曲率可能会牺牲成像质量；

想把镜头做得更紧凑时，原有镜片数量和排列方式可能本身就不合适。

也就是说，复合镜头设计不只需要“参数优化”，还需要“结构优化”。

传统做法通常依赖光学工程师的经验：先基于已有镜头进行手动修改，比如增加一个镜片、删除一个镜片、把两个单透镜胶合成双胶合透镜，或者把双胶合透镜拆开，然后再交给优化软件继续做梯度优化。这个过程非常依赖人工经验，也很难充分搜索整个设计空间。

已有的可微分光线追迹和梯度优化方法，已经可以较好地优化曲率、位置、厚度等连续变量，但它们通常固定镜头拓扑结构，不能自动改变镜片数量和镜片类型。另一方面，一些基于深度学习、遗传算法或大语言模型的方法可以帮助生成初始结构，但往往不能充分优化连续参数，因此也难以准确判断某种结构是否真的有潜力。论文指出，当前自动镜头设计的关键空白在于：现有方法往往只能优化连续参数或离散结构中的一类，而高性能复合镜头恰恰需要两者联合优化。

因此，本文真正想解决的问题是：

能不能让算法既能像传统优化器一样细调镜头参数，又能像光学工程师一样自动尝试增加、删除、合并或拆分镜片？

二、贡献

首次将复合镜头设计转化为离散—连续联合优化问题

本文最大的贡献，是把复合镜头设计从“固定结构下的参数优化”，推进到“结构和参数同时优化”。

以往的可微分镜头设计方法主要做连续优化，例如优化每个镜面的曲率、镜片间距、口径等。但本文进一步把镜片数量和镜片类型也纳入自动设计过程，例如：

增加一个单透镜；

删除一个单透镜；把两个单透镜胶合成双胶合透镜；把一个双胶合透镜拆成两个单透镜。

这意味着算法不再只是在一个固定镜头结构附近做局部搜索，而是能够主动跨越不同镜头结构之间的边界。

从“调参数”走向“改结构”

本文的核心思想可以概括为：

梯度优化负责把当前镜头结构调好，离散突变负责跳到新的镜头结构。

如果只用梯度优化，算法只能在已有结构附近移动，很容易被当前镜头拓扑限制住。比如一个 5 片式镜头，无论怎么优化曲率和间隔，它仍然是 5 片式结构。若真正需要 6 片或 4 片结构才能达到更好的清晰度—通光量平衡，纯梯度优化就很难发现。

本文通过 MCMC 采样把“局部连续优化”和“全局结构突变”结合起来，使算法能够在多个镜头拓扑之间跳转，再对每个候选结构进行连续参数优化。

提出 RESTORE + 镜头突变 + 近轴投影的完整框架

本文不是简单地随机加减镜片，而是设计了一套完整的自动搜索机制：

用梯度优化改进当前镜头的连续参数；
当优化进展变慢时，触发结构突变；
对突变后的镜头做近轴投影，使其保持和原镜头相近的一阶聚焦行为；
再继续进行可微分光线追迹和梯度优化。

这套机制解决了复合镜头自动设计中的三个关键问题：

第一，如何在固定结构内快速优化；第二，如何自动尝试新的镜片数量和类型；第三，如何避免突变后的镜头完全失焦，导致优化无效。

本文把这三个模块结合起来，使算法能够探索比纯梯度优化更大的复合镜头设计空间。

三、方法

本文的技术重点，不是单纯提出一个新网络，而是把复合镜头设计变成一个可以自动“调参数 + 改结构”的闭环优化问题。

整个流程可以概括为：

输初始镜头 → 梯度优化连续参数 → 判断是否陷入局部最优 → 触发结构突变 → 近轴投影修正 → 再次优化 → 得到更优镜头

也就是说，算法既能像传统优化器一样调曲率、厚度、间隔，又能像光学工程师一样尝试增加、删除、合并或拆分镜片。论文明确提出用 MCMC 采样结合梯度优化和跨维度结构突变，并通过近轴投影提高全局搜索效率。

具体流程：

优化目标：同时看清晰度、通光量和焦距

本文没有只优化单一成像指标，而是把镜头设计目标拆成几部分：

清晰度：让光线尽量集中到传感器上，降低 spot error；通光量：让更多有效光线进入系统，提高镜头速度；焦距约束：保证镜头满足目标焦距；厚度约束：避免镜片过薄，降低不可制造风险。

这样设计的好处是，算法不会只追求“看起来更清楚”，也不会只追求“进光量更大”，而是在清晰度、通光量和结构合理性之间寻找平衡。

RESTORE：让优化过程会“停下来换思路”

如果只用梯度优化，算法只能在当前镜头结构附近微调，很容易被原有镜片数量和排列方式限制住。

本文采用 RESTORE 采样框架。它的基本逻辑是：

先在当前结构内做梯度优化；如果优化效果变慢，说明可能陷入局部最优；此时不再继续硬调，而是触发一次结构突变；突变后再进入下一轮优化。

相比传统 Metropolis-Hastings 方法，RESTORE 不需要频繁拒绝候选结构，也不要求每次突变都可逆，因此更适合复合镜头这种对参数扰动极其敏感的问题。论文中也指出，RESTORE 可以使用不加噪声的梯度更新，从而避免随机扰动导致镜头性能崩坏。

Reservoir：给优化过程保留“优秀存档”

RESTORE 中还有一个关键机制：reservoir，也就是优秀镜头样本库。

每当算法找到表现较好的镜头，就把它放进 reservoir。后续如果当前搜索路径走偏，算法可以从这些历史较优结构中重新出发，再进行新的结构突变。

这相当于给自动设计过程加入了“回退机制”。它避免了每次都从随机结构开始搜索，也让算法更容易围绕高质量镜头继续探索。

镜头突变：自动改变镜头结构

本文设计了四种结构突变方式：

增加一个单透镜；删除一个单透镜；把两个单透镜胶合成双胶合透镜；

把一个双胶合透镜拆成两个单透镜。

这些操作对应真实镜头设计中常见的结构编辑方式。

它们的意义在于：算法不再被固定镜头拓扑困住，而是可以主动探索不同数量、不同类型镜片组成的复合镜头空间。论文将这四种突变作为核心结构搜索操作，并结合后续近轴投影避免突变后性能严重下降。

近轴投影：让突变后的镜头不要直接失焦

直接加镜片或删镜片，很容易让原本能成像的镜头突然失焦。如果突变后的结构太差，后续梯度优化也很难把它救回来。

因此，本文在每次结构突变后加入“近轴投影”。

简单理解，近轴投影就是让突变后的新镜头，在一阶聚焦行为上尽量接近原镜头。它不负责最终成像质量，只负责把新结构拉回到一个“还能正常优化”的区域。

这样一来，算法既能大胆改变镜头结构，又不会因为突变太剧烈而让搜索过程崩掉。论文说明，近轴投影可使突变后的镜头保持与原镜头相近的一阶聚焦行为，并在相同运行时间下带来比普通梯度下降更大的目标改进。

四、实验

论文主要验证了四个问题：

本文方法能否突破原有镜头结构限制？近轴投影是否真的有效？RESTORE 是否优于传统 MH 采样？本文方法是否优于简单暴力搜索？

实验结果 1：突破清晰度—通光量的权衡边界

镜头设计中，清晰度和通光量通常相互制约。通光量越高，像差往往越难控制；成像越清晰，系统又可能牺牲一部分进光能力。

实验中，作者通过改变 spot error 和 throughput 的权重，得到不同清晰度—通光量组合。

结果显示，只做梯度优化时，设计结果仍受限于初始镜头拓扑；而本文方法可以通过增加或删除镜片，探索更大的结构空间，从而把 Pareto 前沿向更优区域推进。下图明确展示了本文方法能够扩展 lens speed-sharpness tradeoff 的可达前沿。

实验结果 2：近轴投影显著提高突变质量

论文对近轴投影做了消融实验。

结果很直接：加入近轴投影后，算法更容易找到优于初始镜头的设计；不加入近轴投影时，突变后的结构更容易失焦，搜索效率明显下降。

尤其在 105 mm 微距和 135 mm 长焦这类更复杂任务中，近轴投影的作用更明显。它缩短了算法前期的 warm-up 阶段，使搜索更快进入有效区域。

实验结果 3：RESTORE 比传统 MH 更适合镜头结构搜索

论文还比较了 RESTORE 方法和梅特罗波利斯-黑斯廷斯采样方法。结果表明，后者会频繁拒绝突变后的候选镜头，并且受随机噪声影响，梯度步长不能过大，因此优化速度明显受限。

相比之下，RESTORE 不需要频繁拒绝候选结构，可以对突变后的镜头继续优化，因此更适合复合镜头这种高敏感、高维度、离散—连续混合的设计问题。

实验结果 4：优于暴力搜索

最后，论文将本文方法与暴力搜索进行比较。

暴力搜索的做法是：在每个可能位置尝试增加或删除镜片，然后分别进行梯度优化。这个方法看起来直接，但搜索成本高，也容易陷入局部最优。

作者在四类镜头上测试：

28 mm 广角镜头； 50 mm 标准镜头； 105 mm 微距镜头； 135 mm 长焦镜头。

结果显示，在相同 40 分钟优化时间下，本文方法在四类镜头中都找到了更好的设计。Figure 8 说明，RESTORE 在 spot error、throughput 和最终渲染效果上整体优于暴力搜索基线。

五、结论

这篇论文最值得关注的地方，是把自动复合镜头设计从“调参数”推进到了“改结构”。

以往的可微分镜头设计，大多默认镜片数量和类型已经确定，然后再优化曲率、间隔、厚度等连续参数。本文则进一步让算法自动尝试增加镜片、删除镜片、合并镜片和拆分镜片，从而探索更大的镜头设计空间。

它的核心价值可以概括为三点：

对镜头设计来说

降低了复合镜头设计对人工结构编辑的依赖。算法不再只是工程师给出初始结构后的局部优化工具，而是可以主动参与镜头拓扑搜索。

对计算成像来说

光学结构搜索可以和可微分光线追迹结合起来。镜头设计不再只是优化一个固定系统，而是可以在多个结构之间自动跳转、筛选和再优化。

对 AI for Optics 来说

这篇论文也提醒我们，AI 光学设计不一定只等于训练神经网络。把采样算法、梯度优化、物理近似和光学工程经验结合起来，同样可以形成强有力的自动设计框架。

当然，本文也有局限。当前方法主要面向球面、径向对称的折射元件，并基于几何光学建模；未来还需要进一步扩展到非球面、多波长、变焦系统、制造容差和波动光学效应等更真实的设计场景。

论文原题：Automated design of compound lenses with discrete-continuous optimization发表会议：SIGGRAPH Asia 2025 Conference Papers

来自：戴博豪

编辑：王彤

编审：王烨

制作：智能光学先锋小队