

【一句话核心】复合镜头设计最难的地方,不只是调曲率、厚度、间隔这些连续参数,而是要不要加镜片、删镜片、合并镜片、拆分双胶合镜片这些“结构级决策”。本文提出一种离散—连续联合优化方法,把梯度优化和 MCMC 采样结合起来,让算法能够自动探索镜头拓扑结构,从而在清晰度和通光量之间找到更好的设计。
一、背景
复合镜头设计本质上是一个高度复杂的优化问题。一个镜头系统里包含多个折射元件,每个元件又涉及曲率、口径、厚度、间隔、折射率等参数。传统光学设计软件虽然可以优化这些连续参数,但通常默认镜头的整体结构已经给定,例如有几个镜片、哪些是单透镜、哪些是胶合双透镜。
问题在于,很多时候镜头性能的进一步提升,并不是单纯把已有参数再调一调就能实现的。
比如:
视场扩大时,原有结构可能无法同时保持边缘清晰;
想提高进光量时,仅靠调曲率可能会牺牲成像质量;
想把镜头做得更紧凑时,原有镜片数量和排列方式可能本身就不合适。
也就是说,复合镜头设计不只需要“参数优化”,还需要“结构优化”。
传统做法通常依赖光学工程师的经验:先基于已有镜头进行手动修改,比如增加一个镜片、删除一个镜片、把两个单透镜胶合成双胶合透镜,或者把双胶合透镜拆开,然后再交给优化软件继续做梯度优化。这个过程非常依赖人工经验,也很难充分搜索整个设计空间。
已有的可微分光线追迹和梯度优化方法,已经可以较好地优化曲率、位置、厚度等连续变量,但它们通常固定镜头拓扑结构,不能自动改变镜片数量和镜片类型。另一方面,一些基于深度学习、遗传算法或大语言模型的方法可以帮助生成初始结构,但往往不能充分优化连续参数,因此也难以准确判断某种结构是否真的有潜力。论文指出,当前自动镜头设计的关键空白在于:现有方法往往只能优化连续参数或离散结构中的一类,而高性能复合镜头恰恰需要两者联合优化。
因此,本文真正想解决的问题是:
能不能让算法既能像传统优化器一样细调镜头参数,又能像光学工程师一样自动尝试增加、删除、合并或拆分镜片?
二、贡献
首次将复合镜头设计转化为离散—连续联合优化问题
本文最大的贡献,是把复合镜头设计从“固定结构下的参数优化”,推进到“结构和参数同时优化”。
以往的可微分镜头设计方法主要做连续优化,例如优化每个镜面的曲率、镜片间距、口径等。但本文进一步把镜片数量和镜片类型也纳入自动设计过程,例如:
增加一个单透镜;
删除一个单透镜;把两个单透镜胶合成双胶合透镜;把一个双胶合透镜拆成两个单透镜。
这意味着算法不再只是在一个固定镜头结构附近做局部搜索,而是能够主动跨越不同镜头结构之间的边界。
从“调参数”走向“改结构”
本文的核心思想可以概括为:
梯度优化负责把当前镜头结构调好,离散突变负责跳到新的镜头结构。
如果只用梯度优化,算法只能在已有结构附近移动,很容易被当前镜头拓扑限制住。比如一个 5 片式镜头,无论怎么优化曲率和间隔,它仍然是 5 片式结构。若真正需要 6 片或 4 片结构才能达到更好的清晰度—通光量平衡,纯梯度优化就很难发现。
本文通过 MCMC 采样把“局部连续优化”和“全局结构突变”结合起来,使算法能够在多个镜头拓扑之间跳转,再对每个候选结构进行连续参数优化。
提出 RESTORE + 镜头突变 + 近轴投影的完整框架
本文不是简单地随机加减镜片,而是设计了一套完整的自动搜索机制:
用梯度优化改进当前镜头的连续参数;
当优化进展变慢时,触发结构突变;
对突变后的镜头做近轴投影,使其保持和原镜头相近的一阶聚焦行为;
再继续进行可微分光线追迹和梯度优化。
这套机制解决了复合镜头自动设计中的三个关键问题:
第一,如何在固定结构内快速优化;第二,如何自动尝试新的镜片数量和类型;第三,如何避免突变后的镜头完全失焦,导致优化无效。
本文把这三个模块结合起来,使算法能够探索比纯梯度优化更大的复合镜头设计空间。
三、方法
本文的技术重点,不是单纯提出一个新网络,而是把复合镜头设计变成一个可以自动“调参数 + 改结构”的闭环优化问题。
整个流程可以概括为:
输初始镜头 → 梯度优化连续参数 → 判断是否陷入局部最优 → 触发结构突变 → 近轴投影修正 → 再次优化 → 得到更优镜头
也就是说,算法既能像传统优化器一样调曲率、厚度、间隔,又能像光学工程师一样尝试增加、删除、合并或拆分镜片。论文明确提出用 MCMC 采样结合梯度优化和跨维度结构突变,并通过近轴投影提高全局搜索效率。

具体流程:
优化目标:同时看清晰度、通光量和焦距
本文没有只优化单一成像指标,而是把镜头设计目标拆成几部分:
清晰度:让光线尽量集中到传感器上,降低 spot error;通光量:让更多有效光线进入系统,提高镜头速度;焦距约束:保证镜头满足目标焦距;厚度约束:避免镜片过薄,降低不可制造风险。
这样设计的好处是,算法不会只追求“看起来更清楚”,也不会只追求“进光量更大”,而是在清晰度、通光量和结构合理性之间寻找平衡。
RESTORE:让优化过程会“停下来换思路”
如果只用梯度优化,算法只能在当前镜头结构附近微调,很容易被原有镜片数量和排列方式限制住。
本文采用 RESTORE 采样框架。它的基本逻辑是:
先在当前结构内做梯度优化; 如果优化效果变慢,说明可能陷入局部最优; 此时不再继续硬调,而是触发一次结构突变; 突变后再进入下一轮优化。
相比传统 Metropolis-Hastings 方法,RESTORE 不需要频繁拒绝候选结构,也不要求每次突变都可逆,因此更适合复合镜头这种对参数扰动极其敏感的问题。论文中也指出,RESTORE 可以使用不加噪声的梯度更新,从而避免随机扰动导致镜头性能崩坏。
Reservoir:给优化过程保留“优秀存档”
RESTORE 中还有一个关键机制:reservoir,也就是优秀镜头样本库。
每当算法找到表现较好的镜头,就把它放进 reservoir。后续如果当前搜索路径走偏,算法可以从这些历史较优结构中重新出发,再进行新的结构突变。
这相当于给自动设计过程加入了“回退机制”。它避免了每次都从随机结构开始搜索,也让算法更容易围绕高质量镜头继续探索。
镜头突变:自动改变镜头结构
本文设计了四种结构突变方式:
增加一个单透镜;删除一个单透镜;把两个单透镜胶合成双胶合透镜;
把一个双胶合透镜拆成两个单透镜。
这些操作对应真实镜头设计中常见的结构编辑方式。
它们的意义在于:算法不再被固定镜头拓扑困住,而是可以主动探索不同数量、不同类型镜片组成的复合镜头空间。论文将这四种突变作为核心结构搜索操作,并结合后续近轴投影避免突变后性能严重下降。

近轴投影:让突变后的镜头不要直接失焦
直接加镜片或删镜片,很容易让原本能成像的镜头突然失焦。如果突变后的结构太差,后续梯度优化也很难把它救回来。
因此,本文在每次结构突变后加入“近轴投影”。
简单理解,近轴投影就是让突变后的新镜头,在一阶聚焦行为上尽量接近原镜头。它不负责最终成像质量,只负责把新结构拉回到一个“还能正常优化”的区域。
这样一来,算法既能大胆改变镜头结构,又不会因为突变太剧烈而让搜索过程崩掉。论文说明,近轴投影可使突变后的镜头保持与原镜头相近的一阶聚焦行为,并在相同运行时间下带来比普通梯度下降更大的目标改进。

四、实验
论文主要验证了四个问题:
本文方法能否突破原有镜头结构限制?近轴投影是否真的有效?RESTORE 是否优于传统 MH 采样?本文方法是否优于简单暴力搜索?
实验结果 1:突破清晰度—通光量的权衡边界
镜头设计中,清晰度和通光量通常相互制约。 通光量越高,像差往往越难控制;成像越清晰,系统又可能牺牲一部分进光能力。
实验中,作者通过改变 spot error 和 throughput 的权重,得到不同清晰度—通光量组合。
结果显示,只做梯度优化时,设计结果仍受限于初始镜头拓扑;而本文方法可以通过增加或删除镜片,探索更大的结构空间,从而把 Pareto 前沿向更优区域推进。下图 明确展示了本文方法能够扩展 lens speed-sharpness tradeoff 的可达前沿。

实验结果 2:近轴投影显著提高突变质量
论文对近轴投影做了消融实验。
结果很直接:加入近轴投影后,算法更容易找到优于初始镜头的设计;不加入近轴投影时,突变后的结构更容易失焦,搜索效率明显下降。
尤其在 105 mm 微距和 135 mm 长焦这类更复杂任务中,近轴投影的作用更明显。它缩短了算法前期的 warm-up 阶段,使搜索更快进入有效区域。

实验结果 3:RESTORE 比传统 MH 更适合镜头结构搜索
论文还比较了 RESTORE 方法和梅特罗波利斯-黑斯廷斯采样方法。结果表明,后者会频繁拒绝突变后的候选镜头,并且受随机噪声影响,梯度步长不能过大,因此优化速度明显受限。
相比之下,RESTORE 不需要频繁拒绝候选结构,可以对突变后的镜头继续优化,因此更适合复合镜头这种高敏感、高维度、离散—连续混合的设计问题。

实验结果 4:优于暴力搜索
最后,论文将本文方法与暴力搜索进行比较。
暴力搜索的做法是:在每个可能位置尝试增加或删除镜片,然后分别进行梯度优化。这个方法看起来直接,但搜索成本高,也容易陷入局部最优。
作者在四类镜头上测试:
28 mm 广角镜头; 50 mm 标准镜头; 105 mm 微距镜头; 135 mm 长焦镜头。
结果显示,在相同 40 分钟优化时间下,本文方法在四类镜头中都找到了更好的设计。Figure 8 说明,RESTORE 在 spot error、throughput 和最终渲染效果上整体优于暴力搜索基线。


五、结论
这篇论文最值得关注的地方,是把自动复合镜头设计从“调参数”推进到了“改结构”。
以往的可微分镜头设计,大多默认镜片数量和类型已经确定,然后再优化曲率、间隔、厚度等连续参数。本文则进一步让算法自动尝试增加镜片、删除镜片、合并镜片和拆分镜片,从而探索更大的镜头设计空间。
它的核心价值可以概括为三点:
对镜头设计来说
降低了复合镜头设计对人工结构编辑的依赖。算法不再只是工程师给出初始结构后的局部优化工具,而是可以主动参与镜头拓扑搜索。
对计算成像来说
光学结构搜索可以和可微分光线追迹结合起来。镜头设计不再只是优化一个固定系统,而是可以在多个结构之间自动跳转、筛选和再优化。
对 AI for Optics 来说
这篇论文也提醒我们,AI 光学设计不一定只等于训练神经网络。把采样算法、梯度优化、物理近似和光学工程经验结合起来,同样可以形成强有力的自动设计框架。
当然,本文也有局限。当前方法主要面向球面、径向对称的折射元件,并基于几何光学建模;未来还需要进一步扩展到非球面、多波长、变焦系统、制造容差和波动光学效应等更真实的设计场景。
论文原题:Automated design of compound lenses with discrete-continuous optimization发表会议:SIGGRAPH Asia 2025 Conference Papers

夜雨聆风