一、AI修复体生成的方法学谱系
把过去四年的智能牙冠生成串起来看,方法学从对抗到扩散经历了三段演进。
第一段是基于 GAN 的逐颗形态合成。2021 年那篇 DCPR-GAN 把技师手画的牙冠当成 ground truth,对抗训练让生成器学到"长得像专家做的牙"的几何先验,在单冠形态上把 RMS 误差压到了亚毫米档。这条路在工程上简洁,但模式坍塌与训练不稳定是熟知的两条阴影,遇到多牙缺失或全弓修复,只能逐颗推理再拼接。
第二段是 Transformer 与几何先验的耦合。2022 至 2023 年间多个工作开始借助 graph attention 与 self-attention,把邻牙+对颌+备体颈缘作为条件输入,配合几何先验回归出牙冠形态。它在单牙形态稳定性上有改善,但条件信号的选择与对齐误差成为新的瓶颈,多牙之间的协调性仍然薄弱。
第三段是扩散模型登场。2025 年底挂上预印本的 CrownGen 是这一段的标志:在 1794 例口扫上训练的点云去噪扩散模型,一次推理就能生成多颗协调的牙冠;论文在 496 例外部口扫上做几何评估,再以 26 例真实修复案例做临床盲评,由受过训练的牙医给出统计非劣的结论。其方法学的关键在于把邻接边界显式地建模为一个独立模块——boundary prediction——再以此为锚把多牙的几何关系内化进生成回路。

如图 1 所示,CrownGen 的整体框架把扩散模型分成三段:a 段是数据预处理与牙位索引;b 段是按层组织的生成模块,每一颗目标牙在生成时都能"看到"邻牙与对颌的几何条件;c 段则是临床推理与材料约束。这一框架把上一代逐颗 GAN 的两个主要短板——模式坍塌与多牙不协调——同时解掉了一段。
然而 SOTA 推进到此处,仍有两道几何关没有真正翻过去。
二、第一道关:边缘线的几何约束
边缘线(margin line, finish line)是冠或嵌体与天然牙颈缘的几何接合处。它决定修复体的内表面形状、粘接界面、咬合受力的传导路径,也决定五年十年里牙龈会不会发炎、修复体会不会脱落、二次龋会不会找上门。在微分几何上,它是一条嵌入到三维欧氏空间中的紧致闭合空间曲线 ,沿备体颈部走一圈。
边缘线难自动化的根本原因是它落在一片模糊带上。临床预备的备体颈缘往往不是一条锐利的脊,而是一段宽 0.2 至 0.5 毫米的渐变弧。把备体表面记作 ,把任意一点到颈缘锐脊的有向距离记作 ,那么理想的边缘线可以写成 的零等值线在主曲率约束下的子集:
其中 是该点的最大主曲率绝对值, 是"被认作锐脊"的曲率阈值。问题在于:临床预备的渐变弧上, 沿弧度方向是一段渐变曲线,没有一个对所有病例都能用的固定 ;阈值取高了漏点、取低了把模糊带里的整片区域都判为边缘。
规则式方法在这件事上效果有限——2022 年那篇基于单点双向路径搜索的工作能在简化的预备体上做到接近商用 CAD 的水准,但需要医生先点一个起始点,遇到深倒凹和咬合面破损就崩。本质上是因为边缘线的判定带着主观性:同一段 0.3 毫米宽的模糊带里,不同技师会画出不同答案,规则式算法没法学这种判断。
2025 年两篇关键工作把这条路推进了一档。其中一篇在 380 例真实备牙口扫上训练 3D 网格分割模型,对每个顶点直接预测属于边缘线的概率,再用平滑约束输出最终曲线,报告的核心指标是平均欧氏距离 ;另一篇 7 月挂上预印本的工作把模型做得更紧凑,主打推理速度,两者合起来定义了 2025 年这个子任务的基线。
70.7 微米这个数字要放在两个尺度里读。一个是医生重复描同一条边缘线的自然噪声——前后两次的差异平均落在 200 微米左右,这是行业被默认的AI 至少要做到这个水平才能进入临床的隐性门槛。算法的 130 微米余裕,与黏接剂层的典型厚度(50 至 100 微米)相当,戴牙后边缘适合度不会出现肉眼可见的间隙。另一个尺度是单例最大偏差——70.7 微米是平均数,380 例样本里一定有少数预备体几何复杂、模糊带过宽的案例,单例最大偏差仍可能突破 200 微米。把平均合格误读成全部合格是这类指标最常见的过度乐观。
更深一层的问题是:边缘线模型今天主要被作为前置子任务训练,与下游的牙冠生成模型解耦。一旦下游生成模型用了一条偏移 100 微米的边缘线作为条件输入,这 100 微米会沿着 boundary loss 被以软约束的方式吸进生成结果——并在临床戴牙阶段以边缘悬突或短冠两种形式之一显现。这条链路上的累积误差是当前 SOTA 还没有正面化解的工程题。
三、第二道关:表面细节的缺失
第二道关比边缘线更微妙。把 SOTA 生成的牙冠摆在显微照片之下,宏观形态、牙尖位置、咬合接触都"看得出对"——但釉面横纹、点隙裂沟的微嵴、轴面的细微弧度,却整体地缺失了一段。临床技师把这种现象简单概括成AI 牙冠太光滑。

如图 2 所示,CrownGen 在多种缺失场景下的牙冠生成与真实天然牙的表面距离误差热图——蓝色区代表生成与真实在亚毫米尺度上吻合,沿牙尖与窝沟边缘的色阶则记录了几何细节缺失的位置与幅度。即便在 SOTA 已经把整体形态做到临床可接受档的前提下,咬合面那些标志生命力的微嵴依然是"被推平"的状态。
这件事不是某一篇工作的工程瑕疵,而是当前生成式 AI 在三维形态学上一个普遍的归纳偏置。其几何根源可以从三个层面分析。
第一层:神经网络的频谱归纳偏置。 把神经网络在一段连续函数上的训练动力学放到 NTK(neural tangent kernel)视角下,可以得到一个被反复验证的现象:网络在频域上的收敛速度是非均匀的,低频分量先被拟合,高频分量需要的训练步数随频率指数级增长。形式化地写,目标函数在傅里叶域上的残差近似按
衰减,其中 NTK 的本征值 随频率 增大而衰减,致使高频残差在工程可承受的训练步数之内难以收敛。釉面横纹与点隙微嵴恰落在频谱的中高频带(空间周期 30 至 100 微米量级),它们正是被这条偏置首先牺牲的部分。
第二层:重建损失的低频偏好。 牙冠生成的主流损失是 Chamfer Distance 与其变体:
这一损失对全局形态对不对敏感,对表面是否带高频微嵴几乎无感。把一颗具备完整釉面横纹的真实牙冠与一颗被沿法向平滑掉所有 50 微米尺度振荡的合成牙冠并排比较,二者的 Chamfer 距离差在 米²量级,远小于厘米级的整体形态项。优化器在这样的损失景观下,会自然地放弃高频细节,先把低频形态做对。
第三层:离散化分辨率的物理截断。 多数高质量牙冠生成管线在中间表征上用了体素或栅格——常见做法是先在分辨率为 的格栅上预测一个隐式场,再用 Marching Cubes 之类的算子提取等值面。这一步等价于在频域上把信号与一个 sinc 函数相乘:
格栅边长 决定了奈奎斯特频率 之上的所有信号都被一阶截断。常见的 或 格栅放进 12 毫米尺寸的牙冠包围盒上,每个体素的物理边长约 50 至 100 微米——恰好是釉面横纹与点隙微嵴的栖居频带。换句话说,工程上常见的格栅分辨率本身就把这一档高频砍掉了。

如图 3 所示,CrownGen 与若干基线方法在多种缺失牙数情形下的 Chamfer Distance、Earth Mover's Distance 与不同距离阈值下的 F1 得分。值得注意的是:随着缺失牙数从 1 增加到 6,F1@0.3mm 这一项——也就是 0.3 毫米距离阈值下的高精度匹配比例——明显比 F1@1.0mm 衰减更快。这正是上述三层细节缺失在指标层面的直接折射:粗精度上各方法尚能维持,细精度上即便是 SOTA 也吃力。
把三层根源合起来看:AI 牙冠过于平滑既不是某次实验的偶然现象,也不是模型容量上的简单缺口,而是神经网络的频谱偏置、重建损失的尺度选择、与离散化分辨率三件事在表面细节这个频带上的同向作用。仅靠加深网络、加大数据集这种工程手段,对这条频带的回填效率极低,边际效应明显。
四、深形智能的解法
正因为上述三层根源很难通过再训一遍进行根治,深形智能在过去半年里走的是一条与从头训练高频补全网络截然不同的路径——通过深度分析口腔解剖生理学原理,结合几何先验,对生成的牙冠细节进行重塑。
结合当代最强的扩散与 Transformer 网络。它们的归纳偏置擅长在亚毫米尺度上把整体形态做对——牙尖位置、轴向倾斜、邻接关系、咬合接触——这是上一节里已经过关的部分。再添加自研的几何先验约束。
通过算法和技术团队的日夜学习、实验与归因,一定程度上解决了工业界难以解决的牙冠细节问题。
我们的方案对所有上游生成网络通用:给定 AI 出的粗冠与一条颈缘条件,工具栈就能产出一颗细节齐备的最终牙冠,而不必关心粗冠是哪一代 GAN、Transformer 还是扩散模型生成的。
这条路径与端到端高频补全网络在工程交付的可控性上明显占优。生成段和细化段彼此解耦,意味着上游扩散模型每出一代新版本时,细化段不需要跟着重训;同样地,细化段在产线上做迭代,生成段也不必动。在数字技工流水线对"可重现、可审计、可回滚"的硬性要求下,这种解耦架构是少数能交付到 CAD/CAM 软件里、对接 3D 打印与铣削环节、且不破坏既有质量管控的做法。
具体的细化算法本身是深形智能的核心技术,本文不展开。下面用一例内部集成测试的真实输出,给出这条路径的端到端效果。
五、效果观测:把一颗光面磨牙还回它的窝沟与牙尖
观测牙冠细节最严苛的视角是垂直于颈缘所在平面、从对颌牙位置看向咬合面——这也是临床医生戴牙后第一眼检查咀嚼接触是否到位的视角。在这个视角下,咬合面的微嵴是否存在、窝沟拓扑是否完整、牙尖之间的横嵴斜嵴是否清晰,肉眼可以一秒判定。

如图 4 所示,是深形智能内部集成测试集中一例下颌左侧第一磨牙(T36)的端到端结果,从颈缘垂直方向看向咬合面。左图是 AI 网络一次推理生成的粗冠——即第一节里讲到的 SOTA 路线(在该测试中由 MADCrowner 复现实现)所能达到的形态学水平。可以看到:宏观轮廓与磨牙形态已经过关,颊舌径、近远中径、整体弧度都在该牙位的解剖学窗口里;然而咬合面整体呈一片"被推平"的光面,四枚牙尖的位置依稀可辨,主沟、副沟、点隙、横嵴、斜嵴几乎全部缺失。这正是 §三 里讲到的频谱偏置、损失低频偏好、格栅截断三件事在工程上的合并产物。
右图是同一颗粗冠经几何细化后的最终结果。颊侧远中(MB)、颊侧远中(DB)、舌侧近中(ML)、舌侧远中(DL)四枚牙尖一次性立起来,中央窝四周的横嵴、斜嵴顺势归位,主沟与副沟构成的窝沟系统恢复到天然磨牙应有的拓扑骨架。宏观形态相对左图几乎没有大改——颊舌径、近远中径、整体轮廓被精确地保留下来——变化的是釉面级的高频细节。
在这一例上,最终结果相对 AI 粗冠的表面位移平均落在 、最大约 量级。这个数字的物理含义需要展开说一下:120 微米的平均位移恰好落在天然牙釉面横纹的空间周期(30 至 100 微米)与点隙裂沟深度(150 至 400 微米)之间——也就是说,被神经网络的频谱偏置抹掉的那一档高频,被细化段以恰好匹配的尺度回填了回来。在更广的内部测试集上,这个量级的位移分布在多种牙位、多种缺失模式与多种就位方向下保持稳定。
更具临床意义的一点是:颈缘附近的位移被自动压制到 50 微米以下,远离颈缘的咬合面才被允许接受更大幅度的细节回填。这意味着 第二章节 里讲到的边缘线偏移会沿 boundary loss 被吸进生成结果这条累积误差,在几何细化段被单独按住了一只手——颈缘区的几何忠诚不依赖于生成网络在该处的训练充分度,而由细化段的边界保护机制独立保证。
为了说明这条混合管线不是只在某一颗幸运 case上表现好,从内部集成测试集中再挑三例不同牙位的 case,用相同的视角、相同的渲染参数做了端到端的对比。

如图 5 所示,T24(上颌右侧第一前磨牙)。AI 粗冠(左图)的颊舌两枚牙尖位置存在但中央沟与近远中边缘嵴几乎被推平;细化后(右图)颊舌尖明显立起,中央沟清晰,近远中边缘嵴归位。前磨牙的"两牙尖加中央沟"形态被完整恢复。该例位移为 、。

如图 6 所示,T37(下颌左侧第二磨牙)。AI 粗冠(左图)四枚牙尖位置依稀可辨但主沟与副沟模糊;细化后(右图)四牙尖立起,近远中横沟与颊舌纵沟构成完整的十字窝沟系统。该例位移为 、。

如图 7 所示,T47(下颌右侧第二磨牙),作为对侧同名牙位的独立验证。AI 粗冠(左图)四牙尖被光面包裹、主沟模糊;细化后(右图)四牙尖锐利分明,十字主沟与颊侧副沟齐备,近远中边缘嵴清晰。该例位移为 、。
把上述四例(含图 4 的 T36)合起来看,细化段在不同牙位、不同 AI 输入下的位移量级稳定地落在 mean 118 至 132 微米、max 405 至 587 微米的区间。前磨牙、第一磨牙、第二磨牙——这三类咬合面形态最复杂的牙位——都被同一套几何工具栈、同一组参数处理到了釉面级细节齐备的状态。整套流程没有针对单例做参数调试,跨牙位的稳定性正是这条混合管线在产线层面成熟度的最直接体现。
结语
把 2026 上半年的智能牙冠走过的两道几何关合起来看:扩散模型把多牙生成做进了临床盲评,是这一代方法学的最高点;同时,边缘线遵从与表面细节这两道关,是 SOTA 仍未真正翻过去的两段路。它们的根因不在"再加一倍数据",而分别落在曲面边界判定的内在主观性,与神经网络对表面的非均匀归纳偏置之上。
深形智能选择把这两道关交给几何处理三十年来积累的稳健工具栈——把生成段交给当代最强的扩散与 Transformer 网络,把细化段交给几何先验约束。这种架构既不与扩散模型路线相互排斥,又把工程可控性与几何严谨性纳入同一条产线之中。当下一代 CAD/CAM 工作流从AI 自动可用走向AI 自动可信赖的真正分水岭时,这两道几何关的位置不会变,能在产线里稳定交付高细节牙冠的团队,会先一步看到这片山水的全貌。
夜雨聆风