AAAI 2026 | DGAP 插件赋能 SAM2,3DTeethSAM 实现 3D 牙齿分割全局 – 局部特征优化 SOTA
点击下方“PapersAccepted”,选择加”星标“或“置顶”
家人们,今天挖到一篇超顶的计算机视觉+数字牙科方向的论文!来自AAAI 2026的3DTeethSAM,直接把火遍全网的SAM2模型“驯化”成了3D牙齿分割的高手。不仅精度干到了新高度,还解决了一堆行业痛点。看完我直呼太会玩了!
先抛个结论:这篇论文把二维大模型SAM2的能力玩到了三维牙科领域。在3DTeethSeg基准测试上干出了91.90%的IoU,直接刷新了3D牙齿分割的SOTA!全程不用人工手动提示,训练还贼高效。简直是数字牙科的福音。
为啥3D牙齿分割这么难?
咱先唠唠背景,数字牙科里的3D牙齿分割有多重要?不管是正畸方案设计,还是精准诊断,都得先把每颗牙齿从3D模型里精准抠出来、分清楚。但这事儿难就难在两点:
-
每个人的牙列都不一样,拥挤、错位、形态变异太常见; -
高质量的标注数据少得可怜,训练模型根本不够用。
之前的方法要么直接在3D网格/点云上怼模型,高分辨率下直接歇菜。要么硬套二维模型,维度不匹配、还要手动给提示,根本没法落地。
3DTeethSAM有多牛?核心创新全在这
这篇论文最绝的地方,就是把SAM2这个二维分割大模型的能力,完美嫁接到3D牙齿分割上。还搞了4个核心创新,每一个都踩在痛点上:
创新1:三个轻量级适配器,让SAM2不用人管也能精准分割
SAM2原本得靠人工给点、框这些提示才能分割。而且不管类别、分割边界还糙。作者直接给它加了三个“小插件”,全程自动化:
-
提示嵌入生成器:不用手动标提示,自动从图像特征里生成16个牙齿的提示。还能判断哪颗牙缺了,直接标背景; -
掩码细化器:SAM2初始分割的边界糊成一团。这个插件专门磨边界,把粗糙掩码修成精准的牙齿轮廓; -
掩码分类器:解决SAM2不认牙齿类别的问题。精准给每颗牙贴ID,就算缺牙也不认错。
关键是这三个插件都超轻量。训练的时候只更这仨的参数,SAM2的预训练权重全冻住。又快又省资源!
创新2:可变形全局注意力插件,又快又准
作者还给SAM2的图像编码器加了个“注意力buff”——可变形全局注意力插件(DGAP)。简单说,这个插件能让模型自动把注意力聚焦在牙齿区域。动态采样特征,不仅分割精度提上去了,训练收敛还快了一大截。精度和效率直接双丰收!
创新3:多视图2D-3D流程,打通维度鸿沟
既然SAM2擅长二维,那就把3D问题转成二维来做!流程超清晰:
-
把3D牙齿网格从多个固定视角渲染成512×512的二维图; -
用改造后的SAM2分割这些二维图; -
把二维分割结果通过投票策略还原回3D空间; -
最后用图割算法修修边界,搞定!
创新4:高效微调策略,不浪费SAM2的预训练能力
全程冻结SAM2的预训练权重,只训新增的轻量级模块。既用上了SAM2在海量数据里学的能力,又避免了从头训模型的成本。还不会忘事儿(灾难性遗忘),小样本也能训得贼好。
一张图看懂3DTeethSAM的完整流程
先放张核心框架图,一眼看明白整个过程:
从3D网格渲染成多视角二维图,到SAM2加适配器分割。再到3D重建和后处理,每一步都环环相扣。完美解决2D-3D适配的问题。
再放张适配器细节图,看看三个插件怎么配合的:
还有DGAP插件的效果对比,能明显看到注意力聚焦在牙齿上:
实验结果:全方位碾压SOTA,临床场景超鲁棒
作者在Teeth3DS这个最难的3D牙科分割数据集上做了测试。结果直接封神:
-
整体准确率95.48%、牙齿级平均IoU 91.90%、边界IoU 70.05%、Dice分数94.33%,全指标第一; -
对比之前最好的ToothGroupNet,T-mIoU涨了1.74%,边界IoU涨了0.75%; -
尤其是最难的智齿分割,直接从68.2%干到83.29%,涨了15个百分点!
放张定量对比表,实力肉眼可见:
更关键的是,在各种临床复杂场景下都稳得一批。牙齿拥挤、萌出不全、缺牙、牙龈复杂的情况,分割边界都贼清晰。不会出现牙龈渗漏、牙齿合并的问题。放张效果图感受下:
作者还做了消融实验,验证每个模块的作用:
-
去掉提示嵌入生成器,T-mIoU直接掉39.44%。证明自动提示比手动点提示强太多; -
去掉DGAP,T-mIoU掉1.29%,边界IoU掉3.41%。还慢了训练速度; -
掩码细化器和分类器也都贡献了关键精度。尤其是边界和类别判断上。 放张消融实验结果图:
还有DGAP加速训练收敛的对比图,谁看谁知道多香:
掩码分类器解决类别错配的效果也超直观:
总结:不止是刷榜,更是给3D分割指了新方向
这篇3DTeethSAM最有价值的地方,不只是刷新了SOTA。更重要的是提供了一个思路:把二维大模型的能力,通过轻量级适配、2D-3D转换的方式,用到复杂的3D分割任务上。
对于数字牙科来说,这个方法又快又准。不用大量标注数据,还能自动化落地。对于计算机视觉来说,这也是二维基础模型跨界解决三维问题的绝佳范例。
最后提一嘴实现细节,作者用PyTorch在RTX 4090上训的。SAM2用的Hiera-L版本,冻结预训练权重,训100个epoch,批量大小4,混合精度训练。普通人也能复现!
总之,这篇论文把SAM2玩出了新高度。既解决了实际问题,又有方法论上的创新。不管是做医疗AI还是计算机视觉,都值得好好啃一啃~
论文信息
题目:3DTeethSAM: Taming SAM2 for 3D Teeth Segmentation作者:Zhiguo Lu, Jianwen Lou, Mingjun Ma, Hairong Jin, Youyi Zheng, Kun Zhou
交流群
【PapersAccepted】 微信公众号是一个面向全体学生和医学工作人员/研究员的论文阅读分享交流平台,目前坚持每天推送一篇最新的医学图像处理领域的高质量论文解读文章,涵盖TMI、MIA、MICCAI、最新Arxiv等。目前,推送的文章包含多个领域:医学图像分割、医学图像配准、医学图像重建、医学图像分类、医学图像增强、医学图像分析、医学图像融合、医学图像标注、医学图像处理应用。。
交流群内,每天晚上推送当日高质量解读文章。添加小助理微信,加入交流群,备注:昵称+学校/公司+研究方向!

备注:昵称+学校/公司+研究方向

夜雨聆风
