
研究速览

对于临床IA期肺腺癌,术中快速、精准的病理诊断直接决定是楔形切除、肺段切除还是肺叶切除加淋巴结清扫。目前金标准——冰冻切片分析,耗时长、对侵袭性亚型分级不理想,尤其难以可靠地区分腺体前驱病变、微浸润和浸润性腺癌,更不用说指导IASLC三级分级了。本研究首次基于智能手机自然光下拍摄的手术切除大体标本图像,构建了深度学习模型SuRImage,旨在通过宏观形态特征瞬间预测病理侵袭性。研究前瞻性纳入三家医院1727例患者的2910张图像,训练并外部验证了三个任务:识别浸润性肺腺癌、三元分类(AIS/MIA/IAC)以及IASLC五级分级。在内部测试集上,SuRImage识别浸润癌的AUC为0.84,三元诊断平均AUC达0.87,五分级AUC达0.85,全面优于冰冻切片。更关键的是,在SuRImage辅助下,初级胸外科医生的分级准确率提升至69.79%,超越了无辅助的高级医生。这意味着,只需术中用手机拍下切下的肺结节,十余秒即可获得精准的病理侵袭性判断,有望重塑手术决策流程。
清璟AI——清北医工交叉团队,擅长AI智能体、大模型、深度学习、机器学习、多模态与多组学等,能够为医学研究者和临床医生提供全方位的支持与创新解决方案。我们拥有顶级科研资源,欢迎咨询!共同探索AI与医学的无限可能,一起发顶刊!

研究亮点
首次前瞻性多中心验证:首次通过多中心诊断性研究,在真实手术场景中证实大体标本图像与肺腺癌病理侵袭性的强关联,并构建出优于冰冻切片的AI模型。
全面超越冰冻切片:在浸润性腺癌识别、三元分类及IASLC五级分级三项任务中,SuRImage的准确率、F1分数均显著高于冰冻切片,尤其在微浸润腺癌和Grade 1亚型诊断上弥补了冰冻的短板。
双粒度特征融合:创新性提出粗粒度预测网络(CGPNet)与细粒度预测网络(FGPNet)结合的架构,同时捕捉大体轮廓与局部微观纹理,并与临床变量融合,提升分类性能。
人机协同提升显著:在模型辅助下,所有医生诊断准确率均提升,且初级医生借此超过了无辅助的高级医生,为分级诊疗和手术质控提供了新工具。
稳健的泛化能力:在两家外部医院验证集中保持高AUC(0.78-0.90),并对不同手机型号、拍摄角度及冰冻结果模糊/错误的病例表现出稳健性能,提出标准化拍摄协议。
研究结果

图1:研究队列入组流程
前瞻性从广东省人民医院、广东医科大学附属医院及梅州市人民医院连续纳入临床IA期肺腺癌患者。根据纳排标准,最终1529例患者(1638个结节)进入模型开发队列,116例(127个结节)与82例(89个结节)分别作为外部验证队列1和2。所有图像按6:2:2划分为训练、验证及内部测试集,并采用五折交叉验证。
解读:严格的前瞻性入组与独立外部验证,为模型泛化性奠定基础。共2910张大体图像纳入分析,保证了模型训练数据量。
图2:SuRImage模型在内部与外部验证集的ROC曲线
第一行展示在广东省人民医院内部测试集中,SuRImage对浸润性腺癌识别、三元诊断及五级分级的ROC曲线,其AUC分别为0.84、0.87及0.85。第二行与第三行为外部验证队列1与队列2的结果,各任务AUC分别保持在0.83-0.90、0.84-0.88与0.78-0.82。
解读:模型在各中心均保持高辨别能力,未出现明显的过拟合。在三项任务中,SuRImage的AUC均优于单纯粗粒度或细粒度网络,凸显双粒度融合的有效性。

图3:SuRImage与冰冻切片在诊断参数上的对比
(A)三项任务下SuRImage与冰冻切片的平均敏感性、特异性、精密度、准确率及F1分数对比。(B)任务二中区分AIS、MIA、IAC的详细性能,SuRImage对MIA的准确率达93.17% vs 冰冻79.96%。(C)任务三中五分类的详细性能,冰冻对IASLC Grade 1的诊断准确率仅14.28%,而SuRImage达到82.67%。(D)冰冻诊断与SuRImage预测的桑基图,展示与最终病理的一致性流动。
解读:冰冻切片在MIA与Grade 1亚型上存在严重漏诊与低估,而SuRImage利用整体肿瘤切面信息,大幅提升了这些亚型的识别精度,解决了冰冻“只见一斑”的固有问题。

图4:医生在有无SuRImage辅助下的诊断准确率
8名胸外科医生独立完成三项任务,然后借助SuRImage重新判读。无辅助时,高级医生平均准确率分别为79.17%、69.79%、67.71%,初级医生为63.80%、56.25%、51.67%。AI辅助后,初级医生准确率升至85.83%、73.26%、69.79%,超越无辅助的高级医生;高级医生准确率也提升至85.83%、81.25%、77.08%。
解读:人机协同不仅“锦上添花”,更关键的是“雪中送炭”——显著缩小经验差距,让初级医生拥有堪比专家级的术中判断能力,有望实现同质化手术质量。
课题申报指南
第一步:挖掘临床决策链中的视觉瓶颈
选择您的亚专科中需要术中快速大体判断的场景,比如肝细胞癌切缘是否干净、脑胶质瘤边界、卵巢肿瘤良恶性等。关键是找到现有病理手段(如冰冻或印片细胞学)耗时或准确性不足的环节,明确AI将要替代或辅助的价值点。
第二步:构建标准化图像采集与标注流程
借鉴本研究,制定智能手机/高拍仪拍摄的SOP:固定光源、背景(铺巾颜色)、焦距、角度(正反至少2张)。建立前瞻性连续入组队列,以石蜡病理为金标准进行标签化。同时记录可融合的临床变量(如肿瘤大小、CT特征等)。这一步是证据质量的根基。
第三步:设计任务匹配的模型架构
根据临床问题设定模型输出:如二分类(良性/恶性)、多分类(组织学亚型)或连续值预测(Ki-67指数)。可借鉴“双粒度”思想,用粗细网络分别捕捉整体轮廓与局部纹理,并加入多头注意力机制融合临床结构化数据,构建多模态模型。使用GradCAM等可视化技术增强可解释性,提高医生对模型的信任度。
第四步:以现行标准为对照,设计诊断性试验
方案中务必设置对比组:AI模型 vs. 冰冻切片(或术中细胞学),并给出详细的统计学计划(如McNemar检验比较敏感度/特异度,计算AUC的置信区间)。注册临床试验(如中国临床试验注册中心),同时设计人机协同子研究,量化模型对低年资与高年资医生的辅助效应,这是结题标志性成果的亮点。
第五步:外部验证与临床落地预评估
至少纳入2个外部中心数据,验证泛化能力。做亚组分析(不同设备、不同拍摄人、不同冰冻结果类型)以佐证稳健性。最后给出部署方案:手术室平板或手机APP端离线推理。在此基础上,您便拥有了一份高技术等级、强临床导向的精准外科AI课题。
关于我们
清璟AI由国内TOP2高校医工交叉博士联合创立,专注于医疗大模型科研、影像组学、病理组学、深度学习、AI智能体、生信分析、多组学、多模态和各类人工智能算法。致力打造一站式Al+医学科研生态圈,提供专业的AI智能体、高端科研资源及一对一定制化服务。我们的服务涵盖从科研方案设计、数据处理到AI模型训练及系统开发等各个领域,旨在为医学研究者和临床医生提供全方位的支持与创新解决方案。携手清璟AI,让科研更智能,让医学更精准。

科研合作请联系
长按二维码加微信

夜雨聆风