
5月15日,台湾长庚医院团队的一篇Meta分析文章发表于Nature子刊《Npj Digital Medicine》(医学一区,IF=15.1)。
该研究首次将人工智能筛查与存储转发远程眼科筛查视为两种独立的临床实施路径,而非简单的诊断测试,并引入决策后果转化分析,明确指出了筛查策略的选择方式。

中文标题:人工智能与存储转发糖尿病视网膜病变筛查的临床环境依赖性诊断准确性:系统综述与荟萃分析
PMID:42141103
需要获取文献原文的朋友,关注公众号并在后台回复【PDF】即可免费领取文献原文PDF!

研究背景
糖尿病视网膜病变是全球工作年龄人群可预防性失明的主要原因,尤其在美国等糖尿病高发国家,筛查覆盖率不均、眼科医生分布不均导致大量患者未能及时诊断。然而,现有研究多聚焦于敏感性、特异性等传统诊断准确性指标,忽视了不同临床环境下筛查策略的实际决策后果(如漏诊与过度转诊之间的权衡)。
因此,该研究旨在系统比较AI与SAF两种筛查路径在检测任何DR、可转诊DR、威胁视力DR及糖尿病黄斑水肿中的诊断性能,并进一步将其转化为可指导临床实施的决策依据。
研究设计
数据筛选:遵循PRISMA-DTA指南,在PubMed、Embase、Web of Science、Google Scholar等6个数据库中检索至2025年12月,最终纳入28项研究。
统计方法:采用随机效应模型对敏感性、特异性进行Logit变换后合并,使用荟萃回归分析敏感性与特异性关系,并进行发表偏倚评估。
临床效用转化:将合并后的敏感性与特异性转化为每千人筛查中的真阳性、假阳性、漏诊数与转诊负担,并在不同疾病流行率(5%、15%、30%)下进行情景分析。

▲ PRISMA流程图
研究结果
结果一:
AI在几乎所有终点中的敏感性均高于SAF
针对任何DR、RDR、VTDR和DME,AI的合并敏感性均高于SAF。对于RDR,AI的敏感性为96.2%(Logit值3.222),而SAF为88.6%(Logit值2.052);对于VTDR,AI为96.2%,SAF为84.2%。

▲ AI对任何DR的敏感性

▲ AI对RDR的敏感性

▲ AI对VTDR的敏感性

▲ AI对DME的敏感性
结果二:AI在多数终点中的特异性
也高于SAF,DME除外
AI对任何DR、RDR、VTDR的特异性均高于SAF。对于RDR,AI特异性为96.2%(Logit值3.238),SAF为87.2%(Logit值1.923)。
但在DME检测中,两者特异性相近(93.4% vs. 93.6%),提示该终点可能受到共同的技术天花板限制。

▲ AI对任何DR的特异性

▲ AI对RDR的特异性

▲ AI对VTDR的特异性

▲ AI对DME的特异性
结果三:
敏感性与特异性之间未见明确权衡关系
荟萃回归分析显示,无论是AI还是SAF,研究层面上的敏感性与特异性之间并未呈现系统性负相关,说明在现有证据范围内,不同研究之间的敏感性提升并未以特异性显著下降为代价。

▲ AI的敏感性-特异性回归

▲ SAF的敏感性-特异性回归
结果四:临床效用转化显示
AI在高流行率场景下净获益更高
以RDR为例,在15%的疾病流行率下,AI每千人筛查可产生140.7例净真阳性决策,SAF为120.8例,而“全部转诊”策略仅为55.6例。随着决策阈值提高,AI的优势更加明显。


▲ 不同流行率下的筛查后果
结果讨论
该研究通过区分AI与SAF为两种独立筛查路径,并引入决策后果转化分析,超越了传统的诊断准确性比较框架
研究结果证实:AI筛查在检测可转诊和威胁视力的糖尿病视网膜病变方面具有更高的敏感性,而SAF在特异性上表现稳定,两者应视为互补策略,其优劣取决于具体临床环境与决策优先级。
研究参考与启示
📚选题思路:后续研究可以围绕不同临床实施路径的比较(而非简单技术对比)展开,尤其关注诊断指标在实际决策中的转化后果,如转诊负担、漏诊代价等。
📊统计方法借鉴:可复用该研究的方法,采用Logit变换结合随机效应荟萃回归来分析敏感性与特异性之间的关系,并可引入决策曲线分析或净获益评估将诊断准确性指标转化为临床决策价值。
想要从0开始学习Meta分析发表一篇SCI的同学,可以来【统计之光Meta分析一对一全流程教学】了解一下,👨🎓专业老师带你从0-1走一遍,学会方法举一反三。全程手把手指导您将一个创新性的选题落地,结课即可投稿!


国内老牌的医学科研一对一培训平台,提供多种类型的科研与统计方法一对一教学指导,坚持授人以渔,助力医护工作者科研成长!
已指导1000+医学人掌握方法、成功发表SCI!

扫码联系业务 咨询详情👆

往期精彩
1
2
3
夜雨聆风