过去几年,AI 医学影像论文很多,但真正能进入 JAMA、NEJM AI、Lancet Digital Health 这类临床顶刊体系的研究,已经发生了明显变化。
早期大家更关注:模型能不能把病分出来?AUC 有没有提升?能不能比医生高一点?
现在更重要的问题变成了:这个模型能不能改变临床动作?能不能减少不必要转诊?能不能预测谁会进展?能不能帮助医生更快、更稳地完成真实工作流?
眼科是目前最适合做 AI 临床转化的专科之一。原因很直接:眼底照、OCT、UWF、OCTA、裂隙灯图像都高度结构化;疾病随访密集;很多临床结局可以量化;而且筛查、转诊、复诊、治疗决策都有明确流程。对于 AI 研究者来说,这意味着眼科不是一个单纯做分类模型的领域,而是一个可以把算法真正嵌入临床路径的场景。
一、顶刊趋势:从“模型性能”转向“临床证据链”
基于 2022 年至 2026 年 6 月三大出版体系中 35 篇医学影像 AI 主语料,可以看到一个清楚趋势:2025 年开始,临床影像 AI 论文明显加速。
图 1|三大体系医学影像 AI 主语料年度趋势
这说明,顶刊已经不太满足于“一个新模型在测试集上表现很好”。它们更关心完整证据链:
开发集是否多中心?
外部验证是否严格?
是否跨设备、跨人群、跨地区?
是否进入真实工作流?
是否影响医生决策、转诊效率或患者结局?
一句话:只做算法创新,越来越不够;能进入临床流程,才是关键。
二、眼科为什么特别适合 AI?
在这 35 篇主语料中,眼科影像是最重要的方向之一,共 16 篇,超过胸部影像、MRI、病理和其他影像类型。
图 2|医学影像 AI 研究主题分布
眼科 AI 的优势主要有四点。
第一,数据天然结构化。OCT 是层状结构,眼底照有清晰血管、视盘、黄斑区域,很多病灶有稳定形态学基础。
第二,随访价值高。AMD、DME、高度近视、青光眼、遗传性视网膜病变等疾病都需要长期随访,这让 AI 可以从“诊断”升级为“预测”。
第三,临床动作明确。比如是否转诊、是否加密随访、是否打针、是否换药、是否进入临床试验,这些都可以成为模型输出后的真实动作。
第四,设备和场景丰富。医院内有 OCT、眼底相机、UWF、OCTA;基层和社区有远程阅片;未来手机前节图像也可能成为公众自筛入口。
所以,眼科 AI 最有价值的方向,不是继续做一个“单病种分类器”,而是围绕临床路径设计模型。
三、最近最值得关注的五个研究方向
方向 1:OCT 纵向预后预测
这是目前最值得优先布局的方向之一。
传统 AI 眼科论文经常做“有没有病”“是哪类病”。但临床真正关心的是:这个患者未来会不会进展?多久进展?是否需要提前干预?是否需要更频繁随访?
典型代表是基于 SD-OCT 预测地理萎缩进展的 DeepGAze 研究。它的价值不只是模型 AUC 高,而是把 OCT 图像直接连接到 AMD 进展和临床试验富集。也就是说,AI 不再只是辅助诊断,而是在帮助医生判断“谁更可能在短期内恶化”。
可延展的题目包括:
这类研究的核心不是“模型多复杂”,而是随访结局是否清楚。
方向 2:跨设备、跨中心、跨人群泛化
眼科 AI 的一个现实问题是:模型在一个设备上训练,在另一个设备上就掉性能。
海德堡、蔡司、Topcon、Optovue、图湃等设备的成像风格、分辨率、扫描协议、图像质量都不一样。对于临床应用来说,单设备高性能意义有限,多设备稳定才是关键。
这也是 NEJM AI 近年特别关注 foundation model generalizability 的原因。现在的核心问题不是“能不能训练一个大模型”,而是:
它能否跨设备?
能否跨医院?
能否跨年龄、性别、疾病严重程度?
能否在真实低质量图像中保持可靠?
它在哪些亚组中会失败?
图 3|眼科 AI 泛化验证矩阵
如果研究者手里有多设备、多中心大规模眼科数据,这个方向非常适合做成高质量 benchmark 或 foundation model 论文。
方向 3:AI 辅助转诊与远程眼科
眼科 AI 的另一个高价值方向,是改变转诊路径。
很多真实场景中,问题不在于医生不会诊断,而在于转诊系统效率低:基层不知道哪些患者需要急转,医院专科门诊堆积大量不必要转诊,真正高危患者反而等待过久。
HERMES 这类研究说明,远程眼科和 OCT-only 分诊已经开始走向随机化或准实验式设计。这类论文更接近 Lancet Digital Health 喜欢的风格:不是只证明模型准确,而是证明它能优化医疗系统。
可研究的问题包括:
这类研究最适合做前瞻性 silent deployment,然后再进入真实流程试验。
方向 4:眼底影像预测全身疾病
这是最近非常值得关注的新趋势,也可以称为 oculomics。
眼底是唯一可以无创观察微血管和神经组织的窗口。因此,眼底图像不只可以看眼病,也可能预测糖尿病肾病、心血管疾病、神经退行性疾病、死亡风险等系统性结局。
Lancet Digital Health 近年出现 DeepDKD、fundus predictive atlas 等工作,说明顶刊已经开始接受“眼底影像作为全身疾病风险窗口”这一叙事。
这个方向适合拥有大规模体检、眼底照、基础临床信息和长期随访数据的团队。
更有潜力的问题包括:
这类研究的关键是随访和结局定义。只有图像,没有长期临床结局,很难做出真正有影响力的文章。
方向 5:眼科 foundation model 与生成式模型
foundation model 是近两年眼科 AI 的热点,但单纯“训练一个大模型”已经不够新。
更有发表价值的做法,是把 foundation model 放进具体临床问题中验证,例如:
跨设备 OCT 分割;
多病种眼底筛查;
OCT 报告自动生成;
图像质量控制;
稀有病辅助识别;
基于文本指令的病灶分割;
多模态眼科问答与报告结构化。
未来更有价值的方向不是“模型能生成一张好看的 OCT”,而是它能否帮助医生完成真实任务:自动结构化报告、纵向对比、异常提醒、病灶量化、治疗反应总结、临床试验入组筛选。
四、什么样的研究更容易发表?
如果目标是医学研究领域认可的高质量论文,建议把眼科 AI 研究从一开始就设计成“临床问题驱动”,而不是“模型驱动”。
图 4|眼科 AI 临床转化证据路径
简单说,AUC 只是入场券,不是终点。
真正有说服力的终点包括:
是否减少不必要转诊;
是否缩短等待时间;
是否提前发现高危患者;
是否预测治疗反应;
是否减少医生读片时间;
是否提高报告一致性;
是否在不同设备和人群中稳定;
是否知道模型在哪些情况下会失败。
五、给研究者的选题建议
如果现在有大规模眼科数据,尤其包括 OCT、眼底照、多设备来源和随访信息,最建议优先考虑以下方向。
图 5|眼科 AI 高机会选题矩阵
其中,我最看好的三个方向是:
第一,基线加早期随访 OCT 预测治疗反应。
第二,跨设备 OCT/fundus foundation model 泛化验证。
第三,社区眼科转诊路径中的 AI 分诊模型。
这三个方向的共同点是:既能发挥 AI 算法优势,又能讲清楚临床价值。
结语:眼科 AI 已经进入“临床动作时代”
眼科 AI 的下一阶段,不是继续证明“AI 可以识别疾病”。
这个阶段已经过去了。
真正值得做的问题是:
AI 能不能更早发现会进展的人?
能不能帮医生判断谁需要治疗、谁可以观察?
能不能减少不必要转诊和复诊?
能不能跨设备、跨中心、跨人群稳定工作?
能不能进入真实门诊、真实筛查和真实随访流程?
对于医学研究者来说,这意味着眼科 AI 的选题逻辑要从“模型创新”转向“证据链创新”。
对于算法研究者来说,这意味着论文的核心不再是网络结构多复杂,而是模型是否解决了一个真实临床问题。
未来几年,最有机会发表高质量论文的眼科 AI 研究,大概率会集中在四个关键词上:
纵向预测、跨设备泛化、真实工作流、眼底全身疾病风险。
谁能把这四件事做扎实,谁就更可能写出下一批真正有影响力的眼科 AI 论文。
参考文献
Artificial Intelligence for Screening of Multiple Retinal and Optic Nerve Diseases. JAMA Network Open. 2022.
Evaluation of Generative Adversarial Networks for High-Resolution Synthetic Image Generation of Circumpapillary Optical Coherence Tomography Images for Glaucoma. JAMA Ophthalmology. 2022.
Estimation of Visual Function Using Deep Learning From Ultra-Widefield Fundus Images of Eyes With Retinitis Pigmentosa. JAMA Ophthalmology. 2023.
Accuracy of Artificial Intelligence in Estimating Best-Corrected Visual Acuity From Fundus Photographs in Eyes With Diabetic Macular Edema. JAMA Ophthalmology. 2023.
A Deep-Learning Algorithm to Predict Short-Term Progression to Geographic Atrophy on Spectral-Domain Optical Coherence Tomography. JAMA Ophthalmology. 2023.
Artificial Intelligence for Early Detection of Pediatric Eye Diseases Using Mobile Photos. JAMA Network Open. 2024.
Development and Validation of a Multimodal Multitask Vision Foundation Model for Ophthalmology. NEJM AI. 2024.
Advancing Diabetic Macular Edema Detection from 3D Optical Coherence Tomography Scans: Integrating Privacy-Preserving AI and Generalizability Techniques. NEJM AI. 2024.
How Generalizable Are Foundation Models When Applied to Ophthalmology Tasks? NEJM AI. 2025.
Non-invasive Biopsy Diagnosis of Diabetic Kidney Disease via Deep Learning Applied to Retinal Images: a Population-Based Study. The Lancet Digital Health. 2025.
Automated Retinal Image Analysis Systems to Triage for Diabetic Retinopathy. The Lancet Digital Health. 2025.
Teleophthalmology versus Standard of Care for Community Optometry Referrals of Retinal Disease (HERMES): a Cluster Randomised Controlled Trial. The Lancet Primary Care. 2025.
A Predictive Atlas of Disease Onset from Retinal Fundus Photographs: a Modelling Study Using Data from Population-Based Cohorts. The Lancet Digital Health. 2026.
Smartphone-Based Proactive Self-Screening for Ocular Surface Malignancies: A Nonrandomized Clinical Trial. JAMA Ophthalmology. 2026.
夜雨聆风