眼科 AI 的下一波机会:别再只卷 AUC,顶刊正在奖励“能改变临床流程”的模型

过去几年，AI 医学影像论文很多，但真正能进入 JAMA、NEJM AI、Lancet Digital Health 这类临床顶刊体系的研究，已经发生了明显变化。

早期大家更关注：模型能不能把病分出来？AUC 有没有提升？能不能比医生高一点？

现在更重要的问题变成了：这个模型能不能改变临床动作？能不能减少不必要转诊？能不能预测谁会进展？能不能帮助医生更快、更稳地完成真实工作流？

眼科是目前最适合做 AI 临床转化的专科之一。原因很直接：眼底照、OCT、UWF、OCTA、裂隙灯图像都高度结构化；疾病随访密集；很多临床结局可以量化；而且筛查、转诊、复诊、治疗决策都有明确流程。对于 AI 研究者来说，这意味着眼科不是一个单纯做分类模型的领域，而是一个可以把算法真正嵌入临床路径的场景。

一、顶刊趋势：从“模型性能”转向“临床证据链”

基于 2022 年至 2026 年 6 月三大出版体系中 35 篇医学影像 AI 主语料，可以看到一个清楚趋势：2025 年开始，临床影像 AI 论文明显加速。

图 1｜三大体系医学影像 AI 主语料年度趋势

年份	纳入主语料数量	主要特征
2022	6	多病种筛查、读片辅助、公平性问题开始出现
2023	5	OCT 纵向预后、影像到功能预测、生成式报告起步
2024	6	foundation model、联邦学习、多中心前瞻验证增多
2025	13	真实世界工作流、人机协作、远程转诊、外部验证快速升温
2026 YTD	5	生成式基础模型、眼底预测全身疾病、公众自筛出现

这说明，顶刊已经不太满足于“一个新模型在测试集上表现很好”。它们更关心完整证据链：

开发集是否多中心？
外部验证是否严格？
是否跨设备、跨人群、跨地区？
是否进入真实工作流？
是否影响医生决策、转诊效率或患者结局？

一句话：只做算法创新，越来越不够；能进入临床流程，才是关键。

二、眼科为什么特别适合 AI？

在这 35 篇主语料中，眼科影像是最重要的方向之一，共 16 篇，超过胸部影像、MRI、病理和其他影像类型。

图 2｜医学影像 AI 研究主题分布

主题方向	篇数	主要影像类型	代表性关键词
眼科影像	16	Fundus、OCT、UWF、手机前节图像	RAIDS、DeepGAze、VisionFM、DeepDKD、HERMES
胸部影像	9	CXR、CT	TB、COPD、报告生成、grounding
MRI	3	脑 MRI、前列腺 MRI	分类、辅助识别、ARIA
病理/电镜	2	数字病理、电镜	分割、检测、预后
其他	5	POCUS、皮肤图像、术中影像	多模态、image-text

眼科 AI 的优势主要有四点。

第一，数据天然结构化。OCT 是层状结构，眼底照有清晰血管、视盘、黄斑区域，很多病灶有稳定形态学基础。

第二，随访价值高。AMD、DME、高度近视、青光眼、遗传性视网膜病变等疾病都需要长期随访，这让 AI 可以从“诊断”升级为“预测”。

第三，临床动作明确。比如是否转诊、是否加密随访、是否打针、是否换药、是否进入临床试验，这些都可以成为模型输出后的真实动作。

第四，设备和场景丰富。医院内有 OCT、眼底相机、UWF、OCTA；基层和社区有远程阅片；未来手机前节图像也可能成为公众自筛入口。

所以，眼科 AI 最有价值的方向，不是继续做一个“单病种分类器”，而是围绕临床路径设计模型。

三、最近最值得关注的五个研究方向

方向 1：OCT 纵向预后预测

这是目前最值得优先布局的方向之一。

传统 AI 眼科论文经常做“有没有病”“是哪类病”。但临床真正关心的是：这个患者未来会不会进展？多久进展？是否需要提前干预？是否需要更频繁随访？

典型代表是基于 SD-OCT 预测地理萎缩进展的 DeepGAze 研究。它的价值不只是模型 AUC 高，而是把 OCT 图像直接连接到 AMD 进展和临床试验富集。也就是说，AI 不再只是辅助诊断，而是在帮助医生判断“谁更可能在短期内恶化”。

可延展的题目包括：

具体题目	适合数据	临床终点
AMD 进展预测	OCT + fundus + 随访	1 年内 GA/CNV 进展
DME 治疗反应预测	基线 OCT + 注射记录	视力改善、液体吸收、注射次数
高度近视并发症预测	OCT + 眼轴 + 屈光度	CNV、劈裂、黄斑病变进展
青光眼结构进展预测	OCT RNFL/GCC + 眼压	RNFL 变薄、视野恶化
儿童近视进展预测	眼轴 + 屈光度 + OCT/眼底	眼轴增长速度、高危进展

这类研究的核心不是“模型多复杂”，而是随访结局是否清楚。

方向 2：跨设备、跨中心、跨人群泛化

眼科 AI 的一个现实问题是：模型在一个设备上训练，在另一个设备上就掉性能。

海德堡、蔡司、Topcon、Optovue、图湃等设备的成像风格、分辨率、扫描协议、图像质量都不一样。对于临床应用来说，单设备高性能意义有限，多设备稳定才是关键。

这也是 NEJM AI 近年特别关注 foundation model generalizability 的原因。现在的核心问题不是“能不能训练一个大模型”，而是：

它能否跨设备？
能否跨医院？
能否跨年龄、性别、疾病严重程度？
能否在真实低质量图像中保持可靠？
它在哪些亚组中会失败？

图 3｜眼科 AI 泛化验证矩阵

验证维度	需要回答的问题
设备泛化	Heidelberg 训练，Zeiss/Topcon/图湃上是否稳定？
中心泛化	三甲医院训练，基层/门诊/体检中心是否稳定？
时间泛化	旧数据训练，新时间段数据是否稳定？
人群泛化	儿童、高度近视、老年人、糖尿病人群是否稳定？
图像质量	低信噪比、伪影、屈光间质混浊是否导致误判？
公平性	不同性别、年龄、种族或社会经济背景是否存在性能差异？

如果研究者手里有多设备、多中心大规模眼科数据，这个方向非常适合做成高质量 benchmark 或 foundation model 论文。

方向 3：AI 辅助转诊与远程眼科

眼科 AI 的另一个高价值方向，是改变转诊路径。

很多真实场景中，问题不在于医生不会诊断，而在于转诊系统效率低：基层不知道哪些患者需要急转，医院专科门诊堆积大量不必要转诊，真正高危患者反而等待过久。

HERMES 这类研究说明，远程眼科和 OCT-only 分诊已经开始走向随机化或准实验式设计。这类论文更接近 Lancet Digital Health 喜欢的风格：不是只证明模型准确，而是证明它能优化医疗系统。

可研究的问题包括：

场景	AI 任务	更有价值的终点
社区眼科筛查	判断是否需要转诊	不必要转诊减少、等待时间缩短
糖网筛查	识别 referral-warranted DR	漏诊率、转诊效率、医生工作量
OCT 门诊初筛	识别需要专科处理的黄斑病变	急诊转诊比例、复诊间隔优化
儿童眼病筛查	手机照片识别斜视、上睑下垂、近视风险	可操作转诊率、家长依从性
眼表肿瘤自筛	手机/前节图像识别高危病变	早诊率、误报率、转诊阳性率

这类研究最适合做前瞻性 silent deployment，然后再进入真实流程试验。

方向 4：眼底影像预测全身疾病

这是最近非常值得关注的新趋势，也可以称为 oculomics。

眼底是唯一可以无创观察微血管和神经组织的窗口。因此，眼底图像不只可以看眼病，也可能预测糖尿病肾病、心血管疾病、神经退行性疾病、死亡风险等系统性结局。

Lancet Digital Health 近年出现 DeepDKD、fundus predictive atlas 等工作，说明顶刊已经开始接受“眼底影像作为全身疾病风险窗口”这一叙事。

这个方向适合拥有大规模体检、眼底照、基础临床信息和长期随访数据的团队。

更有潜力的问题包括：

方向	输入	输出
眼底预测 CKD/DKD	fundus + 糖尿病信息 + eGFR	肾病风险、肾功能下降
眼底预测心血管风险	fundus + 血压血脂	MACE、卒中、冠心病
眼底预测生物年龄	fundus/OCT + 基线信息	retinal age gap
眼底预测代谢风险	fundus + BMI + HbA1c	糖尿病、代谢综合征
多模态系统风险模型	fundus + OCT + 临床变量	多疾病风险图谱

这类研究的关键是随访和结局定义。只有图像，没有长期临床结局，很难做出真正有影响力的文章。

方向 5：眼科 foundation model 与生成式模型

foundation model 是近两年眼科 AI 的热点，但单纯“训练一个大模型”已经不够新。

更有发表价值的做法，是把 foundation model 放进具体临床问题中验证，例如：

跨设备 OCT 分割；
多病种眼底筛查；
OCT 报告自动生成；
图像质量控制；
稀有病辅助识别；
基于文本指令的病灶分割；
多模态眼科问答与报告结构化。

未来更有价值的方向不是“模型能生成一张好看的 OCT”，而是它能否帮助医生完成真实任务：自动结构化报告、纵向对比、异常提醒、病灶量化、治疗反应总结、临床试验入组筛选。

四、什么样的研究更容易发表？

如果目标是医学研究领域认可的高质量论文，建议把眼科 AI 研究从一开始就设计成“临床问题驱动”，而不是“模型驱动”。

图 4｜眼科 AI 临床转化证据路径

阶段	核心任务	论文价值
1. 临床问题定义	明确模型要改变什么动作	避免变成普通分类论文
2. 回顾性开发	多中心、多设备、多时间段建模	建立初始性能
3. 外部验证	地区、设备、人群、图像质量分层	证明泛化能力
4. 前瞻静默运行	模型不干预临床，观察真实表现	评估安全性和校准
5. Reader study	比较医生有无 AI 辅助的差异	证明人机协作价值
6. 真实流程试验	转诊、随访、报告、治疗路径改变	形成系统级证据
7. 经济性与公平性分析	成本、效率、亚组表现	提升顶刊竞争力

简单说，AUC 只是入场券，不是终点。

真正有说服力的终点包括：

是否减少不必要转诊；
是否缩短等待时间；
是否提前发现高危患者；
是否预测治疗反应；
是否减少医生读片时间；
是否提高报告一致性；
是否在不同设备和人群中稳定；
是否知道模型在哪些情况下会失败。

五、给研究者的选题建议

如果现在有大规模眼科数据，尤其包括 OCT、眼底照、多设备来源和随访信息，最建议优先考虑以下方向。

图 5｜眼科 AI 高机会选题矩阵

优先级	研究方向	推荐理由
高	OCT 纵向预后预测	临床终点清楚，适合 JAMA Ophthalmology / Lancet Digital Health
高	抗 VEGF 治疗反应预测	可直接影响随访和治疗策略
高	多设备多中心泛化 benchmark	适合 NEJM AI，能体现数据和方法优势
高	社区 OCT/眼底远程分诊	可连接真实工作流和卫生系统效率
中高	眼底预测系统疾病	oculomics 正在升温，适合大队列
中高	儿童/高度近视人群 AI	数据稀缺但临床需求明确
中	生成式眼科报告与结构化总结	有前景，但必须接真实医生工作流
中	稀有病 synthetic data / weak supervision	有方法价值，但需要外部或前瞻验证支撑

其中，我最看好的三个方向是：

第一，基线加早期随访 OCT 预测治疗反应。
第二，跨设备 OCT/fundus foundation model 泛化验证。
第三，社区眼科转诊路径中的 AI 分诊模型。

这三个方向的共同点是：既能发挥 AI 算法优势，又能讲清楚临床价值。

结语：眼科 AI 已经进入“临床动作时代”

眼科 AI 的下一阶段，不是继续证明“AI 可以识别疾病”。

这个阶段已经过去了。

真正值得做的问题是：

AI 能不能更早发现会进展的人？
能不能帮医生判断谁需要治疗、谁可以观察？
能不能减少不必要转诊和复诊？
能不能跨设备、跨中心、跨人群稳定工作？
能不能进入真实门诊、真实筛查和真实随访流程？

对于医学研究者来说，这意味着眼科 AI 的选题逻辑要从“模型创新”转向“证据链创新”。
对于算法研究者来说，这意味着论文的核心不再是网络结构多复杂，而是模型是否解决了一个真实临床问题。

未来几年，最有机会发表高质量论文的眼科 AI 研究，大概率会集中在四个关键词上：

纵向预测、跨设备泛化、真实工作流、眼底全身疾病风险。

谁能把这四件事做扎实，谁就更可能写出下一批真正有影响力的眼科 AI 论文。

参考文献

Artificial Intelligence for Screening of Multiple Retinal and Optic Nerve Diseases. JAMA Network Open. 2022.
Evaluation of Generative Adversarial Networks for High-Resolution Synthetic Image Generation of Circumpapillary Optical Coherence Tomography Images for Glaucoma. JAMA Ophthalmology. 2022.
Estimation of Visual Function Using Deep Learning From Ultra-Widefield Fundus Images of Eyes With Retinitis Pigmentosa. JAMA Ophthalmology. 2023.
Accuracy of Artificial Intelligence in Estimating Best-Corrected Visual Acuity From Fundus Photographs in Eyes With Diabetic Macular Edema. JAMA Ophthalmology. 2023.
A Deep-Learning Algorithm to Predict Short-Term Progression to Geographic Atrophy on Spectral-Domain Optical Coherence Tomography. JAMA Ophthalmology. 2023.
Artificial Intelligence for Early Detection of Pediatric Eye Diseases Using Mobile Photos. JAMA Network Open. 2024.
Development and Validation of a Multimodal Multitask Vision Foundation Model for Ophthalmology. NEJM AI. 2024.
Advancing Diabetic Macular Edema Detection from 3D Optical Coherence Tomography Scans: Integrating Privacy-Preserving AI and Generalizability Techniques. NEJM AI. 2024.
How Generalizable Are Foundation Models When Applied to Ophthalmology Tasks? NEJM AI. 2025.
Non-invasive Biopsy Diagnosis of Diabetic Kidney Disease via Deep Learning Applied to Retinal Images: a Population-Based Study. The Lancet Digital Health. 2025.
Automated Retinal Image Analysis Systems to Triage for Diabetic Retinopathy. The Lancet Digital Health. 2025.
Teleophthalmology versus Standard of Care for Community Optometry Referrals of Retinal Disease (HERMES): a Cluster Randomised Controlled Trial. The Lancet Primary Care. 2025.
A Predictive Atlas of Disease Onset from Retinal Fundus Photographs: a Modelling Study Using Data from Population-Based Cohorts. The Lancet Digital Health. 2026.
Smartphone-Based Proactive Self-Screening for Ocular Surface Malignancies: A Nonrandomized Clinical Trial. JAMA Ophthalmology. 2026.