【乳腺影像AI前瞻预警】乳腺癌确诊前10年,筛查AI分数就可能已经升高?

【乳腺影像AI前瞻预警】乳腺癌确诊前10年，筛查AI分数就可能已经升高？

一、研究背景

乳腺癌筛查正在进入一个更强调“更早发现风险信号”的阶段。传统筛查的核心任务，是在当前这一次乳腺X线检查里尽量识别已经存在、并且足够可见的可疑病灶；但临床上真正更有价值的问题是：在影像还没有形成典型肿块或钙化、尚未达到人工阅片高度警惕的阶段，AI 是否已经能从影像里读出一些更早的风险征象？

2026 年发表在 Radiology 的这项研究，正是沿着这个方向展开。研究者使用瑞典乳腺筛查数据库，分析了 31394 名受检者、88963 次乳腺X线检查，比较后来确诊乳腺癌的人群与始终未患癌的人群在确诊前多年里的 AI 检测分数变化。他们关心的重点，不只是 AI 当下能不能“看见癌”，而是 AI 分数是否会在癌症被正式诊断前数年就逐渐升高。

如果这一点成立，乳腺影像 AI 的角色就不再只是“辅助阅片”，而是可能向“长期风险预警”和“筛查分层管理”推进。对临床而言，这意味着未来筛查策略有机会更精准地分配资源，例如对 AI 长期高分或持续升高的人群进行更密切随访、补充超声或 MRI，甚至提前进行风险沟通。

二、研究核心问题

这项研究试图回答三个很实际的问题。

商业化乳腺筛查 AI 的分数，是否会在乳腺癌正式确诊前多年就逐渐升高。

这种分数变化，是否比传统常用的乳腺密度指标更早、更敏感。

如果 AI 确实能提前多年给出风险信号，它更适合作为“当前检出工具”，还是“长期风险分层工具”的一部分。

研究者并没有只看单一时点，而是把一个人确诊前最长 10 年内的多次筛查都串联起来，观察 AI 分数轨迹。这个设计非常重要，因为它更接近真实筛查场景，也更容易回答“AI 是否能提前发出警报”。

三、研究设计与技术路线

这是一项回顾性研究，使用的是瑞典乳腺影像人工智能验证数据库。研究纳入的是覆盖 2008 年 1 月到 2019 年 4 月的筛查乳腺X线检查。对于后来确诊乳腺癌的个体，研究者尽可能收集其确诊前最多 10 年内的所有检查；对于未患癌对照人群，也纳入对应时间范围内的检查。

研究中一共评估了 3 个商业化 AI 计算机辅助检测系统。每个系统都会给每次乳腺X线检查输出一个原始 AI 分数。为了便于不同系统之间比较，研究者又把这些原始分数转成百分位排序分数。这样做的意义在于，不同算法内部量表不同，但百分位更适合放在统一框架下观察时间趋势。

这项研究还有一个值得注意的处理：研究者对数据做了上采样，使总体癌症比例接近 1%，以更贴近真实筛查环境，而不是停留在高度富集的“科研数据集”里。随后，他们用时间分层方式分析 AI 分数在确诊前 10 年、6 年、4 年等不同节点的表现，并与乳腺密度这个传统风险指标比较受试者工作特征曲线下面积。

四、主要结果

研究共纳入 31394 名个体和 88963 次乳腺X线检查，其中 12072 人最终被诊断为乳腺癌。中位筛查年龄为 57.6 岁。

最值得关注的发现，是 AI 分数确实可以在乳腺癌正式诊断前很多年就已经高于未患癌人群。在 90% 特异度下：

距离确诊前 10 年时，3 个 AI 系统可潜在标记的未来癌症比例分别为 12.7%、13.8% 和 17.0%。

距离确诊前 6 年时，这一比例升至 19.0%、19.6% 和 19.7%。

距离确诊前 4 年时，进一步升至 24.2%、23.3% 和 25.2%。

换句话说，哪怕在常规临床尚未正式诊断乳腺癌的多年以前，一部分受检者的乳腺X线图像中已经存在能够被 AI 量化的异常模式，而且这种信号会随着确诊时间逼近而逐步增强。

当把所有这些时间点合并分析，并排除当次筛查已直接检出的癌症后，3 个 AI 系统的 AUC 大约在 0.63 到 0.67 之间，而乳腺密度作为预测指标的 AUC 为 0.57。这个结果说明，AI 分数对于“未来会不会发生乳腺癌”的区分能力，整体上优于单独使用乳腺密度。

五、这项研究真正重要在哪里

这篇文章的价值，不在于宣称 AI 可以“提前 10 年诊断乳腺癌”，而在于提示我们：乳腺影像 AI 可能已经开始捕捉到一种早于传统显性病灶的长期风险表型。

第一，它拓展了乳腺筛查 AI 的定位。过去很多研究把 AI 看成第二阅片员，目标是减少漏诊或降低阅片负担；这项研究则把 AI 从“当次识别”推进到“纵向预警”，这是筛查医学里更具战略意义的一步。

第二，它提示影像本身可能蕴含比乳腺密度更丰富的早期风险信息。乳腺密度当然重要，但它本质上只是一个较粗的风险标记，而 AI 可以同时整合纹理、结构、局部模式和复杂空间特征，因此有机会在更早阶段识别高风险影像表型。

第三，它非常适合进入临床筛查流程。因为研究使用的是商业化系统和真实世界大样本筛查数据，讨论的不是实验室条件下“能不能分得开”，而是已经部署或接近部署的系统能否支持风险分层。

六、临床应用前景与现实边界

从临床角度看，这项研究最直接的启发不是立刻改变诊断结论，而是为分层筛查提供依据。

未来一种可想象的路径是：如果某位受检者本次筛查没有达到明确召回标准，但 AI 分数持续高于同龄人百分位，或者在数年内稳定上升，那么她也许更适合接受更短间隔复查、补充超声、风险咨询，或在合适人群中进一步考虑 MRI。这样的策略，比“一刀切”式的统一筛查间隔更精准。

但边界也要说清楚。AUC 0.63 到 0.67 说明它有信号，但还远不是可以单独决定临床路径的“决定性工具”。AI 分数升高不等于一定会得癌，也不代表可以脱离影像科医生和现有筛查标准独立使用。更合理的定位，是把它作为现有筛查体系中的一个增量层。

此外，这项研究使用的是回顾性筛查数据，虽然样本量很大，但仍然需要前瞻性研究来回答一个更关键的问题：如果我们真的基于这些提前升高的 AI 分数去改变随访策略，最终是否能够减少间期癌、改善分期分布，或者降低乳腺癌死亡风险。

七、给临床和科普传播的启发

这项研究很适合做中文医学科普，因为它回答的是普通人也能理解、临床医生也会关心的问题：AI 到底是更早看见了什么？

对于临床医生，它提示未来乳腺筛查 AI 的价值可能不仅是“帮我多找一个可疑病灶”，更是“帮我识别哪一类患者值得更早关注”。对于患者和公众，它也有一个很重要的信息：影像 AI 的意义不只是机器替代医生，而是为筛查体系增加一层更前移的风险识别能力。

如果后续前瞻性研究证实，基于 AI 分数的风险分层能够真正带来更早诊断、更少间期癌，乳腺筛查就可能从单纯“发现现有病灶”走向“更早识别将来高风险人群”。

八、总结

这篇 Radiology 研究说明，在乳腺癌被正式诊断前多年，筛查乳腺X线中的 AI 分数就可能已经出现可测量升高，而且整体上优于单独使用乳腺密度来预测未来癌症风险。

它的真正意义，不是宣布 AI 已经能独立做超前诊断，而是提示乳腺影像里可能存在一类更早期、更隐匿、但可被算法量化的风险信号。乳腺影像 AI 的下一步，或许不只是“看得更准”，而是“提醒得更早”。

参考文献

Hickman N, Gialias G, Schurz A, et al. Artificial Intelligence Detection Scores in Screening Mammography for Early Breast Cancer Alerts. Radiology. 2026. PMID: 42262245.