【乳腺影像AI前瞻预警】乳腺癌确诊前10年,筛查AI分数就可能已经升高?
一、研究背景
乳腺癌筛查正在进入一个更强调“更早发现风险信号”的阶段。传统筛查的核心任务,是在当前这一次乳腺X线检查里尽量识别已经存在、并且足够可见的可疑病灶;但临床上真正更有价值的问题是:在影像还没有形成典型肿块或钙化、尚未达到人工阅片高度警惕的阶段,AI 是否已经能从影像里读出一些更早的风险征象?
2026 年发表在 Radiology 的这项研究,正是沿着这个方向展开。研究者使用瑞典乳腺筛查数据库,分析了 31394 名受检者、88963 次乳腺X线检查,比较后来确诊乳腺癌的人群与始终未患癌的人群在确诊前多年里的 AI 检测分数变化。他们关心的重点,不只是 AI 当下能不能“看见癌”,而是 AI 分数是否会在癌症被正式诊断前数年就逐渐升高。
如果这一点成立,乳腺影像 AI 的角色就不再只是“辅助阅片”,而是可能向“长期风险预警”和“筛查分层管理”推进。对临床而言,这意味着未来筛查策略有机会更精准地分配资源,例如对 AI 长期高分或持续升高的人群进行更密切随访、补充超声或 MRI,甚至提前进行风险沟通。
二、研究核心问题
这项研究试图回答三个很实际的问题。
商业化乳腺筛查 AI 的分数,是否会在乳腺癌正式确诊前多年就逐渐升高。
这种分数变化,是否比传统常用的乳腺密度指标更早、更敏感。
如果 AI 确实能提前多年给出风险信号,它更适合作为“当前检出工具”,还是“长期风险分层工具”的一部分。
研究者并没有只看单一时点,而是把一个人确诊前最长 10 年内的多次筛查都串联起来,观察 AI 分数轨迹。这个设计非常重要,因为它更接近真实筛查场景,也更容易回答“AI 是否能提前发出警报”。
三、研究设计与技术路线
这是一项回顾性研究,使用的是瑞典乳腺影像人工智能验证数据库。研究纳入的是覆盖 2008 年 1 月到 2019 年 4 月的筛查乳腺X线检查。对于后来确诊乳腺癌的个体,研究者尽可能收集其确诊前最多 10 年内的所有检查;对于未患癌对照人群,也纳入对应时间范围内的检查。
研究中一共评估了 3 个商业化 AI 计算机辅助检测系统。每个系统都会给每次乳腺X线检查输出一个原始 AI 分数。为了便于不同系统之间比较,研究者又把这些原始分数转成百分位排序分数。这样做的意义在于,不同算法内部量表不同,但百分位更适合放在统一框架下观察时间趋势。
这项研究还有一个值得注意的处理:研究者对数据做了上采样,使总体癌症比例接近 1%,以更贴近真实筛查环境,而不是停留在高度富集的“科研数据集”里。随后,他们用时间分层方式分析 AI 分数在确诊前 10 年、6 年、4 年等不同节点的表现,并与乳腺密度这个传统风险指标比较受试者工作特征曲线下面积。
四、主要结果
研究共纳入 31394 名个体和 88963 次乳腺X线检查,其中 12072 人最终被诊断为乳腺癌。中位筛查年龄为 57.6 岁。
最值得关注的发现,是 AI 分数确实可以在乳腺癌正式诊断前很多年就已经高于未患癌人群。在 90% 特异度下:
距离确诊前 10 年时,3 个 AI 系统可潜在标记的未来癌症比例分别为 12.7%、13.8% 和 17.0%。
距离确诊前 6 年时,这一比例升至 19.0%、19.6% 和 19.7%。
距离确诊前 4 年时,进一步升至 24.2%、23.3% 和 25.2%。
换句话说,哪怕在常规临床尚未正式诊断乳腺癌的多年以前,一部分受检者的乳腺X线图像中已经存在能够被 AI 量化的异常模式,而且这种信号会随着确诊时间逼近而逐步增强。
当把所有这些时间点合并分析,并排除当次筛查已直接检出的癌症后,3 个 AI 系统的 AUC 大约在 0.63 到 0.67 之间,而乳腺密度作为预测指标的 AUC 为 0.57。这个结果说明,AI 分数对于“未来会不会发生乳腺癌”的区分能力,整体上优于单独使用乳腺密度。
五、这项研究真正重要在哪里
这篇文章的价值,不在于宣称 AI 可以“提前 10 年诊断乳腺癌”,而在于提示我们:乳腺影像 AI 可能已经开始捕捉到一种早于传统显性病灶的长期风险表型。
第一,它拓展了乳腺筛查 AI 的定位。过去很多研究把 AI 看成第二阅片员,目标是减少漏诊或降低阅片负担;这项研究则把 AI 从“当次识别”推进到“纵向预警”,这是筛查医学里更具战略意义的一步。
第二,它提示影像本身可能蕴含比乳腺密度更丰富的早期风险信息。乳腺密度当然重要,但它本质上只是一个较粗的风险标记,而 AI 可以同时整合纹理、结构、局部模式和复杂空间特征,因此有机会在更早阶段识别高风险影像表型。
第三,它非常适合进入临床筛查流程。因为研究使用的是商业化系统和真实世界大样本筛查数据,讨论的不是实验室条件下“能不能分得开”,而是已经部署或接近部署的系统能否支持风险分层。
六、临床应用前景与现实边界
从临床角度看,这项研究最直接的启发不是立刻改变诊断结论,而是为分层筛查提供依据。
未来一种可想象的路径是:如果某位受检者本次筛查没有达到明确召回标准,但 AI 分数持续高于同龄人百分位,或者在数年内稳定上升,那么她也许更适合接受更短间隔复查、补充超声、风险咨询,或在合适人群中进一步考虑 MRI。这样的策略,比“一刀切”式的统一筛查间隔更精准。
但边界也要说清楚。AUC 0.63 到 0.67 说明它有信号,但还远不是可以单独决定临床路径的“决定性工具”。AI 分数升高不等于一定会得癌,也不代表可以脱离影像科医生和现有筛查标准独立使用。更合理的定位,是把它作为现有筛查体系中的一个增量层。
此外,这项研究使用的是回顾性筛查数据,虽然样本量很大,但仍然需要前瞻性研究来回答一个更关键的问题:如果我们真的基于这些提前升高的 AI 分数去改变随访策略,最终是否能够减少间期癌、改善分期分布,或者降低乳腺癌死亡风险。
七、给临床和科普传播的启发
这项研究很适合做中文医学科普,因为它回答的是普通人也能理解、临床医生也会关心的问题:AI 到底是更早看见了什么?
对于临床医生,它提示未来乳腺筛查 AI 的价值可能不仅是“帮我多找一个可疑病灶”,更是“帮我识别哪一类患者值得更早关注”。对于患者和公众,它也有一个很重要的信息:影像 AI 的意义不只是机器替代医生,而是为筛查体系增加一层更前移的风险识别能力。
如果后续前瞻性研究证实,基于 AI 分数的风险分层能够真正带来更早诊断、更少间期癌,乳腺筛查就可能从单纯“发现现有病灶”走向“更早识别将来高风险人群”。
八、总结
这篇 Radiology 研究说明,在乳腺癌被正式诊断前多年,筛查乳腺X线中的 AI 分数就可能已经出现可测量升高,而且整体上优于单独使用乳腺密度来预测未来癌症风险。
它的真正意义,不是宣布 AI 已经能独立做超前诊断,而是提示乳腺影像里可能存在一类更早期、更隐匿、但可被算法量化的风险信号。乳腺影像 AI 的下一步,或许不只是“看得更准”,而是“提醒得更早”。
参考文献
Hickman N, Gialias G, Schurz A, et al. Artificial Intelligence Detection Scores in Screening Mammography for Early Breast Cancer Alerts. Radiology. 2026. PMID: 42262245.
夜雨聆风