
本周核心判断
通用大模型在专科病理诊断上仍不可靠,但专用AI工具在临床验证后已展现出明确的效率提升价值。
数字病理标准化(DICOM)仍是行业规模化瓶颈。
AI就绪性的核心不是技术先进性,而是病理学家的深度参与。

重磅头条

1. Google DeepMind AMIE:AI在29/32维度超越医生
2026年5月15日,Google DeepMind发布多模态医疗AI模型AMIE。
在模拟临床场景中,AMIE与18位初级保健医生进行随机对照测试,在32个评估维度中的29个上表现优于人类医生。
惊人发现:AI在"共情能力"和"诚实可信"上也超越了医生。
⚠️ 但请注意——这是模拟场景测试,不是真实世界临床实践。
2. 影像AI实现乳腺癌"一级预防"
2026年5月21日,《Science Translational Medicine》发表重磅研究。
基于影像的AI风险模型,首次实现乳腺癌一级预防——不是发现癌症,而是提前识别高风险人群并干预。
3个国家队列验证,中位随访10年
AUC=0.72,校准度极高
在"top10%高风险人群"中,AI预测了33%的乳腺癌病例,传统模型仅20-24%
这意味着:未来我们可能通过AI预判风险,在癌症发生前就进行干预。
3. 前列腺癌AI:诊断周转缩短30%
来自学术医疗中心的真实世界验证——不是实验室测试,是真正投入日常病理报告签发流程的数据。
灵敏度91%-100%,AUC=0.97
诊断周转时间缩短30%
免疫组化检测使用率下降38%
这意味着:AI不仅辅助诊断,还直接降低了诊疗成本和患者等待时间。
4. SCRIPT:大模型从病理报告提取预后标志物
研究团队用LLaMA 3.3 700亿参数大模型,直接从纯文本病理报告生成风险评分。
疾病特异性生存期的风险比高达5.85(P<0.001)。
不需要额外检测,不增加病理医师工作负荷,直接利用现有文本资料。

临床应用

AI质控系统:日处理6000+张
大型三甲肿瘤医院的数据显示:
组织褶皱检测一致性>97%
单张分析仅17秒
日处理超6000张
压力测试零失败
AI质控正式纳入数字病理标准化工作流。
ClinSegAI肿瘤分割:DSC 0.79
基于BiomedParse的后处理框架,在多个数据集中DSC达0.79,优于多款主流工具。
单张图像处理仅30秒,占用4GB显存。
❌ 反面警示:ChatGPT甲状腺诊断失败
《Human Pathology》研究给通用大模型泼了冷水:
ChatGPT Bethesda分类准确率:26.2%
Gemini:23.6%
完全认不出髓样癌、间变性癌
结论:通用大模型在专科病理诊断上远未达到临床可用水平。

数字病理

数字孪生:从NASA走向临床
五级架构:基因组→细胞→组织器官→全身→群体。
目前处于第三层级(组织与器官)起步阶段。
关键挑战:模拟运算耗时数小时、LLM幻觉风险、法律责任界定模糊。
产业合作动态
印度首套240切片系统:巴萨瓦塔拉卡姆医院启用罗氏DP600
PathAI会诊平台:AISight Dx获FDA+CE-IVD双认证
阿斯利康+罗氏:三年战略合作,覆盖九大亚洲市场
Lumea获奖:BxBoard活检技术,无效检测下降2.1倍

AI安全与监管

美国试图叫停医保AI审批试点
民主党议员联合行动,试图叫停联邦医保WISeR AI预授权试点。
争议:上线不合规、患者就医延误、薪酬机制催生拒诊。
美国医疗数据跨境政策收紧
新规划定健康、基因组数据跨境传输红线,尤其强化对华数据管控。
将阻碍国际联合医疗科研和AI协同创新。

跨领域突破
中国脑机接口实用化:解码速度达每分钟300汉字,6月推出智能轮椅
多智能体AI药物研发:覆盖假设到验证的完整闭环
AI价值医疗:联邦医保推行结果导向付费,打通AI慢病管理报销通道
ChatCPR开源急救AI:实时指导心肺复苏,超越人类调度员

本周关键洞察

洞察一:通用大模型 vs 专用AI,鸿沟巨大
AMIE在29/32维度超越医生,ChatGPT甲状腺诊断准确率仅26%。
真正的临床价值来自专业模型,而非通用API。
洞察二:AI就绪性=病理学家参与度
巴基斯坦病理学家零扫描仪起步,用静态图像发表论文。
没有病理学家的专业判断,再好的模型也是黑箱。
洞察三:瓶颈不是AI,是标准化
放射科几十年前就用DICOM解决了互通问题,病理领域至今仍被厂商私有格式困住。
数据格式的统一比算法创新更紧迫。
本期周报基于PathologyNews、STATNews、Nature、MedCityNews、Eric Topol推特、Human Pathology、Dr. Aleks播客等来源整理。
整理人:秦蕾、汇总分析:砚池。
夜雨聆风