Nat Med|AI 决策支持工具|AI 预判手术生死:结直肠癌围手术期能否实现＂一人一策＂?-夜雨聆风

Nat Med|AI 决策支持工具|AI 预判手术生死:结直肠癌围手术期能否实现＂一人一策＂?

文献来源：本文核心内容源自 2025 年 9 月发表于 Nature Medicine 的论文《Clinical implementation of an AI-based prediction model for decision support for patients undergoing colorectal cancer surgery》，核心研究团队主要来自丹麦西兰大学医院外科科学中心（Center for Surgical Science, Zealand University Hospital）、哥本哈根大学临床医学系（University of Copenhagen, Department of Clinical Medicine）等。

科研王师兄总结：研究团队基于丹麦国家健康登记处 19,403 例结直肠癌手术患者数据，开发并临床实施了一款预测 1 年死亡率的 AI 决策支持工具。模型整合年龄、合并症指数（Charlson）、WHO 体能状态、肿瘤分期等多维信息，将患者分为 A（≤1%）、B（>1–5%）、C（>5–15%）、D（>15%）四个风险组，AUROC 达 0.82（开发集）/ 0.79（外部验证）。在前瞻性实施队列中，接受 AI 指导的个性化围手术期治疗的患者，严重并发症（CCI>20）发生率从 28.0% 降至 19.1%（调整 OR 0.63，P=0.02），任何内科并发症从 37.3% 降至 23.7%（OR 0.53，P<0.001），90 天内再入院率也显著下降。经济学模型显示每患者可节省约 2,848 美元，同时增加 0.020 QALYs。

一、为什么这项研究重要？

✦

1.领它卡住的是”结直肠癌手术并发症高、再入院率高”的真实痛点。

结直肠癌手术量大，但近三分之一患者出现术后并发症，传统风险评估工具（如 ASA、Charlson）各自只测单一维度，无法整合预判。

2. 它是”开发→验证→临床实施→经济学评估”的完整闭环。

不是止步于模型 AUC，而是真正嵌入临床路径，用前后对照队列证明并发症减少和成本节省，直接回答医院管理层”值不值得买”的问题。

「光速科研」是一个由协和、复旦、湘雅等知名高校博士组成的AI科研辅导团队，专注于AI医学交叉研究和AI赋能传统科研两个方向。我们已形成完整的AI科研工作流，在此基础上持续推出课程，帮助线上师兄师姐师弟师妹持续产出、高效产出。关注添加「科研王师兄：wpro999」。

二、核心结果拆解

✦

证据点1：这项研究够不够真实？

Figure 1· 左侧展示从 8,694 变量 → 68 候选 → 58 最终变量的筛选流程；右侧用四色金字塔或矩阵展示 A/B/C/D 四个风险组的定义阈值及对应的临床干预强度（基础优化 / 标准优化 / 强化优化 / 最高强度优化）。让读者理解”预测模型不是只给数字，而是直接驱动治疗路径”。

模型开发基于丹麦全国结直肠癌登记处 19,403 例患者，从 8,694 个初始候选变量中经临床监督筛选，最终保留 58 个预测因子进入模型。验证采用三轨设计：开发集（13,803 例）、内部时间验证集（4,600 例）、外部验证集（806 例）。临床实施阶段纳入前瞻性队列（PCC）194 例，与回顾性对照队列（RCC）806 例比较。

这意味着： 数据来源国家级登记系统，变量筛选有临床专家参与，验证跨越时间和中心，实施阶段是真实临床决策支持。

证据点 2：核心结果到底强在哪里？

Figure 3· 上半部分展示开发集、内部验证集、外部验证集的三条 ROC 曲线及 AUROC；中间展示校准曲线，标注模型在低风险区校准良好、高风险区略有高估的特点；下半部分用四组柱状图展示 A/B/C/D 风险组在 1 年死亡率、严重并发症、再入院率上的梯度差异。回答”模型准不准”和”分层有没有临床意义”两个问题。

模型区分度良好：AUROC 0.82（开发）/ 0.77（内部验证）/ 0.79（外部验证）。更重要的是风险分层后的临床结局呈现单调递增：D 组（>15% 死亡风险）的 1 年死亡率、严重并发症率、再入院率均显著高于 A 组。

临床实施后的硬终点改善尤为突出：严重术后并发症（CCI>20）发生率从 28.0% 降至 19.1%；任何内科并发症从 37.3% 降至 23.7%；90 天内并发症次数从 0.76 降至 0.48；再入院率从 0.31 降至 0.20。医生对模型风险分层的采纳一致性极高（Kappa=0.926）。

这意味着： AI 不是只预测风险，而是通过标准化风险分层，让”该强化的患者得到强化、该保守的患者避免过度治疗”，从而系统性降低并发症负担。

证据点 3：它真正改变的是什么？

Figure 5· 左侧用分组柱状图对比 PCC（AI 实施后）与 RCC（对照）在严重并发症、任何内科并发症、并发症次数、再入院率四项指标上的绝对发生率；右侧用成本效益平面散点图展示 10,000 次模拟中 AI 策略与标准护理的成本-QALY 分布，突出 96.56% 模拟点落在”降低成本且增加 QALY”的象限。回答”值不值得推广”的问题。

研究不仅做了临床验证，还做了卫生经济学分析。AI 指导的个性化治疗组平均每患者 1 年内医疗成本为 25,159 美元，对照组为 28,007 美元，节省 2,848 美元，同时增加 0.020 QALYs。在 96.56% 的模拟中，AI 策略均呈现”降低成本+改善健康”的优势。

这意味着： 这篇文章直接回答了医院管理者最关心的问题——AI 决策支持不仅改善临床结局，还在短期内实现了成本节省，为大规模推广提供了经济学依据。

三、这项研究的启发

✦

1️⃣ 它改变的不是一个预测公式，而是”围手术期风险管理”的工作流。传统模式下，术前风险评估依赖医生主观综合判断；AI 模式下，多维度数据被整合为标准化风险分组，直接匹配到预设的优化 bundle 强度。这提示我们：AI 在临床中的最大价值，可能不在于”比医生看得更准”，而在于”让不同医生看得一样准、做得一样规范”。

四、王师兄小结

✦

这【可借鉴的研究选题方向】

如果你也想在”AI 围手术期决策支持”方向继续做延伸，这篇文章至少给了以下 5 个可借鉴方向：

其他癌种的外推验证： 将同款 AI 风险分层逻辑迁移至肺癌、肾癌、膀胱癌、卵巢癌等手术的围手术期管理，验证跨癌种通用性。
中国或亚洲人群的外部验证：基于中国国家级手术登记数据库（如 NCIS）重建并验证模型，评估在不同人种、不同医疗资源配置下的性能变化。
术前优化 bundle 的组分拆解研究：进一步 RCT 验证风险分层后具体干预措施（预康复训练、营养支持、血糖控制）的独立贡献度。
医生对 AI 建议的偏离模式研究：分析 Kappa=0.926 之外的 7.4% 偏离案例，探究医生在什么情况下选择”不听 AI 的”，以及这些偏离是否合理。
长期随访与肿瘤学结局研究：当前研究主要关注 90 天并发症和 1 年死亡率，可延伸至 3–5 年无病生存、总生存及生活质量结局。

这些方向都符合本文的成功范式：以国家级真实世界数据开发模型，经多轨验证后嵌入临床路径，用前后对照队列证明硬终点改善，并辅以卫生经济学分析支撑规模化决策。

衷心感谢、致敬原作者团队的工作！

— END —

✦ 永远相信美好的事情即将发生 ✦

✦ 永远相信投稿的文章即将接收 ✦

AI Exploring Everyday

专注分享有趣研究

追踪最新科研进展

期待启发科研思路

👉 关注「光速科研AI」