AI 看病终于学会说＂我不知道＂了,这才是医疗 AI 该有的样子

你有没有想过一个问题：如果一个 AI 告诉你"你可能得了癌症"，你敢信吗？

更可怕的是，如果它说得特别自信，条条有理，你可能真的就信了——哪怕它是错的。

这不是科幻电影里的情节。过去几年，已经有不少医疗 AI 产品闹出过类似的乌龙。它们的问题不是"不够聪明"，而是太自信了，自信到不知道自己什么时候该闭嘴。

最近，一个叫 OncoAgent 的项目，给出了一个不太一样的解法。

它不是来"看病"的

先说清楚一件事：OncoAgent 不是一个"AI 医生"。它不会告诉你"你得了什么病"，也不会给你开药方。

它的定位是肿瘤辅助分诊系统。

什么叫分诊？你去医院挂急诊，门口有个护士会先看看你的情况，判断你应该去内科还是外科，应该马上抢救还是排队等着——这个过程就叫分诊。

OncoAgent 做的事情类似：当医生输入一份病例信息后，它会帮忙分析这个病例可能涉及哪个肿瘤方向，给出初步的分诊建议，但最终的判断权始终在医生手里。

这个定位本身就很有自知之明。

三个"AI 医生"轮流把关

OncoAgent 的内部架构，说白了就是三个 AI 角色轮流干活，像一个小型会诊团队：

第一个角色：分诊台（Router Agent）

它的任务是"接诊"。拿到病例后，先做两件事：

把病人的隐私信息脱敏处理（专业术语叫 Zero-PHI，就是把姓名、身份证号这些全部抹掉）
判断这个病例应该交给哪个方向的专家来分析

就像你去医院，分诊台护士先问你"哪里不舒服"，然后告诉你去几楼几号诊室。

第二个角色：专科医生（Specialist Agent）

这是真正干活的角色。它会：

仔细分析病例里的各种信息
去查权威的医学知识库，看看有没有匹配的临床指南
综合各种证据，给出分析意见

第三个角色：审核专家（Critic Agent）

这是最关键的角色。它不看病历，专门检查前一个"医生"说的对不对。

它会做一件很重要的事：Reflexion（自我反思）。简单说就是——你说的每一句话，有没有权威文献支撑？如果你是瞎猜的，那就打回去重来。

这种"自己检查自己"的机制，在 AI 领域叫 self-check，目的就是防止 AI 产生"幻觉"——也就是一本正经地胡说八道。

三个角色配合起来，形成了一个完整的工作流程：先分诊、再分析、最后审查。这在 AI 领域有个专业说法叫 Planner → Solver → Critic 架构，OncoAgent 把它做成了医疗版。

最聪明的设计：学会说"我不知道"

这才是 OncoAgent 真正让人眼前一亮的地方。

很多医疗 AI 的逻辑是：你问我，我就得给你一个答案。不管对不对，先说了再说。这就像一个学生考试，不会做的题也要蒙一个答案——万一蒙对了呢？

但医疗不是考试。蒙错了，代价可能是人命。

OncoAgent 的做法完全不同：它只引用权威指南。

具体来说，它只认两本"教科书"：

NCCN 指南（美国国家综合癌症网络发布的临床实践指南）
ESMO 指南（欧洲肿瘤内科学会发布的临床指南）

这两个是什么来头？可以理解为全球肿瘤科医生的"标准答案"。全世界的肿瘤科医生在做治疗决策时，基本都会参考这两份指南。

OncoAgent 的规则很简单：如果在这两份指南里找不到支持你结论的依据，那就不说。

换句话说，它宁可告诉你"这个问题我回答不了，建议咨询专科医生"，也不会编一个看起来很像那么回事的答案。

这种设计在技术上叫 Guideline-grounded RAG（指南锚定的检索增强生成）。用人话解释就是：AI 不是自由发挥写作文，而是开卷考试——只能从指定的参考资料里找答案，不能自己编。

技术上用了什么？

从技术角度看，OncoAgent 的"底子"也很扎实：

LangGraph：一个专门用来搭建多 Agent 工作流的框架，可以让多个 AI 角色有序配合
RAG（检索增强生成）：让 AI 在回答之前先去查资料，而不是纯靠"记忆"回答
推理验证：每次回答都要经过逻辑检验，不是"说得通就行"

值得一提的是，这个项目是在 AMD 开发者黑客松上诞生的，所以底层用了 AMD ROCm + MI300X 来做推理优化。MI300X 是 AMD 的高端 AI 加速芯片，专门用来跑大模型，性能很强。

为什么评委看好它？

在黑客松比赛中，OncoAgent 能脱颖而出，主要赢在四点：

第一，技术够硬。 多 Agent 协作、RAG 检索、推理验证、隐私脱敏，该有的都有。

第二，和赛题高度契合。 既然是 AMD 的比赛，就要求选手展示 AMD 生态的能力，OncoAgent 在这方面做得很到位。

第三，有故事性。 据作者说，这个项目的灵感来自母亲的一次误诊经历。真实的痛点加上技术解决方案，天然就能打动人。

第四，Demo 效果好。 输入一份病例，屏幕上立刻展示出分析过程和分诊建议——这种可视化的效果，比 PPT 有说服力多了。

但我们也得说说它的局限

任何技术项目都不可能完美，OncoAgent 也不例外。有三个问题值得冷静思考：

第一个问题：没有经过真正的临床验证。

在医学领域，一个系统能不能用，不是"看起来合理"就行的。你需要拿出硬指标：

敏感度（Sensitivity）：真有病的人，系统能查出来多少？
特异度（Specificity）：没病的人，系统会不会误报？
误诊率（False Positive Rate）：系统说"有问题"的人里，有多少其实是健康的？

没有这些数据，OncoAgent 目前还只是一个工程原型，离真正的临床应用还有很长的路。

第二个问题：查了资料不代表就靠谱。

很多人会想：AI 都查了权威指南了，应该没问题了吧？

没那么简单。RAG 技术本身也有坑：

检索的时候可能找错了段落
把长文章切成小块的时候（chunking）可能切在了不该切的地方
指南更新了，但系统里的知识库还是旧版本

这些都是实际部署中可能遇到的问题。

第三个问题：法律和合规门槛极高。

如果真要让 OncoAgent 进医院，需要过好几道关：

医疗器械注册认证（在中国是 NMPA，在美国是 FDA）
患者数据隐私合规（比如 HIPAA、GDPR）
大规模临床试验验证

这些都不是一个黑客松项目能在短时间内解决的。

写在最后

OncoAgent 最让人欣赏的地方，不是它的技术有多炫酷，而是它的设计哲学——知道自己不知道什么。

在一个"万物皆可 AI"的时代，太多项目追求的是"AI 什么都能做"。但医疗领域恰恰相反：AI 最重要的能力，不是回答问题，而是知道自己什么时候不该回答。

一个会说"我不知道，建议您咨询专业医生"的 AI，远比一个自信满满却可能误诊的 AI 更值得信赖。

OncoAgent 可能还不是最终答案，但它指出了一个正确的方向：让 AI 做医生的助手，而不是替代者。 在这个方向上，每往前走一步，都可能挽救更多的生命。

参考来源：OncoAgent - Hugging Face