你有没有想过一个问题:如果一个 AI 告诉你"你可能得了癌症",你敢信吗?
更可怕的是,如果它说得特别自信,条条有理,你可能真的就信了——哪怕它是错的。
这不是科幻电影里的情节。过去几年,已经有不少医疗 AI 产品闹出过类似的乌龙。它们的问题不是"不够聪明",而是太自信了,自信到不知道自己什么时候该闭嘴。
最近,一个叫 OncoAgent 的项目,给出了一个不太一样的解法。
它不是来"看病"的
先说清楚一件事:OncoAgent 不是一个"AI 医生"。它不会告诉你"你得了什么病",也不会给你开药方。
它的定位是肿瘤辅助分诊系统。
什么叫分诊?你去医院挂急诊,门口有个护士会先看看你的情况,判断你应该去内科还是外科,应该马上抢救还是排队等着——这个过程就叫分诊。
OncoAgent 做的事情类似:当医生输入一份病例信息后,它会帮忙分析这个病例可能涉及哪个肿瘤方向,给出初步的分诊建议,但最终的判断权始终在医生手里。
这个定位本身就很有自知之明。
三个"AI 医生"轮流把关
OncoAgent 的内部架构,说白了就是三个 AI 角色轮流干活,像一个小型会诊团队:
第一个角色:分诊台(Router Agent)
它的任务是"接诊"。拿到病例后,先做两件事:
把病人的隐私信息脱敏处理(专业术语叫 Zero-PHI,就是把姓名、身份证号这些全部抹掉)
判断这个病例应该交给哪个方向的专家来分析
就像你去医院,分诊台护士先问你"哪里不舒服",然后告诉你去几楼几号诊室。
第二个角色:专科医生(Specialist Agent)
这是真正干活的角色。它会:
仔细分析病例里的各种信息
去查权威的医学知识库,看看有没有匹配的临床指南
综合各种证据,给出分析意见
第三个角色:审核专家(Critic Agent)
这是最关键的角色。它不看病历,专门检查前一个"医生"说的对不对。
它会做一件很重要的事:Reflexion(自我反思)。简单说就是——你说的每一句话,有没有权威文献支撑?如果你是瞎猜的,那就打回去重来。
这种"自己检查自己"的机制,在 AI 领域叫 self-check,目的就是防止 AI 产生"幻觉"——也就是一本正经地胡说八道。
三个角色配合起来,形成了一个完整的工作流程:先分诊、再分析、最后审查。这在 AI 领域有个专业说法叫 Planner → Solver → Critic 架构,OncoAgent 把它做成了医疗版。
最聪明的设计:学会说"我不知道"
这才是 OncoAgent 真正让人眼前一亮的地方。
很多医疗 AI 的逻辑是:你问我,我就得给你一个答案。不管对不对,先说了再说。这就像一个学生考试,不会做的题也要蒙一个答案——万一蒙对了呢?
但医疗不是考试。蒙错了,代价可能是人命。
OncoAgent 的做法完全不同:它只引用权威指南。
具体来说,它只认两本"教科书":
NCCN 指南(美国国家综合癌症网络发布的临床实践指南)
ESMO 指南(欧洲肿瘤内科学会发布的临床指南)
这两个是什么来头?可以理解为全球肿瘤科医生的"标准答案"。全世界的肿瘤科医生在做治疗决策时,基本都会参考这两份指南。
OncoAgent 的规则很简单:如果在这两份指南里找不到支持你结论的依据,那就不说。
换句话说,它宁可告诉你"这个问题我回答不了,建议咨询专科医生",也不会编一个看起来很像那么回事的答案。
这种设计在技术上叫 Guideline-grounded RAG(指南锚定的检索增强生成)。用人话解释就是:AI 不是自由发挥写作文,而是开卷考试——只能从指定的参考资料里找答案,不能自己编。
技术上用了什么?
从技术角度看,OncoAgent 的"底子"也很扎实:
LangGraph:一个专门用来搭建多 Agent 工作流的框架,可以让多个 AI 角色有序配合
RAG(检索增强生成):让 AI 在回答之前先去查资料,而不是纯靠"记忆"回答
推理验证:每次回答都要经过逻辑检验,不是"说得通就行"
值得一提的是,这个项目是在 AMD 开发者黑客松上诞生的,所以底层用了 AMD ROCm + MI300X 来做推理优化。MI300X 是 AMD 的高端 AI 加速芯片,专门用来跑大模型,性能很强。
为什么评委看好它?
在黑客松比赛中,OncoAgent 能脱颖而出,主要赢在四点:
第一,技术够硬。 多 Agent 协作、RAG 检索、推理验证、隐私脱敏,该有的都有。
第二,和赛题高度契合。 既然是 AMD 的比赛,就要求选手展示 AMD 生态的能力,OncoAgent 在这方面做得很到位。
第三,有故事性。 据作者说,这个项目的灵感来自母亲的一次误诊经历。真实的痛点加上技术解决方案,天然就能打动人。
第四,Demo 效果好。 输入一份病例,屏幕上立刻展示出分析过程和分诊建议——这种可视化的效果,比 PPT 有说服力多了。
但我们也得说说它的局限
任何技术项目都不可能完美,OncoAgent 也不例外。有三个问题值得冷静思考:
第一个问题:没有经过真正的临床验证。
在医学领域,一个系统能不能用,不是"看起来合理"就行的。你需要拿出硬指标:
敏感度(Sensitivity):真有病的人,系统能查出来多少?
特异度(Specificity):没病的人,系统会不会误报?
误诊率(False Positive Rate):系统说"有问题"的人里,有多少其实是健康的?
没有这些数据,OncoAgent 目前还只是一个工程原型,离真正的临床应用还有很长的路。
第二个问题:查了资料不代表就靠谱。
很多人会想:AI 都查了权威指南了,应该没问题了吧?
没那么简单。RAG 技术本身也有坑:
检索的时候可能找错了段落
把长文章切成小块的时候(chunking)可能切在了不该切的地方
指南更新了,但系统里的知识库还是旧版本
这些都是实际部署中可能遇到的问题。
第三个问题:法律和合规门槛极高。
如果真要让 OncoAgent 进医院,需要过好几道关:
医疗器械注册认证(在中国是 NMPA,在美国是 FDA)
患者数据隐私合规(比如 HIPAA、GDPR)
大规模临床试验验证
这些都不是一个黑客松项目能在短时间内解决的。
写在最后
OncoAgent 最让人欣赏的地方,不是它的技术有多炫酷,而是它的设计哲学——知道自己不知道什么。
在一个"万物皆可 AI"的时代,太多项目追求的是"AI 什么都能做"。但医疗领域恰恰相反:AI 最重要的能力,不是回答问题,而是知道自己什么时候不该回答。
一个会说"我不知道,建议您咨询专业医生"的 AI,远比一个自信满满却可能误诊的 AI 更值得信赖。
OncoAgent 可能还不是最终答案,但它指出了一个正确的方向:让 AI 做医生的助手,而不是替代者。 在这个方向上,每往前走一步,都可能挽救更多的生命。
参考来源:OncoAgent - Hugging Face
夜雨聆风