上一篇《一个循证医学框架,串起了我的5个医疗AI Skill》发出来之后,有读者留言——如果叠上真实世界的数据,就会有很大的想象空间。
而真实世界数据,可能就是那双翅膀。光有循证框架,AI会照本宣科;接上真实数据,它有机会像一个见过几百个病人的老医生一样,给出更有价值的判断。
这一篇就来写写我在"医疗AI的真实数据是什么"这件事上,想了什么、做了什么。
以我目前的判断,一个医疗AI产品想真正落地、解决具体的业务问题,绕不开两类数据——
· 关于"人"的数据——又分两层:个人维度(这个人是谁、什么病史、当下什么状态)、群体维度(情况差不多的人,后来都怎么样了)
· 关于"病"的数据——医学指南、循证证据、临床判断规则这些专业知识
下面我会沿着这个分类一层层拆——每一层该怎么留下来、怎么用起来,以及哪一层我自己也暂时碰不到。
01
为什么是这两类——从医生怎么看诊倒推
为什么我会把数据切成"人"和"病"这两类?想一下去医院的样子——
· 医生先跟你聊——最近哪儿不舒服、什么时候开始的、有没有加重,目的是搞清楚你当下到底是什么状态
· 如果是复诊,他会翻你的旧档案——之前的病历、检查报告、用药记录,作为这次判断的基线
· 接着他会调用自己脑子里的医学知识——这十几年学的教材、读过的指南、跟过的病例,全在脑子里
· 还有一层——他回想自己接诊过的同类病人:你这种情况,他过去半年看过的几十个类似病人的相关性
把这四件事拆开看,可以映射到两类数据——
关于"人"的数据:人的当下状态 + 既往档案 + 同类病人的真实结局。前两项是个人维度,最后一项是群体维度。
关于"病"的数据:医生脑子里那部分医学知识——写在教材、指南、文献里等。
追本溯源会发现,在循证医学的奠基论文里有讲过。Sackett 1996 年发在 BMJ 上的文章《Evidence based medicine: what it is and what it isn't》,把循证医学定义成三件事的整合:当前最佳研究证据、医生的临床经验、患者的具体情况与偏好。翻译成数据语言就是——研究证据是"病",临床经验和患者情况是"人"。
美国医学研究院(IOM)2007 年的报告《The Learning Healthcare System》讲得更直白——一个能持续学习的医疗系统,要把三股数据流打通:个人诊疗数据、临床知识、群体真实结局。这三股流落到我前面的分类里,就是"个人 + 病 + 群体"。
这就是医疗领域早就有的共识。我们要做的,是把它翻译成 AI 听得懂的语言。
02
关于"人"的数据,怎么留下来
患者数据这件事,一直在路上。纸质病历——一张张表,写完就归档了。电子病历——数字化了,但本质还是"快照"。碎片化记录——这次问诊一段、下次复诊一段,串不起来。
我一直在想一个问题——AI时代的居民健康档案,该长什么样?
我在 2018 年曾做过一个覆盖亿级用户的健康档案项目——设计了六大类数据模型(生命体征、健康关系、生活环境、生活行为、医疗数据、预测性风险库),构建了几十种健康标签和百余种疾病风险库。架构是很完整的。但其实那本质上还是一张"静态大表"。
后来是搭自己的AI数字分身时得到的启发。
AI助手的记忆系统其实分两种——长期记忆和短期记忆。我顺着这个思路套到健康档案上,发现是同构的。
· 长期记忆——这个人的稳定事实:过敏史、家族史、疾病史
· 短期记忆——这个人的当前状态:"最近两周睡不好"、"这周胃口差"、"上个月体重掉了3斤"
这两层缺一不可——医生看诊本身就是在拿你的稳定背景去对照你此刻的变化。只有背景,看不到你近期出了什么状况;只有此刻,又分不清这是你本来的底色还是新冲出来的问题。
健康档案在存进来的那一刻,就要先把这两层分好。
但在 AI 之前,这件事其实只能做到一半——长期记忆这一层是有地方存的,疾病史、家族史、过往诊断都会沉淀在病历里;短期记忆那一层却始终是悬空的——最近两周睡得怎么样、这周胃口好不好、上个月体重有没有掉,只有你自己知道,没有任何一个地方记得下来。等你去了医院,医生会问,问完写进当次问诊记录——下次复诊时,再问一遍。
所以过去的"个人健康档案",本质上是缺一条腿的——不是产品没设计好,是短期记忆这一层根本没有可沉淀的载体。
AI 时代的机会就在这儿——对话即采集。你跟 AI 聊一句"最近两周睡不好",这句话本身就是一次数据录入,不用填表、不用回忆、也不用等下次问诊。
但对话只是入口——真正决定档案能不能用起来的,是产品要在采集那一刻就把这句话归位:哪些进长期记忆、哪些进短期记忆,时间标在哪、字段挂在哪。这一步,是医疗 AI 产品要专门设计的能力,不是模型默认就会。
做到了这一步,健康档案才能从一张静态病历变成一个动态的记忆系统。
这是个人层面的数据。
还有一种患者数据——群体层面的。和这个患者情况类似的一千个人,吃了同一种药之后,有多少人好转、多少人复发、多少人出了新问题。这种数据叫 RWE(Real-World Evidence,真实世界证据)——它不来自实验室,来自真实诊疗记录、保险理赔库、医院随访数据库。它不排除任何人,反映真实结局。
这层数据极有价值。但对一个做问诊AI的产品来说——碰不到。
医院HIS系统里有、保险理赔库里有、国家队列研究里有。但隔着合规、隐私、跨机构数据治理一整套门槛。技术上不难,难的是拿到访问权限。
所以现实是:个人数据能做、群体数据很难碰。但是先把个人这层做扎实。
03
关于"病"的数据,怎么用起来
医学知识这块的指南、共识、文献等怎么用,在两件事上——
一是格式。这些资产大多是 PDF、长文本、非结构化,不是 AI 能直接调的形态。
二是判断标准。这里需要引入循证医学的一个概念——EBM 证据金字塔:

证据等级越高,越接近"真相"。一篇严谨的系统综述,权重远超过几十篇专家经验帖。这套规则需要从医学界喂给 AI。
这两件事,AI 来做正好对路——让指南从"查得到"变成"调得出":
· 把指南、共识、文献按证据等级建索引,RAG 检索时优先调高等级证据
· 输出建议时,把证据来源和等级一起带出来——是系统综述、是 RCT、还是专家共识,让用户看得到 AI 凭什么这么说
这一块上一篇展开过——循证医学是医疗AI的护城河。一句话总结:让指南从"查得到"变成"调得出、可追溯",是这一代医疗 AI 最该做的事。
04
这两类数据,怎么在 AI 产品里咬合起来
假如这四类数据都齐了,医疗 AI 产品怎么玩转?
回到医生看诊那个画面。医生不是先看人、再翻指南、再分别下结论的——他是边问边想、边想边查,把"你是谁""你现在怎么样""医学上对你这种情况是什么共识"揉在一起,给一个判断。
医疗 AI 产品要复刻的,就是这个揉合动作。
举个例子——还是上一篇那个肝移植术后的张先生。系统检测到他这次复查的 ALT 从 60 升到 95,需要给医生一个判断建议。
· 调人·长期记忆:他术后 3 个月、用的是他克莫司 + 吗替麦考酚酯方案
· 调人·短期记忆:这两周他在 AI 助手里聊到"感觉恢复得差不多了,是不是可以少吃一点"——这条就是"对话即采集"刚刚补进去的
· 调人·群体真实结局(RWE):这家中心过去几百例肝移植术后患者里,术后 3 个月出现 ALT 波动 + 依从性下滑的人,最后多少演变成了排斥反应?多少在调整随访频次后回归正常?
· 调病那一侧:当前 EBM 指南对"他克莫司浓度异常 + 依从性差"的标准建议是什么
最后把四股数据合到一起出答案——医生侧建议把张先生的随访频次从两周一次调到每周一次,重点关注用药纪律;患者侧 AI 助手顺手给他开了用药定时提醒,附一张科普卡片,提醒他术后 3 个月恰是依从性疲劳的高发期,免疫抑制剂擅自减量会显著抬高排斥反应风险。
每条建议背后既挂着指南证据,也挂着几百个相似患者走过的真实路径。
人 × 病一起进决策——这才是医疗 AI 跟通用 AI 本质的差别。通用 AI 看到的是一段症状叙述,医疗 AI 看到的是一个肝移植术后 3 个月的具体患者,背后还跟着几百个张先生走过的路径。
也只有走到这一步,前面那句"对话即采集"才算真落到地上——他随口聊出的那句"是不是可以少吃一点",下一次就能立刻进决策、进干预,而不是变成又一段没人读的笔记。
上一篇讲的 PICO 框架(异常预警 → 用药速查 → 依从性分析 → 随访计划),其实就是这套数据流之上的编排逻辑。框架告诉 AI 该按什么顺序问问题,数据告诉 AI 每一步问出来的答案在哪。两篇拼到一起,才是医疗 AI 的完整骨架。
05
医疗行业的特殊性——为什么这件事比其他行业难
写到这里得诚实一点。
如果是做电商推荐、做内容分发,数据采集和使用的闭环可以很快跑通。但医疗不行。
隐私合规——健康数据是最敏感的个人信息,采集、存储、使用每一步都有法规约束。
数据孤岛——每家医院各自一套系统,一个人在A医院的诊疗记录,B医院看不到,AI产品更看不到。
群体数据的结构性门槛——上面说的RWE,早就有人在做。受限于权限、安全、医疗、公益等考量,这层数据的访问权是最难的,并不是技术问题。
所以我自己想做的版本,大概率是这个状态:
· 个人数据 ✅ 能做——把长期/短期记忆分层做对,让健康档案从静态走向动态
· 医学知识 ✅ 能做——把指南调用做扎实,让证据等级显式标注
· 群体真实结局 ⬜ 暂时碰不到——先承认它的价值,知道将来该补什么
知道自己缺什么其实也有价值。
医疗AI的"真实数据"就是这两类——关于人的,和关于病的。留得下、用得起来,才叫真有数据。
其中关于人的那一类,还有一层群体数据,价值极高但门槛也极高。难的不在技术,而是要拿到访问权这一关——做产品架构的时候知道它在那儿,留好将来接入的口子就行。
上一篇说,循证医学是地基。这一篇想补一句——个人健康档案是四面墙,群体数据是屋顶。墙先砌好,屋顶的事交给时间和政策。
我先把自己能砌的墙砌好——你觉得医疗AI现在最该补的,是哪一块?
我是老贺,医疗健康+供应链双行业产品人。
正在用 AI 搭建数字分身,把干过的活沉淀成方法论。
END
夜雨聆风