给医疗AI插上翅膀——引入真实世界数据

上一篇《一个循证医学框架，串起了我的5个医疗AI Skill》发出来之后，有读者留言——如果叠上真实世界的数据，就会有很大的想象空间。

而真实世界数据，可能就是那双翅膀。光有循证框架，AI会照本宣科；接上真实数据，它有机会像一个见过几百个病人的老医生一样，给出更有价值的判断。

这一篇就来写写我在"医疗AI的真实数据是什么"这件事上，想了什么、做了什么。

以我目前的判断，一个医疗AI产品想真正落地、解决具体的业务问题，绕不开两类数据——

· 关于"人"的数据——又分两层：个人维度（这个人是谁、什么病史、当下什么状态）、群体维度（情况差不多的人，后来都怎么样了）

· 关于"病"的数据——医学指南、循证证据、临床判断规则这些专业知识

下面我会沿着这个分类一层层拆——每一层该怎么留下来、怎么用起来，以及哪一层我自己也暂时碰不到。

为什么是这两类——从医生怎么看诊倒推

为什么我会把数据切成"人"和"病"这两类？想一下去医院的样子——

· 医生先跟你聊——最近哪儿不舒服、什么时候开始的、有没有加重，目的是搞清楚你当下到底是什么状态

· 如果是复诊，他会翻你的旧档案——之前的病历、检查报告、用药记录，作为这次判断的基线

· 接着他会调用自己脑子里的医学知识——这十几年学的教材、读过的指南、跟过的病例，全在脑子里

· 还有一层——他回想自己接诊过的同类病人：你这种情况，他过去半年看过的几十个类似病人的相关性

把这四件事拆开看，可以映射到两类数据——

关于"人"的数据：人的当下状态 + 既往档案 + 同类病人的真实结局。前两项是个人维度，最后一项是群体维度。

关于"病"的数据：医生脑子里那部分医学知识——写在教材、指南、文献里等。

追本溯源会发现，在循证医学的奠基论文里有讲过。Sackett 1996 年发在 BMJ 上的文章《Evidence based medicine: what it is and what it isn't》，把循证医学定义成三件事的整合：当前最佳研究证据、医生的临床经验、患者的具体情况与偏好。翻译成数据语言就是——研究证据是"病"，临床经验和患者情况是"人"。

美国医学研究院（IOM）2007 年的报告《The Learning Healthcare System》讲得更直白——一个能持续学习的医疗系统，要把三股数据流打通：个人诊疗数据、临床知识、群体真实结局。这三股流落到我前面的分类里，就是"个人 + 病 + 群体"。

这就是医疗领域早就有的共识。我们要做的，是把它翻译成 AI 听得懂的语言。

关于"人"的数据，怎么留下来

患者数据这件事，一直在路上。纸质病历——一张张表，写完就归档了。电子病历——数字化了，但本质还是"快照"。碎片化记录——这次问诊一段、下次复诊一段，串不起来。

我一直在想一个问题——AI时代的居民健康档案，该长什么样？

我在 2018 年曾做过一个覆盖亿级用户的健康档案项目——设计了六大类数据模型（生命体征、健康关系、生活环境、生活行为、医疗数据、预测性风险库），构建了几十种健康标签和百余种疾病风险库。架构是很完整的。但其实那本质上还是一张"静态大表"。

后来是搭自己的AI数字分身时得到的启发。

AI助手的记忆系统其实分两种——长期记忆和短期记忆。我顺着这个思路套到健康档案上，发现是同构的。

· 长期记忆——这个人的稳定事实：过敏史、家族史、疾病史

· 短期记忆——这个人的当前状态："最近两周睡不好"、"这周胃口差"、"上个月体重掉了3斤"

这两层缺一不可——医生看诊本身就是在拿你的稳定背景去对照你此刻的变化。只有背景，看不到你近期出了什么状况；只有此刻，又分不清这是你本来的底色还是新冲出来的问题。

健康档案在存进来的那一刻，就要先把这两层分好。

但在 AI 之前，这件事其实只能做到一半——长期记忆这一层是有地方存的，疾病史、家族史、过往诊断都会沉淀在病历里；短期记忆那一层却始终是悬空的——最近两周睡得怎么样、这周胃口好不好、上个月体重有没有掉，只有你自己知道，没有任何一个地方记得下来。等你去了医院，医生会问，问完写进当次问诊记录——下次复诊时，再问一遍。

所以过去的"个人健康档案"，本质上是缺一条腿的——不是产品没设计好，是短期记忆这一层根本没有可沉淀的载体。

AI 时代的机会就在这儿——对话即采集。你跟 AI 聊一句"最近两周睡不好"，这句话本身就是一次数据录入，不用填表、不用回忆、也不用等下次问诊。

但对话只是入口——真正决定档案能不能用起来的，是产品要在采集那一刻就把这句话归位：哪些进长期记忆、哪些进短期记忆，时间标在哪、字段挂在哪。这一步，是医疗 AI 产品要专门设计的能力，不是模型默认就会。

做到了这一步，健康档案才能从一张静态病历变成一个动态的记忆系统。

这是个人层面的数据。

还有一种患者数据——群体层面的。和这个患者情况类似的一千个人，吃了同一种药之后，有多少人好转、多少人复发、多少人出了新问题。这种数据叫 RWE（Real-World Evidence，真实世界证据）——它不来自实验室，来自真实诊疗记录、保险理赔库、医院随访数据库。它不排除任何人，反映真实结局。

这层数据极有价值。但对一个做问诊AI的产品来说——碰不到。

医院HIS系统里有、保险理赔库里有、国家队列研究里有。但隔着合规、隐私、跨机构数据治理一整套门槛。技术上不难，难的是拿到访问权限。

所以现实是：个人数据能做、群体数据很难碰。但是先把个人这层做扎实。

关于"病"的数据，怎么用起来

医学知识这块的指南、共识、文献等怎么用，在两件事上——

一是格式。这些资产大多是 PDF、长文本、非结构化，不是 AI 能直接调的形态。

二是判断标准。这里需要引入循证医学的一个概念——EBM 证据金字塔：

证据等级越高，越接近"真相"。一篇严谨的系统综述，权重远超过几十篇专家经验帖。这套规则需要从医学界喂给 AI。

这两件事，AI 来做正好对路——让指南从"查得到"变成"调得出"：

· 把指南、共识、文献按证据等级建索引，RAG 检索时优先调高等级证据

· 输出建议时，把证据来源和等级一起带出来——是系统综述、是 RCT、还是专家共识，让用户看得到 AI 凭什么这么说

这一块上一篇展开过——循证医学是医疗AI的护城河。一句话总结：让指南从"查得到"变成"调得出、可追溯"，是这一代医疗 AI 最该做的事。

这两类数据，怎么在 AI 产品里咬合起来

假如这四类数据都齐了，医疗 AI 产品怎么玩转？

回到医生看诊那个画面。医生不是先看人、再翻指南、再分别下结论的——他是边问边想、边想边查，把"你是谁""你现在怎么样""医学上对你这种情况是什么共识"揉在一起，给一个判断。

医疗 AI 产品要复刻的，就是这个揉合动作。

举个例子——还是上一篇那个肝移植术后的张先生。系统检测到他这次复查的 ALT 从 60 升到 95，需要给医生一个判断建议。

· 调人·长期记忆：他术后 3 个月、用的是他克莫司 + 吗替麦考酚酯方案

· 调人·短期记忆：这两周他在 AI 助手里聊到"感觉恢复得差不多了，是不是可以少吃一点"——这条就是"对话即采集"刚刚补进去的

· 调人·群体真实结局（RWE）：这家中心过去几百例肝移植术后患者里，术后 3 个月出现 ALT 波动 + 依从性下滑的人，最后多少演变成了排斥反应？多少在调整随访频次后回归正常？

· 调病那一侧：当前 EBM 指南对"他克莫司浓度异常 + 依从性差"的标准建议是什么

最后把四股数据合到一起出答案——医生侧建议把张先生的随访频次从两周一次调到每周一次，重点关注用药纪律；患者侧 AI 助手顺手给他开了用药定时提醒，附一张科普卡片，提醒他术后 3 个月恰是依从性疲劳的高发期，免疫抑制剂擅自减量会显著抬高排斥反应风险。

每条建议背后既挂着指南证据，也挂着几百个相似患者走过的真实路径。

人 × 病一起进决策——这才是医疗 AI 跟通用 AI 本质的差别。通用 AI 看到的是一段症状叙述，医疗 AI 看到的是一个肝移植术后 3 个月的具体患者，背后还跟着几百个张先生走过的路径。

也只有走到这一步，前面那句"对话即采集"才算真落到地上——他随口聊出的那句"是不是可以少吃一点"，下一次就能立刻进决策、进干预，而不是变成又一段没人读的笔记。

上一篇讲的 PICO 框架（异常预警 → 用药速查 → 依从性分析 → 随访计划），其实就是这套数据流之上的编排逻辑。框架告诉 AI 该按什么顺序问问题，数据告诉 AI 每一步问出来的答案在哪。两篇拼到一起，才是医疗 AI 的完整骨架。

医疗行业的特殊性——为什么这件事比其他行业难

写到这里得诚实一点。

如果是做电商推荐、做内容分发，数据采集和使用的闭环可以很快跑通。但医疗不行。

隐私合规——健康数据是最敏感的个人信息，采集、存储、使用每一步都有法规约束。

数据孤岛——每家医院各自一套系统，一个人在A医院的诊疗记录，B医院看不到，AI产品更看不到。

群体数据的结构性门槛——上面说的RWE，早就有人在做。受限于权限、安全、医疗、公益等考量，这层数据的访问权是最难的，并不是技术问题。

所以我自己想做的版本，大概率是这个状态：

· 个人数据 ✅ 能做——把长期/短期记忆分层做对，让健康档案从静态走向动态

· 医学知识 ✅ 能做——把指南调用做扎实，让证据等级显式标注

· 群体真实结局 ⬜ 暂时碰不到——先承认它的价值，知道将来该补什么

知道自己缺什么其实也有价值。

医疗AI的"真实数据"就是这两类——关于人的，和关于病的。留得下、用得起来，才叫真有数据。

其中关于人的那一类，还有一层群体数据，价值极高但门槛也极高。难的不在技术，而是要拿到访问权这一关——做产品架构的时候知道它在那儿，留好将来接入的口子就行。

上一篇说，循证医学是地基。这一篇想补一句——个人健康档案是四面墙，群体数据是屋顶。墙先砌好，屋顶的事交给时间和政策。

我先把自己能砌的墙砌好——你觉得医疗AI现在最该补的，是哪一块？

我是老贺，医疗健康+供应链双行业产品人。
正在用 AI 搭建数字分身，把干过的活沉淀成方法论。

END