
AI读病历,读的不是文字,是时间
一份病历,平均包含几十个缩写、十几种单位、数百个数值。医生读它需要训练五年以上。AI读它,需要的不是更快的眼睛,而是一种完全不同的「理解方式」。这件事比你想象的更难,也比你想象的更接近成真。
先说一个让很多人意外的事实:电子病历并不是为了「被读」而设计的。它最初的目的是计费和存档。美国推行电子病历系统的核心驱动力,是2009年的《经济复苏法案》里一条关于医疗报销的附加条款。换句话说,电子病历的格式逻辑,是按照保险公司的需求设计的,不是按照临床诊断的需求设计的。这个历史背景,解释了为什么后来AI读病历会这么难。
病历里藏着一种特殊的「语言」
打开一份真实的病历,你会看到这样的句子:「Pt c/o SOB x3d, hx of CHF, on Lasix 40mg QD, O2 sat 88% RA。」这不是英语,是医学速记。翻译过来是:「患者主诉呼吸急促三天,有充血性心衰病史,正在服用每日一次40毫克呋塞米,室内空气下血氧饱和度88%。」每一个缩写背后都有语境,同一个缩写在不同科室可能意思完全不同。「MS」在神经科是多发性硬化,在产科是硫酸镁,在精神科是精神状态。这种高度依赖上下文的语言,是AI面对病历时遇到的第一道真正的门槛。
●病历不是给机器读的,它是给同行读的——默认对方有相同的训练背景、相同的临床直觉、相同的隐性知识储备。
AI是怎么「学」读病历的
目前主流的方法,是用大规模预训练语言模型做底座,然后在医疗文本上做领域微调。听起来简单,但魔鬼在细节里。医疗文本的获取本身就是一场持久战:隐私保护、机构壁垒、数据格式不统一,每一项都是真实的工程障碍。斯坦福医学院曾经花了两年时间,才把院内的电子病历整理成一个可以用于训练的数据集。两年,只是「整理」。
但更有意思的挑战不是数据量,而是数据的时间结构。一份病历不是一篇文章,它是一段时间线。入院记录、每日查房记录、检验结果、影像报告、手术记录、出院小结——这些文本之间的关系,是时序的、因果的、递进的。读病历本质上是在重建一段疾病演变的历史。普通的语言模型擅长处理「一段话里的关系」,但处理「几十份文档跨越几个月的关系」,这是不同量级的问题。
30%
临床医生平均花在病历录入和阅读上的时间占比,这些时间本可以用于面对面诊疗
真正有价值的不是「读懂」,而是「发现」
AI读病历,最直接的用途是减少医生的文书负担。自动生成出院小结、自动提取关键诊断、自动标记药物相互作用——这些已经在一些医院系统里部分落地了。但这只是第一层价值,也是最容易被替代的那层。
更深的价值在于:人类医生读病历是线性的,AI可以是全局的。一个医生接诊新患者,通常只会重点看最近几次就诊记录。十年前的一次检验异常,很可能被忽略。但对于某些慢性病的早期预警,恰恰那条被忽略的数据才是关键线索。AI不会因为「这条记录太旧了」就跳过它。梅奥诊所曾经做过一个回顾性研究,用AI重新分析了一批心脏骤停患者的历史病历,发现其中相当比例的患者,在事件发生前6到24小时内,病历里已经出现了可识别的预警信号——但当时没有人把这些信号串联起来。
「
医疗错误很少来自单一的失误,更多来自信息没有被正确连接。
」
一个没人愿意公开谈的问题
AI读病历有一个结构性的困境:它越准确,就越容易被过度信任。医疗决策里有一个概念叫「自动化偏误」——当一个系统给出建议时,人类操作者会倾向于接受它,即使他们自己的判断本来是正确的。航空业在引入自动驾驶后研究过这个问题,结论是:工具越好用,飞行员的手动操作能力退化越快。医疗领域面临同样的风险。如果AI读病历的能力越来越强,年轻医生会不会逐渐失去自己独立分析病历的能力?这不是反技术的抱怨,这是一个需要提前设计答案的系统性问题。
另一个被低估的问题是偏差的放大。AI是从历史数据里学习的,而历史医疗数据里充满了系统性偏差——某些族裔的患者被记录的信息更少,某些症状在特定人群里被长期误诊,这些偏差一旦被模型学进去,就会以「客观算法」的面目出现,比人类偏见更难被质疑。
现在到了哪一步
坦率地说,AI读病历目前最成熟的应用,还集中在结构化任务上:提取、分类、标注、匹配。真正意义上的「理解」——理解一个患者的疾病叙事,理解症状背后的生活背景,理解一个家庭在反复就诊背后的真实困境——这些还远没有到来。不是因为算法不够聪明,而是因为这些信息本来就没有被完整地写进病历。病历记录的是医学事实,不是人的故事。
但即便只是在结构化任务上做好,影响已经足够大。一个能在30秒内提取患者10年用药史的系统,一个能在夜班时自动标记高风险患者的工具,一个能帮助全科医生快速识别专科转诊指征的助手——这些不性感,但真实有用。医疗的进步,从来都不只靠那些发论文的突破,更多靠的是这些让日常工作少出错一点的小工具。
✦ 小结
AI读病历,本质上是在做一件人类医生每天都在做但做得不够好的事:把散落在时间线上的信息碎片,重新组织成一个完整的患者图景。技术障碍是真实的,偏差风险是真实的,对医生能力的潜在侵蚀也是真实的。但最值得关注的,或许不是AI能不能读懂病历,而是:我们有没有想清楚,我们希望它读出什么。
夜雨聆风