如果你去过医院,你可能有过这样的疑问:为什么一种药在临床试验中表现优异,到了现实中却未必如此?
答案可能比你想象的复杂。临床试验往往在高度控制的环境下进行,受试者经过严格筛选,而真实世界里的患者情况千差万别。于是,"真实世界证据"(RWE)应运而生——它用患者在实际诊疗中产生的数据来补充甚至替代传统临床试验,帮助决策者更全面地评估医疗干预的效果。
而现在,人工智能正在让这个过程发生根本性的改变。
一、什么是真实世界证据?为什么它如此重要?
要理解这个话题,我们首先需要搞清一个核心概念:真实世界数据(RWD)和真实世界证据(RWE)是什么关系?
简单来说,真实世界数据就像是"原材料"——它来自电子病历、医保理赔、可穿戴设备、患者登记系统等各种来源。而真实世界证据,则是将这些原材料经过科学分析后产出的"成品",用于支持医疗决策、药品审批和医保支付。
为什么它重要?举个例子:一种新药在批准上市后,监管机构和医保部门需要知道它在更大、更多样化人群中的真实表现。这时候,等上几年再做传统临床试验已经来不及了——RWE能更快地提供答案。
美国FDA早在2018年就发布了真实世界证据框架,支持用RWE来拓展已批准药物的适应症。此后,欧洲、日本、中国等国家和地区都相继出台了相关政策。到了2026年,RWE已经从"锦上添花"变成了医疗决策的标准工具。
二、AI如何改变RWE的生产方式?
传统上,将真实世界数据转化为证据是一个耗时、费力且容易出错的过程。研究人员需要手动清洗数据、选择分析方法、排除干扰因素,每一个环节都需要大量的专业判断。
人工智能的介入,正在三个关键维度上带来变化:
第一,数据预处理的自动化。真实世界数据通常是"脏"的——缺失值、编码不一致、非结构化文本混杂其中。AI模型(尤其是自然语言处理技术)能够自动识别和纠正这些问题,将原本需要数周的数据清洗工作缩短到数小时。
第二,因果推断的增强。RWE研究最大的科学挑战在于因果推断——如何在非随机化的数据中区分"因为用药而好转"和"碰巧好转了"。AI辅助的方法,如目标试验模拟(target trial emulation)和机器学习倾向性评分,正在让因果推断变得更加严谨和可重复。
第三,证据生成的加速。当数据处理和分析环节被AI提速后,从提出问题到产出证据的整个周期被大幅压缩。据业界估计,AI辅助的RWE项目可以将传统流程的时间缩短30%至50%,对于紧急公共卫生问题(如新出现的传染病),这种速度可能是生死攸关的。
三、机遇背后的挑战:更快不等于更好
然而,硬币的另一面同样值得关注。
数据质量是首要问题。"垃圾进,垃圾出"——如果输入AI模型的真实世界数据本身存在系统性偏差(例如只来自大型三甲医院,忽略了基层医疗机构),那么AI产出的证据再快也是不可靠的。这要求我们在追求效率的同时,必须坚守数据治理的底线。
可解释性是不可妥协的要求。当AI辅助的证据被用于药品审批或医保支付决策时,决策者和患者有权知道结论是如何得出的。"黑箱"模型在科研探索阶段或许可以接受,但在监管场景中必须提供透明的推理路径。
隐私保护是永远的底线。真实世界数据涉及大量个人健康信息,AI模型的训练和推理过程必须严格遵守数据保护法规。近年来,联邦学习、差分隐私等技术的发展为这一问题提供了新的解决思路——让模型"走到数据身边",而不是让数据"搬到模型那边"。
四、展望未来:RWE与AI的共同进化
从更宏观的视角看,AI与真实世界证据的结合,反映的是医疗行业一个更深层的趋势:从经验驱动到数据驱动的转型。
过去,医疗决策很大程度上依赖专家经验和有限的试验数据。未来,随着真实世界数据的积累和AI分析能力的提升,我们将看到一个更加动态、更加个性化的证据生态系统——新药在上市后就能持续产生真实世界证据,这些证据反过来又指导临床实践和医保支付,形成一个不断迭代、不断优化的闭环。
对于中国的医疗健康行业来说,这是一个不容错过的机遇。中国拥有全球最庞大的患者群体和日益完善的电子病历体系,如果能将数据基础设施和AI分析能力结合起来,完全有可能在全球RWE领域发出独特的声音。
当然,这条路还很长。数据标准的统一、隐私保护的强化、专业人才的培养,每一项都是需要持续投入的系统工程。但方向是对的,步伐也在加快。
当AI真正走进真实世界研究,受益的不仅是制药公司和监管机构,更是每一位期待更好治疗的患者。
夜雨聆风