在临床科研中,很多医生做真实世界研究时,常见流程是:收集数据、分组、做倾向评分匹配、跑 Cox 回归、得出 HR,然后写论文。
但问题是:为什么有些真实世界研究只能发普通期刊,而有些能发 Nature Medicine?
这篇 Nature Medicine 文章《Cardiovascular outcomes of semaglutide and tirzepatide for patients with type 2 diabetes in clinical practice》非常适合作为临床医生学习高阶真实世界研究的模板。它研究的问题很直接:在真实临床环境中,2 型糖尿病合并肥胖或心血管风险患者,使用替尔泊肽和司美格鲁肽,谁的心血管结局更好?
一、研究问题模板:先问“能不能公平比较”
这篇文章没有简单比较“替尔泊肽使用者”和“司美格鲁肽使用者”,而是采用了更高级的研究思路:
第一步:模拟已有随机临床试验。作者先模拟 SUSTAIN-6 和 SURPASS-CVOT,验证真实世界数据库和统计方法是否能复现临床试验结果。
第二步:扩展到真实临床人群。在方法可信后,再分析更广泛、更复杂的真实世界患者。
第三步:进行头对头比较。最后才比较替尔泊肽和司美格鲁肽的真实世界心血管结局。
这给临床医生一个重要启发:
高质量 RWE 研究不是直接问“哪个药更好”,而是先设计一个尽可能接近随机试验的比较框架。
二、数据设计模板:大样本不是重点,基线信息完整才是重点
这篇研究使用多个美国大型保险理赔数据库,纳入数十万例患者。但真正值得学习的不是样本量大,而是数据结构严谨。
作者要求患者在入组前有足够长的基线观察期,用来识别既往疾病、合并用药和心血管风险。
临床医生做类似研究时,数据表至少应包括 4 类变量:
1. 人口学变量
年龄、性别、BMI、吸烟、饮酒、地区、医保类型或就诊来源。
2. 疾病和合并症
糖尿病病程、HbA1c、既往心梗、卒中、心衰、慢性肾病、高血压、血脂异常。
3. 合并用药
二甲双胍、SGLT2 抑制剂、DPP-4 抑制剂、胰岛素、他汀、ACEI/ARB、抗血小板药物。
4. 结局和随访
心肌梗死、卒中、全因死亡、心衰住院、HbA1c 变化、体重变化、停药、换药、不良反应。
一句话总结:
真实世界研究不是“病例越多越好”,而是“治疗前、治疗中、治疗后”的信息链条越完整越好。
三、对照组模板:优先使用 active-comparator new-user design
这篇文章最值得临床医生学习的设计是:
active-comparator new-user design,主动对照新使用者设计。
也就是说,比较对象不是“用药者 vs 不用药者”,而是:
首次使用 A 药的患者 vs 首次使用 B 药的患者。
这种设计可以减少治疗适应证偏倚。因为两组患者都处在“需要强化治疗”的临床场景中,可比性更强。
模板:
研究对象:2 型糖尿病合并肥胖患者。
暴露组:首次使用替尔泊肽。
对照组:首次使用司美格鲁肽。
基线窗口:用药前 6–12 个月。
随访起点:首次处方或首次给药日期。
主要终点:MACE:心肌梗死、卒中、全因死亡。
次要终点:心衰住院、HbA1c、体重、BMI、eGFR、停药率和胃肠道不良反应。
四、统计方法模板:PSM 只是第一步
这篇文章使用了倾向评分匹配,但并没有把 PSM 当成唯一方法。
核心统计思路包括:
使用 logistic 回归构建倾向评分模型。 纳入年龄、性别、BMI、HbA1c、既往 ASCVD、心衰、CKD、合并用药等变量。 采用 1:1 最近邻匹配或 IPTW。 使用 SMD 判断匹配后平衡性。 SMD <0.10 通常认为两组基线平衡较好。 匹配后再进行结局分析。 最后用敏感性分析验证结果稳健性。
临床医生需要特别注意:
PSM 只能平衡“已经测量到的混杂因素”,不能解决没有记录的生活方式、经济能力、医生偏好和患者依从性问题。
所以,做完 PSM 不是终点,而是高质量真实世界研究的起点。
五、结局分析模板:不要只报告 HR
很多临床论文只报告 HR 和 P 值,但这篇文章同时关注:
相对风险:HR 绝对风险:1 年事件发生率 风险差:两组之间绝对差异 竞争风险:如死亡对非死亡结局的影响 敏感性分析:不同假设下结果是否一致
这对临床解读非常重要。
例如,文章中替尔泊肽 vs 司美格鲁肽的主要心血管复合终点 HR 接近 1,提示两者在 1 年主要心血管结局方面没有明显差异。
这说明:
替尔泊肽减重和降糖更强,并不必然意味着 1 年内 MACE 风险更低。
对于临床医生,真正有价值的不是只看“哪个药更强”,而是要看:
强在哪个终点? 随访多久? 患者是哪类人群? 绝对风险下降有多大? 是否有统计学和临床意义?
六、敏感性分析模板:让结果更可信
高质量真实世界研究必须回答审稿人最关心的问题:
你的结果是不是由偏倚造成的?
因此,建议至少设计以下敏感性分析:
1. As-treated 分析
按患者实际用药持续时间分析。
2. Intention-to-treat-like 分析
按初始分组分析,模拟随机试验思路。
3. 排除早期事件
减少反向因果或既往疾病影响。
4. 限制完整数据人群
例如只纳入 HbA1c、BMI、eGFR 完整者。
5. 改变停药定义
如 30 天、60 天、90 天无处方续开分别定义为停药。
6. 亚组分析
按 ASCVD、CKD、心衰、BMI、年龄、性别、SGLT2i 合用情况分层。
一句话总结:
敏感性分析不是附属内容,而是 RWE 研究能否被相信的关键。
七、可直接套用的科研方案模板
研究题目
《替尔泊肽与司美格鲁肽在 2 型糖尿病合并肥胖患者中心血管结局的真实世界比较研究》
研究类型
多中心回顾性队列研究;目标试验模拟设计。
研究对象
2 型糖尿病合并超重或肥胖患者。
入组标准
年龄 ≥18 岁; 明确诊断 2 型糖尿病; BMI 符合超重或肥胖标准; 首次使用替尔泊肽或司美格鲁肽; 用药前有 6–12 个月基线资料。
排除标准
既往同时使用两种研究药物; 关键基线变量严重缺失; 随访时间过短; 妊娠; 终末期疾病或研究者认为不适合纳入者。
暴露定义
首次处方或首次给药日期作为 index date。
主要终点
MACE:心肌梗死、卒中、全因死亡复合终点。
次要终点
心衰住院、HbA1c 变化、体重变化、BMI 变化、eGFR 变化、停药率、换药率、胃肠道不良反应。
主要统计方法
active-comparator new-user design PSM 或 IPTW Kaplan–Meier 曲线 Cox 比例风险模型 竞争风险分析 亚组分析 敏感性分析 负对照结局分析,如条件允许
八、这篇文章给临床科研的核心启发
这篇 Nature Medicine 研究告诉我们,高质量真实世界研究不是:
有数据 + 做 PSM + 跑 Cox。
而是:
明确临床问题 + 模拟目标试验 + 选择合理对照 + 平衡基线差异 + 严谨定义结局 + 多维敏感性分析 + 谨慎解释结果。
临床医生做 RWE 时,最应该从这篇文章学会三点:
第一,不要直接比较用药者和不用药者,优先选择主动对照新使用者设计。
第二,不要只依赖 P 值和 HR,要同时报告绝对风险和风险差。
第三,不要把 PSM 当成万能方法,必须用敏感性分析和亚组分析验证结果。
最后,用一句话概括这篇文章的方法学价值:
真正高级的真实世界研究,不是把真实数据简单统计一遍,而是在真实世界中尽可能模拟一场严谨的临床试验。

![]() | ![]() |
![]() | ![]() |
![]() | ![]() |
![]() | ![]() |
(点击👆图片,进入自己感兴趣的专辑。或点击“资源”,浏览本公众号所有资源)
夜雨聆风






