MIMIC + eICU 双库验证SOFA-2+源代码开放
三句话讲完核心: 1. JAMA 2025 SOFA-2 在 eICU 全栈落地——与 MIMIC-IV 同款阈值 + 脚注 a–q + Sepsis-3 重新定义,双库双轨验证在同一个项目里同口径一次完成 2. 本平台 eICU SOFA-2 全套 SQL 源码开放下载(VIP 专享)——README + 11 个分步脚本,按 JAMA 2025 Table 2 全部 17 条脚注分别实装;可作为 SCI 论文 Supplementary Materials 一并提交,外审对 Methods 可重现性的疑虑根上解决 3. MIMIC + eICU 两库 SOFA-2 sepsis 同时跑出来约 9 万例脓毒症 cohort,子群分析 / 亚组研究的统计功率从此不缺
JAMA 原文:Ranzani OT, et al. JAMA. 2025;334(23):2090-2103。MIMIC SOFA-2 篇见:抢发 SOFA-2 SCI:30 年才一次的红利窗口已经打开。
为什么 eICU 上的 SOFA-2 同样关键
eICU 是公开数据库里少数的多中心 ICU 队列——来自全美 200+ 家医院的 200,859 例 ICU 入住。重症顶刊近几年对"单中心队列抢发"已经审得越来越紧,"MIMIC 单库" 越来越难独自撑起一篇高分稿件。把 SOFA-2 在 eICU 上同口径做出来,意义有三层:
- 天然的外部验证集
—— MIMIC 出主分析结果,eICU 出外部验证。两库阈值、脚注、Sepsis-3 操作化定义完全一致,外审挑刺的空间被压到最小。 - 多中心异质性
—— 200+ 家医院的护理习惯、用药偏好、ICU 类型差异天然存在,这本身就是稿件 Discussion 章节最有分量的稳健性证据。 - 样本规模
—— 在 SOFA-2 重新定义下,eICU 内被判为脓毒症的 ICU 入住共 48,581 例,与 MIMIC 同款 队列拼起来直接突破 9 万——任何子群分析、亚组研究都有了足够的统计功率。
一个直接可上手的选题套路
一处勾选,队列立即收紧
eICU 的「人群纳排」页里多了一个开关「脓毒症患者(SOFA-2)」,紧挨着原有的「脓毒症患者(SOFA-1)」。

放大看两个开关,每个标签后面都跟着判定口径说明 + 鼠标悬停的详细 tooltip:

两个开关完全独立、自由组合: - 单勾 SOFA-1 → 队列收紧到经典 Sepsis-3 定义的患者 - 单勾 SOFA-2 → 队列收紧到 JAMA 2025 SOFA-2 重新定义下的患者 - 同时勾两个 → 取交集,即两套定义都判为脓毒症的患者(最严格的"双口径金标准 cohort",主分析直接用) - 一勾都不勾 → 不收紧,按 ICU 全人群保留
不论选哪种组合,都和年龄、首次入 ICU、AKI、脓毒症休克这些其它纳排条件自由叠加,全部按交集生效。右侧 CONSORT 流程图实时刷新——保存后立即出现 SOFA-2 节点:

读这张图的方式:只两步收紧,每条括号里是还剩多少人。
- 1. 人群:icu(200859)
— 整个 eICU 共 200,859 次 ICU 入住 - 2. 脓毒症(SOFA-2)(48581)
— 满足 JAMA 2025 SOFA-2 重新定义的 Sepsis-3 患者共 48,581 - 最终人群(48581)
— 进入后续分析的 cohort
把这张 CONSORT 图直接贴进论文 Methods 章节,配合 "Sepsis-3 在 MIMIC-IV 与 eICU 上一致按 Ranzani 2025 SOFA-2 操作化定义" 一句话引用——主分析 + 外部验证的方法学描述一次写完。如果想做"双口径金标准 cohort"(同时勾 SOFA-1 + SOFA-2 取交集 = 46,784 例),CONSORT 流程图会自动多插一行——零代码切换。
关于人群边界:在 eICU 的 SOFA-2 重新定义下,48,581 例脓毒症患者与原 SOFA-1 定义高度一致(重叠 46,784 例,96.1%),同时 SOFA-2 把过去"判不到的人"重新拉进了 1,797 例(footnote e/f/p 的 delirium 触发 / SpO2-FiO2 fallback / virtual-RRT 路径功劳)。两套定义的差异本身就是天然的方法学比较选题素材。
通用指标里 SOFA-2 评分 + Sepsis-3(SOFA-2) 双指标可选
eICU 的「通用指标及预后」里两处新增:
- 评分
分组:「SOFA-2 评分(JAMA 2025)」紧贴原有的「SOFA 评分」 - 住院过程指标
分组:「脓毒症(SOFA-2)」+「脓毒症(SOFA-2)发生时间hr」紧贴原有的「脓毒症」+「脓毒症发生时间hr」

放大评分 + 住院过程指标两个分组:

为什么把新旧两套全部并列保留?三种研究通通用得上:
① 敏感性分析必备 — 主分析用一个口径出结果,审稿人很可能要求用另一套口径重跑验证稳健性。两套都可勾,导出来同一份数据里两列并列,跑 R / Python 一句 group_by 就能对照。
② 方法学比较选题 — 比较两套评分在不同患者子群(脓毒症、ARDS、AKI、心脏外科、神经重症)下的诊断一致性、AUROC、ΔSOFA 与 28d/90d 死亡的关联强度。这就是 SCI 里的"方法学比较"类天然选题,队列准备好直接进统计。
③ 双口径金标准 cohort — 同时勾 SOFA-1 + SOFA-2,得到两套定义都判阳性的最严格 cohort,论文 Methods 里写"双口径金标准定义",外审挑刺的空间被压到最小。
重头戏:SOFA-2 全套源码开放下载(eICU VIP 专享)
「SOFA-2 评分(JAMA 2025)」复选框右侧多了一个蓝色小链「(下载 sofa2 源代码实现)」——eICU VIP 用户可以一键下载本平台 SOFA-2 全部实装源码:
这是平台第一次对外开放评分体系的工程级实装源码。为什么这件事对 SCI 投稿是大事:
- Methods 可重现性是 JAMA 级别期刊外审的必查项
—— 你可以在论文里写:"SOFA-2 评分按 Ranzani 2025 JAMA Table 2 操作化定义,源码由医学在线-MIMIC超市平台提供,实装细节作为 Supplementary Materials 一并提交",附件直接打包附上。外审挑刺的空间被根上解决。 - JAMA 2025 原文 Table 2 + 脚注 a–q 是描述层
—— 把它落到具体 SQL,要处理细到 footnote c 镇静窗里 GCS LOCF 回填、footnote e 抗谵妄药 OR CAM-ICU 双信号、footnote h 呼吸 3/4 必须高级支持封顶 2、footnote n IABP/LVAD/Impella/VA-ECMO 任意一项 → 心血管 4、footnote o UO 阶梯 6h/12h/24h + 无尿 ≥12h、footnote p 虚拟 RRT (Cr>1.2 OR UO<0.3) AND (K≥6 OR pH≤7.20+HCO3≤12) → 4,等等 17 条具体规则——这部分的工程一致性,论文里光靠文字说不清楚,源码摆出来一目了然。 - R/Python 都不能直接跑
—— 它必须在 PostgreSQL 里跑(因为依赖 eICU-CRD 原表 + 平台预先建好的 12 张派生表),但你拿到源码后可以审计、可以核对脚注是否实装、可以在自己的 PG 实例上复跑验证,这是论文级别的可重现性背书。
平台广度本身就是护城河
这一次 SOFA-2 在 eICU 的全栈落地,并不是孤立动作。平台目前已接入 14 个主流医疗公共数据库:
8 个 ICU 数据库:MIMIC-IV、eICU、INSPIRE、nwICU、SICdb、HiRID、PIC、AmsterdamUMCdb
6 个公共健康/调查数据库:CHARLS、NHANES、HRS、SHARE、MHAS、CDC WONDER
JAMA 2025 SOFA-2 这种国际共识级指标,目标是在所有 ICU 数据库都做到同口径、同阈值、同 Sepsis-3 操作化定义的全栈对齐——MIMIC-IV 与 eICU 已先行支持,其它 6 个 ICU 数据库按同样标准跟进。这意味着:
- 任意两库或多库联合做外部验证
,方法学描述就是同一段话 - 同一个研究问题
可以同时跑在亚洲(PIC)/欧洲(HiRID、AmsterdamUMCdb、SICdb、INSPIRE)/北美(MIMIC、eICU、nwICU)三大洲数据上,跨洲异质性研究天然成立 - 零工程量
——所有 SOFA-2 / Sepsis-3(SOFA-2) 都是 checkbox,队列配置在一次会话里完成
不写一行 SQL,把工程时间全部腾出来投到选题、统计、文字打磨上。
一句话总结
MIMIC 上的 SOFA-2 选题套路,在 eICU 上原样可复制;MIMIC 主分析 + eICU 外部验证组合,在医学在线-MIMIC超市的同一个项目里同口径一次完成——抢发 SOFA-2 SCI 的"易发文 + 易接收"双重红利,现在多了一份多中心稳健性背书。
落地步骤
打开 https://yxzx.hubstack.cn/ 登录 创建 eICU 项目 → 纳排页勾「脓毒症患者(SOFA-2)」 通用指标页勾 SOFA-2 评分 + 脓毒症(SOFA-2) + 脓毒症(SOFA-2)发生时间hr + 多窗口死亡 化验/用药/出入量页配「脓毒症(SOFA-2)时间」作为时间窗锚点 - 保存 → 下载 → 上传到分析模块 → AI 写初稿
数据准备就绪 = 投稿主体材料就绪。
访问 医学在线-MIMIC超市:https://yxzx.hubstack.cn/
管理员微信:yxzx2023999
关于医学在线-MIMIC超市
我们专注于医疗公共数据库一站式科研服务,已接入 MIMIC-IV、eICU、PIC、nwICU、SICdb、INSPIRE、HiRID、AmsterdamUMCdb、CHARLS、HRS、NHANES、SHARE、MHAS、CDC WONDER 等主流医疗公共数据库。
无需安装数据库,无需写一行代码,浏览器打开就能完成数据提取 → 清洗 → 统计 → 机器学习 → AI 论文初稿全流程。
网址:https://yxzx.hubstack.cn/ 微信:yxzx2023999
关注「医学在线-MIMIC超市」公众号,助你早日完成 SCI 发表。
📖 完整高清原图与更多历史文章
yxzx.hubstack.cn/h
夜雨聆风