eICU数据库实现SOFA-2 + 源码开放下载:MIMIC + eICU 双库验证SOFA-2

MIMIC + eICU 双库验证SOFA-2+源代码开放

医学在线-MIMIC超市｜零代码玩转主流医疗公共数据库（MIMIC-IV、eICU、INSPIRE、nwICU、SICdb、HiRID、PIC、CHARLS、NHANES、HRS、SHARE、MHAS、CDC WONDER），从队列构建到 AI 写论文初稿一站搞定。

三句话讲完核心： 1. JAMA 2025 SOFA-2 在 eICU 全栈落地——与 MIMIC-IV 同款阈值 + 脚注 a–q + Sepsis-3 重新定义，双库双轨验证在同一个项目里同口径一次完成 2. 本平台 eICU SOFA-2 全套 SQL 源码开放下载（VIP 专享）——README + 11 个分步脚本，按 JAMA 2025 Table 2 全部 17 条脚注分别实装；可作为 SCI 论文 Supplementary Materials 一并提交，外审对 Methods 可重现性的疑虑根上解决 3. MIMIC + eICU 两库 SOFA-2 sepsis 同时跑出来约 9 万例脓毒症 cohort，子群分析 / 亚组研究的统计功率从此不缺
JAMA 原文：Ranzani OT, et al. JAMA. 2025;334(23):2090-2103。MIMIC SOFA-2 篇见：抢发 SOFA-2 SCI：30 年才一次的红利窗口已经打开。

为什么 eICU 上的 SOFA-2 同样关键

eICU 是公开数据库里少数的多中心 ICU 队列——来自全美 200+ 家医院的 200,859 例 ICU 入住。重症顶刊近几年对"单中心队列抢发"已经审得越来越紧，"MIMIC 单库" 越来越难独自撑起一篇高分稿件。把 SOFA-2 在 eICU 上同口径做出来，意义有三层：

天然的外部验证集
—— MIMIC 出主分析结果，eICU 出外部验证。两库阈值、脚注、Sepsis-3 操作化定义完全一致，外审挑刺的空间被压到最小。
多中心异质性
—— 200+ 家医院的护理习惯、用药偏好、ICU 类型差异天然存在，这本身就是稿件 Discussion 章节最有分量的稳健性证据。
样本规模
—— 在 SOFA-2 重新定义下，eICU 内被判为脓毒症的 ICU 入住共 48,581 例，与 MIMIC 同款队列拼起来直接突破 9 万——任何子群分析、亚组研究都有了足够的统计功率。

一个直接可上手的选题套路

难度	怎么做	投稿亮点
★ 最易	在 MIMIC 上做主分析，在 eICU 上原样重跑一遍做外部验证	"MIMIC + eICU 双库一致采用 JAMA 2025 SOFA-2 操作化定义" — 方法学评分直接拉满
★★ 易	把已发表的 Sepsis-3 多中心队列用 SOFA-2 重做	同一队列在 SOFA-1 vs SOFA-2 下的重分类率、Cohen κ、AUROC 漂移
★★★ 中	6 大器官 domain 在两库间的分数迁移	心血管/肾脏/呼吸三个改动最大的 domain 在 MIMIC vs eICU 下的稳定性

一处勾选，队列立即收紧

eICU 的「人群纳排」页里多了一个开关「脓毒症患者(SOFA-2)」，紧挨着原有的「脓毒症患者(SOFA-1)」。

放大看两个开关，每个标签后面都跟着判定口径说明 + 鼠标悬停的详细 tooltip：

两个开关完全独立、自由组合： - 单勾 SOFA-1 → 队列收紧到经典 Sepsis-3 定义的患者 - 单勾 SOFA-2 → 队列收紧到 JAMA 2025 SOFA-2 重新定义下的患者 - 同时勾两个 → 取交集，即两套定义都判为脓毒症的患者（最严格的"双口径金标准 cohort"，主分析直接用） - 一勾都不勾 → 不收紧，按 ICU 全人群保留

不论选哪种组合，都和年龄、首次入 ICU、AKI、脓毒症休克这些其它纳排条件自由叠加，全部按交集生效。右侧 CONSORT 流程图实时刷新——保存后立即出现 SOFA-2 节点：

读这张图的方式：只两步收紧，每条括号里是还剩多少人。

1. 人群:icu(200859)
— 整个 eICU 共 200,859 次 ICU 入住
2. 脓毒症(SOFA-2)(48581)
— 满足 JAMA 2025 SOFA-2 重新定义的 Sepsis-3 患者共 48,581
最终人群(48581)
— 进入后续分析的 cohort

把这张 CONSORT 图直接贴进论文 Methods 章节，配合 "Sepsis-3 在 MIMIC-IV 与 eICU 上一致按 Ranzani 2025 SOFA-2 操作化定义" 一句话引用——主分析 + 外部验证的方法学描述一次写完。如果想做"双口径金标准 cohort"（同时勾 SOFA-1 + SOFA-2 取交集 = 46,784 例），CONSORT 流程图会自动多插一行——零代码切换。

关于人群边界：在 eICU 的 SOFA-2 重新定义下，48,581 例脓毒症患者与原 SOFA-1 定义高度一致（重叠 46,784 例，96.1%），同时 SOFA-2 把过去"判不到的人"重新拉进了 1,797 例（footnote e/f/p 的 delirium 触发 / SpO2-FiO2 fallback / virtual-RRT 路径功劳）。两套定义的差异本身就是天然的方法学比较选题素材。

通用指标里 SOFA-2 评分 + Sepsis-3(SOFA-2) 双指标可选

eICU 的「通用指标及预后」里两处新增：

评分
分组：「SOFA-2 评分(JAMA 2025)」紧贴原有的「SOFA 评分」
住院过程指标
分组：「脓毒症(SOFA-2)」+「脓毒症(SOFA-2)发生时间hr」紧贴原有的「脓毒症」+「脓毒症发生时间hr」

放大评分 + 住院过程指标两个分组：

为什么把新旧两套全部并列保留？三种研究通通用得上：

① 敏感性分析必备 — 主分析用一个口径出结果，审稿人很可能要求用另一套口径重跑验证稳健性。两套都可勾，导出来同一份数据里两列并列，跑 R / Python 一句 group_by 就能对照。

② 方法学比较选题 — 比较两套评分在不同患者子群（脓毒症、ARDS、AKI、心脏外科、神经重症）下的诊断一致性、AUROC、ΔSOFA 与 28d/90d 死亡的关联强度。这就是 SCI 里的"方法学比较"类天然选题，队列准备好直接进统计。

③ 双口径金标准 cohort — 同时勾 SOFA-1 + SOFA-2，得到两套定义都判阳性的最严格 cohort，论文 Methods 里写"双口径金标准定义"，外审挑刺的空间被压到最小。

重头戏：SOFA-2 全套源码开放下载（eICU VIP 专享）

「SOFA-2 评分(JAMA 2025)」复选框右侧多了一个蓝色小链「（下载 sofa2 源代码实现）」——eICU VIP 用户可以一键下载本平台 SOFA-2 全部实装源码：

内容	文件数	说明
README.md	1	安装顺序、依赖说明、JAMA 2025 Table 2 全部 17 条脚注的实装状态对照表
SQL 分步脚本	11	CAM-ICU 谵妄信号 / SpO2-FiO2 fallback / ECMO 模式区分 / MCS (IABP+LVAD+Impella) / 抗谵妄药 / 镇静窗 / 升压药速率 / UO 滚动速率 / RRT 持续判定 / SOFA-2 主表 / Sepsis-3(SOFA-2)

这是平台第一次对外开放评分体系的工程级实装源码。为什么这件事对 SCI 投稿是大事：

Methods 可重现性是 JAMA 级别期刊外审的必查项
—— 你可以在论文里写："SOFA-2 评分按 Ranzani 2025 JAMA Table 2 操作化定义，源码由医学在线-MIMIC超市平台提供，实装细节作为 Supplementary Materials 一并提交"，附件直接打包附上。外审挑刺的空间被根上解决。
JAMA 2025 原文 Table 2 + 脚注 a–q 是描述层
—— 把它落到具体 SQL，要处理细到 footnote c 镇静窗里 GCS LOCF 回填、footnote e 抗谵妄药 OR CAM-ICU 双信号、footnote h 呼吸 3/4 必须高级支持封顶 2、footnote n IABP/LVAD/Impella/VA-ECMO 任意一项 → 心血管 4、footnote o UO 阶梯 6h/12h/24h + 无尿 ≥12h、footnote p 虚拟 RRT (Cr>1.2 OR UO<0.3) AND (K≥6 OR pH≤7.20+HCO3≤12) → 4，等等 17 条具体规则——这部分的工程一致性，论文里光靠文字说不清楚，源码摆出来一目了然。
R/Python 都不能直接跑
—— 它必须在 PostgreSQL 里跑（因为依赖 eICU-CRD 原表 + 平台预先建好的 12 张派生表），但你拿到源码后可以审计、可以核对脚注是否实装、可以在自己的 PG 实例上复跑验证，这是论文级别的可重现性背书。

平台广度本身就是护城河

这一次 SOFA-2 在 eICU 的全栈落地，并不是孤立动作。平台目前已接入 14 个主流医疗公共数据库：

8 个 ICU 数据库：MIMIC-IV、eICU、INSPIRE、nwICU、SICdb、HiRID、PIC、AmsterdamUMCdb
6 个公共健康/调查数据库：CHARLS、NHANES、HRS、SHARE、MHAS、CDC WONDER

JAMA 2025 SOFA-2 这种国际共识级指标，目标是在所有 ICU 数据库都做到同口径、同阈值、同 Sepsis-3 操作化定义的全栈对齐——MIMIC-IV 与 eICU 已先行支持，其它 6 个 ICU 数据库按同样标准跟进。这意味着：

任意两库或多库联合做外部验证
，方法学描述就是同一段话
同一个研究问题
可以同时跑在亚洲（PIC）/欧洲（HiRID、AmsterdamUMCdb、SICdb、INSPIRE）/北美（MIMIC、eICU、nwICU）三大洲数据上，跨洲异质性研究天然成立
零工程量
——所有 SOFA-2 / Sepsis-3(SOFA-2) 都是 checkbox，队列配置在一次会话里完成

不写一行 SQL，把工程时间全部腾出来投到选题、统计、文字打磨上。

一句话总结

MIMIC 上的 SOFA-2 选题套路，在 eICU 上原样可复制；MIMIC 主分析 + eICU 外部验证组合，在医学在线-MIMIC超市的同一个项目里同口径一次完成——抢发 SOFA-2 SCI 的"易发文 + 易接收"双重红利，现在多了一份多中心稳健性背书。

落地步骤

打开 https://yxzx.hubstack.cn/ 登录
创建 eICU 项目 → 纳排页勾「脓毒症患者(SOFA-2)」
通用指标页勾 SOFA-2 评分 + 脓毒症(SOFA-2) + 脓毒症(SOFA-2)发生时间hr + 多窗口死亡
化验/用药/出入量页配「脓毒症(SOFA-2)时间」作为时间窗锚点
保存 → 下载 → 上传到分析模块 → AI 写初稿

数据准备就绪 = 投稿主体材料就绪。

访问 医学在线-MIMIC超市：https://yxzx.hubstack.cn/

管理员微信：yxzx2023999

关于医学在线-MIMIC超市

我们专注于医疗公共数据库一站式科研服务，已接入 MIMIC-IV、eICU、PIC、nwICU、SICdb、INSPIRE、HiRID、AmsterdamUMCdb、CHARLS、HRS、NHANES、SHARE、MHAS、CDC WONDER 等主流医疗公共数据库。

无需安装数据库，无需写一行代码，浏览器打开就能完成数据提取 → 清洗 → 统计 → 机器学习 → AI 论文初稿全流程。

网址：https://yxzx.hubstack.cn/　微信：yxzx2023999

关注「医学在线-MIMIC超市」公众号，助你早日完成 SCI 发表。

📖 完整高清原图与更多历史文章

yxzx.hubstack.cn/h