睿宾速递|基于AI的心电图诊断算法检测慢性肝病风险患者:我们准备好应对后果了吗?-夜雨聆风

睿宾速递|基于AI的心电图诊断算法检测慢性肝病风险患者:我们准备好应对后果了吗?

点击蓝字关注我们

基于AI的心电图诊断算法检测慢性肝病风险患者：我们准备好应对后果了吗？

文献信息	类型：大模型临床研究
期刊: Journal of Hepatology
发表时间：2026
DOI：10.1016/j.jhep.2026.03.008
影响因子：33.0 （Q1）

研究背景与目的

背景：

本研究背景聚焦于慢性肝病（CLD）的早期筛查挑战。临床应用场景涉及利用人工智能（AI）算法分析常规心电图（ECG）数据，以识别高风险患者。现有研究局限包括：初级保健中CLD风险常被低估，非侵入性筛查工具使用不足（仅少数高危患者接受筛查），导致CLD相关死亡率居高不下；现有筛查工具（如FIB-4或弹性成像）需针对性启动，难以无缝整合至常规诊疗。

目的：

本研究目的为通过一项实用、集群随机临床试验，评估基于ECG的机器学习（ECG-ML）模型能否在初级保健中实现advanced CLD的早期检测，从而提升诊断率。

研究方法

数据

数据集来源于Mayo Clinic机构数据湖，包含临床常规进行的12导联ECG数据。数据特征：患者人群包括成人（年龄≥18岁），因临床指征接受ECG（非研究相关），排除已有明显advanced CLD体征者；总样本量15,596例，其中干预组8,034例，对照组7,562例。关键人口学特征：平均年龄63.4岁，女性占比53.6%，平均BMI 35.3 kg/m²。数据获取时间未提及。预处理与质控流程未提及。

模型

采用基于ECG的机器学习模型（全称和版本未提及）。开发与微调策略：模型基于北美联盟研发的AI-ECG算法（初始用于检测心脏疾病），并在回顾性数据集（12,930例肝硬化患者和64,577例对照）上训练以识别CLD。提示工程细节未涉及（非NLP模型）。模型原始输出为CLD风险评分；后处理涉及设定高风险阈值（0.51），用于通知临床医生高风险结果（风险评分≥0.51视为阳性）。

输出评价

评价标准基于临床试验主要终点：ECG后180天内经序贯肝病评估（如FibroTest、磁共振弹性成像或振动控制瞬时弹性成像）确认的新诊断advanced CLD。结局指标包括新诊断率、比值比（OR）及阳性预测值（PPV）。结局指标与临床价值的相关性体现为：提升早期病例发现，支持及时干预以降低并发症和死亡率。人工评估流程未提及（结局评估依赖临床医生决策，无模型输出的专项评估）。评估者资质未提及。评估者间一致性分析未提及。

研究结果

患者/临床数据的流动路径

患者数据流动为多阶段流程：首先，纳入成人患者接受临床常规12导联ECG→ECG数字化上传至数据湖→模型分析生成风险评分→干预组中高风险结果通知临床医生→基于临床判断和患者意愿，决定是否启动序贯肝病评估（包括FibroTest、磁共振弹性成像或振动控制瞬时弹性成像）→最终确认CLD诊断。路径中，干预组共8,034例患者，17%为ECG-ML阳性；对照组无AI结果通知。序贯评估率：干预组3.6% vs. 对照组1.3%。

整体数据特征

关键时间点未提及（数据收集时间范围未明确）。主要特征：总样本量15,596例（干预组8,034例，对照组7,562例）；基线合并症：90%患者至少1项CLD风险因素（如代谢功能障碍），56%新诊断CLD病例为MASLD/MASH相关。样本亚群特征：ECG-ML阳性率17%（干预组）；高脂血症患者占比突出（为主要混杂因素）。

结局指标

模型性能测试结果：在整体队列中，干预组advanced CLD新诊断率显著高于对照组（1.0% vs. 0.5%；OR 2.09，95% CI 1.22–3.55，P=0.007）。在ECG-ML阳性亚组中，干预组诊断率更高（4.4% vs. 1.1%；OR 4.37，95% CI 1.94–9.88，P<0.001）。次要终点（任何纤维化检测率）同样提升：整体队列1.7% vs. 0.5%（OR 3.17，95% CI 1.86–5.40，P<0.001）；ECG-ML阳性亚组8.4% vs. 1.1%（OR 8.03，95% CI 3.50–18.4，P<0.001）。评价者间一致性结果未提及。关键子群体表现差异：在高脂血症患者中，干预显著提升CLD诊断率（表明代谢因素为CLD驱动因子）；而无高脂血症患者中无变化。与现有标准方法比较结果：未直接比较（如FIB-4）。PPV结果：高风险队列整体PPV为4.4%；接受序贯评估的患者子组PPV为27.5%。

研究讨论

解释主要研究结果，讨论研究发现的临床意义

主要结果表明，ECG-ML模型在初级保健中显著提升advanced CLD的诊断率（尤其在高风险亚组），OR值显示中等至高度效应。临床意义在于：模型通过常规ECG的再利用，为高风险人群筛查提供低门槛、自动化工具，可弥补现有筛查依从性不足的问题，有助于早期干预以降低肝病进展和死亡率。

研究局限性

研究局限性包括：（1）模型为“黑箱”，无法解释驱动预测的ECG特征，难以区分CLD特异性信号或广泛代谢/心血管风险信号；（2）泛化性问题：训练队列（含40%失代偿CLD）与DULCE试验队列（排除advanced CLD且代谢因素更高）差异显著，影响阈值适用性；（3）低阳性预测值（整体PPV 4.4%）导致假阳性风险，增加下游检查负担和卫生经济学压力；（4）未与标准工具（如FIB-4）直接比较，限制性能评估；（5）临床决策不确定性：高风险结果后的评估依从性仅约16%，漏诊风险未量化。

总结研究模型的预期应用场景

预期应用场景为初级保健中的初步风险筛查工具：结合常规ECG检查，自动识别高风险患者，再由医生启动序贯非侵入性纤维化测试（如弹性成像），以优化资源分配并提升筛查可及性。

总结后续研究方向建议

后续研究方向仅原文提及：需澄清模型特异性、校准风险阈值、评估成本效益，并整合至护理路径（如结合FIB-4等工具）。同时，应研究模型在多元疾病风险筛查中的潜力。

原文速递：

10.1016/j.jhep.2026.03.008

以上解读内容由论界Schola生成

睿宾Agent之“论界Schola”由四川大学华西医院胡兵教授团队联合上海润达医疗科技股份有限公司、华为技术有限公司、成都智算中心共同研发的一款医学科研专用智能体，为广大医务人员提供科研服务。

更多内容↓↓↓