
“过去,一个科学家收集数据、理解一次,写出来发表,一个科学研究的故事就结束了。现在基于大模型,所有科学数据可以被不同的人、用不同的方式、在更大的规模上重新理解。”

之江实验室主任王坚在2026北京智源大会上讲的这句话,北京大学健康医疗大数据国家研究院助理教授洪申达的一份演讲报告充分进行了诠释。
他用哈佛医学院40年、1000万份心电图,训练出一个叫ECGFounder的模型。它不只是看心律失常——它能估算你的心脏年龄、判断心衰风险、算出你血液里的钾和钙,甚至预测你未来的疾病概率。
而最让医生们坐不住的是:心电图里藏着大量人类医生也看不见的信息。
以下内容根据洪申达在2026北京智源大会上的演讲整理。
我有一个梦想:做AI家庭医生
—
“我们有一个终极梦想——是做AI家庭医生。”西医是循证医学,需要各类检查检验证据支撑诊断。那么,在家里面,怎么才能获得实时的、客观的检查?
场景分析:三个痛点,一个突破口
—
围绕居家健康管理这一场景,洪申达总结了三个问题:
1. 可穿戴设备的数据没用起来。你家抽屉里有体温计、血压计、血氧仪,但手机、手表、手环其实能测更多——情绪、心功能、睡眠、免疫。这些数据是连续采集的“声、光、电、力、热”,大模型还不太会读。
2. 大模型天生“看不懂”波形。它擅长文本和图像,但心电图是一串时序信号。好比让一个语文老师去解微积分——不对口。
3. 患者缺医学常识。百度知道上,有个问题被问了无数遍——“我的体检是窦性心律,心脏到底有没有问题?”窦性心律,其实是正常心律。但患者不知道。
他选了一个硬核的突破口——心电。
为什么是心电?因为它100多年前就有了,检查量大、数据多、标准统一。而且过去几年的研究发现:心电图不只是看心律失常。它能看重大慢病、看全因死亡、看血液指标。去年《Nature》甚至发表了一篇文章——用心电图看结构性心脏病。
“这说明,越来越多的疾病,跟心电之间存在着关联。只是人类还没发现。”
用1000万份心电图训练一个大模型,看见医生看不见的隐藏信息
—
要训练一个能“读懂”心电的大模型,需要海量数据。
在哈佛医学院做博后期间,他和团队一起把哈佛医学院过去40年的心电图数据整理出来,公开。这个数据集叫HEEDB:1000万份心电图,180万人。是目前最大的心电数据库之一。
有了数据之后,他开始训练基座模型。
2025年,ECGFounder发表在《NEJMAI》上。它不只是诊断150种心律失常——它还做性别、年龄、CKD预测,甚至无创测血钾、测左心室射血分数。
“你现在问任何一个大夫:‘心电图能看血钾数值吗?’他大概会告诉你‘这不靠谱’。但我们的模型效果确实很好。”
主流大模型评测:读心电全军覆没
—
洪申达团队做了一次系统评测。他们把市面上所有主流大模型——闭源的、开源的、通用的、医疗专用的——全部拉出来,看它们能不能读懂心电。
结果:全军覆没。
无论是时序数据还是心电图片,没有一个模型表现合格。“这说明什么?说明这个方向几乎没人做。我们算是第一批。”
于是他们和腾讯合作,做了ECG-R1。核心思路:让模型同时处理心电信号和心电图片,而且要求两者的输出必须一致——这叫“公平性约束”。
“同样一份数据,你输信号和输图片,结果不能差太多。如果差很多,说明模型根本没理解数据。”这个设计很小巧,但切中要害。
设一个让普通人秒懂的指标:心脏年龄
—
传统AI做疾病预测,是端到端的:输入心电图,输出“有房颤风险”。但患者听不懂。
团队借鉴了“生物标志物”的思路,提出了“AI数字生物标志物”。比如心脏年龄。“一份心电图,人的肉眼看不出来心脏老没老。但算法能算出来。然后你就可以跟患者说:你的心脏比你的实际年龄老了5岁,可能最近熬夜太多了。”
这个概念很讨巧。它不替代医生,而是让患者能自我感知。
他们把所有这些指标集成到一个软硬件一体的心电仪里,叫“问心无恙”。软件、硬件、算法都是团队自己做的:一个主机,外面是一个收纳仓(也是电池仓),通过微信小程序连接。考虑到很多用户是老人,让他们装一个安卓或iOS APP很费劲,但微信大家都有——扫个码,手按上去30秒,就能测出单导联心电信号。
刚才说的心律失常指标都集成在模型里,心脏年龄、大模型问答也放进去了。拉到最下面有一个“未来实验室”,包括我们最近提出的“心电组学”等功能。测30秒心电图,可以得到:心脏年龄、性格特质(跟性别相关)、左右心室射血分数、电解质指标(钾、钙、镁等)、NT-proBNP(心衰强相关指标)、重大慢性疾病的未来风险概率。很多临床大夫看到这些指标都很感兴趣,我们也在开展临床试验,评判它对患者日常健康管理的促进作用。
用AI增强设备:从单导联合成12导联
—
单导联心电图有一个致命问题:医生不会读。
因为医生在学校学的就是12导联。你给他一条波形,他不知道怎么看。所以团队做了一个生成模型:从单导联,合成出其他11个导联。“我们不是要替代12导联机。我们只是想让医生能用他已经学会的方式,去解读患者在家里测的数据。”
这带来一个更广泛的思路:用AI增强设备能力——或者说,用“穷模态”数据集去合成“富模态”数据集。
从左到右,越往左越穷:从手机摄像头拍摄的视频(可以识别心率,叫rPPG),到手环、手表,到手机、体重秤、方向盘、马桶(都可以测心电),再到传统的12导联心电图,再到256导联心电图,甚至合成心脏核磁、推测基因型。这些不是天方夜谭,我们在尝试,看能力边界在哪里。
“这些不是天方夜谭。我们在尝试,看能力边界在哪里。”
还有一个有趣的应用:机会性筛查。你做心电的时候,顺便看看有没有睡眠障碍;你做睡眠监测的时候,顺便看看心脏有没有问题。
“同一个数据,可以回答多个问题。这就是AI的效率。”
对科学的意义:不止于辅助看病
—
AI正在改变传统的诊疗指南和路径。“现在你问医生:‘心电图能看血钾数值吗?’他说‘不靠谱’。但我们的模型效果非常好,说明这里面还有人类没发现的规律——这是科学问题。”
同时,AI也为基于心电数据的科学研究带来更多可能。HEEDB数据库里心电数据量很充足,而且是时序数据,是目前AI领域还没有被充分挖掘的角落。心电信号作为最常见的医学检查(甚至没有之一),AI看到的是信号,人看到的是图像——这两者不一致,这里面还有很多问题没有被解决、没有被发现。
洪申达说,“我们会用AI家庭医生,去推动临床和科研两个领域的发展。”
最后
—
洪申达团队的相关成果已陆续发表于NEJM AI等顶尖期刊,引起国际学术界的广泛关注与讨论。除心电外,团队还在探索脑电、PPG、肺功能曲线、胎心、心音等生理信号,并将这些时间序列数据的数字健康价值作为长期研究目标。他说,“我们做的这件事,不只是为了做一个产品。更是为了发现——人类还不知道的那些事。”
基座模型(Foundation Model),指在大规模、多样化的无标注数据上预训练,并能通过微调适配多种下游任务的大型通用模型。它不是针对某个具体问题(如识别心律失常)打造的“专用工具”,而是一个具备广泛知识、强大泛化能力的“智能底座”。如今,基座模型正在重新定义临床科研的能力边界。
洪申达团队的这项研究,为我们展现了一幅真实的未来图景:AI不再只是医生的“辅助读图工具”,而是一台能够“重新理解数据”的认知引擎。它从陈旧的心电记录中,发现了人类医生从未意识到的关联——心电能看血钾、能测心衰、能估算心脏年龄。这些“隐藏信息”不仅正在改写临床科研的范式,也为年轻科研人员提供了发现更多隐藏密码的可能。一个基座模型,就能支撑起从诊断到风险评估的一整套能力。
诚如王坚所言:科学研究的故事,正在被改写。
视频回放:2026北京智源大会“从生理信号大模型到AI家庭医生”,请访问https://event.baai.ac.cn/live/1021

扫码加入「医疗AI商业化专家群」,一起在落地中找答案。
注:本群实行审核制,仅限医院信息/临床/管理专家及医疗AI企业创始人、产品/市场负责人加入。





扩展阅读
夜雨聆风