点击蓝字 关注我们
ENTERPRISE


✦
•
✦

衰老最直观的后果,是疾病发生率的持续攀升,以及随之而来的生活质量下降。这不仅影响个体健康,也在社会和经济层面带来了沉重负担。过去数十年的研究已经证实,通过热量限制、部分表观遗传重编程等方式,人类寿命及健康寿命在理论上是可以被延长的。然而,这些干预策略要真正走向临床,前提是能够准确衡量生物学年龄以及衰老发生的速度。
在众多衰老标志中,DNA 甲基化(DNA methylation,DNAm)的变化被认为是最稳定、最具代表性的指标之一。研究发现,随着年龄增长,基因组范围内 DNAm 水平呈现出可预测的变化趋势,因此,全基因组 DNAm 信息被广泛用于生物学年龄的评估。
不过,现有的表观遗传时钟在实际应用中仍面临明显限制。其预测性能往往受到测序平台差异、数据预处理流程、样本组织来源以及人群背景等多重因素的干扰,这种“技术偏差”极大削弱了模型在真实临床场景中的可靠性。
正因如此,开发一种能够削弱技术因素影响、同时保留真实衰老生物学信号的通用型 DNA 甲基化时钟,已成为该领域亟待解决的关键问题。
2026 年 1 月 13 日,复旦大学校长金力院士团队联合上海科学智能研究院 / 复旦大学人工智能创新与产业研究院漆远教授团队,以及无线光年的研究人员,在 Nature 子刊 Nature Computational Science 上发表研究论文《A robust computational framework for methylation age and disease-risk prediction based on pairwise learning》,为这一难题提供了新的解决方案。
(论文链接:https://www.nature.com/articles/s43588-025-00939-x)
研究团队提出了一套全新的计算框架——MAPLE(methylation age and disease-risk prediction based on pairwise learning),用于同时预测甲基化年龄和衰老相关疾病风险。
MAPLE 的核心在于引入成对学习(Pairwise Learning)策略。该方法并非直接给出样本的“绝对年龄”,而是通过比较两个 DNA 甲基化谱之间的相对关系,判断它们在年龄或疾病风险上的差异。这样一来,模型在捕获衰老相关生物学信号的同时,大幅降低了不同数据来源带来的技术噪声。
在覆盖不同研究项目、测序平台、数据预处理方法以及多种组织类型的 31 项基准测试中,MAPLE 的中位绝对误差仅为 1.6 年,整体性能明显优于另外五种主流方法。不仅如此,在疾病风险预测方面,MAPLE 的表现同样亮眼:疾病识别的平均曲线下面积达到 0.97,而对疾病前期状态的检测也取得了 0.85 的平均曲线下面积。这些结果显示,MAPLE 在临床层面的应用潜力十分可观。
传统表观遗传时钟的瓶颈何在?
进DNA 甲基化长期以来被视为衰老过程的重要分子特征。随着时间推移,特定 CpG 位点的甲基化模式会发生系统性改变。基于这一规律,Horvath 时钟、Hannum 时钟等经典模型得以建立。
但在实际使用中,这类模型普遍受到“批次效应”的严重影响。一旦训练数据与测试数据来自不同平台或采用不同预处理策略,预测精度便会显著下降,这成为表观遗传时钟走向临床应用的主要障碍。
MAPLE 的关键突破:关注“相对差异”
与传统方法不同,MAPLE 放弃了对绝对数值的依赖,转而学习样本之间的相对关系。通过成对比较 DNA 甲基化数据,模型可以推断样本之间的年龄差距或疾病风险差异。
这一策略的优势在于:即使不同数据集的甲基化分布存在差异,样本间真实的生物学差异依然具有可比性。MAPLE 采用两阶段训练流程,首先利用编码器将甲基化数据映射至统一的潜在空间,随后在该空间中训练预测器进行年龄或疾病状态判断。成对学习还使训练样本数量呈平方级增长,有效降低了过拟合风险。

图 MAPLE 概述
MAPLE 的关键突破:关注“相对差异”
在系统性能评估中,研究团队设置了 31 项严格的基准测试,涵盖多平台、多组织和多种数据处理流程。
结果显示,在跨平台血液样本分析中,MAPLE 的平均绝对误差仅为 1.45 年,相关系数高达 0.97;相比之下,传统多层感知器(MLP)模型的误差达到 4.14 年,相关系数仅为 0.88。在大脑、肌肉、皮肤等非血液组织中,MAPLE 同样保持稳定优势,平均误差为 2.30 年,显著优于其他方法。
综合全部测试结果,MAPLE 在 31 项基准测试中的平均绝对误差为 1.6 年,明显领先于 cAge 和 AltumAge 等模型。尤其值得注意的是,MAPLE 在不同预处理条件下几乎不受影响,而传统模型的误差波动则十分明显。

图 31 项基准测试中 MAPLE 与多种方法的对比

图 MAPLE 捕获衰老相关生物学过程及加速衰老信号
从年龄评估到疾病风险预警
除年龄预测外,MAPLE 还被用于评估多种衰老相关疾病风险,包括心血管疾病(CVD)和 2 型糖尿病(T2D)。在疾病识别任务中,其平均曲线下面积达到 0.97,对疾病前期状态的识别能力同样出色。
这意味着,MAPLE 不仅能够衡量个体的生物学年龄,还具备提前识别潜在健康风险的能力,为早期干预争取宝贵时间。

图 MAPLE 评估心血管疾病风险

图 MAPLE 评估 2 型糖尿病风险
进一步分析模型关注的关键 CpG 位点后,研究人员发现,这些位点显著富集于器官发育、细胞黏附、认知功能以及免疫调节等与衰老密切相关的生物学通路,从分子层面验证了 MAPLE 预测结果的合理性。
临床前景:迈向精准衰老管理
MAPLE 的价值不仅体现在高精度,更体现在其突出的泛化能力,而这正是临床应用的核心前提。通过成对学习策略削弱批次效应,MAPLE 为甲基化数据在真实医疗环境中的使用提供了可行路径。
未来,随着更多临床验证工作的推进,MAPLE 有望在多个方向发挥作用:其一,用于评估个体化抗衰老干预的真实效果;其二,实现疾病的早期风险筛查;其三,助力衰老分子机制的深入研究。
通过方法论层面的创新,MAPLE 直击表观遗传时钟领域的核心痛点,为衰老评估与疾病风险预测提供了更稳健的工具。或许在不久的将来,“衰老检测”将像常规体检一样,成为健康管理的重要组成部分,为实现健康老龄化提供科学支撑。
✦
•
✦
同医济云生物科技是提供国家自然科学基金(NSFC)申报的一站式服务平台。提供包括基金选题立意、方案设计、润色优化、形式审查、创新性提升、科研逻辑梳理以及全程申报指导等全方位技术服务。
我们的官网:http://www.tongyijiyun.com/



版权/免责声明:
本文内容仅用于医疗行业信息传播、知识分享,我们会对发表的内容进行溯源、求证,力求专业、可靠,但不对内容的准确性做出承诺;不提供任何医疗、商业、投资建议,欢迎个人转发至朋友圈分享。如需转载,请务必注明文章作者和来源,否则我们将保留追究法律责任的权利。
对本文有异议或投诉、开白名单、商务合作请联系:Tongyijiyun@163.com或扫描二维码 👇🏻

微信号丨Tongyijiyun
求点赞

求分享

求喜欢

夜雨聆风