
研究亮点 1. FMT疗效与受体微生物组向供体的"趋同"(convergence)密切相关,有效组相似度平均提升17.16%,无效组反而下降1.94% 2. 基于515例FMT、30个队列、12种疾病的全球最大FMT宏基因组分析数据集 3. 开发MOZAIC框架:AUC 0.88,准确率/召回率>0.80,预测临床结局准确率达78.7% 4. AI引导的供体-受体匹配可提升临床应答率1.44倍(从49.4%至71.0%),实现精准微生物组治疗 |
一、开篇导读
FMT是近年来备受关注的微生态治疗手段,通过将健康供体的肠道菌群移植到患者体内,以重建肠道微生态平衡。FMT已被证实对复发性艰难梭菌感染(CDI)有显著疗效,并在炎症性肠病、代谢综合征、肿瘤免疫治疗辅助等多个领域展现了广阔的应用前景。
然而,FMT的临床疗效存在显著的个体差异。即使是同一供体的菌群移植到不同受体,临床结局也可能截然不同。
这一"供体中心论"的局限性促使研究者开始反思:仅仅关注供体的菌群质量是否足够?受体自身的微生态状态、以及供体与受体之间的微生物组"匹配度",是否是决定FMT成败的更深层因素?
2026年,来自香港中文大学微生物组创新中心团队,在权威期刊Cell Reports上发表了一项重磅研究。

该研究首次系统性地揭示了FMT受体微生物组向供体"趋同"与临床疗效之间的稳健关联,并基于此开发了一个名为MOZAIC的AI框架,为精准供体-受体匹配提供了可操作的解决方案。

二、研究概览:前所未有的大规模数据整合
该研究的突出特点之一是数据规模的空前庞大。研究团队整合了来自全球24个公共数据集和6个自产数据集(含2个首次公开发表)的宏基因组测序数据,涵盖了515例FMT操作、30个独立队列和12种疾病类型。
表1:研究纳入的FMT数据集概览
疾病类型 | 队列数 | FMT例数 | 主要来源国家/地区 | 临床有效率 |
艰难梭菌感染 (CDI) | 7 | 114 | 加拿大/俄罗斯/美国/香港 | 95% |
糖尿病 (Diabetes) | 1 | 114 | 中国香港 | 14% |
肠易激综合征 (IBS) | 2 | 65 | 挪威/中国香港 | 63% |
克罗恩病 (CD) | 3 | 47 | 法国/美国/中国香港 | 64% |
溃疡性结肠炎 (UC) | 5 | 33 | 美国/澳大利亚/荷兰 | 57% |
代谢综合征 (MS) | 3 | 29 | 荷兰 | N/A |
多重耐药菌 (MDRO) | 2 | 26 | 以色列/荷兰 | 46% |
黑色素瘤 (Melanoma) | 2 | 25 | 以色列/美国 | 40% |
COVID-19后综合征(PACS) | 1 | 25 | 中国香港 | 60% |
肥胖 (Obesity) | 1 | 17 | 中国香港 | 0% |
Tourette综合征 (TS) | 1 | 10 | 中国大陆 | 80% |
肾细胞癌 (RCC) | 1 | 7 | 意大利 | N/A |
健康志愿者 | 1 | 3 | 俄罗斯 | 100% |
合计 | 30 | 515 | — | 52.3% (总) |
值得一提的是,研究不仅局限于细菌层面,还对真菌、病毒和古菌进行了多界(multi-kingdom)分类学分析,同时整合了MetaCyc代谢通路和KEGG直系同源群(KO)的功能注释。这种多维度的宏基因组分析策略,使得对FMT过程中微生物动态变化的理解达到了前所未有的深度。
三、核心发现一:微生物组"趋同"决定FMT成败
该研究最重要的发现是:FMT受体在移植后的微生物组是否向供体"趋同"(即受体菌群谱变得更像供体),与临床疗效之间存在强大的关联。
具体而言,研究团队使用Bray-Curtis相似度作为量化指标,比较了移植前后受体与供体之间的微生物组相似性变化。结果显示:
• 在临床应答组中,移植后受体微生物组与供体的相似度平均提升了17.16%,尤其在细菌组分和整体微生物组层面最为显著。
• 在临床无应答组中,移植后受体微生物组与供体的相似度反而平均下降了1.94%,表明没有发生有意义的菌群趋同。
• 这一趋势不仅体现在分类学层面,在功能层面(代谢通路MetaCyc、KO直系同源群)同样显著(p<0.05和p<0.001,经疾病类型、年龄、性别、抗生素预处理等混杂因素校正后)。
更为重要的是,大多数队列中的FMT案例都遵循了这一规律:临床应答者的微生物组趋同于供体,而非应答者则未发生趋同或趋异。这一跨疾病的一致性发现,将"微生物组趋同"确立为FMT疗效的关键中介因素,超越了特定疾病类型的微生态变化模式。
四、核心发现二:传统指标预测能力捉襟见肘
基于上述发现,研究者进一步追问:能否通过移植前的供体和受体微生物组特征,来预测移植后是否会发生趋同?
表2:传统机器学习模型预测FMT微生物组趋同的表现
机器学习模型 | 输入特征 | 平均AUC |
随机森林 (Random Forest) | 供体/受体Shannon & Simpson指数 | 0.746±0.010 |
支持向量机 (SVM) | + 供体-受体Bray-Curtis相异度 | 0.700±0.015 |
XGBoost | + 供体-受体Bray-Curtis相异度 | 0.702±0.015 |
逻辑回归 (Logistic Regression) | + 供体-受体Bray-Curtis相异度 | 0.717±0.017 |
神经网络 (Neural Network) | + 供体-受体Bray-Curtis相异度 | 0.746±0.013 |
结果显示,仅依赖传统的生态学指标(供体α多样性、受体α多样性、供体-受体β多样性等),即使采用随机森林、XGBoost、支持向量机、神经网络等多种机器学习算法,预测移植后微生物组趋同的AUC仅在0.70-0.75之间,远未达到临床应用所需的AUC>0.8水平。
该结果揭示了两个关键问题:第一,传统生态学指标难以捕捉供体-受体间复杂的多维度微生物互作;第二,不同疾病背景下微生物组的迁移模式存在显著的异质性(疾病特异性),同一套简单特征无法适配所有疾病场景。
五、核心发现三:不同疾病呈现独特的微生物迁移模式
通过PCA和t-SNE降维分析,研究清晰展示了不同疾病类型的FMT受体在移植前后呈现各异的微生物组迁移轨迹。例如:
• 在克罗恩病(CD)、艰难梭菌感染(CDI)和肠易激综合征(IBS)患者中,Bacteroides uniformis和Phocaeicola vulgatus在移植后显著增加,与其已知的保护作用一致。
•Akkermansia massiliensis、Bacteroides fragilis和Faecalibacterium prausnitzii在CDI患者中特异性增加,提示这些菌种的定植与CDI缓解密切相关。
•Alistipes onderdonkii和Bacteroides eggerthii在IBS患者中显著富集,可能通过调节宿主免疫参与炎症缓解。
•Segatella copri作为一种纤维降解相关的肠道共生菌,在CDI、MDRO、UC和PACS患者中均显著增加。
这些发现强调了疾病特异性微生态背景对FMT结果的重要影响,也解释了为何简单通用指标预测能力有限——精准预测需要一个能够整合多维度信息、捕捉疾病特异性模式的先进计算框架。
六、MOZAIC框架:AI驱动的精准供体-受体匹配
面对传统方法的局限,研究团队设计了MOZAIC(Microbiome Matching Optimization via Artificial Intelligence),一个基于深度学习的计算框架,旨在预测特定供体-受体配对能否实现移植后的微生物组趋同。
MOZAIC 框架架构 核心理念:基于生态位填充(niche filling)和微生物组趋同(microbiome convergence)的生态学原理,FMT成功取决于供体与受体之间的"互补性"而非任何一方的单独特征 输入层:供体/受体的多界微生物组特征(细菌、真菌、病毒、古菌共1541个分类特征)+ 功能特征(53条MetaCyc通路 + 246个KO基因家族)= 1840个特征 上游处理:5个计算模块(Computational Blocks 1-5)并行提取供体和受体特征 → 激活模块 + 过滤层降噪 下游整合:密集连接的神经网络集群(Densely-Connected Neural Network Clusters)→ 捕捉供体-受体内在互补模式 → 多层感知器(MLP)输出预测 训练策略:L2正则化 + 15-20%随机Dropout + 动态学习率调整(β1=0.9, β2=0.999),对称平衡供体和受体特征权重,抑制噪声 最优超参数:增长率(growth rate)=2⁶=64, 滤波器=5, 学习率=5×10⁻⁴, 计算模块层数=5, 批大小=16-32 数据划分:严格三路分割(72%训练/8%验证/20%测试),保持疾病类型和标签在不同子集中的平衡分布 |
MOZAIC的设计有两大独特之处。其一,它并非简单地堆叠供体特征和受体特征进行预测,而是通过上游模块分别提取双方的特征后,在下游模块中捕获供体-受体之间的"互补模式"。这一设计理念源自生态学中"生态位互补"理论——移植前较高的供体-受体相异度可能意味着受体肠道中存在待填充的生态位空间,而这种互补性才是驱动成功趋同的关键。
其二,框架同时整合了分类学组成和功能潜能两个层面的信息。消融实验显示,当同时使用微生物组组成、代谢通路(pathways)和基因家族(KOs)三类特征时,MOZAIC达到了最佳预测性能,缺一不可。
七、MOZAIC性能表现:全面超越传统方法
表3:MOZAIC与传统ML模型在独立测试集上的性能对比
模型 | AUC | 准确率 (Accuracy) | 召回率 (Recall) |
传统ML方法 (范围) | 0.700-0.819 | — | — |
MOZAIC (本方法) | 0.879±0.006 | 0.818±0.012 | 0.838±0.025 |
在独立测试集上(103例FMT),MOZAIC的AUC达到0.879±0.006,准确率为0.818±0.012,召回率为0.838±0.025,全面超越了现有方法。值得注意的是:
• 模型训练在30个epoch内快速收敛,验证集AUC稳定在0.849±0.017,表明有效的过拟合控制。
• 当屏蔽供体或受体特征时,AUC分别降至0.775和0.770,证实了双方特征对于最佳预测同等重要。
• 在不同趋同定义阈值(相似度提升>0%、>1%、>2%)下,MOZAIC均维持了稳定的预测性能(AUC>0.85, 准确率/召回率>0.8),显示了对操作定义变化的鲁棒性。
• 在留一队列交叉验证(leave-one-cohort-out)中同样表现稳健,支持其在不同临床场景下的适用性。
八、临床转化潜力:AI有望将FMT有效率提升1.44倍
MOZAIC真正的价值在于其临床转化潜力。研究者进行了关键的回顾性模拟分析:在拥有临床结局标注的89例独立测试集FMT中——
•MOZAIC预测临床结局的准确率高达78.7%(即预测的"匹配/不匹配"与实际临床"有效/无效"的一致率)。
•整体基线临床有效率为49.4%,但在MOZAIC预测为"匹配"(即预测会发生微生物组趋同)的供体-受体配对中,临床有效率飙升至71.0%——这意味着如果根据MOZAIC的预测来筛选供体-受体配对,临床应答率可能提升1.44倍。
•即使排除CDI病例(CDI本身对FMT应答率极高,可能高估效果),MOZAIC指导下的配对选择仍可将临床有效率提升26.3%。
核心数据 49.4% → 71.0% AI优化供体-受体匹配后的预估临床应答率提升 |
九、局限性与未来方向
研究团队坦诚地指出了当前工作的局限,展现了严谨的科学态度:
1. 回顾性设计:当前分析基于已完成的FMT队列数据,无法进行因果推断。未来需要通过前瞻性临床试验来验证MOZAIC指导下的供体选择是否能真正改善临床结局。
2. "黑箱"可解释性:MOZAIC作为深度学习模型,其内部决策过程难以直观解释。这与临床应用中对透明性的要求存在一定张力,也是未来需要着力改进的方向——例如通过注意力机制(attention)或可解释AI方法识别关键特征。
3. 样本量不均衡:部分疾病亚组(如Tourette综合征n=10、肾细胞癌n=7)样本量较小,MOZAIC在这些类别上的预测性能可能不够稳健。扩大特定疾病的FMT队列至关重要。
4. 混杂因素:供体的人口学信息(年龄、性别等)在多数已发表研究中缺失,且肠道微生物组本身受遗传、饮食、环境等多种因素影响而波动。
5. 缺乏非FMT对照组:无法完全排除疾病自然病程或安慰剂效应对结果的潜在影响。
未来,研究团队计划整合纵向肠道微生物组监测、宿主基因组学和免疫学数据、以及高分辨率长读长测序技术,进一步完善预测模型。更为关键的是,需要通过机制研究阐明微生物组趋同究竟是FMT疗效的直接中介因素,还是成功生态修复的下游标志物。
十、总结与展望
这项研究具有多重重要意义。在科学层面,它重新定义了FMT成功的本质——不是简单的"好菌"移植,而是供体菌群与受体生态系统之间的系统性互补与融合。微生态趋同(microbiome convergence)超越了特定菌种的定植,成为一个跨疾病的通用疗效预测指标。
在技术层面,MOZAIC展示了人工智能如何突破传统生态学指标的局限,通过整合多界微生物组信息和功能特征,实现对复杂微生物互作的高精度预测。其1.44倍的临床改善模拟结果,为精准微生物组治疗提供了令人振奋的前景。
在转化层面,该研究直接回应了粪菌移植领域的一个核心瓶颈——如何为特定患者选择最佳供体。MOZAIC提供了一个可操作的计算工具,有望从当前的"试错"模式升级为"精准匹配"模式。
正如作者所言,未来需要将MOZAIC推进到介入性临床试验中,同时阐明其预测背后的机制基础,最终弥合微生物生态学与个性化医学之间的鸿沟。我们有理由期待,在AI的加持下,FMT这一古老的疗法将焕发新的生机,迈向精准化、个性化的新时代。
END
参考文献
1. Su Q, Chen S, Lau LHS, et al. Artificial intelligence-driven donor-recipient gut microbiome matching for optimized fecal microbiota transplantation. Cell Reports, 2026, 117301.
2. Wang X, Zhao D, Bi D, et al. Fecal microbiota transplantation: transitioning from chaos and controversial realm to scientific precision era. Science Bulletin, 2025, 70:970-985.
3. Schmidt TSB, Li SS, Maistrenko OM, et al. Drivers and determinants of strain dynamics following fecal microbiota transplantation. Nature Medicine, 2022, 28:1902-1912.
4. Ianiro G, Puncochar M, Karcher N, et al. Variability of strain engraftment and predictability of microbiome composition after fecal microbiota transplantation across different diseases. Nature Medicine, 2022, 28:1913-1923.
5. Chen Q, Wu C, Xu J, et al. Donor-recipient intermicrobial interactions impact transfer of subspecies and fecal microbiota transplantation outcome. Cell Host & Microbe, 2024, 32:349-365.e4.
6.研究代码开源地址: https://github.com/ChenSizhe13893461199/FMT_donor_recipient_matching
7. 数据获取: NCBI PRJNA1262688, PRJNA1263159, 及文中列出的其他公共数据集。
免责声明:本文仅供学术交流与科普传播之用,不构成任何临床建议。
夜雨聆风