《Cell》子刊-AI赋能FMT:精准供体-受体匹配的新纪元

研究亮点

1. FMT疗效与受体微生物组向供体的"趋同"（convergence）密切相关，有效组相似度平均提升17.16%，无效组反而下降1.94%

2. 基于515例FMT、30个队列、12种疾病的全球最大FMT宏基因组分析数据集

3. 开发MOZAIC框架：AUC 0.88，准确率/召回率>0.80，预测临床结局准确率达78.7%

4. AI引导的供体-受体匹配可提升临床应答率1.44倍（从49.4%至71.0%），实现精准微生物组治疗

一、开篇导读

FMT是近年来备受关注的微生态治疗手段，通过将健康供体的肠道菌群移植到患者体内，以重建肠道微生态平衡。FMT已被证实对复发性艰难梭菌感染（CDI）有显著疗效，并在炎症性肠病、代谢综合征、肿瘤免疫治疗辅助等多个领域展现了广阔的应用前景。

然而，FMT的临床疗效存在显著的个体差异。即使是同一供体的菌群移植到不同受体，临床结局也可能截然不同。

这一"供体中心论"的局限性促使研究者开始反思：仅仅关注供体的菌群质量是否足够？受体自身的微生态状态、以及供体与受体之间的微生物组"匹配度"，是否是决定FMT成败的更深层因素？

2026年，来自香港中文大学微生物组创新中心团队，在权威期刊Cell Reports上发表了一项重磅研究。

该研究首次系统性地揭示了FMT受体微生物组向供体"趋同"与临床疗效之间的稳健关联，并基于此开发了一个名为MOZAIC的AI框架，为精准供体-受体匹配提供了可操作的解决方案。

二、研究概览：前所未有的大规模数据整合

该研究的突出特点之一是数据规模的空前庞大。研究团队整合了来自全球24个公共数据集和6个自产数据集（含2个首次公开发表）的宏基因组测序数据，涵盖了515例FMT操作、30个独立队列和12种疾病类型。

表1：研究纳入的FMT数据集概览

疾病类型	队列数	FMT例数	主要来源国家/地区	临床有效率
艰难梭菌感染 (CDI)	7	114	加拿大/俄罗斯/美国/香港	95%
糖尿病 (Diabetes)	1	114	中国香港	14%
肠易激综合征 (IBS)	2	65	挪威/中国香港	63%
克罗恩病 (CD)	3	47	法国/美国/中国香港	64%
溃疡性结肠炎 (UC)	5	33	美国/澳大利亚/荷兰	57%
代谢综合征 (MS)	3	29	荷兰	N/A
多重耐药菌 (MDRO)	2	26	以色列/荷兰	46%
黑色素瘤 (Melanoma)	2	25	以色列/美国	40%
COVID-19后综合征(PACS)	1	25	中国香港	60%
肥胖 (Obesity)	1	17	中国香港	0%
Tourette综合征 (TS)	1	10	中国大陆	80%
肾细胞癌 (RCC)	1	7	意大利	N/A
健康志愿者	1	3	俄罗斯	100%
合计	30	515	—	52.3% (总)

值得一提的是，研究不仅局限于细菌层面，还对真菌、病毒和古菌进行了多界（multi-kingdom）分类学分析，同时整合了MetaCyc代谢通路和KEGG直系同源群（KO）的功能注释。这种多维度的宏基因组分析策略，使得对FMT过程中微生物动态变化的理解达到了前所未有的深度。

三、核心发现一：微生物组"趋同"决定FMT成败

该研究最重要的发现是：FMT受体在移植后的微生物组是否向供体"趋同"（即受体菌群谱变得更像供体），与临床疗效之间存在强大的关联。

具体而言，研究团队使用Bray-Curtis相似度作为量化指标，比较了移植前后受体与供体之间的微生物组相似性变化。结果显示：

• 在临床应答组中，移植后受体微生物组与供体的相似度平均提升了17.16%，尤其在细菌组分和整体微生物组层面最为显著。

• 在临床无应答组中，移植后受体微生物组与供体的相似度反而平均下降了1.94%，表明没有发生有意义的菌群趋同。

• 这一趋势不仅体现在分类学层面，在功能层面（代谢通路MetaCyc、KO直系同源群）同样显著（p<0.05和p<0.001，经疾病类型、年龄、性别、抗生素预处理等混杂因素校正后）。

更为重要的是，大多数队列中的FMT案例都遵循了这一规律：临床应答者的微生物组趋同于供体，而非应答者则未发生趋同或趋异。这一跨疾病的一致性发现，将"微生物组趋同"确立为FMT疗效的关键中介因素，超越了特定疾病类型的微生态变化模式。

四、核心发现二：传统指标预测能力捉襟见肘

基于上述发现，研究者进一步追问：能否通过移植前的供体和受体微生物组特征，来预测移植后是否会发生趋同？

表2：传统机器学习模型预测FMT微生物组趋同的表现

机器学习模型	输入特征	平均AUC
随机森林 (Random Forest)	供体/受体Shannon & Simpson指数	0.746±0.010
支持向量机 (SVM)	+ 供体-受体Bray-Curtis相异度	0.700±0.015
XGBoost	+ 供体-受体Bray-Curtis相异度	0.702±0.015
逻辑回归 (Logistic Regression)	+ 供体-受体Bray-Curtis相异度	0.717±0.017
神经网络 (Neural Network)	+ 供体-受体Bray-Curtis相异度	0.746±0.013

结果显示，仅依赖传统的生态学指标（供体α多样性、受体α多样性、供体-受体β多样性等），即使采用随机森林、XGBoost、支持向量机、神经网络等多种机器学习算法，预测移植后微生物组趋同的AUC仅在0.70-0.75之间，远未达到临床应用所需的AUC>0.8水平。

该结果揭示了两个关键问题：第一，传统生态学指标难以捕捉供体-受体间复杂的多维度微生物互作；第二，不同疾病背景下微生物组的迁移模式存在显著的异质性（疾病特异性），同一套简单特征无法适配所有疾病场景。

五、核心发现三：不同疾病呈现独特的微生物迁移模式

通过PCA和t-SNE降维分析，研究清晰展示了不同疾病类型的FMT受体在移植前后呈现各异的微生物组迁移轨迹。例如：

• 在克罗恩病（CD）、艰难梭菌感染（CDI）和肠易激综合征（IBS）患者中，Bacteroides uniformis和Phocaeicola vulgatus在移植后显著增加，与其已知的保护作用一致。

•Akkermansia massiliensis、Bacteroides fragilis和Faecalibacterium prausnitzii在CDI患者中特异性增加，提示这些菌种的定植与CDI缓解密切相关。

•Alistipes onderdonkii和Bacteroides eggerthii在IBS患者中显著富集，可能通过调节宿主免疫参与炎症缓解。

•Segatella copri作为一种纤维降解相关的肠道共生菌，在CDI、MDRO、UC和PACS患者中均显著增加。

这些发现强调了疾病特异性微生态背景对FMT结果的重要影响，也解释了为何简单通用指标预测能力有限——精准预测需要一个能够整合多维度信息、捕捉疾病特异性模式的先进计算框架。

六、MOZAIC框架：AI驱动的精准供体-受体匹配

面对传统方法的局限，研究团队设计了MOZAIC（Microbiome Matching Optimization via Artificial Intelligence），一个基于深度学习的计算框架，旨在预测特定供体-受体配对能否实现移植后的微生物组趋同。

MOZAIC 框架架构

核心理念：基于生态位填充（niche filling）和微生物组趋同（microbiome convergence）的生态学原理，FMT成功取决于供体与受体之间的"互补性"而非任何一方的单独特征

输入层：供体/受体的多界微生物组特征（细菌、真菌、病毒、古菌共1541个分类特征）+ 功能特征（53条MetaCyc通路 + 246个KO基因家族）= 1840个特征

上游处理：5个计算模块（Computational Blocks 1-5）并行提取供体和受体特征 → 激活模块 + 过滤层降噪

下游整合：密集连接的神经网络集群（Densely-Connected Neural Network Clusters）→ 捕捉供体-受体内在互补模式 → 多层感知器（MLP）输出预测

训练策略：L2正则化 + 15-20%随机Dropout + 动态学习率调整（β1=0.9, β2=0.999），对称平衡供体和受体特征权重，抑制噪声

最优超参数：增长率(growth rate)=2⁶=64, 滤波器=5, 学习率=5×10⁻⁴, 计算模块层数=5, 批大小=16-32

数据划分：严格三路分割（72%训练/8%验证/20%测试），保持疾病类型和标签在不同子集中的平衡分布

MOZAIC的设计有两大独特之处。其一，它并非简单地堆叠供体特征和受体特征进行预测，而是通过上游模块分别提取双方的特征后，在下游模块中捕获供体-受体之间的"互补模式"。这一设计理念源自生态学中"生态位互补"理论——移植前较高的供体-受体相异度可能意味着受体肠道中存在待填充的生态位空间，而这种互补性才是驱动成功趋同的关键。

其二，框架同时整合了分类学组成和功能潜能两个层面的信息。消融实验显示，当同时使用微生物组组成、代谢通路（pathways）和基因家族（KOs）三类特征时，MOZAIC达到了最佳预测性能，缺一不可。

七、MOZAIC性能表现：全面超越传统方法

表3：MOZAIC与传统ML模型在独立测试集上的性能对比

模型	AUC	准确率 (Accuracy)	召回率 (Recall)
传统ML方法 (范围)	0.700-0.819	—	—
MOZAIC (本方法)	0.879±0.006	0.818±0.012	0.838±0.025

在独立测试集上（103例FMT），MOZAIC的AUC达到0.879±0.006，准确率为0.818±0.012，召回率为0.838±0.025，全面超越了现有方法。值得注意的是：

• 模型训练在30个epoch内快速收敛，验证集AUC稳定在0.849±0.017，表明有效的过拟合控制。

• 当屏蔽供体或受体特征时，AUC分别降至0.775和0.770，证实了双方特征对于最佳预测同等重要。

• 在不同趋同定义阈值（相似度提升>0%、>1%、>2%）下，MOZAIC均维持了稳定的预测性能（AUC>0.85, 准确率/召回率>0.8），显示了对操作定义变化的鲁棒性。

• 在留一队列交叉验证（leave-one-cohort-out）中同样表现稳健，支持其在不同临床场景下的适用性。

八、临床转化潜力：AI有望将FMT有效率提升1.44倍

MOZAIC真正的价值在于其临床转化潜力。研究者进行了关键的回顾性模拟分析：在拥有临床结局标注的89例独立测试集FMT中——

•MOZAIC预测临床结局的准确率高达78.7%（即预测的"匹配/不匹配"与实际临床"有效/无效"的一致率）。

•整体基线临床有效率为49.4%，但在MOZAIC预测为"匹配"（即预测会发生微生物组趋同）的供体-受体配对中，临床有效率飙升至71.0%——这意味着如果根据MOZAIC的预测来筛选供体-受体配对，临床应答率可能提升1.44倍。

•即使排除CDI病例（CDI本身对FMT应答率极高，可能高估效果），MOZAIC指导下的配对选择仍可将临床有效率提升26.3%。

核心数据

49.4% → 71.0%

AI优化供体-受体匹配后的预估临床应答率提升

九、局限性与未来方向

研究团队坦诚地指出了当前工作的局限，展现了严谨的科学态度：

1. 回顾性设计：当前分析基于已完成的FMT队列数据，无法进行因果推断。未来需要通过前瞻性临床试验来验证MOZAIC指导下的供体选择是否能真正改善临床结局。

2. "黑箱"可解释性：MOZAIC作为深度学习模型，其内部决策过程难以直观解释。这与临床应用中对透明性的要求存在一定张力，也是未来需要着力改进的方向——例如通过注意力机制（attention）或可解释AI方法识别关键特征。

3. 样本量不均衡：部分疾病亚组（如Tourette综合征n=10、肾细胞癌n=7）样本量较小，MOZAIC在这些类别上的预测性能可能不够稳健。扩大特定疾病的FMT队列至关重要。

4. 混杂因素：供体的人口学信息（年龄、性别等）在多数已发表研究中缺失，且肠道微生物组本身受遗传、饮食、环境等多种因素影响而波动。

5. 缺乏非FMT对照组：无法完全排除疾病自然病程或安慰剂效应对结果的潜在影响。

未来，研究团队计划整合纵向肠道微生物组监测、宿主基因组学和免疫学数据、以及高分辨率长读长测序技术，进一步完善预测模型。更为关键的是，需要通过机制研究阐明微生物组趋同究竟是FMT疗效的直接中介因素，还是成功生态修复的下游标志物。

十、总结与展望

这项研究具有多重重要意义。在科学层面，它重新定义了FMT成功的本质——不是简单的"好菌"移植，而是供体菌群与受体生态系统之间的系统性互补与融合。微生态趋同（microbiome convergence）超越了特定菌种的定植，成为一个跨疾病的通用疗效预测指标。

在技术层面，MOZAIC展示了人工智能如何突破传统生态学指标的局限，通过整合多界微生物组信息和功能特征，实现对复杂微生物互作的高精度预测。其1.44倍的临床改善模拟结果，为精准微生物组治疗提供了令人振奋的前景。

在转化层面，该研究直接回应了粪菌移植领域的一个核心瓶颈——如何为特定患者选择最佳供体。MOZAIC提供了一个可操作的计算工具，有望从当前的"试错"模式升级为"精准匹配"模式。

正如作者所言，未来需要将MOZAIC推进到介入性临床试验中，同时阐明其预测背后的机制基础，最终弥合微生物生态学与个性化医学之间的鸿沟。我们有理由期待，在AI的加持下，FMT这一古老的疗法将焕发新的生机，迈向精准化、个性化的新时代。

END

参考文献

1. Su Q, Chen S, Lau LHS, et al. Artificial intelligence-driven donor-recipient gut microbiome matching for optimized fecal microbiota transplantation. Cell Reports, 2026, 117301.

2. Wang X, Zhao D, Bi D, et al. Fecal microbiota transplantation: transitioning from chaos and controversial realm to scientific precision era. Science Bulletin, 2025, 70:970-985.

3. Schmidt TSB, Li SS, Maistrenko OM, et al. Drivers and determinants of strain dynamics following fecal microbiota transplantation. Nature Medicine, 2022, 28:1902-1912.

4. Ianiro G, Puncochar M, Karcher N, et al. Variability of strain engraftment and predictability of microbiome composition after fecal microbiota transplantation across different diseases. Nature Medicine, 2022, 28:1913-1923.

5. Chen Q, Wu C, Xu J, et al. Donor-recipient intermicrobial interactions impact transfer of subspecies and fecal microbiota transplantation outcome. Cell Host & Microbe, 2024, 32:349-365.e4.

6.研究代码开源地址: https://github.com/ChenSizhe13893461199/FMT_donor_recipient_matching

7. 数据获取: NCBI PRJNA1262688, PRJNA1263159, 及文中列出的其他公共数据集。

免责声明：本文仅供学术交流与科普传播之用，不构成任何临床建议。