云平台组学小工具——MLST分析
MLST,即多位点序列分型(Multilocus sequence typing)是一种通过测定核酸序列来对细菌进行分型的方法,其概念最早来源于多位点酶电泳(multilocus enzyme electrophoresis, MLEE)。简单来说,就是用PCR扩增并测定多个管家基因(通常是6~8个)内部片段的序列,根据序列差异来区分不同的细菌菌株。每个管家基因的序列会被分配一个等位基因编号,这些编号组合起来就构成了一个序列型(sequence type, ST)。以肺炎克雷伯菌为例,它的ST型就是基于rpoB、gapA、mdh、pgi、phoE、infB、tonB这7个管家基因来确定的。
随着全基因组测序技术的发展,MLST不再依靠PCR扩增,对于已经有成熟MLST方案的细菌,可以直接拿它的全基因组序列(FASTA格式)去数据库里比对,就能快速预测出ST型。目前用得比较多的三个MLST数据库是PubMLST、BIGSdb-Pasteur和Enterobase,有关数据库的介绍可参考之前发布的文章《常用的MLST在线分析网站》。
以下以文献《Emergence and hospital dissemination of hypervirulent carbapenem-resistant Klebsiella pneumoniae lineages in eastern China》为例进行说明。该研究是温州医科大学附属第二医院的一项单中心、回顾性研究,所有菌株均来自同一家医院。从ST型的时间分布趋势、进化与传播动态、基因特征关联三个维度来呈现ST型在这项研究中的作用。
分析意义:
看ST型在不同年份的检出情况,可以知道医院里哪些克隆一直存在,哪些变多了,哪些变少了。追踪主要ST型的变化趋势,能帮助发现优势克隆的演替、新发高风险克隆的出现,还有地方性流行克隆的持续存在情况等。
本文结果:
图1A展示了2010-2025年间131株CRKP的ST型年度分布。ST11在整个研究期间持续检出,呈现地方性流行特征;ST15从2021年开始检出变多;ST23主要在研究早期(2013-2017年)流行,后期检出减少。进一步把ST型和菌株分类(经典CRKP、CR-hvKP、hv-CRKP)放在一起看,CR-hvKP以ST23为主(占66.7%),流行于研究早期;而hv-CRKP以ST11为主(占72%),自2019年起成为优势克隆。这说明高毒力耐药克隆发生了更替——ST23型CR-hvKP慢慢被ST11型hv-CRKP取代。

Fig. 1 ST distribution and antibiotic resistance profiles of CRKP isolates. A ST distribution among CRKP isolates from 2010 to 2025. The bar graph shows the number of isolates per year, with colors indicating different STs. The inset graph displays the yearly distribution of isolates grouped into three lineages: classical CRKP, CR-hvKP, and hv-CRKP.
分析意义:
基于全基因组系统发育分析可以展示不同ST型菌株之间的亲缘关系。结合SNP差异和患者科室信息的传播网络分析,则有助于评估不同ST型克隆的院内扩散能力,识别具有高传播风险的优势克隆。
本文结果:
图2A(系统发育树)显示菌株按ST型聚成不同的分支,ST11、ST15、ST23、ST5799这些主要ST型里都有不同年份的菌株,说明它们在医院里一直存在没有消失。把ST型和K血清型对应起来看,KL64、KL47、KL25基本只在ST11里出现,且ST11内部还发生了从KL47向KL64的转变;另外KL19主要在ST15(90.91%),KL1主要在ST23(90%)中发现。这说明同一ST型的菌株往往具有相似的血清型特征,不同ST型之间则沿着不同的进化路径分化。
图2B-D(最小生成树) 基于SNP差异构建ST11、ST15、ST23三个主要ST型的院内传播网络。以SNP差异<21作为判断克隆传播的标准,发现ST11和ST15中分别有85.71%和91.49%的传播对涉及跨病区传播,而ST23只有46.15%。这说明不同ST型的传播能力是不一样的——ST11和ST15更容易在不同病区之间扩散,这可能也解释了为什么hv-CRKP(主要是ST11)这几年成了主流。

Fig. 2 Phylogenetic trees of CRKP isolates. A Phylogenetic tree of 131 CRKP isolates in this study. Tips are labeled by strain name and colored according to ST. The shape of the tips represents different CRKP lineages: classical CRKP, CR-hvKP, and hv-CRKP. Strain characteristics are mapped on the tree from the inner to the outer circle, including the year of isolation, source of isolation, type of ward, K locus, O locus, carbapenemase gene, ICEKp, and hypervirulence marker. Clades representing STs with more than two strains are highlighted with a background color fill. B-D Minimum Spanning Trees (MSTs) of ST11, ST15, and ST23 lineages from our collection. Each node represents an isolate, with colors corresponding to the ward types and shapes representing the three different CRKP lineages. The SNP differences of each lineage are indicated on the connecting lines, and lines suggesting potential clonal transmission are marked in red.
分析意义:
把ST型和耐药基因、毒力基因的携带情况对应起来,可以看出不同克隆在基因层面有什么特点,帮助理解为什么有的菌株耐药强、有的毒力强。
本文结果:
图3A(基因热图) 按菌株排列,展示了每个菌株分别携带了哪些耐药基因和毒力基因。菌株分成三类——经典CRKP、CR-hvKP、hv-CRKP,这三类和ST型是高度对应的。从热图上能明显看出来,CR-hvKP(主要是ST23)带的毒力基因比另外两类多得多,尤其是在免疫调节基因、沙门菌素基因簇iro、产气菌素基因簇iuc、colibactin基因簇clb、黏液表型调节基因rmpA方面。

Fig. 3 Resistance gene and virulence profiles among different CRKP lineages. A Heatmap of chromosomal mutation, AMR genes and virulence genes in the CRKP lineages. Virulence genes showing a positive rate exceeding 85% across all three CRKP lineages were excluded from this figure.
上海唯那生物已推出生信云平台服务,包含多种测序数据一键化分析流程和超百种实用小工具。可以帮助大家更方便的生物信息学分析,将操作流程简单化,无需安装软件,无需配置环境,即可快速输出需要的结果。
本节内容介绍的是小工具“MLST分析(单个基因组注释)”和“MLST分析(批量注释)”。您仅需微信扫码注册一个账号,在相应界面提交基因组序列(fasta格式),就能快速得到MLST分析结果。
免费,适合单样本分析
链接:http://cloud2.mimazi.net:9001/tool/article-139.html

付费解锁,可快速批量生成多样本结果
链接:http://cloud2.mimazi.net:9001/tool/article-138.html

需要注意单样本和多样本分析的两个小工具输入文件不同。
单样本分析仅支持基因组组装序列文件,后缀名可以是*.fasta、*.fa、*.fas、*.fna、*.fnn等,并设置菌株名称(避免空格)。
多样本分析同样是基于基因组组装序列文件进行分析,但需要把它们保存到同一个文件夹中,将其压缩为zip格式进行提交,同时设定阈值。

输出结果(单样本与多样本样式一致)
mlst.tsv/MLST.xls —ST分型预测结果

-
第一列:Sample_Name(样本名称);
-
第二列:Scheme(分型谱);
-
第三列:MLST_ST(ST型);
-
其它列:Gene(基因座名称及等位基因编号)。
分型谱对应的物种及来源数据库
本MLST分析小工具基于tseemann/mlst软件构建,下载地址为https://github.com/tseemann/mlst。
其核心数据库主要来源于PubMLST,并补充了部分BigSdb的数据。
当前版本涵盖以下122个种属,绝大多数为细菌,另有少量衣原体/支原体、病毒、真菌及昆虫。



Zhou W, Yang T, Zhou J, et al. Emergence and hospital dissemination of hypervirulent carbapenem-resistant Klebsiella pneumoniae lineages in eastern China. BMC Microbiol. 2025;26(1): 73. doi:10.1186/s12866-025-04638-5
基因组组装注释、统计绘图、数据处理、格式转换、数据下载、比较分析,百款专业小工具免费用
注册即用,一键直达:
https://cloud.mimazi.net/tool/index.html
分析细菌基因组,选专业平台,认准密码子·生信云,注册即用,不限样本量,7天免费使用!
云流程使用,一键直达:
https://cloud.mimazi.net/cloud/index.html

夜雨聆风