你还在手动构建物种进化树吗?
做宏基因组、16S、ITS 或者转录组分析的时候,咱们经常遇到一个场景——
OTU 注释完了,手上有一串物种名:
Homo sapiensPan troglodytesMus musculusRattus norvegicus...老板说:"画个进化树看看。"
然后你就开始了漫长之路:找序列 → 多序列比对 → 建树 → 调图……一套组合拳下来,半天过去了。
但如果我告诉你,不需要序列,10 秒就能从物种名直接生成进化树呢?
taxtree-tree:基于 Taxonomy 数据库的分类学树构建插件
taxtree-tree是我们基于公众号已开发的taxtree-rs命令行工具,选取建树tree功能,为 TBtools平台打造的一款图形交互界面插件,核心能力就一句话:
📌 输入一串物种名 → 输出一棵基于 NCBI Taxonomy 的分类学进化树(Newick 格式)
它背后站着的,是 NCBI Taxonomy 数据库——目前收录了地球已知物种中约 10%的生物分类与命名信息,共计 768,430个分类单元(taxa)。
| 合计 | 768,430 |
为什么选择 taxtree-tree?
❶ 不需要序列
传统建树依赖 MSA(多序列比对),费时费力。taxtree-tree 走的是 分类学层级拓扑——利用 NCBI Taxonomy 中已有的父子关系(界门纲目科属种),直接推算进化树结构。
❷ 速度极快
taxtree-tree 基于 Rust编写,单二进制文件,无运行时依赖。完整数据库索引构建约 15 秒,单次查询 <1ms,100 个物种的树构建仅需 ~50ms。
❸ 输出格式通用
输出标准的 Newick 格式,可直接导入:
• 🧬 ggtree(R 包,Bioconductor) • 🌐 iTOL(在线进化树可视化) • 🖥️ FigTree(桌面端进化树查看器) • 📦 itol.toolkit(R 包,iTOL 批量化伴侣)
❹ TBtools 一键运行
不需要敲命令行,不需要配环境。在 TBtools 中点点鼠标,拖入物种列表,Done。
插件安装
前提:已安装 TBtools ≥ v2.0
1. 打开BioAnno社区,直接下载taxtree-tree插件:https://www.bioanno.com/plugin-detail/1290 2. 打开 TBtools,点击菜单栏 Plugin → Install Plugin,安装taxtree-tree插件
3. 首次使用前,需下载 NCBI Taxonomy 数据(taxdump.tar.gz文件,约 70 MB 压缩包),链接为:https://ftp.ncbi.nih.gov/pub/taxonomy/,下载后解压 5. 数据就绪后即可使用
上手教程
Step 1:准备物种列表
新建一个文本文件 taxa.txt,每行一个物种名(学名):
Homo sapiensPan troglodytesMus musculusRattus norvegicusBos taurusCanis lupus familiarisGallus gallusDanio rerioDrosophila melanogasterCaenorhabditis elegansStep 2:打开插件界面
TBtools → Plugin → taxtree-tree

Step 3:构建索引(仅第一次使用需要)
在功能选择中选取index功能,将包含names.dmp和nodes.dmp的目录路径(taxdump.tar.gz文件解压缩后的路径)输入到dump-dir文本框。输出文件文本框则输入索引存储的绝对路径,建议命名为taxdump.ttidx。
注意:此时索引文件路径、存储物种拉丁名的文档这两处参数栏均不能为空,可以随意拖拽一个文件,不影响结果。
Step 4:设置参数
此时,在功能选择中切换至tree功能:
taxdump.ttidx | ||
taxa.txt | ||
tree.nwk |
Step 4:一键运行
点击 Start,等待数秒,完成!
输出文件 tree.nwk内容示例:
((((Homo_sapiens,Pan_troglodytes),Mus_musculus),Bos_taurus),Gallus_gallus);结果可视化
拿到 Newick 文件后,你有三种主流可视化选择:
方案 A:ggtree(推荐)
library(ggtree)tree <- read.newick("tree.nwk")ggtree(tree)+ geom_tiplab()+ geom_tippoint(color ="#E64B35", size =3)+ theme_tree2()方案 B:iTOL 在线工具
访问 itol.embl.de,上传 tree.nwk,拖拽式美化,无需写代码。
方案 C:FigTree 桌面软件
下载 FigTree,打开 tree.nwk,交互式调整树形布局。
应用场景一览
常见问题
Q: 我输入的物种名在数据库里找不到怎么办?
A: 请检查学名拼写(如 Homo sapiens而非 Homo sapien)。
Q: 支持中文俗名吗(如 "人类")?
A: 当前仅支持 NCBI Taxonomy 中的 scientific name。建议使用学名查询。
Q: 数据库多久更新一次?
A: NCBI Taxonomy 数据库持续更新。我们建议每 3-6 个月重新下载一次最新数据。
Q: 生成的树能直接发表吗?
A: 分类学拓扑树反映的是 NCBI 收录的分类层级关系,不等同于基于分子序列构建的系统发育树。发表时请注明数据来源和方法。
更多功能
体验更完整更全面的taxtree功能,请下载使用命令行工具版本taxtree-rs:
https://github.com/nongxinshengxin/taxtree-rs
引用
如果 taxtree-tree 对你的研究有帮助,请引用:
taxtree-rs: https://github.com/nongxinshengxin/taxtree-rs
NCBI Taxonomy Database: https://www.ncbi.nlm.nih.gov/taxonomy
关注我们
更多生物信息学工具和教程,请关注微信公众号:
「农心BioInfo」
夜雨聆风