TCGA病理切片下载保姆级教程(2026最新版)!



















TCGA数据库里除了表达谱和临床信息,还有一个经常被忽略的宝藏——病理切片。今天手把手教大家搞定下载!

方法一:官方工具下载
No.1

第一步:锁定目标肿瘤
打开TCGA官网:https://portal.gdc.cancer.gov/

这里以TCGA-ACC作为演示案例,大家可以根据自己的研究需求换成其他癌种。

选好后,进入数据存储页面,勾选病理切片数据,再把它加入购物车。

把病理切片加入购物车之后,就可以直接在购物车页面里点击下载按钮获取切片文件。

点击下载后,TCGA会弹出提示,因为数据量较大,需要借助官方提供的专用下载工具来完成。

点击对话框中的“Data Transfer Tool”链接,就会跳转到官方工具的下载页面,往下翻找到适配自己电脑系统的版本,下载安装即可。

下载完成后解压缩,就能得到一个可执行的工具文件。

第二步:使用官方工具批量下载
拿到官方工具后,重新进入购物车页面,把病理切片的下载清单保存到本地。

然后把下载好的清单文件和刚才解压出来的工具放在同一个文件夹里。

最后一步,打开命令行终端(控制台),进入工具和清单所在的文件夹,输入以下命令即可开始下载:
gdc-client download -m 下载清单文件名.txt
(记得把“下载清单文件名.txt”替换成你实际保存的那个清单名称)

No.2
使用软件进行高速下载

一、运行软件
在方法二对应的文件夹里找到该软件,双击启动就行。

温馨提示:软件启动大约需要1-3分钟,请耐心等待。
二、获取目标肿瘤切片信息
启动完成后,进入病理组学模块,选择你要研究的癌种,软件会自动从TCGA服务器拉取该肿瘤的所有病理切片信息。

以TCGA-ACC为例,软件界面会显示从TCGA服务器共识别到323张病理切片,总数据量约为380.9GB。
三、分片调参
开始下载前,需要先设定好下载参数。建议按照以下配置来调整:分片数量设为64,超时时间设为10秒,重试次数设为30次。这样可以有效提升下载稳定性。

小贴士:如果需要长时间挂机下载,可以适当把超时秒数调高(建议不超过20秒),重试次数也能增加(建议不超过60次),这样能更好地应对网络波动。
四、执行下载
设定好这些参数后,点击下载按钮就可以开始批量获取病理切片了。

实测即使在关闭加速器的环境下,下载速度也能基本跑满宽带带宽。而且因为前面配置了超时重试机制,即便遇到网络波动,软件也能自动恢复下载请求,不会像官方工具那样直接卡死不动。
所有病理切片下载完成后,文件会自动存放在软件安装目录下的 GDC_Slide 文件夹里。



下载过程中,可以随时打开已下载的病理切片进行预览,确认文件是否完整、没有因为网络波动而损坏。

到这里,我们就成功拿到了TCGA目标癌种的全部病理切片数据。
拿到病理切片后,就可以结合自己关注的目标基因,开展深度学习建模、病理组学分析等后续研究了。



夜雨聆风