点击上方蓝色,关注稳妥少年
author: 稳妥少年
date: "2026/04/12"
版权声明: 本文为原创,欢迎分享,转载请注明出处。
本期推文聚焦反向虚拟筛选中的关键基础——蛋白质结构库的构建。我们详细介绍了为什么高质量的三维结构对药物发现至关重要,并以AlphaFold v6版本为例,提供了一个完整的R脚本,用于从GeneCards链接批量下载蛋白质PDB文件,助力科研人员快速搭建本地结构库。
一、药物筛选与反向虚拟筛选:蛋白质库是“靶点仓库”
在药物研发中,虚拟筛选是一种通过计算手段从海量化合物中寻找潜在药物的方法。传统虚拟筛选通常以一个已知的蛋白质靶点为中心,评估小分子库中的化合物能否与之结合。
而反向虚拟筛选则反过来:以一个或多个小分子(如天然产物、已有药物)为探针,在蛋白质靶点库中搜索可能与之结合的靶点。这种方法尤其适用于发现药物的新用途(老药新用)、解释药物副作用或寻找天然产物的作用机制。
无论是正向还是反向虚拟筛选,蛋白质三维结构库的质量和数量都直接决定了筛选结果的可靠性。没有准确的蛋白质结构,分子对接就成了“盲人摸象”。

二、AlphaFold:颠覆结构生物学的利器
传统获取蛋白质结构的方法(X射线晶体衍射、冷冻电镜等)耗时耗力,且许多蛋白质难以解析。AlphaFold 的出现彻底改变了这一局面——它利用深度学习,可以从氨基酸序列高精度预测蛋白质的三维结构。
目前AlphaFold已迭代至v6版本(即最新版本),相较于早期版本(如v4),v6在侧链构象、无序区域和复合物预测上均有显著提升。因此,使用v6版本构建本地蛋白质结构库,能大幅提高反向虚拟筛选的命中率和可信度。
三、脚本功能解析:从GeneCards链接到批量下载
我们编写了一个R脚本,能够自动从GeneCards数据库提供的AlphaFold链接中,批量下载v6版本的PDB文件。脚本的核心步骤如下:
1. 读取靶点信息
ann <- read.xlsx("./GeneCards_data.xlsx")links <- ann$link2. 设置下载目录并自动创建文件夹
download_dir <- "../Protein_WTSN.v6.0412/Alpha.Fold.pdb/"dir.create(download_dir, recursive = TRUE, showWarnings = FALSE)3. 定义下载函数并循环处理
download_file <- function(url, destdir) { filename <- basename(url) destfile <- file.path(destdir, filename) download.file(url, destfile, mode = "wb", quiet = FALSE)}for (url in links_v6) {tryCatch(download_file(url, download_dir), error = function(e) message("下载失败: ", url, "\n", e$message))}tryCatch确保单个文件下载失败不会中断整个流程。mode = "wb"适用于二进制文件(PDB文件本质是文本,但用wb更安全)。
4. 网络代理设置(如需要)
Sys.setenv(all_proxy = "socks5://127.0.0.1:7890")如果你的网络需要代理访问AlphaFold服务器,可在此配置。无需代理则可删除或注释该行。
四、使用注意事项
修改下载路径:请根据你的项目结构调整 download_dir,建议使用绝对路径避免歧义。网络稳定性:批量下载大量PDB文件可能需要较长时间,建议在稳定网络下运行,或分批下载。 文件覆盖:脚本默认覆盖已存在的同名文件。如需跳过已下载文件,可在 download_file中加入if(file.exists(destfile)) return()。
五、总结与展望
构建一个完整、最新的蛋白质结构库是开展反向虚拟筛选的地基工程。通过本脚本,你可以轻松将AlphaFold v6的结构整合到本地,为后续的分子对接、药效团建模或机器学习筛选提供高质量数据。
未来,随着AlphaFold数据库的持续更新,自动化脚本将成为每个计算生物学家的必备工具。希望本文能帮你迈出药物筛选的第一步——从获取可靠的蛋白质结构开始。
Sys.setenv(all_proxy="socks5://127.0.0.1:7890")library(openxlsx)ann<-read.xlsx("./GeneCards_data.xlsx")ann$link[1:10]links <- ann$link# 设置下载目录(请修改为你的实际路径)download_dir <- "../Protein_WTSN.v6.0412/Alpha.Fold.pdb/"# 相对路径,可改为绝对路径如 "/data/downloads"if (!dir.exists(download_dir)) { dir.create(download_dir, recursive = TRUE)}# 定义下载函数(覆盖已存在文件)download_file <- function(url, destdir) { filename <- basename(url) # 从 URL 提取文件名 destfile <- file.path(destdir, filename) download.file(url, destfile, mode = "wb", quiet = FALSE) message("已下载: ", destfile)}# 循环下载,捕获错误避免中断for (url in links) { tryCatch( download_file(url, download_dir), error = function(e) { message("下载失败: ", url, "\n错误信息: ", e$message) } )}生信科研服务(有意者私信联系,添加客服【文末】)
项目情况介绍



稳妥少年课程推荐【优惠促销】
淘宝官方:

温馨提示:稳妥少年所有课程都有售后服务,学习期间有问题可以交流学习!另外,课程视频都需要专用播放器观看,维护版权所有,如果不喜欢用专用播放器的,就不用来打扰啦!感谢大家的支持
认准稳妥少年,官方淘宝或者闲鱼店铺。其他途径一律不要购买,我们没有授权任何合作平台,谨防上当受骗
稳妥少年——单细胞分析实战

本课程系统介绍了单细胞RNA测序数据分析的全流程方法学体系。从原始数据读取开始,详细讲解了三种常见格式(标准10X输出、HDF5文件和稀疏矩阵)的处理策略,并统一转换为Seurat对象进行分析。质控阶段通过检测基因数、UMI总数和线粒体基因百分比等指标过滤低质量细胞,确保数据可靠性。标准化环节采用对数归一化和高变基因识别方法,通过主成分分析降维,使用JackStraw检验和肘部图确定最佳维度。
细胞聚类分析采用共享最近邻算法和Louvain聚类,在UMAP降维空间可视化细胞亚群。基于经典标记基因表达模式,对细胞类型进行系统注释。差异表达分析采用多层次策略,包括整体水平比较、细胞类型特异性分析和功能富集评估。细胞比例分析通过统计检验评估实验组间细胞组成的差异。
高级分析模块涵盖细胞间通讯网络构建(CellChat)、发育轨迹推断(Monocle)、代谢通路活性评估(scMetabolism)以及基因集富集分析(GSEA)。特别整合了GSVA通路活性评分、AddModuleScore模块化评分等创新方法,全面解析细胞功能状态。可视化方面采用多类型图表(火山图、热图、轨迹图、网络图等)呈现分析结果,所有方法均经过标准化流程验证,确保分析结果的可靠性和可重复性,为疾病机制研究和生物标志物发现提供系统解决方案。

【淘宝】https://e.tb.cn/h.7IBE4L1VZmhyFzH?tk=pI8SURprzmu tG-#22>lD 「稳妥少年,单细胞分析实战课」点击链接直接打开 或者 淘宝搜索直接打开咸鱼
【闲鱼】https://m.tb.cn/h.7IBwfPZ?tk=2EpqURpH0jZ HU293 「我在闲鱼发布了【【稳妥少年-单细胞分析实战全流程视频课】】」点击链接直接打开稳妥少年——生信技能课
本课程系统涵盖了生物信息学在基因组数据挖掘与分析中的核心流程与方法。课程从GEO、TCGA等公共数据库的数据检索与下载入门,进而学习差异表达分析(使用limma、DESeq2等工具)及结果可视化。在此基础上,深入进行功能富集分析(GO、KEGG)和蛋白质互作网络构建,并利用Cytoscape筛选关键基因模块。课程还整合了多种机器学习算法进行生物标志物筛选,并教授诊断列线图、神经网络模型等临床预测模型的构建与评估。此外,课程内容扩展至基因集富集分析(GSEA/GSVA)、免疫细胞浸润分析、基因的亚细胞与染色体定位、表型关联分析、表达相关性分析、单基因预后分析以及肿瘤免疫检查点分析等一系列高级专题,旨在提供从基础到前沿的完整生物信息学分析能力。

淘宝
【淘宝】https://e.tb.cn/h.7INfO4ga0MuqSsm?tk=e4YfURpGVeV CZ007 「稳妥少年一生信技能课」点击链接直接打开 或者 淘宝搜索直接打开咸鱼
【闲鱼】https://m.tb.cn/h.7sB0ThE?tk=RIgqURptokQ HU287 「我在闲鱼发布了【本课程《生物信息学全流程实战技能课》系统讲授疾病研究,尤其是】」点击链接直接打开TCGA肿瘤预后+单细胞+虚拟基因敲除
本研究系统整合了多组学数据与生物信息学方法,旨在探究多发性骨髓瘤的分子特征、预后标志及免疫微环境。首先,从TCGA与GEO数据库获取并标准化了批量转录组数据,通过差异表达分析鉴定了疾病相关的关键基因,并利用GO/KEGG富集分析阐释其功能。基于此,采用Cox回归与LASSO算法构建并验证了一个多基因预后风险模型,该模型在独立队列中展现出稳健的预测效能。进一步分析揭示了风险评分与临床病理特征的独立性,并通过列线图实现了个体化生存预测。
为深入解析肿瘤微环境,本研究应用ssGSEA评估了免疫细胞浸润水平,并分析了其与风险模型及免疫检查点表达的相关性。同时,利用单细胞RNA测序技术,在细胞分辨率下刻画了骨髓瘤微环境的细胞组成图谱,识别了主要免疫细胞亚群,并量化了其在不同临床状态下的比例变化。通过CellChat工具,系统推断了疾病组与对照组间细胞通讯网络的差异。此外,采用scTenifoldKnk算法对髓系细胞亚群进行了虚拟基因敲除分析,从网络层面探索了关键基因的调控功能。
综上,本研究通过从宏观群体水平到微观单细胞层面的多层次分析,构建了多发性骨髓瘤的预后预测体系,并深入揭示了其肿瘤免疫微环境的特征与潜在调控机制,为理解疾病生物学及开发治疗策略提供了新的见解和数据支持。

淘宝
【淘宝】https://e.tb.cn/h.7sB1fudbltixEGJ?tk=t4ueURpupUW CZ057 「稳妥少年【肿瘤预后+单细胞+基因敲除】全流程视频课」点击链接直接打开 或者 淘宝搜索直接打开咸鱼
【闲鱼】https://m.tb.cn/h.7IBBBmp?tk=vJ6RURpvlA0 MF278 「我在闲鱼发布了【肿瘤预后+单细胞+基因敲除全流程视频课】」点击链接直接打开稳妥少年网络毒理学课程
网络毒理学分析流程详细内容
(1)疾病转录组数据准备(2)毒物毒理学评估(3)毒物靶点基因的获取(4)疾病靶点基因的获取(5)差异表达基因的获取(6)候选基因的获取(7)GO与KEGG富集分析(8)毒物-基因-通路-疾病网络构建(9)蛋白质相互作用网络构建和核心基因筛选(10)表达水平验证筛选关键基因(11)相关性和功能相似性分析(12)转录因子-基因-miRNA调控网络构建(13)关键基因富集分析(14)GeneMANIA分析、亚细胞定位和染色体定位分析(15)分子对接(16)分子动力学模拟

课程购买链接
淘宝
【淘宝】https://e.tb.cn/h.7INTsgyv2Iulc20?tk=BC4iURpwibt HU287 「稳妥少年【网络毒理学全流程视频课】」点击链接直接打开 或者 淘宝搜索直接打开咸鱼
【闲鱼】https://m.tb.cn/h.7sBWlNW?tk=4QFxURpwrXV CZ028 「我在闲鱼发布了【稳妥少年【网络毒理学全流程视频课】】」点击链接直接打开分子对接、动力学模拟课程推荐
课程一:《分子对接零基础教学课程上线 | ADT/Vina/Maestro全流程详解》
介绍:
本课程系统讲解从原理到实操的全流程操作,配套三大常用工具教学,助你快速掌握药物设计核心技能。
课程主要内容包括:分子对接原理、全流程梳理、软件下载、蛋白质小分子数据库介绍、ADT受配体结果预处理、对接口袋预测及设置、vina\qvina分子对接计算、结果可视化相互作用力分析、Maestro软件安装介绍、Maestro分子对接计算、高通量分子对接、Maestro蛋白质-蛋白质对接计算

咸鱼平台购买链接
【闲鱼】https://m.tb.cn/h.7IzXZSs?tk=46dDURpBGRw CZ356 「我在闲鱼发布了【【分子对接零基础教学课程上线 | ADT/Vina/Maes】」点击链接直接打开淘宝购买链接:
【淘宝】https://e.tb.cn/h.7Iz2CBImNGyXB7j?tk=ZLHcURKaXX5 CA381 「【分子对接零基础教学课程上线 | ADT/Vina/Maestro全流程详解】」点击链接直接打开 或者 淘宝搜索直接打开课程二:《分子动力学全流程视频课程》
介绍:
本课程系统讲解从原理到实操的全流程操作,配套三大常用工具教学,助你快速掌握药物设计核心技能。
课程总时长4小时左右,从动力学模拟原理解读、GROMACS软件安装、受配体拆分预处理、拓扑文件构建、模拟体系搭建、动力学模拟以及下游分析、结果图的绘制和解读、文章发表的撰写方法;可以说是全流程一课通!!!

咸鱼平台购买链接
【闲鱼】https://m.tb.cn/h.7INhxHT?tk=g5EbURpCGQu HU293 「我在闲鱼发布了【分子动力学全流程视频课】」点击链接直接打开淘宝购买链接:
【淘宝】https://e.tb.cn/h.7IN7PzuTYtDBIYA?tk=t5buURpBFbN HU591 「稳妥少年《分子动力学全流程视频课程》时长4小时左右,一课通!」点击链接直接打开 或者 淘宝搜索直接打开优惠活动:现在同时购买两套课程,赠送稳妥少年自研的《高通量分子对接工具HTMDv3》,赠送9113个小分子库,以及2101个重要活性分子库,助力大家进行药研相关工作!!!
工具介绍:高通量分子对接软件(HTMDv3)介绍及教学——稳妥少年

以上就是本期全部内容,祝大家学习愉快,收获满满,请给稳妥少年点一个赞、并转发给新的小伙伴吧!!!
稳妥少年建立了第一个讨论群(稳妥少年_共勉学习交流群),特此欢迎新老朋友进群交流学习,让学习变简单!
交流已超200+,无法直接扫码加入,大家如果需要的可以添加微信,拉您进群的。添加微信时,一定要注明来意哈。
祝大家学习愉快!也感谢大家对公众号的支持,继续努力!!!今天分享的内容可能存在不足,希望感兴趣的小伙伴进行批评指正。同时也希望大家可以一键三连(点赞、关注和转发“稳妥少年”)


夜雨聆风