做医学科研的人,最痛苦的不是没想法,而是想法有了、代码不会写、分析跑不通。很多人卡在R语言环境配置、Python包冲突、数据库连接失败这些基础设施问题上,真正该花时间的科学问题反而被耽误了。技能在AI时代已经都开源了,不用学,拿来就能用。
2025到2026年,AI Agent生态发生了质变。GitHub上出现了一批开源可下载、可安装、可直接运行的科研Skill库。这些Skill不是概念性的提示词模板,而是封装了完整代码、依赖配置、数据库连接和分析流程的可执行模块。安装后,你的AI Agent(Cursor、Claude Code、Codex等)就能自动调用这些Skill完成从文献检索到数据分析的全流程。我们之前介绍过一个国内的免费Trae,可以用这个尝试(国内友好免费Trae SOLO实现文献查询与数据库查询十倍效率)
今天这篇文章,我把目前GitHub上真正能下载运行的医学科研AI Agent Skill做一个系统梳理。每个Skill都标注了安装命令、适用场景和运行方式,看完就能直接上手。
一、什么是Agent Skill?为什么比Prompt强得多
很多人把Agent Skill和Prompt混为一谈,这是最大的误解。Prompt只是文字指令,Skill是Prompt + 执行代码 + 依赖配置 + 数据库连接的完整封装。
通俗理解
Prompt相当于你给实习生口述任务;Skill相当于你给实习生一本标准操作手册(SOP)+ 全套实验器材。后者出错的概率低得多,产出也更稳定。
★ ★ ★
二、三大核心开源Skill库总览
目前GitHub上医学科研相关的开源Skill库主要有三个:Scientific Agent Skills(K-Dense-AI)、AI-research-SKILLs(Orchestra Research)、Life Sciences MCP(donbr)。它们各有侧重,可以组合使用。
| Scientific Agent Skills | ||||
| AI-research-SKILLs | ||||
| Life Sciences MCP |
★ ★ ★
三、Scientific Agent Skills:最大的全能科研Skill库
GitHub: https://github.com/K-Dense-AI/scientific-agent-skills | Star: 27,000+ | MIT License | 134个Skill
这是目前GitHub上最大的开源科研Skill集合,由K-Dense公司维护。它把134个科研技能封装成标准化的Agent Skill,覆盖生物信息学、药物发现、临床研究、机器学习等17个科学领域。支持Cursor、Claude Code、Codex、Gemini CLI等主流AI编程工具。
3.1 安装方式(三选一)
# 方式1:npx安装(推荐)
npx skills add K-Dense-AI/scientific-agent-skills
# 方式2:GitHub CLI安装
gh skill install K-Dense-AI/scientific-agent-skills
# 方式3:安装单个Skill
npx skills add https://github.com/k-dense-ai/scientific-agent-skills --skill scanpy
3.2 生物信息学与基因组学Skill(21+个)
这是医学科研最核心的Skill模块,覆盖从序列分析到单细胞RNA-seq的完整流程。
| scanpy | ||
| biopython | ||
| pydeseq2 | ||
| pysam | ||
| anndata | ||
| gget | ||
| scvelo | ||
| cellchat | ||
| monocle3 | ||
| pygenometracks | ||
| cnvkit | ||
| pyvcf | ||
| mutsig | ||
| phylogenetics | ||
| variant-annotation | ||
| gene-regulatory-networks | ||
| single-cell-integration | ||
| spatial-transcriptomics | ||
| rna-velocity | ||
| bulk-rna-seq | ||
| chip-seq |
3.3 临床研究Skill(8个)
| clinical-trials | ||
| pharmacogenomics | ||
| variant-interpretation | ||
| drug-safety | ||
| clinical-decision-support | ||
| treatment-planning | ||
| ehr-analysis | ||
| survival-analysis |
3.4 科学数据库Skill(28+个)
这个模块是Scientific Agent Skills的杀手锏。28个数据库Skill覆盖了从基因到药物到临床的全链路数据,AI Agent可以直接查询结构化数据,而不是在搜索引擎里大海捞针。
| pubchem | ||
| chembl-database | ||
| uniprot-database | ||
| pdb | ||
| drugbank-database | ||
| kegg | ||
| clinvar-database | ||
| cosmic-database | ||
| ensembl-database | ||
| geo-database | ||
| gwas-database | ||
| reactome-database | ||
| string-database | ||
| alphafold-database | ||
| biorxiv-database | ||
| clinicaltrials-database | ||
| fda-database | ||
| zinc-database | ||
| brenda-database | ||
| clinpgx-database | ||
| uspto-database | ||
| openalex-database | ||
| pubmed-database | ||
| gtex-database | ||
| tcga-database | ||
| mimic-database | ||
| nhanes-database | ||
| ukbiobank-database |
3.5 科学写作与文献综述Skill(20+个)
| literature-review | ||
| hypothesis-generation | ||
| scientific-writing | ||
| peer-review | ||
| grant-writing | ||
| citation-management | ||
| poster-design | ||
| slide-generation | ||
| figure-generation | ||
| schematic-drawing | ||
| document-processing | ||
| academic-search |
实战案例:单细胞分析3分钟出结果
传统方式:安装Scanpy + 配环境 + 写代码,2小时起步,中间还可能遇到包冲突。
使用Skill方式:
1. 安装Skill:npx skills add K-Dense-AI/scientific-agent-skills --skill scanpy
2. 对AI Agent说:"用scanpy分析这个h5ad文件,做质控、降维、聚类和标记基因鉴定"
3. Agent自动调用Skill,3分钟后输出UMAP图、聚类结果和标记基因表格。
效率提升40倍,而且不需要你自己写一行代码。
★ ★ ★
四、AI-research-SKILLs:AI研究工程专用Skill库
GitHub: https://github.com/zechenzhangAGI/AI-research-SKILLs | Star: 9,000+ | 86个Skill | 22个分类
这是由哈佛大学背景的Orchestra Research团队维护的Skill库,侧重AI模型训练、评估和论文工程。如果你的科研涉及深度学习模型构建或需要发表机器学习相关的论文,这个库是必装的。
4.1 安装方式
# 交互式安装(推荐)
npx @orchestra-research/ai-research-skills
# 安装全部Skill
npx @orchestra-research/ai-research-skills install --all
# 安装特定分类
npx @orchestra-research/ai-research-skills install post-training
# 本地项目安装
npx @orchestra-research/ai-research-skills install --all --local
4.2 核心Skill分类与功能
| Autoresearch | autoresearch | |
| litgpt | ||
| grpo-rl-training | ||
| axolotl | ||
| deepspeed | ||
| vllm | ||
| flash-attention | ||
| academic-plotting | ||
| rag-pipeline | ||
| multimodal-training | ||
| nemo-guardrails | ||
| evaluating-llms-harness |
医学科研中的AI模型应用
如果你在做临床预测模型(如基于EHR的死亡风险预测、影像AI诊断),这个Skill库能帮你:
1. 用 autoresearch 自动规划实验方案;
2. 用 peft 做LoRA微调,在有限算力下训练大模型;
3. 用 evaluating-llms-harness 标准化评估模型性能;
4. 用 academic-plotting 生成符合期刊要求的ROC曲线和混淆矩阵图。
★ ★ ★
五、Life Sciences MCP:生命科学数据库专用接口
GitHub: https://github.com/donbr/lifesciences-research | Star: 3,000+ | 12个MCP Server | MIT License
这个库不走Skill路线,而是采用MCP(Model Context Protocol)协议,为AI Agent提供标准化的生命科学数据库访问接口。它的特点是数据库覆盖精准、API调用稳定、适合药物发现工作流。
5.1 已上线的12个MCP Server
| chembl-mcp | |||
| opentargets-mcp | |||
| hgnc-mcp | |||
| ensembl-mcp | |||
| entrez-mcp | |||
| uniprot-mcp | |||
| string-mcp | |||
| biogrid-mcp | |||
| pubchem-mcp | |||
| iuphar-mcp | |||
| wikipathways-mcp | |||
| clinicaltrials-mcp |
5.2 安装方式
# 克隆仓库
git clone https://github.com/donbr/lifesciences-research.git
cd lifesciences-research
# 安装依赖(每个Server独立)
cd chembl-mcp && pip install -e .
# 配置MCP(以Claude Code为例)
# 在 ~/.claude/config.json 中添加:
{
"mcpServers": {
"chembl": {
"command": "python",
"args": ["-m", "chembl_mcp"]
}
}
}
药物发现工作流示例
用Life Sciences MCP可以搭建一条完整的药物发现流水线:
1.opentargets-mcp查询疾病相关靶点;
2.chembl-mcp获取靶点的生物活性数据;
3.pubchem-mcp查询化合物结构;
4.uniprot-mcp获取靶点蛋白序列;
5.string-mcp构建靶点PPI网络。
全程不需要手动下载数据,AI Agent通过MCP接口直接查询数据库。
★ ★ ★
六、其他值得关注的科研Skill与工具
6.1 BioMCP(生物医学MCP服务器)
GitHub: https://github.com/chengeric/biomcp
BioMCP是目前生物医学领域最完善的MCP服务器,整合了PubMed、UniProt、PDB、ClinVar等多个核心数据库。特点是查询速度快、结果结构化、支持自然语言提问。
6.2 AlphaFold MCP(蛋白质结构预测)
GitHub: https://github.com/alphafold-mcp/alphafold-mcp
直接调用AlphaFold数据库进行蛋白质结构预测和可视化,不需要自己部署AlphaFold,适合结构生物学研究。
6.3 K-Dense BYOK(桌面端AI科学家)
GitHub: https://github.com/K-Dense-AI/k-dense-byok
这是K-Dense推出的免费开源桌面AI科学家应用,封装了Scientific Agent Skills的全部134个Skill,支持40+模型。特点:
零配置,下载即用 数据留在本地,隐私安全 可选云端计算(Modal)处理大数据 自带Web搜索、文件处理、数据库查询
如果你不想折腾命令行安装,这是最省事的入门方式。
七、Skill选型指南:按科研场景匹配
| 单细胞RNA-seq分析 | npx skills add K-Dense-AI/scientific-agent-skills --skill scanpy | ||
| 差异表达分析 | npx skills add K-Dense-AI/scientific-agent-skills --skill pydeseq2 | ||
| 肿瘤基因组分析 | npx skills add K-Dense-AI/scientific-agent-skills --skill cnvkit | ||
| 药物靶点发现 | |||
| 分子对接 | npx skills add K-Dense-AI/scientific-agent-skills --skill rdkit | ||
| 临床预测模型 | |||
| 文献综述写作 | npx skills add K-Dense-AI/scientific-agent-skills --skill literature-review | ||
| 国自然基金申请 | npx skills add K-Dense-AI/scientific-agent-skills --skill grant-writing | ||
| 蛋白质结构分析 | |||
| 公共数据挖掘 | npx skills add K-Dense-AI/scientific-agent-skills --skill geo-database | ||
| 空间转录组 | npx skills add K-Dense-AI/scientific-agent-skills --skill spatial-transcriptomics | ||
| 变异注释与解读 |
八、运行环境要求与避坑指南
8.1 基础环境(可用Trae等云端运行没有要求)
| 3.12 | ||
| uv | ||
| 16GB+ | ||
8.2 常见坑与解决方案
| 包冲突 | ||
| API Key缺失 | ||
| Skill未激活 | ||
| 大数据内存溢出 | ||
| MCP连接失败 |
重要提醒
Skill能大幅降低技术门槛,但不能替代你对科学问题的理解。AI Agent跑出来的结果,你必须能判断对错。特别是统计方法和实验设计,AI可能会选错方法或忽略关键假设。Skill是加速器,不是自动驾驶——方向盘还在你手里。
★ ★ ★
九、总结:医学科研AI Agent Skill全景图
| Scientific Agent Skills | ||||
| AI-research-SKILLs | ||||
| Life Sciences MCP | ||||
| AtomisticSkills | ||||
| K-Dense BYOK |
最后说一句掏心窝的话:这些Skill不是让你变懒,而是让你把精力从配环境、调包、写样板代码上解放出来,真正投入到科学问题本身。一个会善用AI Agent Skill的科研人,效率可能是传统方式的5到10倍。但前提是,你得知道自己在做什么,能判断AI的输出是否合理。
工具已经准备好了,剩下的就是你的科学问题。

参考资料与GitHub仓库:
Scientific Agent Skills: https://github.com/K-Dense-AI/scientific-agent-skills (27,000+ stars) AI-research-SKILLs: https://github.com/zechenzhangAGI/AI-research-SKILLs (9,000+ stars) Life Sciences MCP: https://github.com/donbr/lifesciences-research (3,000+ stars) AtomisticSkills: https://github.com/atomisticskills/atomisticskills (MIT) K-Dense BYOK: https://github.com/K-Dense-AI/k-dense-byok BioMCP: https://github.com/chengeric/biomcp AlphaFold MCP: https://github.com/alphafold-mcp/alphafold-mcp Agent Skills标准: https://agentskills.io/
夜雨聆风