Darwin:开源的生物医学研究AI智能助手

在AI席卷各行各业的今天，生物医学研究这个高度专业化的领域也需要自己的智能助手。Darwin是我基于feynman改造得到的一个开源的生物医学生成式代理，它不仅能帮你检索文献、设计实验，还能完成系统综述、证据分级、甚至写出符合期刊规范的手稿。这篇文章带你深入了解darwin的每一个功能模块，看看AI如何真正融入科研工作流。

一、darwin是什么？

Darwin是基于feynman深度改造而来的生物医学专用AI研究工具。feynman偏向计算领域，缺少生物领域数据库访问以及领域相关的agent，且不支持DeepSeek。Darwin是在feynman框架下（核心还是Pi智能体）改造成的生物医学领域专家 —— 它懂PubMed的检索语法，知道PRISMA的系统综述规范，能识别HGNC基因命名，甚至能在你引用一篇论文前自动检查它是否已被撤稿。

Darwin 的核心定位有三点：

系统文献综述：不是简单堆砌摘要，而是遵循 PRISMA 指南的结构化分析
临床证据分级：自动识别RCT、队列研究、预印本，建立证据金字塔
可重复方案生成：输出附带检查清单（MIQE/CONSORT/ARRIVE）的实验方案

二、十六个工作流：从文献检索到手稿撰写

和feynman一样，darwin的交互方式非常直觉 —— 你可以像和同事聊天一样自然提问，也可以使用斜杠命令快速触发特定工作流。以下是全部16个工作流的详细说明：

`/deepresearch <主题>` — 深度多代理调查

这是最"重"的研究模式。Darwin会调动多个代理并行工作：一个负责PubMed检索，一个负责临床试验数据库，一个负责预印本监控，最后由一个证据整合代理将结果汇总成一份带引用来源的深度报告。适合对一个陌生领域进行快速但全面的摸底。

`/systematic-review <主题>` — PRISMA 合规系统综述

这是Darwin的招牌功能。输入一个研究问题后，它会：

制定检索策略（含MeSH词）
在多个数据库执行结构化检索
按PRISMA流程图筛选文献（识别、筛选、纳入、排除）
提取关键数据点
生成质量评估表格
输出结构化综述文本

`/lit <主题>` — 文献综述

比 /deepresearch 更轻量，专注于文献梳理而非深度分析。覆盖PubMed、bioRxiv、medRxiv 、等来源，自动生成带时间线的研究进展图。

`/target-dossier <基因/蛋白>` — 靶点档案

输入一个基因符号（如 KRAS G12C）或蛋白名称，Darwin会生成一份综合靶点档案：

基础信息：基因功能、通路、表达谱
成药性评估：小分子口袋、抗体表位、已上市/在研药物
专利与文献 landscape
相关临床试验状态

`/trial-tracker <药物/适应症>` — 临床试验追踪

实时监控ClinicalTrials.gov 和EU CTR，生成临床试验全景图：

按阶段分布（I/II/III/IV 期）
关键终点与入排标准对比
监管里程碑（IND、NDA、PDUFA日期）
竞品药物平行对比

`/retraction-sweep <主题>` — 撤稿与勘误扫描

在引用前执行尽职调查。PubMed Retraction Watch、Retraction Database 等多源交叉验证，标记 Expressions of Concern 和 Publisher Corrections。

`/protocol <名称>` — 实验方案起草

输出符合国际标准的可重复实验方案：

湿实验：附带 MIQE（qPCR）、ARRIVE（动物实验）、CONSORT（临床试验）检查清单
计算机模拟：附带代码版本、依赖环境、随机种子

`/biomarker-roc <标志物+疾病>` — 生物标志物 ROC 分析

设计并评估诊断/预后标志物：

计算敏感度、特异度、AUC
生成 ROC 曲线与置信区间
提供验证队列建议

`/dosage-calc <药物+患者>` — 用药剂量计算

基于标准参考文献（如 Lexicomp、Sanford Guide）计算个体化剂量：

肾功能调整（Cockcroft-Gault、MDRD）
肝功能调整（Child-Pugh分级）
药物相互作用警示

`/ic50-fit <化合物+数据>` — 剂量-反应曲线拟合

四参数逻辑回归（4PL）拟合，输出：

IC50 / EC50 及 95% 置信区间
Hill 斜率
拟合优度评估

`/review <成果>` — 生物医学同行评审

模拟领域专家评审，按期刊要求输出：

主要发现总结
方法学评价（统计方法、样本量、对照设置）
报告规范检查（CONSORT、ARRIVE、MIQE、PRISMA）
具体修改建议

`/audit <项目>` — 证据完整性审计

比 /review 更严苛的"挑刺"模式，专门寻找：

数据与结论不一致
引用链断裂（引用文献不支持原文陈述）
可重复性风险点
潜在的利益冲突

`/compare <主题>` — 来源对比矩阵

对同一主题的多篇文献进行结构化对比，输出矩阵表格：样本量、方法、结论、局限性。

`/draft <主题>` — 手稿式草稿

将研究发现转化为符合期刊风格的草稿文本，含标题、摘要、引言、方法、结果、讨论结构。

`/watch <主题>` — 定期文献监控

设置监控主题后，Darwin 会定期检查新发表文献，生成周报/月报推送。

`/outputs` — 成果浏览器

交互式浏览所有生成过的报告、方案、图表，支持导出为PDF或Markdown。

三、六大代理：各有所长的研究团队

Darwin 的代理系统模拟了一个真实的研究团队，不同代理负责不同环节：

bio-researcher（基础研究代理）

专长：PubMed 高级检索、MeSH 词优化、预印本监控
工具：PubMed API、bioRxiv/medRxiv RSS、Google Scholar
输出：带引用的文献摘要、研究 gap 分析

clinical-researcher（临床研究代理）

专长：RCT 质量评估（Cochrane Risk of Bias）、指南解读
工具：ClinicalTrials.gov、Cochrane Library、NICE/ASH 指南
输出：证据等级表、临床建议分级（GRADE）

bioinformatician（生物信息学代理）

专长：NGS 流程设计、差异表达分析、通路富集
工具：GEO 查询、BLAST、AlphaFold API、Ensembl
输出：分析流程代码（Python/R）、结果解读、可视化建议

bio-reviewer（评审代理）

专长：报告规范检查、统计方法审计
工具：CONSORT/ARRIVE/MIQE/PRISMA 检查清单
输出：结构化评审意见，含严重程度分级

bio-writer（写作代理）

专长：学术英语润色、期刊格式调整
工具：目标期刊 author guidelines
输出：符合投稿要求的手稿段落

evidence-verifier（证据验证代理）

专长：事实核查、引用溯源、撤稿检测
工具：Crossref、Retraction Watch、PubPeer
输出：验证报告，标记可疑引用

四、技能与工具生态

Darwin 的能力不仅来自大模型本身，更来自其丰富的技能（Skills）系统 —— 这些是 Markdown 格式的指令文件，启动时自动同步到 ~/.darwin/agent/skills/。

文献检索类

PubMed Search：支持布尔逻辑、MeSH 树、日期范围、期刊筛选的高级检索
bioRxiv / medRxiv Monitor：追踪预印本，设置关键词自动提醒
Clinical Trial Check：ClinicalTrials.gov 和 EU CTR 双库检索

数据验证类

Retraction Check：引用前自动扫描撤稿状态
Statistics Check：审计 p-hacking 迹象（如 p 值分布异常、选择性报告）
Gene Lookup：HGNC 官方符号验证，防止基因别名混淆

生物信息学类

BLAST：序列比对，自动选择最优数据库（nt、nr、swissprot）
Pathway Enrichment：ORA（过表达分析）和 GSEA 指导，支持 KEGG、Reactome、GO
AlphaFold Fetch：获取预测结构，评估 pLDDT 分数和预测可靠性
GEO Reanalysis：查询 GEO 数据集，生成重分析代码模板

临床计算类

Biomarker ROC：诊断性能评估，含 Delong 检验
Dosage Calc：肾/肝调整剂量计算，引用标准参考文献
IC50 Fit：四参数逻辑回归，自动异常值检测

通用工具类

Web Search：Exa、Perplexity、Gemini API 多源搜索
Session Search：跨会话的语义检索，"上周查的那个基因叫什么？"
Preview：一键导出浏览器可读格式或 PDF

六、来个简单案例

研究Akkermansia muciniphila与人体健康的关系。

第一条命令

darwin /lit "Akkermansia muciniphila and human health"

然后看着Darwin自动完成从检索到成稿的全过程。

七、为什么Darwin不一样？

上面结果是不是很惊艳？市面上不乏AI文献助手，但Darwin有几个独特的坚持：

证据层级优先：不会把预印本和RCT混为一谈，每句话都标注证据等级
撤稿先行：引用前必查撤稿状态，避免踩坑
可重复性内建：生成的方案附带检查清单，计算机模拟结果明确标注"in-silico"
开源可控：代码、技能、代理定义全部开源，你可以修改SYSTEM.md调整行为，也可以写自己的技能

结语

Darwin不是来替代研究者的 —— 它是来替代那些重复、枯燥但又不能出错的科研杂活。把文献检索、格式检查、撤稿扫描交给Darwin，把真正需要创造力的思考留给自己。

开源地址：https://github.com/yejunbin/darwin

Darwin —— 让AI成为实验室里靠谱的科研助理。

一、darwin是什么？

二、十六个工作流：从文献检索到手稿撰写

/deepresearch <主题> — 深度多代理调查

/systematic-review <主题> — PRISMA 合规系统综述

/lit <主题> — 文献综述

/target-dossier <基因/蛋白> — 靶点档案

/trial-tracker <药物/适应症> — 临床试验追踪

/retraction-sweep <主题> — 撤稿与勘误扫描

/protocol <名称> — 实验方案起草

/biomarker-roc <标志物+疾病> — 生物标志物 ROC 分析

/dosage-calc <药物+患者> — 用药剂量计算

/ic50-fit <化合物+数据> — 剂量-反应曲线拟合

/review <成果> — 生物医学同行评审

/audit <项目> — 证据完整性审计

/compare <主题> — 来源对比矩阵

/draft <主题> — 手稿式草稿

/watch <主题> — 定期文献监控

/outputs — 成果浏览器