首个全自动 AI 药物发现系统诞生:从辅助到自主,AI 接手科学发现

最近发表于Nature 的一篇研究是AI驱动科学发现领域的里程碑式成果，由美国FutureHouse团队开发的Robin多智能体系统首次实现了实验生物学中假设生成、实验设计、数据分析与假设迭代的全流程半自动化闭环，并成功发现了干性年龄相关性黄斑变性（dAMD）的两个新型治疗候选药物，验证了AI作为“半自主科学家”的可行性。

一、研究的背景与痛点

1.科学发现的本质瓶颈：传统科学发现依赖“观察-假设-实验-分析”的迭代循环，但人类科学家在跨领域知识合成上存在天然局限——大量已发表的科学知识无法被快速整合，导致药物重定位等领域存在显著的“发现滞后”（如达布非尼的耳保护作用滞后其机制发现10年，氯胺酮的抗抑郁作用滞后22年）。

2.现有AI系统的不足：此前的AI工具仅能完成单一环节任务（如文献检索、分子性质预测），没有任何系统能同时自动化假设生成与实验数据分析，更无法形成基于实验反馈的迭代闭环。

3.dAMD的临床需求：dAMD是发达国家首位致盲原因，美国约150万人患有威胁视力的dAMD，预计2050年患者数将增至3倍，但目前尚无有效治疗手段，存在巨大的未满足临床需求。

二、Robin多智能体系统的核心架构与工作流

Robin是一个模型无关的模块化多智能体系统，通过三个专业化语言智能体的协同，实现科学发现的全流程自动化，单次完整运行成本仅约10.76美元，认知效率较人类提升200倍以上。

1. 核心智能体分工

2. 标准化工作流（单发现周期）

疾病输入：人类仅需提供目标疾病名称（如“干性年龄相关性黄斑变性”）
机制与实验模型筛选：Robin通过Crow检索文献，提出10种潜在疾病机制，经LLM评审员（Claude 3.7 Sonnet）两两比较排名，选择最优体外实验模型
候选药物生成与排名：基于选定模型，Robin生成30个候选药物，由Falcon生成深度评估报告，再次经LLM评审员排名
人类实验执行：科学家根据Robin的实验方案开展实验室验证
自主数据分析：上传原始实验数据（如.FCS流式文件、基因计数矩阵），Finch启动8条独立分析轨迹，通过共识分析生成稳健结论
假设迭代：Robin基于分析结果提出后续实验建议，并生成新一轮优化的候选药物列表

3. 效率提升量化数据

三、关键科学发现：dAMD的新型治疗策略与候选药物

Robin通过两轮迭代实验，不仅验证了其科学发现能力，还取得了具有临床转化价值的实质性成果。

1. 核心治疗策略的提出

Robin通过文献合成，首次明确提出“增强视网膜色素上皮（RPE）细胞吞噬功能”作为dAMD的核心治疗策略——RPE细胞吞噬功能衰退是dAMD的关键病理特征，但此前未被作为主要治疗靶点系统研究。

2. 第一轮筛选：ROCK抑制剂的有效性验证

•从30个候选药物中选出前5个进行实验，发现ROCK抑制剂Y-27632可显著增强ARPE-19（Adult Retinal Pigment Epithelial cell line-19）细胞（是人视网膜色素上皮永生化细胞系，是视网膜生物学和眼科疾病研究中最常用的体外细胞模型之一）的吞噬能力

•Robin自主提出后续RNA-seq实验，分析Y-27632的作用机制，发现其不仅通过翻译后调控F-actin动力学促进吞噬杯形成，还能转录上调脂质外排泵ABCA1的表达（上调3倍，调整后p=2.13×10⁻⁸³）

•ABCA1是维持RPE细胞脂质稳态的关键蛋白，其配体Apo-E是dAMD的已知遗传易感基因，这一发现揭示了dAMD治疗的全新潜在靶点

3. 第二轮迭代：临床转化价值更高的候选药物

基于第一轮实验结果，Robin生成新一轮候选药物列表，实验验证发现：

•利帕西泮（Ripasudil）：已在日本获批用于治疗青光眼的ROCK抑制剂，首次被发现可用于dAMD治疗。其增强RPE细胞吞噬的效力是Y-27632的2.5倍（IC₅₀：19.0μM vs 47.6μM），且在原代人RPE干细胞（RPE-SC）中验证了有效性

•安全性优势：利帕西泮具有明确的临床安全性数据，且高浓度下可降低RPE-SC细胞的LDH释放（细胞毒性降低），显著优于仅作为研究工具的Y-27632

•KL001：昼夜节律调节剂，通过抑制CRY蛋白的泛素化降解发挥作用，首次被发现可增强RPE细胞吞噬功能，代表了dAMD治疗的全新作用机制

4. 原代细胞验证

所有结果均在60岁以上健康供体来源的原代RPE-SC细胞中得到重复验证，排除了永生化细胞系（ARPE-19）的假阳性可能，进一步提升了结果的临床相关性。

四、系统有效性验证：架构优势而非通用LLM的运气

研究通过严格的对照实验，证明Robin的性能来源于其专业化的多智能体架构，而非通用大模型的能力。

1.消融实验

￮移除Falcon或同时移除Crow+Falcon，替换为OpenAI o4-mini，会导致44.5%的参考文献出现幻觉，而原生Robin的参考文献准确率为100%

￮LLM评审员评估显示，移除任意一个文献智能体都会导致候选药物提案质量显著下降（p<0.001）

2.Finch数据分析能力验证

￮在本文的流式细胞术和RNA-seq任务中，Finch的专家评分分别为100%和86%，与人类分析结果高度一致

￮在BixBench生物信息学基准测试中，Finch的整体准确率为22.8%，显著高于纯Claude 3.7 Sonnet的1.6%；其中统计学任务准确率47.9%，生物信息学多步骤任务准确率15.3%（仍有较大提升空间）

3.与通用AI研究工具的对比

￮给OpenAI Deep Research相同的任务指令，其生成的17个候选药物在RPE-SC细胞中无一有效，且未提出ROCK抑制作为治疗策略

￮这一结果证明：通用AI研究工具无法替代专业化的科学发现系统，领域特异性架构是实现可靠科学发现的关键

五、系统局限性与未来发展方向

1.当前局限性

￮仅能生成实验大纲，无法生成精确可执行的实验室操作方案，仍需人类科学家进行实验执行

￮Finch依赖领域专家的提示工程，无法自主适配新的数据模态或分析任务

￮多步骤生物信息学分析任务准确率较低，复杂机制解析能力有限

￮仍为“实验室在环”（lab-in-the-loop）系统，实验操作环节完全依赖人类

2.未来优化方向

￮开发可生成标准化实验方案的智能体，减少人类翻译环节

￮提升Finch的自主提示生成能力，实现无专家干预的数据分析

￮整合自动化实验室设备（如液体处理机器人），向“全自主科学发现”迈进

￮扩展系统适用范围，从药物重定位延伸到全新分子设计、材料科学等领域

六、对生物制药与科学发现的颠覆性意义

1.药物重定位的范式革命：Robin可在数小时内完成人类科学家数月的知识合成工作，大幅加速已上市药物的新适应症发现，显著降低药物开发成本和时间（利帕西泮可直接进入II期临床试验，跳过I期安全性评估）

2.AI科学发现的新范式：首次实现了“从文献到假设、从数据到结论”的全流程自动化闭环，证明AI不仅是辅助工具，更能成为独立的科学发现主体

3.解决“知识碎片化”问题：Robin能够跨领域整合分散的科学知识，发现人类专家因学科壁垒而忽略的“低悬果实”，这一能力可扩展到所有依赖知识合成的科学领域

4.安全性与伦理设计：系统内置多重安全护栏，优先选择已上市药物、自动检索已知毒性、所有输出需经过人类实验验证，有效规避了AI科学发现的潜在风险

总结

这篇研究标志着AI驱动科学发现进入了半自主闭环时代。Robin系统在dAMD药物发现中的成功，不仅为这一难治性疾病带来了新的治疗希望，更证明了多智能体架构在解决复杂科学问题上的巨大潜力。未来，随着系统的不断优化和自动化实验室技术的融合，AI有望彻底改变科学研究的速度和范式，加速人类对生命和自然的理解。

Reference

Ghareeb, A. E. et al. A multi-agent system for automating scientific discovery. Nature https://doi.org/10.1038/s41586-026-10652-y (2026)