最近发表于Nature 的一篇研究是AI驱动科学发现领域的里程碑式成果,由美国FutureHouse团队开发的Robin多智能体系统首次实现了实验生物学中假设生成、实验设计、数据分析与假设迭代的全流程半自动化闭环,并成功发现了干性年龄相关性黄斑变性(dAMD)的两个新型治疗候选药物,验证了AI作为“半自主科学家”的可行性。

一、研究的背景与痛点
1.科学发现的本质瓶颈:传统科学发现依赖“观察-假设-实验-分析”的迭代循环,但人类科学家在跨领域知识合成上存在天然局限——大量已发表的科学知识无法被快速整合,导致药物重定位等领域存在显著的“发现滞后”(如达布非尼的耳保护作用滞后其机制发现10年,氯胺酮的抗抑郁作用滞后22年)。
2.现有AI系统的不足:此前的AI工具仅能完成单一环节任务(如文献检索、分子性质预测),没有任何系统能同时自动化假设生成与实验数据分析,更无法形成基于实验反馈的迭代闭环。
3.dAMD的临床需求:dAMD是发达国家首位致盲原因,美国约150万人患有威胁视力的dAMD,预计2050年患者数将增至3倍,但目前尚无有效治疗手段,存在巨大的未满足临床需求。
二、Robin多智能体系统的核心架构与工作流
Robin是一个模型无关的模块化多智能体系统,通过三个专业化语言智能体的协同,实现科学发现的全流程自动化,单次完整运行成本仅约10.76美元,认知效率较人类提升200倍以上。

1. 核心智能体分工

2. 标准化工作流(单发现周期)
疾病输入:人类仅需提供目标疾病名称(如“干性年龄相关性黄斑变性”)
机制与实验模型筛选:Robin通过Crow检索文献,提出10种潜在疾病机制,经LLM评审员(Claude 3.7 Sonnet)两两比较排名,选择最优体外实验模型
候选药物生成与排名:基于选定模型,Robin生成30个候选药物,由Falcon生成深度评估报告,再次经LLM评审员排名
人类实验执行:科学家根据Robin的实验方案开展实验室验证
自主数据分析:上传原始实验数据(如.FCS流式文件、基因计数矩阵),Finch启动8条独立分析轨迹,通过共识分析生成稳健结论
假设迭代:Robin基于分析结果提出后续实验建议,并生成新一轮优化的候选药物列表

3. 效率提升量化数据

三、关键科学发现:dAMD的新型治疗策略与候选药物
Robin通过两轮迭代实验,不仅验证了其科学发现能力,还取得了具有临床转化价值的实质性成果。
1. 核心治疗策略的提出
Robin通过文献合成,首次明确提出“增强视网膜色素上皮(RPE)细胞吞噬功能”作为dAMD的核心治疗策略——RPE细胞吞噬功能衰退是dAMD的关键病理特征,但此前未被作为主要治疗靶点系统研究。
2. 第一轮筛选:ROCK抑制剂的有效性验证
•从30个候选药物中选出前5个进行实验,发现ROCK抑制剂Y-27632可显著增强ARPE-19(Adult Retinal Pigment Epithelial cell line-19)细胞(是人视网膜色素上皮永生化细胞系,是视网膜生物学和眼科疾病研究中最常用的体外细胞模型之一)的吞噬能力
•Robin自主提出后续RNA-seq实验,分析Y-27632的作用机制,发现其不仅通过翻译后调控F-actin动力学促进吞噬杯形成,还能转录上调脂质外排泵ABCA1的表达(上调3倍,调整后p=2.13×10⁻⁸³)
•ABCA1是维持RPE细胞脂质稳态的关键蛋白,其配体Apo-E是dAMD的已知遗传易感基因,这一发现揭示了dAMD治疗的全新潜在靶点
3. 第二轮迭代:临床转化价值更高的候选药物
基于第一轮实验结果,Robin生成新一轮候选药物列表,实验验证发现:
•利帕西泮(Ripasudil):已在日本获批用于治疗青光眼的ROCK抑制剂,首次被发现可用于dAMD治疗。其增强RPE细胞吞噬的效力是Y-27632的2.5倍(IC₅₀:19.0μM vs 47.6μM),且在原代人RPE干细胞(RPE-SC)中验证了有效性
•安全性优势:利帕西泮具有明确的临床安全性数据,且高浓度下可降低RPE-SC细胞的LDH释放(细胞毒性降低),显著优于仅作为研究工具的Y-27632
•KL001:昼夜节律调节剂,通过抑制CRY蛋白的泛素化降解发挥作用,首次被发现可增强RPE细胞吞噬功能,代表了dAMD治疗的全新作用机制
4. 原代细胞验证
所有结果均在60岁以上健康供体来源的原代RPE-SC细胞中得到重复验证,排除了永生化细胞系(ARPE-19)的假阳性可能,进一步提升了结果的临床相关性。
四、系统有效性验证:架构优势而非通用LLM的运气
研究通过严格的对照实验,证明Robin的性能来源于其专业化的多智能体架构,而非通用大模型的能力。
1.消融实验
○移除Falcon或同时移除Crow+Falcon,替换为OpenAI o4-mini,会导致44.5%的参考文献出现幻觉,而原生Robin的参考文献准确率为100%
○LLM评审员评估显示,移除任意一个文献智能体都会导致候选药物提案质量显著下降(p<0.001)
2.Finch数据分析能力验证
○在本文的流式细胞术和RNA-seq任务中,Finch的专家评分分别为100%和86%,与人类分析结果高度一致
○在BixBench生物信息学基准测试中,Finch的整体准确率为22.8%,显著高于纯Claude 3.7 Sonnet的1.6%;其中统计学任务准确率47.9%,生物信息学多步骤任务准确率15.3%(仍有较大提升空间)
3.与通用AI研究工具的对比
○给OpenAI Deep Research相同的任务指令,其生成的17个候选药物在RPE-SC细胞中无一有效,且未提出ROCK抑制作为治疗策略
○这一结果证明:通用AI研究工具无法替代专业化的科学发现系统,领域特异性架构是实现可靠科学发现的关键
五、系统局限性与未来发展方向
1.当前局限性
○仅能生成实验大纲,无法生成精确可执行的实验室操作方案,仍需人类科学家进行实验执行
○Finch依赖领域专家的提示工程,无法自主适配新的数据模态或分析任务
○多步骤生物信息学分析任务准确率较低,复杂机制解析能力有限
○仍为“实验室在环”(lab-in-the-loop)系统,实验操作环节完全依赖人类
2.未来优化方向
○开发可生成标准化实验方案的智能体,减少人类翻译环节
○提升Finch的自主提示生成能力,实现无专家干预的数据分析
○整合自动化实验室设备(如液体处理机器人),向“全自主科学发现”迈进
○扩展系统适用范围,从药物重定位延伸到全新分子设计、材料科学等领域
六、对生物制药与科学发现的颠覆性意义
1.药物重定位的范式革命:Robin可在数小时内完成人类科学家数月的知识合成工作,大幅加速已上市药物的新适应症发现,显著降低药物开发成本和时间(利帕西泮可直接进入II期临床试验,跳过I期安全性评估)
2.AI科学发现的新范式:首次实现了“从文献到假设、从数据到结论”的全流程自动化闭环,证明AI不仅是辅助工具,更能成为独立的科学发现主体
3.解决“知识碎片化”问题:Robin能够跨领域整合分散的科学知识,发现人类专家因学科壁垒而忽略的“低悬果实”,这一能力可扩展到所有依赖知识合成的科学领域
4.安全性与伦理设计:系统内置多重安全护栏,优先选择已上市药物、自动检索已知毒性、所有输出需经过人类实验验证,有效规避了AI科学发现的潜在风险
总结
这篇研究标志着AI驱动科学发现进入了半自主闭环时代。Robin系统在dAMD药物发现中的成功,不仅为这一难治性疾病带来了新的治疗希望,更证明了多智能体架构在解决复杂科学问题上的巨大潜力。未来,随着系统的不断优化和自动化实验室技术的融合,AI有望彻底改变科学研究的速度和范式,加速人类对生命和自然的理解。
Reference
夜雨聆风