AI科学家Robin问世:自主文献挖掘发现干性黄斑变性新药,成果登上Nature📧 通讯作者: Samuel G. Rodriques(美国旧金山未来之家);Michaela M. Hinks(美国旧金山未来之家);Andrew D. White(美国旧金山未来之家)
传统的科学发现依赖人类专家从海量文献中提炼假设、设计实验并分析数据,这一过程耗时且容易遗漏跨领域的知识联结。针对这一瓶颈,研究团队开发了首个能够全自动完成假设生成与实验数据分析的多智能体系统Robin。Robin由三个专用智能体组成:Crow和Falcon分别负责快速与深度的文献检索与综述,Finch则充当自动化数据科学家,能够独立分析流式细胞术和RNA测序等生物实验数据。系统以干性年龄相关性黄斑变性(dAMD)——一种全球主要致盲疾病——为测试案例,在30分钟内阅读分析了551篇论文,并自主提出了通过增强视网膜色素上皮(RPE)细胞吞噬功能来治疗dAMD的策略。Robin随即筛选出老药Y-27632等候选药物,并通过第二轮假设迭代,发现了已获日本批准的治疗青光眼的ROCK抑制剂瑞帕舒地尔(ripasudil)以及昼夜节律调节分子KL001,二者在体外实验中均显著提升RPE吞噬能力,效果优于Y-27632。在验证环节,Finch对实验产生的原始数据进行端到端分析,从流式细胞术的门控到RNA测序的差异表达分析均无须人工干预,且分析结论与人类科学家的独立分析高度吻合。RNA测序额外揭示了瑞帕舒地尔上调脂质外排泵ABCA1,为药物机制提供新线索。所有正文中的假设、实验方向、数据分析及数据图均由Robin生成。这一“实验室在环”的迭代框架不仅将完整一次发现周期的人力时间从约900小时压缩至不到2小时,更标志着AI驱动科学发现范式的重大突破。相关研究成果以"A multi-agent system for automating scientific discovery"为题发表在Nature上。
• 1. 构建了首个全流程自动化科学发现系统Robin,该系统由文献搜索智能体Crow/Falcon与数据分析智能体Finch耦联而成,可自主完成从假设生成、实验策略提出、试验结果分析到新假设迭代的完整循环,首次将实验室数据与文献推理无缝对接。• 2. 运用Robin针对干性AMD提出全新治疗假说,通过增强RPE细胞吞噬功能作为治疗切入点,从已上市药物中快速锁定瑞帕舒地尔和KL001两个候选物,并经ARPE-19细胞和原代人RPE干细胞两次独立验证,确认其促吞噬效力优于已知ROCK抑制剂Y-27632。• 3. 开发了可复用、可解释的自动化实验分析管道,Finch通过并行生成8条独立分析轨迹并跨轨迹整合共识,显著提高了流式细胞术和RNA-seq结果的一致性与可靠性,在基准测试中对统计类任务准确率达47.9%,且分析结果与人类专家高度一致。• 4. 通过组件消融与外部比较深度验证系统架构,移除Crow/Falcon导致药物提案质量显著下降、文献幻觉率激增,而通用型AI代理Deep Research在同等任务中未提出任何有效的ROCK抑制方案,证明Robin的专用化设计不可或缺。• 5. 揭示药物新机制与重定位机会,RNA-seq分析首次发现瑞帕舒地尔通过上调ABCA1脂质外排泵发挥作用,为干性AMD的治疗提供了可药物化的新靶点,并展示了AI系统揭示隐藏生物学见解的能力。
图1:Robin系统的架构与工作流程。
图2:Robin为干性AMD生成治疗候选假说并分析体外实验数据。
图3:经ROCK抑制剂Y-27632处理的ARPE-19细胞的RNA测序分析。【优点】全流程自动化范式具有一定的里程碑意义。Robin是首个同时覆盖假设生成与实验数据分析的闭环系统,其“组合式综合”策略巧妙利用了跨领域知识碎片,使药物重定位这类“低垂果实”得以被系统采摘,理论上可大幅降低发现周期成本。严格依赖文献回溯,有效抑制幻觉。Crow和Falcon基于PaperQA2,参考文献真实可查,且Falcon能主动更正上游错误,使得提案质量远超纯大语言模型对答;消融实验中Falcon被移除时幻觉率飙升,反证了架构的可靠性。实验验证扎实,反复证实系统输出的可信度。团队不仅对ARPE-19细胞系进行了两轮筛选,还专门在老年供体的原代RPE干细胞中进行交叉验证,并辅以流式、RNA-seq、LDH毒性等多维数据,结论稳健。系统自我迭代能力令人兴奋。Robin能根据前期数据自主提出跟进实验(如RNA-seq),并分析出ABCA1上调这样的新机制线索,展现出一定科研直觉,超越了单纯的文献检索组合。社会价值突出。针对干性AMD这一临床缺药的重大疾病,找到已具眼科安全记录的瑞帕舒地尔,为患者带来立即可转化的希望。【短处】系统尚未完全实现“无人化”科学发现。Robin生成的实验方案仍是高层描述,仍需科学家手动转化为具体的移液、加药步骤,且实验室操作和执行全由人完成,距离端到端的无人实验室仍有距离。数据分析智能体Finch的泛化能力有限。在BixBench的131道生物信息学题目上准确率仅15.3%,严重拖累了整体平均分(22.8%),主要因为多步骤管道对参数敏感且缺乏人工调整。当前仍需领域专家精心编写提示词才能稳定运行,否则表现变差。验证范围较窄。研究仅聚焦单一疾病、单一表型(RPE吞噬),且未在动物模型中验证候选物的体内药效与眼内递送,距离临床有效性的证明尚有巨大鸿沟。对语言模型基座依赖过重。论文使用2025年初的GPT-4o-mini和Claude Sonnet 3.7,若底层模型进化,其表现可能大幅波动,且成本效益分析尚未涉及更大规模疾病谱系的推广。潜在的安全与伦理边界未能深入探讨,虽然提供了护栏说明,但系统识别“已知毒性”的能力未得到严格压力测试,自动发现生物活性分子的能力若被恶意滥用,仍存在风险。声明:仅代表作者个人观点,作者水平有限,如有不科学之处,请在下方留言指正!华研科技(www.cqhuayan.cn)由中科院博士成立,是一支具有科研背景及丰富科研绘图经验的团队,专注于期刊封面、论文插图(TOC/流程图/摘要图/示意图)、科学动画、宣传片、科普视频等设计制作,科研绘图培训/专场培训,为国内外高校和科研院所提供丰富的可视化服务方案。设计作品已发表在Nature、Science、Cell等国际著名杂志上,服务客户的研究领域涵盖生物、物理、化学、医学、计算机、人工智能等各个学科,提供的科学可视化手段包括三维建模、手绘、VR/AR、数字孪生等。华研科技志在为广大科研工作者提供完美的科学可视化服务,节约您宝贵的时间和精力。(如有需要请添加文末微信)