
一、文献速览
- 论文题目:
Accelerating scientific discovery with Co-Scientist - 作者:
Juraj Gottweis, Wei-Hung Weng, Alexander Daryin, Tao Tu, Petar Sirkovic 等 - 单位:
Google Cloud AI Research、Google DeepMind、Google Research、Stanford University等 - 期刊:Nature,2026 年 5 月 19 日在线发表
二、一句话导读
Co-Scientist 是一个基于 Gemini 的多智能体科研协作系统,目标不是简单总结文献,而是围绕科学家给定的研究目标,持续生成、评审、排序和改进可实验验证的研究假设。论文在药物重定位、肝纤维化治疗靶点发现和抗菌药物耐药机制解释三个生物医学场景中进行了验证,展示了 AI 参与科学发现流程的早期形态。
阅读推荐度:★★★★★
三、研究背景与问题
现代科学发现面临一个典型矛盾:复杂问题需要越来越深的领域专业知识,而真正有价值的突破又常常来自跨学科知识之间的连接。随着论文数量、实验技术和专业数据库快速增长,单个研究团队很难同时保持足够的专业深度和跨领域广度。
论文试图回答的问题是:能否构建一个面向“科学发现”的 AI 系统,使其在科学家设定研究目标和约束条件后,能够主动检索文献、整合证据、提出新假设,并把这些假设转化为可检验的实验方案。Co-Scientist 的定位因此不是文献综述工具,而是一个服务于“scientist-in-the-loop”的结构化科学思考引擎。
四、实验设计
这项工作围绕生物医学中的三个真实科学发现任务展开验证:癌症药物重定位,重点关注急性髓系白血病;肝纤维化的新治疗靶点发现,使用人源肝脏类器官和活细胞成像实验;抗菌药物耐药相关的基因转移机制解释,聚焦 capsid-forming phage-inducible chromosomal islands(cf-PICIs)如何跨细菌物种传播。
系统输入主要包括科学家用自然语言描述的研究目标、偏好、约束条件、已有科学证据和相关文献。药物重定位场景中,Co-Scientist 被限定在 2300 种已批准药物和 34 种癌症类型中探索候选药物,并进一步在急性髓系白血病细胞系上进行体外验证。实验涉及 MOLM-13、KG-1a、HL-60、NOMO-1 等 AML 细胞系,以及 TK6 非 AML 对照细胞系。

五、方法思路
Co-Scientist 采用异步多智能体架构,底层基于 Gemini 模型。系统由自然语言交互界面、任务执行框架、上下文记忆和多个专门智能体组成,包括 Generation、Reflection、Ranking、Evolution、Proximity 和 Meta-review agent,并通过 Supervisor agent 进行调度。
其基本流程可以概括为:Generation agent 生成初始研究假设;Reflection agent 以类似同行评审的方式检查假设的正确性、质量和新颖性;Ranking agent 通过基于 Elo 的锦标赛和模拟科学辩论对假设进行排序;Evolution agent 持续改进高排名假设;Proximity agent 用于聚类、去重和探索假设空间;Meta-review agent 汇总评审和辩论中的规律,把反馈加入后续迭代提示中。
与一次性生成答案的模型不同,Co-Scientist 依赖测试时计算扩展:系统会随着更多推理、搜索、辩论和自我反馈不断改进假设质量。其输出默认受四类条件约束,即与研究目标一致、具备合理性、具有新颖性、能够被实验检验,并包含安全性方面的初步考量。
六、主要结果
多智能体机制和测试时计算扩展提高了假设质量。 消融实验显示,Reflection agent 接入外部搜索工具有助于减少“看似新颖但不合理”的假设;Ranking agent 中的科学辩论提示提高了假设排序质量并减少位置偏差;Evolution agent 的迭代改进进一步提升输出质量。在 203 个研究目标上,Co-Scientist 生成假设的平均 Elo 和最佳 Elo 随生成时间推进而提高,说明系统的反馈循环能够推动假设质量逐步改善。
在专家构建的复杂研究目标上,Co-Scientist 的输出优于多个基线模型。 论文进一步选取 15 个由 7 位生物医学专家整理的挑战性研究目标,将 Co-Scientist 与 Gemini 2.0 Pro Experimental、Gemini 2.0 Flash Thinking Experimental、OpenAI o1、OpenAI o3-mini-high、DeepSeek R1 以及专家“最佳猜测”进行比较。基于 Elo 的自动评价显示,随着迭代进行,Co-Scientist 最终超过其他前沿模型和推理模型;对其中 11 个目标的专家小规模评价中,Co-Scientist 的输出获得最高偏好,平均偏好排名为 2.36,新颖性和影响力评分分别为 3.64 和 3.09。
急性髓系白血病药物重定位获得了体外实验支持。 在专家参与筛选后,Co-Scientist 提出的 Binimetinib、Pacritinib 和 Cerivastatin 在 AML 细胞系中表现出细胞活性抑制作用。其中 Binimetinib 在除 NOMO-1 外的 AML 细胞系中 IC50 低至 2 nM,而在 TK6 非 AML 细胞系中的 IC50 更高。系统进一步提出的 KIRA6 在多个 AML 细胞系中显示抑制作用,尤其在 KG-1a 细胞中 IC50 为 10 nM,相比 TK6 对照细胞的 180 nM 形成约 18 倍差异。
Co-Scientist 能探索药物组合和更复杂的转化医学问题。 论文测试了 7 组 Co-Scientist 提出的 AML 多药组合,在 MOLM-13 细胞中双药和三药组合多表现为协同效应,而 KG-1a 细胞中的反应更依赖具体组合和分子背景。系统还用于临床转化分析,例如将 Binimetinib 定位到体弱、重度预治疗 AML 患者这一潜在临床亚群,并指出其 UGT1A1 代谢路径可能规避与唑类抗真菌药相关的 CYP3A4 药物相互作用。
在肝纤维化和抗菌药物耐药机制中,系统提出了可验证或可复现的科学假设。 肝纤维化任务中,Co-Scientist 提出并排序新的表观遗传调控靶点,专家选取其中 3 个进一步验证,系统识别的 2 个候选药物在人源肝脏类器官中表现出抗纤维化活性且未造成细胞毒性,其中 Vorinostat 已获 FDA 批准用于其他癌症适应证。抗菌药物耐药相关任务中,Co-Scientist 在最少背景信息条件下提出 cf-PICIs 通过与多样化噬菌体尾部相互作用来扩展宿主范围,这一高排名假设与同期独立实验研究的核心发现相符。
七、结论与意义
Co-Scientist 展示了一种区别于“检索—总结”式 AI 工具的科研协作范式:系统围绕明确研究目标组织文献搜索、假设生成、同行评审式反思、锦标赛排序和迭代进化,并把输出导向可实验验证的研究方案。其价值不在于一次性给出最终答案,而在于用可扩展的测试时计算持续探索假设空间,帮助科学家发现可能被忽略的跨领域连接。
从论文验证结果看,Co-Scientist 在三个生物医学任务中均产生了具有实验价值的候选假设,尤其是急性髓系白血病药物重定位与药物组合设计,为 AI 参与真实湿实验闭环提供了初步证据。不过,作者也强调,这些结果仍属于早期验证,系统会受到开放文献覆盖不足、负结果缺失、文献质量不一致、模型幻觉和事实性缺陷等因素影响,AI 生成假设不能替代严格实验验证、同行评审和科学家的专业判断。
对于遥感与地理方向,这篇论文的启发主要在方法范式层面:如果地学问题能够被表述为清晰的研究目标,并能通过观测数据、模型实验或区域案例进行验证,类似多智能体系统有可能用于自动梳理文献证据、生成假设、设计实验路线和比较解释机制。真正关键的不是让 AI 给出“结论”,而是让 AI 帮助构建更系统、更可检验的研究假设空间。
八、参考文献
Gottweis, J., Weng, W.-H., Daryin, A., Tu, T., Sirkovic, P. et al. Accelerating scientific discovery with Co-Scientist. Nature (2026). https://doi.org/10.1038/s41586-026-10644-y.
夜雨聆风