2026年4月16日,OpenAI正式发布生命科学专用模型GPT-Rosalind。这一模型的推出,不仅迅速吸引了Amgen、Moderna以及Allen Institute等顶级机构成为首批客户,也在资本市场引发了直接反应——IQVIA与Schrödinger等传统CRO及科研软件公司的股价随之下行。这种市场反馈本身就说明,行业已经意识到,这并不是一次普通的模型迭代,而是一次可能重塑药物研发底层逻辑的技术跃迁。

从本质上看,GPT-Rosalind并不是一个“更聪明的ChatGPT”,而是一个专门为生命科学复杂工作流打造的领域模型。药物研发之所以耗时长达10到15年,很大程度上并不只是因为科学难度本身,而是因为科研过程高度碎片化:科学家需要在海量论文、数据库、实验数据和不断变化的假设之间反复切换,任何一个环节的低效都会在后续阶段被放大。OpenAI在官方报告中明确指出,这类问题的核心不只是“效率低”,而是“探索空间受限”,而GPT-Rosalind的目标正是扩大这种探索空间,让科研人员可以更快地提出假设、验证路径并迭代认知 。
在能力层面,这个模型最大的变化在于它将“跨学科推理”作为核心设计目标。传统通用模型在生物、化学等领域往往停留在知识调用层面,而Rosalind则针对分子机制、蛋白结构、基因序列与疾病通路之间的关系进行了专门强化,使其能够在复杂的生物系统中进行多步推理。这种能力使它不再只是回答问题,而是可以参与到科研推导本身之中。例如,在蛋白突变分析或化学反应路径推断中,它能够结合已有数据与理论知识,生成具有可验证性的解释,而不是简单复述已有结论。
更关键的是,GPT-Rosalind覆盖的并不是单一任务,而是贯穿整个科研流程。从文献检索与证据整合,到假设生成,再到实验设计与结果分析,这一模型都可以参与其中。传统科研通常是线性推进的过程,而Rosalind的介入使得这一流程更接近“并行探索”:它可以同时生成多个潜在路径,并根据已有证据不断调整优先级。这种模式的改变意味着科研不再完全依赖个体经验,而是逐渐演变为“人机协同的搜索过程”,在更大的可能性空间中寻找最优解。
这一能力之所以成立,还依赖于其工具调用机制。OpenAI同步推出的Life Sciences Research Plugin,本质上是一个连接科研工具生态的中枢,使模型可以调用超过50个生物数据库与分析工具。这意味着Rosalind并不是孤立运行的语言模型,而是可以在真实科研环境中调取结构数据库、基因组数据、文献资源等外部信息,并在多工具之间完成复杂任务。这种“模型+工具”的组合,使其更接近一个科研操作系统,而非单一算法。

图1 Life Sciences Research Plugin
从性能表现来看,GPT-Rosalind已经开始逼近甚至在部分任务上超越人类专家水平。在公开基准测试中,它在BixBench等真实生物信息学任务上取得领先成绩,而在LABBench2中也在多个关键科研任务上超过了更通用的模型版本。更具代表性的是与Dyno Therapeutics合作进行的RNA序列任务评估:在预测任务中,其表现超过95%的人类专家,在序列生成任务中也达到约84%的专家水平。这些结果并不只是“模型更强”的证明,更重要的是,它展示了AI已经具备参与真实科研决策的能力,而不仅仅是辅助工具。

图2 GPT-Rosalind在核心生物与化学基准测试中表现提升

图3 GPT-Rosalind在BixBench测试中表现领先
这种能力的出现,对药物研发的影响将是结构性的。传统研发模式中,最昂贵的并不是实验本身,而是错误决策带来的路径依赖,一旦早期靶点选择或机制判断出现偏差,后续数年的投入都可能被浪费。GPT-Rosalind的价值正在于,它可以在早期阶段显著提升假设质量,从而提高整体研发成功率。由于药物研发是一个高度放大的系统,前端哪怕只有小幅优化,都会在后端产生巨大的成本与时间节约,这也是为什么行业对其反应如此敏感。
从产业角度看,这一模型也在重新定义CRO与科研软件公司的价值边界。过去,这些公司的核心竞争力在于数据处理能力、实验设计经验以及工具链整合能力,但当AI能够直接完成部分分析、设计甚至推理工作时,这些能力开始被“软件化”和“模型化”。市场对IQVIA与Schrödinger的负面反应,本质上反映的是一种预期变化:未来药物研发的价值可能更多集中在数据与模型本身,而不是传统的人力服务或工具授权。
当然,OpenAI也对这一模型采取了严格的开放策略。GPT-Rosalind目前仅通过“可信访问机制”向特定企业开放,要求使用方具备明确的科研目的、合规体系以及安全治理能力。这种限制并非商业策略,而是出于生物安全考虑,因为当AI具备强大的生物推理能力时,其潜在影响远超一般软件工具。因此,这一模型的扩展路径很可能是“逐步放开”,而非快速普及。
从更长远的视角来看,GPT-Rosalind的意义在于,它标志着AI正式进入生命科学的核心决策层。过去,AI更多用于优化效率,而现在开始直接影响“科学发现”本身。随着这一系列模型的持续演进,未来的药物研发流程可能会发生根本性变化:AI负责探索与生成,人类负责判断与验证,整个体系从线性推进转向高维搜索。在这种范式下,科研的速度与成功率都有可能被重新定义。
如果说生成式AI改变了信息生产,那么GPT-Rosalind正在改变知识创造的方式。在药物研发这样一个高度复杂且关乎人类健康的领域,这种改变的意义,可能远超任何一次单纯的技术升级。
参考链接:
https://openai.com/index/introducing-gpt-rosalind/
--------- End ---------
感兴趣的读者,可以添加小邦微信加入读者实名讨论微信群。添加时请主动注明姓名-企业-职位/岗位或姓名-学校-职务/研究方向。


夜雨聆风