OpenAI推出了GPT-Rosalind,生物狗终于可以少坐冷板凳了

前言萨姐在出差途中看到Open AI推出GPT-Rosalind甚是激动，当年要是有这样的工具就不用放弃坐冷板凳了。GPT-Rosalind能加速生物学研究发现，帮助立项阶段避坑，值得写一篇文章拆解。这一工具如果能开放给全世界使用，将是人类的福音，当然也会对当前一波“AI制药公司”造成冲击。人类科学家在实验室中的角色将发生深刻转变。这种范式转移很快将扩展至法律、金融与工程等高门槛行业。相信未来借由这一工具，生物学领域的impactful discovery将会迎来“寒武纪”爆发。

1952年，一个名叫罗莎琳德·富兰克林的英国科学家，在伦敦国王学院的实验室里拍下了一张X射线衍射照片。照片中，一个分子的轮廓清晰可见——那是DNA。那张照片，后来被称为"照片51号"，是破解生命密码的关键证据之一。然而，直到她去世后，科学界才真正认识到她的贡献。

七十四年后的今天，OpenAI将“罗莎琳德”这个名字赋予了他们的最新力作。2026年4月16日，OpenAI正式发布GPT-Rosalind，这是全球首个专为生命科学领域打造的前沿推理模型。与那些只会"寒暄"、帮你写周报的通用大模型不同，GPT-Rosalind从诞生之日起，就带着一个明确的使命：帮人类更快地从靶点发现走到临床证据。

生命科学领域充斥着许多重复证明业已建立的机制理论或框架的研究，急需一个能在假说形成阶段就帮助研究者避雷的工具。这个模型的出现，它标志着AI在药物研发领域，正在完成一次从"辅助工具"到"推理伙伴"的质变。

底层架构：不是微调，而是重构

GPT-Rosalind并非简单的领域微调产物，而是从底层架构上针对生物化学、基因组学、蛋白质工程和转化医学进行了深层优化。

生物学特有的Attention机制：这是GPT-Rosalind最核心的技术突破。传统的LLM在处理生物序列或化学分子式时，往往将其视为简单的文本字符串，这导致模型难以真正理解分子内部的空间构象和化学逻辑。而生物学特有的注意力机制则直接对信息进行多维推理，能够理解和联系生物学概念，如化学键，蛋白质相互作用等，能将原子间的相互作用，核苷酸的排列视为具有内在物理关联的整体。

2000亿Token的专业训练语料：通过与博德研究所（Broad Institute）及欧洲生物信息学研究所（EBI）合作，OpenAI构建了包含2000亿个Token的专有数据集，涵盖同行评审学术期刊、专利库、基因组数据库、蛋白质结构数据及临床试验报告。这种垂直化训练使其在总结药物相互作用机制时的幻觉率降低了约40%。

研发历程：从AlphaFold的挑战者到互补伙伴

GPT-Rosalind的命名本身就蕴含深意：罗莎琳德·富兰克林通过X射线晶体学照片揭示了DNA的双螺旋结构，而GPT-Rosalind则试图通过AI推理揭示生命科学的下一个奥秘。

在正式发布前，GPT-Rosalind经历了严格的行业测试。

在BixBench（一个专注于真实世界生物信息学分析的测试集）中，GPT-Rosalind取得了0.751的通过率，创下了目前所有已发布模型的最高纪录。在LABBench2（涵盖文献检索、数据库访问、序列操作和实验方案设计的综合测试）中，GPT-Rosalind在11个任务中的6个上超越了通用旗舰型号GPT-5.4。

最引人注目的，是GPT-Rosalind在分子克隆任务（CloningQA）上的表现。该任务要求模型进行端到端的DNA设计，并为分子克隆协议选择合适的酶制剂。GPT-Rosalind不仅能设计出在理论上可行的方案，还能考虑到实际实验室环境中的操作限制，生成具有高度可执行性的实验步骤——这种从"知识"到"操作"的转化能力，是其作为"数字实验室助手"的核心价值。

在与基因治疗公司Dyno Therapeutics的合作测试中，GPT-Rosalind接受了更严苛的挑战：在使用未经公开、未被"污染"过的RNA序列数据集上，进行功能预测和序列生成测试。测试结果令人震撼——在预测RNA序列与功能关系的任务中，模型的表现超过了95%的人类专家；在序列生成任务中，其表现也达到了人类专家的第84百分位。这意味着，在某些分子设计的具体任务上，AI已经具备了与顶尖人类科学家同台竞技的能力。

当一枚生物狗同时拥有GPT-Rosalind和AlphaFold，就像一位少年同时拿到屠龙宝刀和倚天剑：Alphafold解决了"静态空间构象预测"这一物理问题，GPT-Rosalind帮助"推理、综述与协议设计"。科学家可以先用AlphaFold预测分子结构，再用GPT-Rosalind规划后续实验。

如何帮助药物研发：压缩从靶点到转化研究的周期

已关注

关注

重播分享赞

视频详情

GPT-Rosalind的介绍视频

OpenAI的宣传视频里demo了一个案例 (https://openai.com/index/introducing-gpt-rosalind/?video=1183840075)，在一次实际的 Codex 会话中，GPT Rosalind 被要求对用于哮喘治疗的三个药物靶点（IL-33、TSLP 和 IL1RL1）进行比较和优先级排序。

这个过程体现了该模型如何处理复杂的生命科学工作流，具体步骤如下：

构建内部证据包：模型首先从内部结构化数据库中调取数据，建立一个“内部证据包”。这包括了内部实验分析结果、生物标志物策略、靶点的成药性（Tractability）和安全性，以及靶点产品概况（TPP）。

生成并行Sub-agents：模型会生成多个Sub-Agent来并行分析每个靶点。例如，它指派了一个名为 Pascal 的Agent专门负责收集和分析所有相关的人类遗传学证据。

多维度证据路径分析：这些Sub-Agent会在各自的“证据路径”中独立工作，确保遗传学、转化生物学、监管背景和其他标准在最终综合之前保持独立且无偏见。分析的内容涵盖了遗传证据、临床试验数据、通路生物学和成药性等。

调用专业插件与数据库：模型会利用生命科学研究插件，从超过 50 个专业数据库（如 PubMed、clinicaltrials.gov、UniProt 等）中提取相关证据，以解决研究中的歧义。

最终综合与建议：模型汇总所有子智能体的产出，结合本地文件与全球知识库，生成一份带有对比图表的最终优先级建议。这种多兵种协作模式，将传统的科研团队需耗时数日的调研工作，压缩为分钟级的自动化流程。

可以看出， Rosalind 是一个能够执行原本需要科学家团队花费数天才能完成的自动化研究工作流，相当于一支高效的生物学研究员队伍。

制药巨头的选择：用真金白银投票

市场对GPT-Rosalind的反应，是检验其价值的最好标尺。

目前，包括安进（Amgen）、Moderna、诺和诺德（Novo Nordisk）和赛默飞世尔（Thermo Fisher Scientific）在内的多家制药与生命科学巨头，已经开始深度集成GPT-Rosalind。

安进公司的人工智能与数据高级副总裁Sean Bruich这样评价："生命科学领域要求每一步都做到精准。问题极其复杂，数据高度独特，赌注高得惊人。" 安进将GPT-Rosalind作为其研发管线的底层推理平台，用于解决靶点生物学中的复杂问题，帮助识别哪些药物靶点最具开发潜力。

Moderna则将GPT-Rosalind的能力推向了更广泛的应用。这家因mRNA新冠疫苗而闻名的公司，利用该模型强大的跨领域逻辑推理能力，优化临床试验的剂量选择流程。CEO斯蒂芬·班塞尔（Stéphane Bancel）指出，该模型能够将复杂的生物学证据转化为可执行的实验流，显著缩短了从科研假设到临床验证的路径。

诺和诺德的布局更具战略意味。这家丹麦制药巨头与OpenAI建立了战略联盟，合作范围从药物研发延伸至商业运营的各个环节。与此同时，OpenAI还与洛斯阿拉莫斯国家实验室（LANL）展开合作，探索GPT-Rosalind在催化剂设计和更深层次生物结构修饰中的应用。这些跨界合作表明，GPT-Rosalind的影响力正在从生物医药向材料科学和更广泛的生物技术领域扩散。

固有的局限性：生物学家最后的堡垒

尽管GPT-Rosalind表现卓越，但基于LLM的固有特性，在以下方面依然无法代劳，其他领域亦可横向迁移：

湿实验室的物理操作不可替代 模型缺乏在物理空间中执行实验方案的能力。液体处理、化学品配制、蛋白质样品制备中的触觉微调——这些基于感官反馈的操作，目前AI无法感知。

无法产生真正的原创发现 GPT-Rosalind本质上是基于硅基计算的统计模式识别，而非基于好奇心的科学想象力。它只能在已知知识空间内重新排列"令牌"，无法像弗莱明发现青霉素那样，在"异常现象"中捕捉意外的生物学信号。虽然它无法从海量知识里提炼自洽的逻辑和理论体系，但随着impactful discovery的寒武纪式的爆发，也许下一个划时代的类似“中心法则”的理论很快会被揭示。

隐性知识的壁垒 生物学家通过长期"做中学"积累的隐性知识——如显微手术中的"手感"、细胞培养中对微小形态改变的敏感——无法被数字化或算法捕捉。

临床转化的鸿沟 AI无法全面模拟compound在活体环境下的安全性、免疫原性和保护效力。许多在动物模型中显效的药物在临床试验中失败，这种"转化失败"揭示了生物真实性的复杂程度远超计算模拟。

伦理决策与责任承担 机器无法为错误或违法结论承担责任。在涉及人类参与者的研究中，AI绝对不能独立决定参与者的资格或推断其医疗需求—这种决策权不仅是技术性的，更是法律和道德上的义务。

行业影响：搅动CRO格局

GPT-Rosalind发布当天，资本市场的反应折射出了另一种焦虑。

4月16日，多家临床研究组织（CRO）的股价出现明显下跌：查尔斯河实验室（Charles River Laboratories）下跌2.6%，Recursion Pharmaceuticals下跌超过5%，Schrödinger下跌超过5%。投资者担心，随着AI能够独立完成早期的假设生成和初步筛选，那些以临床前模型和安全评估为主业的CRO公司，其服务需求可能出现结构性收缩。

这种担忧并非没有道理。早期研发阶段——靶点识别、分子筛选、文献筛选——在很大程度上依赖于信息处理和初步实验方案的设计。GPT-Rosalind恰恰擅长这些任务。它能够在短时间内完成大规模的文献综述，原本需要三周的手动工作，使用GPT-Rosalind后被缩短至不到三天。这种数量级的效率提升，意味着药企内部可以承接更多原本外包出去的工作。

但临床阶段CRO表现出更强的防御性：IQVIA等公司拥有全球最大的脱敏患者数据库，这种核心数据资产构成AI难以跨越的"护城河"。临床试验涉及的患者招募、现场监测、合规性报告以及与监管机构的深度沟通，属于"高交付、低结构化"的服务，AI极难完全接管。

未来展望：增强型研究员时代

GPT-Rosalind并未要取代生物学家，而是将其定位为"增强型研究员"时代的工具。AI负责逻辑与计算，人类负责意义、直觉与责任。

GPT-Rosalind代表AI在垂直领域应用的新高度。它通过整合底层的大规模推理能力、特定领域的工作流训练、以及开放的插件生态系统，为生命科学研究提供了一个强大的、具备初步因果理解能力的计算底座。虽然模型仍面临幻觉风险、物理执行缺失以及严厉的安全管控，但它在缩短药物研发周期、优化早期靶点筛选以及降低实验成本方面的潜力已经得到了顶级药企的初步认可。GPT-Rosalind的成功并非在于它能“替代”科学家，而是在于它极大地扩展了人类在面对生命复杂性时的探索半径，使得科学发现的过程从单纯的体力与算力消耗，进化为一种更高层次的人机协作推理活动。随着技术的进一步成熟，这类领域特定（Domain-specific）的前沿推理模型将成为开启下一次生物技术革命的关键钥匙。

参考资料：综合自OpenAI官方发布信息、BixBench/LABBench2基准测试报告、Fierce Biotech、TNW、MLQ.ai等媒体报道