OpenAI的聪明切口:不做药,先做科学家的"外接大脑"
OpenAI最近一个月在医药领域动作极快。4月16日刚发布生命科学垂直模型GPT-Rosalind,两天后4月18日就被曝出与辉瑞、诺华、强生等全球前十药企洽谈合作。而在此之前的4月14日,诺和诺德已官宣与OpenAI建立全链条战略合作,计划2026年底前把AI塞进从药物发现到生产制造再到商业运营的每一个环节。这不再是”AI+医药”的概念炒作,而是OpenAI正式把枪口对准了药物研发最值钱的前端科学判断层。
一、AI为什么非要啃药物研发这块硬骨头?
先说结论:药物研发是AI最值得攻打的行业,没有之一。
这个行业有个专门的名词叫”反摩尔定律”。芯片是越做越便宜、越做越快,新药研发恰恰相反——越做越贵、越做越慢。根据美国国会预算办公室(CBO)的数据,进入临床试验的药物里,最终能成功获批上市的只有12%。单个药品研发成本常见估算从不到10亿美元到超过20亿美元不等。砸进去10个项目,9个可能全死,每个死掉的项目背后都是几年时间和几亿美元的真金白银。
这也是为什么全世界科技巨头只要AI稍一成熟,就一定往这个方向冲。别的行业AI提效10%,可能只是帮企业省点人力成本;但在药物研发里,AI如果能让一个错误靶点早点淘汰、让一个正确发现提前现身,省下来的不是几个员工的工资,而是几亿美元和几年时间。赛道虽难,诱惑实在太大。
二、药物研发的四个真痛点
很多人一听AI做药,以为核心是靠AI生成分子。真相完全不是这样。药物研发最痛的地方根本不是”分子怎么画”,而是前面那道极其复杂的科学判断。
第一,信息过载,人脑根本处理不过来。一个药物项目启动初期,科学家要同时吞论文、专利、临床数据、通路资料、蛋白信息、基因信息、疾病机制研究。不是没资料,而是资料多到爆炸,且分散在不同数据库、不同工具、不同体系里。OpenAI官方对GPT-Rosalind的描述很精准:它擅长处理已发表的证据、数据工具和实验,并支持多步科研工作流,比如文献综述、序列功能解释、实验规划和数据分析。它打的不是一个单点任务,而是一条科研数据链。
第二,选错靶点,后面全白干。药物研发最怕的不是实验难做,而是方向一开始就写错了。疾病机制判断错了,或者成药性预期错了,后面再强的化学家、再强的实验团队,也只是在错误道路上越跑越远。整个行业成功率最低的本质,就是前期科学判断的不确定性极高。
第三,AI会计算,不代表药就能做出来。 这是当前AI制药最容易被吹过头的环节。电脑里生成几千个分子确实很酷,但真正的关卡在实验室:体外实验、动物实验、安全性、毒性、药代动力学、人体临床。AI可以加速发现,但验证机理、实验重复性和监管合规依然是决定成败的核心门槛。
第四,生命科学的数据远没有互联网世界那么干净。互联网公司有海量点击、停留、购买数据;生命科学的数据往往是小样本、高噪音、跨平台不一致、实验条件不统一。2026年一些AI药物设计的综述已经把数据完整性和可信度列为核心问题。这意味着一个残酷现实:AI在药物研发里,不是把互联网配方复制过去就能跑通的。
三、OpenAI的聪明切口:不做药,先做科学家的”外接大脑”
OpenAI这次没有直接喊”我能设计新药”,而是选了一个更刁钻的切入点——先做生命科学版的科研智能体。
1. GPT-Rosalind的发布与定位
2026年4月16日,OpenAI正式发布GPT-Rosalind,这是其首个针对特定行业构建的垂直领域模型,命名取自DNA双螺旋结构关键贡献者罗莎琳德·富兰克林。首批合作机构包括安进(Amgen)、莫德纳(Moderna)、艾伦研究所、赛默飞世尔科技等全球顶尖药企和科研机构。
与谷歌DeepMind的AlphaFold不同,AlphaFold是把”蛋白质结构预测”这一件事做到极致的计算引擎;而GPT-Rosalind更像一个科研伙伴,覆盖文献综合、假设生成、实验规划、序列功能解读和工具调用。AlphaFold解决的是蛋白质”长什么样”,Rosalind解决的是”用这个蛋白质,应该怎么干出创新药”。
2. 内置”批判性推理”机制
一个容易被忽略但至关重要的设计,是Rosalind内置了批判性推理能力。OpenAI针对性调整了模型,让它在面对低价值靶点时更倾向于直接否定,而非盲目附和。在新药研发中,早期错判靶点被一路执行到临床三期,是烧掉十亿美元最典型的方式之一。这种”敢说不”的能力,比会生成漂亮图表更有价值。
3. 实战数据:超越95%的人类专家
在生物信息学基准BixBench上,GPT-Rosalind以0.751的Pass@1得分领跑所有已公开模型,超越GPT-5.4(0.740)、Grok 4.2(0.698)和Gemini 3.1 Pro(0.550)。在与AI基因治疗公司Dyno Therapeutics的实战中,基于全新未被训练数据污染的RNA序列测试,Rosalind在RNA序列功能预测任务上超过了95%的人类专家,在序列生成任务上超越了约84%的人类专家。这证明它不是在”背答案”,而是具备在未见过的新型生物数据上进行推理和预测的能力。
4. 诺和诺德全链条合作:从实验室到工厂
2026年4月14日,诺和诺德宣布与OpenAI建立战略合作伙伴关系,覆盖药物发现、生产制造、供应链、分销及企业运营,计划2026年底前完成全面整合。诺和诺德CEO迈克·杜斯特达明确表示:”我们的目标不是取代科学家,而是增强他们的能力”。OpenAI还将协助培训其全球员工,提升AI素养。
这场合作发生的时机很微妙:司美格鲁肽核心化合物专利在中国刚到期,礼来的口服减肥药Orforglipron已获FDA批准上市。诺和诺德需要的不是简单的分子迭代,而是发现新药的新范式。
5. 为什么这个切入点聪明?
很多AI制药公司的路线像垂直引擎——专门做蛋白结构的、专门做靶点发现的、专门做分子生成的。OpenAI这次更像做一个科研总控台,优势不是某个单点绝对最强,而是想成为那个高频入口。谁掌握高频入口,谁就更容易进入真实工作流;谁进入真实工作流,谁就更容易拿到反馈数据;谁拿到反馈数据,谁就能把模型从助手变成系统。这正是OpenAI真正聪明的地方。
四、巨头混战与冷思考:入口之争背后的泡沫与真相
这条赛道早已巨头云集。谷歌的AlphaFold+Isomorphic Labs在结构生物学上护城河极深,2025年拿到6亿美元外部融资,已与诺华、礼来、强生合作。礼来更是构建”Lilly TuneLab”AI/ML平台,建设自主AI算力工厂,试图用联邦学习技术把自身数据与算法能力转化为吸引全行业创新资源的”公共事业”。亚马逊也不甘示弱,4月14日推出Amazon Bio Discovery智能体,集成40多个行业顶级生物医药大模型,主打干湿试验闭环。
未来AI在医药领域大概率会朝五个方向演进:一是从研究助手升级为科研智能体,真正参与推进研究流程;二是与自动化实验室、机器人平台结合,形成设计-合成-测试-反馈的闭环;三是从发现端往临床、制造、运营端延伸;四是监管合规越来越重要,FDA已发布草案要求用于支持监管决策的AI做可信度评估;五是最终拼的一定是数据——谁有更好的实验反馈、更深的行业合作,谁就更难被取代。
第一,不要把”会生成分子”吹成”已经能制药”。 这中间隔着太多的生物学和临床现实。从跑分到真正缩短10到15年的新药周期,中间有一条巨大的鸿沟。
第二,不要把大模型当成自动科学家。大模型在生命科学里最危险的地方,是可能用很自信的语气输出不可靠的结论。而在这个行业里,错一次的代价可能是几个月的失业、几百万的预算,甚至让患者承担风险。幻觉问题仍是悬而未决的挑战,OpenAI自己也坦言尚未完全解决这一顽疾。
未来的赢家未必是模型能力最强的那家,而是最先进入药企真实闭环、最先拿到独家数据反馈的那家。本质上,这不是单纯拼模型,而是拼谁能进入流程、谁能掌握入口、谁能建立最后的闭环。
OpenAI这次推出GPT-Rosalind,不是在做一个会讲生物的聊天机器人,而是在试图切入药物研发最值钱的内一层——前端科学判断层。它先抢的不是最后一步制药环节,而是第一个决定。在药物研发行业里,第一个决定往往比最后那个结果更值钱,因为最后那个药不一定能做出来,很多时候早在开始那一个判断里,就已经埋下了结局。