GPT-5.4被塞进了一个真实的化学实验室。不是模拟,不是论文推演。是实实在在地设计并验证了10080次Chan-Lam偶联反应——药物合成中最重要的碳氮键构建反应之一。OpenAI赶在6月18日公布了和Molecule.one合作的初步结果,标题用了个大词:"near-autonomous AI chemist"。

Chan-Lam偶联反应是制药行业真正的"老黄牛"。1998年由Dominic Chan和Patrick Lam两位化学家建立,核心技术是在温和条件下用芳基硼酸和胺类底物构建碳氮键——这是绝大多数药物分子骨架的核心连接方式。从降压药到抗癌药,这个反应几乎无处不在。但问题是它臭名昭著的不稳定:换一种底物,产率可能从80%直接跌到20%;条件稍微不对,还容易出现过芳基化副产物,把整个合成路线搞废。制药公司的合成化学家们花在这个反应优化上的时间,加起来可能比任何其他单一反应都多。一个博士泡在实验室里筛条件,三个月能找到一个可接受的结果就算运气不错。
OpenAI这套AI化学家是怎么工作的?简单说是一个"AI出主意、人做实验、数据喂回去"的闭环。GPT-5.4根据文献数据和化学原理,提出反应条件组合——催化剂种类、溶剂配比、反应温度、时间窗口等参数。人类化学家在湿实验室里实际跑反应,把产率、纯度、副产物分布等数据反馈给模型。模型学习结果后调整建议,再次迭代。10080次循环下来,系统找到了显著优于传统方法的条件组合。这个数字本身就是信息量:10080次实验如果全靠人工设计执行,按一个合成化学家一天跑5-10个反应算,需要一个人全职做两三年。而人机协作把这个周期压缩到了几周。

需要说清楚的是:这不是一个"AI取代化学家"的故事,至少现在不是。整个流程仍然是human-in-the-loop——人类化学家操作实验、判断数据质量、决定是否采纳AI的建议。Crypto Briefing的报道明确指出,系统的设计意图就是通过人工监督来降低大模型幻觉带来的风险。但这个模式真正的价值在于速度:传统的反应条件优化靠的是经验和直觉试错,而AI驱动的闭环系统把"试错"变成了"试对"——每一次失败都在为下一次成功缩小搜索空间。
当然也有令人不太满意的地方。第一,具体产率提升的数字OpenAI没有公开,用的词是"notable improvements"——在科学界,这是一个偏软的信号。真正的突破应该经得起数字和统计显著性检验。第二,10080次反应听着很唬人,但在工业级药物筛选的尺度上并不大——高通量筛选平台一天就能跑几十万次。第三点更重要:这个系统目前只验证了Chan-Lam偶联一个反应类型,泛化能力完全没有证据。AI在化学领域的落地,最难的不是在某个反应上跑赢人类,而是跨底物、跨反应类型的稳定性。

但从行业趋势看,这件事的象征意义不小。4月份OpenAI刚推出GPT-Rosalind专门服务生命科学领域,Novo Nordisk和Sanofi都在和OpenAI合作把AI嵌入研发管线。Molecule.one这样的公司更是把计算化学和AI结合当成核心商业模式。制药行业每年在研发上烧掉超过2000亿美元,单是合成路线优化这个环节,哪怕缩短几个月,对应的成本和上市时间优势都是真金白银。这也解释了为什么Chai Discovery能拿到1.3亿美元B轮融资——AI制药已经从"可能有用"变成了"谁能先落地谁吃红利"的阶段。
九边形观察:AI进湿实验室,是2026年最值得严肃关注的AI落地方向之一。它的特殊之处在于——不像聊天机器人可以靠"感觉好用"过关,化学实验的结果是0和1:产率是小数点后一位的硬数字,纯度是HPLC图谱的硬指标,骗不了人也吹不了牛。GPT-5.4这次的表现证明了大模型在科学推理上的潜力,但距离"near-autonomous"这个定语所暗示的程度,还有相当长的路。真正的检验标准不是公关稿,而是经同行评议的论文。我们等数据。

—— 九边形
夜雨聆风