AI化学家进湿实验室了

GPT-5.4被塞进了一个真实的化学实验室。不是模拟，不是论文推演。是实实在在地设计并验证了10080次Chan-Lam偶联反应——药物合成中最重要的碳氮键构建反应之一。OpenAI赶在6月18日公布了和Molecule.one合作的初步结果，标题用了个大词："near-autonomous AI chemist"。

Chan-Lam偶联反应是制药行业真正的"老黄牛"。1998年由Dominic Chan和Patrick Lam两位化学家建立，核心技术是在温和条件下用芳基硼酸和胺类底物构建碳氮键——这是绝大多数药物分子骨架的核心连接方式。从降压药到抗癌药，这个反应几乎无处不在。但问题是它臭名昭著的不稳定：换一种底物，产率可能从80%直接跌到20%；条件稍微不对，还容易出现过芳基化副产物，把整个合成路线搞废。制药公司的合成化学家们花在这个反应优化上的时间，加起来可能比任何其他单一反应都多。一个博士泡在实验室里筛条件，三个月能找到一个可接受的结果就算运气不错。

OpenAI这套AI化学家是怎么工作的？简单说是一个"AI出主意、人做实验、数据喂回去"的闭环。GPT-5.4根据文献数据和化学原理，提出反应条件组合——催化剂种类、溶剂配比、反应温度、时间窗口等参数。人类化学家在湿实验室里实际跑反应，把产率、纯度、副产物分布等数据反馈给模型。模型学习结果后调整建议，再次迭代。10080次循环下来，系统找到了显著优于传统方法的条件组合。这个数字本身就是信息量：10080次实验如果全靠人工设计执行，按一个合成化学家一天跑5-10个反应算，需要一个人全职做两三年。而人机协作把这个周期压缩到了几周。

需要说清楚的是：这不是一个"AI取代化学家"的故事，至少现在不是。整个流程仍然是human-in-the-loop——人类化学家操作实验、判断数据质量、决定是否采纳AI的建议。Crypto Briefing的报道明确指出，系统的设计意图就是通过人工监督来降低大模型幻觉带来的风险。但这个模式真正的价值在于速度：传统的反应条件优化靠的是经验和直觉试错，而AI驱动的闭环系统把"试错"变成了"试对"——每一次失败都在为下一次成功缩小搜索空间。

当然也有令人不太满意的地方。第一，具体产率提升的数字OpenAI没有公开，用的词是"notable improvements"——在科学界，这是一个偏软的信号。真正的突破应该经得起数字和统计显著性检验。第二，10080次反应听着很唬人，但在工业级药物筛选的尺度上并不大——高通量筛选平台一天就能跑几十万次。第三点更重要：这个系统目前只验证了Chan-Lam偶联一个反应类型，泛化能力完全没有证据。AI在化学领域的落地，最难的不是在某个反应上跑赢人类，而是跨底物、跨反应类型的稳定性。

但从行业趋势看，这件事的象征意义不小。4月份OpenAI刚推出GPT-Rosalind专门服务生命科学领域，Novo Nordisk和Sanofi都在和OpenAI合作把AI嵌入研发管线。Molecule.one这样的公司更是把计算化学和AI结合当成核心商业模式。制药行业每年在研发上烧掉超过2000亿美元，单是合成路线优化这个环节，哪怕缩短几个月，对应的成本和上市时间优势都是真金白银。这也解释了为什么Chai Discovery能拿到1.3亿美元B轮融资——AI制药已经从"可能有用"变成了"谁能先落地谁吃红利"的阶段。

九边形观察：AI进湿实验室，是2026年最值得严肃关注的AI落地方向之一。它的特殊之处在于——不像聊天机器人可以靠"感觉好用"过关，化学实验的结果是0和1：产率是小数点后一位的硬数字，纯度是HPLC图谱的硬指标，骗不了人也吹不了牛。GPT-5.4这次的表现证明了大模型在科学推理上的潜力，但距离"near-autonomous"这个定语所暗示的程度，还有相当长的路。真正的检验标准不是公关稿，而是经同行评议的论文。我们等数据。

—— 九边形