

在生物医药这个动辄“百亿美金砸不出一个响动”的终极高风险行业,一个决策的失误就能让巨头瞬间跌落神坛。如果把今天最顶尖的AI智能体(Agents)组装成“虚拟高管团队”,送回那些决定巨头命运的董事会时刻,它们能比人类做得更好吗?
最近,Liang's AIxBIO foundry开展了一项跨越时空的“盲测”实验:让Anthropic的Claude和OpenAI的GPT/Codex团队独立推演20个制药巨头的重大战略决策。
实验的结果如下:在90%的案例中,两个相互独立的AI团队做出了完全相同的战略选择。它们彼此之间高度共识,却在面对复杂的现实时暴露了致命的短板。
TONACEA
终极盲测:给AI戴上“时间锁”
为了保证绝对公平,作者对AI团队施加了严格的“时间锁”:只能调用决策发生前的公开数据(如学术论文、财报、临床试验登记信息等),严禁“开天眼”偷看未来的实际结局。在这20个生死决策中,包含10个历史回顾案例(已有明确结果),以及10个前瞻性案例(发生在2023晚期至2025年之间,成败要到2027-2031年才能揭晓)。通过这场博弈,作者试图清了AI决策的底色,总结出了AI决策的底层规律。
TONACEA
规律一:共识的下限极高,AI是完美的“老实人”
在历史案例中,只要正确的路径符合当时的主流专家共识,AI的表现就堪称封神。
• 案例:诺和诺德(Novo Nordisk)砸钱肥胖症(2016年)洞察:AI没有任何人类高管的“沉没成本谬误”、内部政治斗争或短期财务指标压力。在客观整合现有证据、推导合乎逻辑的“主流最优解”时,AI能够提供极高水准的决策下限。
TONACEA
规律二:特立独行的上限极低,AI永远不会“豪赌”
然而,一旦行业迎来了需要逆向思维(Contrarian Bet),或者在缺乏直接证据时进行“信念一跃”的时刻,AI就露怯了。这里有一个长达22个月的“时空打脸”:
• 时空A(2012年):BMS的CheckMate-026惨败洞察:AI本质上是一个共识推理者。它只能在证据基础发生变化后,随之翻转决策;而真正伟大的人类破局者,是在证据尚未形成的迷雾中,凭借偏执去创造证据。AI永远给不了你对抗共识的勇气。
TONACEA
规律三:框架压倒模型,别再迷信最新的大模型了
实验中一个颠覆认知的发现是:尽管Claude和GPT拥有不同的参数和技术,但在“最终采取什么行动”上,两者的吻合度高达90%。这意味着,智能体角色扮演的架构(比如强制加入合规、商业竞争等视角的相互辩论)、提示词流程的设计,比你调用具体哪一个版本的LLM要重要得多。想让AI帮你做决策,花精力升级工作流框架,远比傻傻等待下一个模型更新要有价值。
TONACEA
盲测未来:10个前瞻性当前案例的大博弈
为了彻底打消“AI只是在训练数据里读过答案”的质疑,作者让升级版的7人AI高管团队(加入了CFO和专门抬杠的特立独行董事)对当下的10个悬而未决的真实制药巨头决策进行了盲测推演(篇幅限制本文只摘取4个):
1、诺和诺德竞标Metsera:AI敏锐识别出长效GLP-1(每月注射一次)的威胁,支持拦截,但精准算到了美国FTC的反垄断红线(现实中诺和诺德确实因反垄断压力被迫退出竞标)。
2、阿斯利康与第一三共的Dato-DXd申报:面对临床数据中部分人群的致命毒性风险,AI强烈警告不要贪大,建议主动缩窄申报范围以“保护整体管线叙事”(现实中两家巨头硬闯全人群全label碰壁,最终不得不像AI建议的那样妥协缩窄标签)。
3、艾伯维(AbbVie)对emraclidine的暴雷止损:面对87亿美元买来的精神病新药二期临床意外溃败,AI展现了极其冷酷的商业止损逻辑:立即叫停所有单药三期临床,及时计提资产减值,并迅速转产开拓辅助治疗或其他精神病领域(现实中艾伯维的做法与AI的salvaging挽救方案高度吻合)。
4、BridgeBio后来者的蚕食定价:面对辉瑞长期垄断且高昂的心衰药,AI精准建议采取“Parity-minus”(略低于平价,约9%折扣)的市场准入策略,既学到了高端定位又给医保医院更换处方的财务激励(现实中该药精准以该价格上市,首季利润轻松打爆华尔街预期)。
TONACEA
结语:商业世界不需要完美的传声筒
AI高管在90%的案例中达成一致,这恰恰证明了它的局限——当全行业的共识都在走向悬崖时,AI也会充满逻辑、极其理智地陪着人类一起走向毁灭。
对于企业来说,AI是一个完美的“降噪器”和“纠偏镜”,它能强制逼你的团队看清冷酷的数据事实,剔除掉自大和办公室政治。但面对未知的、反直觉的、需要颠覆规则的未来,那临门一脚的“惊天一跃”,依然需要人类高管自己带上无畏的勇气。因为AI的字典里只有概率,而商业的奇迹,往往诞生于信念。

夜雨聆风