AI科研:试错比“聪明”更重要
AI科研:试错比“聪明”更重要
AI也能像达尔文、爱因斯坦一样搞科研了。
清北斯坦福团队发布SimpleTES框架,通过放大“试错-反馈-进化”机制,使AI在21个科学难题上超越人类和闭源模型。这表明AI科研的关键在于系统化地放大“试错”过程,而非单纯追求模型“脑子大”。
核心观点
夯爆了清北斯坦福联手SimpleTES横扫21个科学难题
SimpleTES:AI驱动科学发现的新范式
过去一年,AI领域普遍认为通过增加模型参数、延长推理时间、深化链路等方式,能让模型更智能,从而实现科学发现。然而,这种侧重模型“脑力”的传统路径,忽略了科研工作流中“试错—反馈—进化”的关键环节。
SimpleTES框架提出,AI科研的真正突破不在于模型更“聪明”,而在于系统性地放大“试错”过程。该框架通过优化“生成候选解—评估反馈—持续改进”的闭环,显著提升了科学发现的效率。
SimpleTES由宽德智能学习实验室(Will)、斯坦福大学、北京大学、清华大学和香港科技大学(广州)的研究团队共同提出。目前,基于SimpleTES的试用平台已在Will官网开放申请,代码也已开源。
SimpleTES将科研试错过程拆解为三个可调度的核心维度:并行探索宽度(C)、迭代精修深度(L)和局部候选数量(K)。这三个维度共同决定了评估器调用的总次数N = C × L × K。
SimpleTES在涵盖六个领域的21个科学问题上,发现了当前最先进的解决方案,持续超越了前沿闭源模型基线和精心调优的优化流程。这些成果很多并非依赖昂贵的闭源模型,而是通过高效组织试错、评估和迭代链路实现。
SimpleTES的出现促使人们重新审视AI科研的路线图,将“评估侧计算”(试错循环的深度和广度)与“生成侧计算”(模型参数、推理长度)并列为可持续投入和收获的扩展轴线。这种通用性方法论在多个科学领域均取得了显著成果。
SimpleTES的能力受限于评估器的效率和准确性,在评估昂贵或主观的领域会面临挑战。此外,当前三维参数仍需手动调整,未来理想状态是系统能动态调整资源分配。Will实验室将致力于让试错过程更智能,从蛮力搜索进化为具备理解、判断和探索能力的系统。
Will实验室:AI for Science的长期主义者
实验室背景与目标
Will(Wizard Intelligence Learning Lab,宽德智能学习实验室)是由顶级量化私募宽德投资孵化的独立AI实验室。Will的目标是实现超级科技助手(ASI for Sci-Tech),构建能辅助甚至驱动科学发现和技术创新的AI系统,而非通用聊天机器人或消费级产品。
全栈式投入与发展策略
Will实验室采取“全栈式”投入策略,并行推进自研基座大模型、面向科学研究的方法论探索以及评估驱动的科学发现引擎。他们从预训练阶段开始构建面向科研场景的底层能力,致力于打造为科学发现深度定制的AI基础设施。
团队与理念
Will汇聚了来自斯坦福、北大、清华、港科大等顶尖机构的AI人才,秉持“Good Will Hunter,AI向善”的理念,致力于服务科研探索、技术创新与知识生产。他们将“让AI学会做科研”视为长期战役,追求技术复利与持续性领先。
行业影响力
宽德作为赞助商参与了ICLR 2026,这表明这家量化金融机构正以深度和长线投入介入前沿AI基础研究。SimpleTES是Will实验室在AI for Science领域迈出的第一步,预示着未来可能带来更快速、更猛烈的故事。
夜雨聆风