这篇论文提出 AiScientist:一个面向机器学习研究的长时程自主工程系统。
核心思想:长期自主科研不能只靠聊天式推理,而要靠 结构化编排 + 持久化项目状态。
它采用:
顶层 Orchestrator 控制研究阶段;
多个专门智能体执行分析、计划、代码、实验、调试;
File-as-Bus 工作区保存计划、代码、实验结果等,让智能体持续接力。
效果:在 PaperBench 上平均提升 10.54 分,在 MLE-Bench Lite 上达到 81.82% Any Medal。消融显示 File-as-Bus 是关键,移除后性能明显下降。
意大利,1分钟前,
夜雨聆风