一、一个问题:AI能不能设计AI算法?

它做对了什么?
二、从零开始:MLE-bench到底在考什么
| MLEvolve | Gemini-3.1-Pro | 12h | 80.3% | 64.0% | 46.7% | 65.3% |

那么,MLEvolve究竟是怎么做到的?
三、三把钥匙:MLEvolve的核心创新
(1)跨分支信息隔离——传统的树搜索方法中,不同探索分支各自为战,互不相通,无法共享中间发现;
(2)无记忆搜索——每个竞赛任务都从头开始,不会从之前的经验中学习;
(3)缺乏分层控制——策略规划和代码生成混为一谈,导致长周期迭代中方向容易跑偏。
3.1 从树到图:渐进式蒙特卡洛图搜索(Progressive MCGS)
3.2 记忆即智能:回顾性记忆系统(Retrospective Memory)
3.3 谋定而后动:自适应编码模式(Adaptive Coding Modes)

四、数字不说谎:MLEvolve的实战战绩

五、超越Kaggle:当AI做起了数学题

夜雨聆风