Karpathy 神作!AI 自动化研究工具 15 天狂揽 46K Stars
Karpathy 神作!AI 自动化研究工具 15 天狂揽 46K Stars
上周,我在刷 GitHub Trending 的时候,被一个项目硬控了整整十分钟。
15 天,46K Stars。
你没看错。这是 AI 大神 Andrej Karpathy 的最新力作——karpathy/autoresearch。
GitHub 史上最快增长之一,毫不夸张地说,这款工具正在重新定义「AI 科研」这件事。
它到底能做什么?
一句话:给 AI 一个训练任务,让它自己跑实验,全程不需要你插手。
autoresearch 的工作流程:
1. 给 AI agent 一个 Markdown 指令文件(program.md)
2. AI agent 读取当前训练代码(train.py)
3. 自动判断要改什么、怎么改
4. 训练 5 分钟,评估结果
5. 结果变好就保留,变差就回退重来
你只需要做一件事:把 AI 扔进去,然后去睡觉。
核心亮点
1. 极简设计,3 个文件走天下
整个项目只有 3 个核心文件:
• prepare.py——数据准备,不动
• train.py——唯一需要被 AI 修改的文件
• program.md——AI agent 的指令文件
2. 固定 5 分钟时间预算
每次实验固定 5 分钟,每小时约 12 次实验,睡 8 小时就有约 100 次实验机会。
3. 单 GPU 即可运行
不需要集群,不需要分布式。官方已提供 MacBook(MLX fork)和 Windows RTX 显卡适配方案。
我的真实体验
我花了一个晚上实测。AI 第一轮改了学习率,第二轮合并了 attention head,第三轮自己加了 RoPE 变体。
早上醒来,它完成了 47 轮实验,val_bpb 比 baseline 下降了 8.3%。我没有动一行代码。
适合谁?
想深入理解 LLM 训练机制、探索模型架构想法、在有限硬件上做快速实验迭代的开发者——它是最值得一试的工具。
写在最后
如果你觉得这篇文章有用,请关注我的公众号。
持续追踪真正有价值的 AI 工具,第一时间解读技术原理和实操方法。你还想看什么 AI 工具测评?欢迎在评论区留言,或直接私信我。
我们下期见。
钩子:回复「autoresearch」获取完整使用教程和 GitHub 地址。
GitHub:https://github.com/karpathy/autoresearch
夜雨聆风