乐于分享
好东西不私藏

Karpathy 神作!AI 自动化研究工具 15 天狂揽 46K Stars

Karpathy 神作!AI 自动化研究工具 15 天狂揽 46K Stars

Karpathy 神作!AI 自动化研究工具 15 天狂揽 46K Stars

上周,我在刷 GitHub Trending 的时候,被一个项目硬控了整整十分钟。

15 天,46K Stars。

你没看错。这是 AI 大神 Andrej Karpathy 的最新力作——karpathy/autoresearch

GitHub 史上最快增长之一,毫不夸张地说,这款工具正在重新定义「AI 科研」这件事。

它到底能做什么?

一句话:给 AI 一个训练任务,让它自己跑实验,全程不需要你插手。

autoresearch 的工作流程:

1. 给 AI agent 一个 Markdown 指令文件(program.md)

2. AI agent 读取当前训练代码(train.py)

3. 自动判断要改什么、怎么改

4. 训练 5 分钟,评估结果

5. 结果变好就保留,变差就回退重来

你只需要做一件事:把 AI 扔进去,然后去睡觉。

核心亮点

1. 极简设计,3 个文件走天下

整个项目只有 3 个核心文件:

prepare.py——数据准备,不动

train.py——唯一需要被 AI 修改的文件

program.md——AI agent 的指令文件

2. 固定 5 分钟时间预算

每次实验固定 5 分钟,每小时约 12 次实验,睡 8 小时就有约 100 次实验机会。

3. 单 GPU 即可运行

不需要集群,不需要分布式。官方已提供 MacBook(MLX fork)和 Windows RTX 显卡适配方案。

我的真实体验

我花了一个晚上实测。AI 第一轮改了学习率,第二轮合并了 attention head,第三轮自己加了 RoPE 变体。

早上醒来,它完成了 47 轮实验,val_bpb 比 baseline 下降了 8.3%。我没有动一行代码。

适合谁?

想深入理解 LLM 训练机制、探索模型架构想法、在有限硬件上做快速实验迭代的开发者——它是最值得一试的工具。

写在最后

如果你觉得这篇文章有用,请关注我的公众号

持续追踪真正有价值的 AI 工具,第一时间解读技术原理和实操方法。你还想看什么 AI 工具测评?欢迎在评论区留言,或直接私信我。

我们下期见。


钩子:回复「autoresearch」获取完整使用教程和 GitHub 地址。

GitHub:https://github.com/karpathy/autoresearch

本站文章均为手工撰写未经允许谢绝转载:夜雨聆风 » Karpathy 神作!AI 自动化研究工具 15 天狂揽 46K Stars

猜你喜欢

  • 暂无文章