乐于分享
好东西不私藏

最近 GitHub 上最热的 5 个 AI 项目,我先替你试着筛了一遍

最近 GitHub 上最热的 5 个 AI 项目,我先替你试着筛了一遍

最近 GitHub 上最热的 5 个 AI 项目,我先替你试着筛了一遍

这两天看 GitHub 热榜,有个感觉很明显:AI 开源项目的焦点正在从「模型本身」往「怎么让 Agent 真正干活」迁移。

以前大家追的是大模型、RAG、推理框架。现在热起来的项目,很多都在解决更具体的问题:怎样让编码 Agent 少犯错,怎样把任务交给多个 Agent,怎样把提示词、技能、工作流沉淀下来。

我按近期活跃度筛了 5 个项目。不是按总 Star 排名,而是看最近在 GitHub 上升得快、讨论度高、对普通开发者也有参考价值的项目。

1. mattpocock/skills

项目地址: https://github.com/mattpocock/skills

这是 Matt Pocock 放出来的一套 Agent Skills。它不是一个大而全的框架,更像是一组可直接塞进 Claude Code、Codex 这类编码 Agent 里的工作习惯。

我觉得它火得合理。现在很多人已经不缺「让 AI 写代码」的工具,缺的是让 AI 少绕路、少乱改、少把小需求写成大工程的方法。

这个项目里比较有意思的技能包括:

/grill-me:让 Agent 在开工前追问你,把需求问清楚。
/tdd:引导 Agent 走测试驱动开发。
/diagnose:遇到复杂 bug 时,不让 Agent 瞎试,而是按复现、缩小范围、验证假设的流程排查。
/improve-codebase-architecture:让 Agent 从架构角度看代码,而不是只盯着当前文件修修补补。

怎么用:

npx skills@latest add mattpocock/skills

安装后选择你要启用的技能,再在 Agent 里运行:

/setup-matt-pocock-skills

适合谁: 适合已经在用 Claude Code、Codex、Cursor Agent 的人。尤其是那种「AI 能写,但写完我不太放心」的场景。

2. warpdotdev/Warp

项目地址: https://github.com/warpdotdev/Warp

Warp 以前更多被当成一个现代终端工具,现在它的定位变得更激进:agentic development environment。

说人话,就是终端不再只是敲命令的地方,而是可以直接接入编码 Agent 的工作台。你可以用 Warp 自带的 coding agent,也可以接 Claude Code、Codex、Gemini CLI 这类外部 Agent。

我对这个方向挺感兴趣。很多 AI 编程工具喜欢重新造一个界面,但开发者真正高频停留的地方,还是终端、编辑器、浏览器。Warp 如果把 Agent、命令行、上下文管理揉得足够顺,它可能会变成一个很自然的 AI 开发入口。

怎么用:

普通用户直接下载 Warp: https://www.warp.dev

想从源码跑,可以:

./script/bootstrap./script/run

做提交前检查:

./script/presubmit

适合谁: 适合终端重度用户,尤其是喜欢把 AI 助手放进真实开发流里的人。它不是单纯聊天窗口,而是更靠近开发现场。

3. openai/symphony

项目地址: https://github.com/openai/symphony

Symphony 是 OpenAI 开源的一个 Agent 编排项目。它想解决的问题比「让一个 Agent 写代码」更往后一层:当任务越来越多时,怎么管理一群 Agent 的工作。

它的思路是把项目任务拆成相互隔离的实现运行。每个 Agent 处理自己的任务,并提供证据,比如 CI 状态、PR review 反馈、复杂度分析、演示视频。人不需要一直盯着 Agent 打字,而是像管理项目一样管理它们的产出。

这个项目目前还偏工程预览,不适合不看文档就往生产环境里塞。但它代表了一个很值得注意的方向:未来 AI 编程可能不是「我问一句,它答一句」,而是「我维护任务板,它自己派工、交付、证明自己做完了」。

怎么用:

有两条路。

第一种,按官方 spec 自己实现:

Implement Symphony according to:https://github.com/openai/symphony/blob/main/SPEC.md

第二种,看官方实验性的 Elixir 参考实现:

https://github.com/openai/symphony/blob/main/elixir/README.md

适合谁: 适合团队负责人、工程平台团队,或者正在研究多 Agent 协作的人。普通个人开发者可以先看思路,不一定急着部署。

4. forrestchang/andrej-karpathy-skills

项目地址: https://github.com/forrestchang/andrej-karpathy-skills

这个项目很小,但传播很快。它把 Andrej Karpathy 对 LLM 编程问题的观察,整理成一份 CLAUDE.md 指南。

核心不是某个神奇命令,而是给编码 Agent 上几条「规矩」:

写代码前先想清楚,不要替用户乱猜。
先简单,不要过度抽象。
只改和任务有关的代码。
每个任务要有可验证的成功标准。

这几个点看起来普通,但真的很实用。很多 AI 写代码的灾难现场,本质上不是模型不会写,而是它太自信、太爱扩写、太喜欢顺手「优化」旁边的代码。

怎么用:

Claude Code 插件方式:

/plugin marketplace add forrestchang/andrej-karpathy-skills/plugin install andrej-karpathy-skills@karpathy-skills

单项目使用也可以直接下载 CLAUDE.md

curl -o CLAUDE.md https://raw.githubusercontent.com/forrestchang/andrej-karpathy-skills/main/CLAUDE.md

已有项目可以追加进去:

curl https://raw.githubusercontent.com/forrestchang/andrej-karpathy-skills/main/CLAUDE.md >> CLAUDE.md

适合谁: 适合所有正在用编码 Agent 的人。尤其是你已经遇到过「它把事情做大了」「它乱改了我没让它动的文件」这种情况。

5. obra/superpowers

项目地址: https://github.com/obra/superpowers

Superpowers 是一整套 Agent 开发方法论。它不只给你几个 prompt,而是把需求澄清、方案设计、任务拆分、工作区隔离、TDD、代码审查、收尾合并都做成技能流程。

这个项目最打动我的地方是,它没有假装 Agent 天生靠谱。它默认 Agent 需要流程约束,需要小步验证,需要在每个阶段留下证据。

它支持的工具也比较多:Claude Code、OpenAI Codex、Cursor、OpenCode、Gemini CLI、GitHub Copilot CLI 都有对应安装路径。

Codex CLI 里可以这样装:

/plugins

然后搜索:

superpowers

选择 Install Plugin

Codex App 里更简单:打开侧边栏 Plugins,在 Coding 分类里找到 Superpowers,点加号安装。

适合谁: 适合想把 AI 编程流程做得更稳的人。如果你只是偶尔让 AI 改一行代码,它可能有点重;但如果你经常让 Agent 做多步开发,它很值得研究。

我的判断

这 5 个项目放在一起看,信号很清楚:AI 编程正在进入「流程化」阶段。

以前大家问的是:哪个模型更强?哪个 Agent 更会写? 现在更实际的问题变成了:怎么让它少犯错?怎么让它解释自己的工作?怎么让多个 Agent 协作?怎么把好习惯沉淀成可复用的技能?

我会优先建议这样试:

如果你是个人开发者,先看 andrej-karpathy-skills 和 mattpocock/skills。这两个上手成本低,收益也直接。

如果你在用终端做大量开发,可以试试 Warp。

如果你在团队里管理复杂任务,或者对多 Agent 协作感兴趣,再去看 Symphony 和 Superpowers。

AI 编程工具现在不缺热闹。真正值得关注的是:哪些项目能让我们少返工,少被 AI 带偏,把时间花在判断和设计上。

这才是我最近最想追的方向。