最近 GitHub 上最热的 5 个 AI 项目,我先替你试着筛了一遍
最近 GitHub 上最热的 5 个 AI 项目,我先替你试着筛了一遍
这两天看 GitHub 热榜,有个感觉很明显:AI 开源项目的焦点正在从「模型本身」往「怎么让 Agent 真正干活」迁移。
以前大家追的是大模型、RAG、推理框架。现在热起来的项目,很多都在解决更具体的问题:怎样让编码 Agent 少犯错,怎样把任务交给多个 Agent,怎样把提示词、技能、工作流沉淀下来。
我按近期活跃度筛了 5 个项目。不是按总 Star 排名,而是看最近在 GitHub 上升得快、讨论度高、对普通开发者也有参考价值的项目。
1. mattpocock/skills
项目地址: https://github.com/mattpocock/skills
这是 Matt Pocock 放出来的一套 Agent Skills。它不是一个大而全的框架,更像是一组可直接塞进 Claude Code、Codex 这类编码 Agent 里的工作习惯。
我觉得它火得合理。现在很多人已经不缺「让 AI 写代码」的工具,缺的是让 AI 少绕路、少乱改、少把小需求写成大工程的方法。
这个项目里比较有意思的技能包括:
/grill-me:让 Agent 在开工前追问你,把需求问清楚。/tdd:引导 Agent 走测试驱动开发。/diagnose:遇到复杂 bug 时,不让 Agent 瞎试,而是按复现、缩小范围、验证假设的流程排查。/improve-codebase-architecture:让 Agent 从架构角度看代码,而不是只盯着当前文件修修补补。怎么用:
npx skills@latest add mattpocock/skills
安装后选择你要启用的技能,再在 Agent 里运行:
/setup-matt-pocock-skills
适合谁: 适合已经在用 Claude Code、Codex、Cursor Agent 的人。尤其是那种「AI 能写,但写完我不太放心」的场景。
2. warpdotdev/Warp
项目地址: https://github.com/warpdotdev/Warp
Warp 以前更多被当成一个现代终端工具,现在它的定位变得更激进:agentic development environment。
说人话,就是终端不再只是敲命令的地方,而是可以直接接入编码 Agent 的工作台。你可以用 Warp 自带的 coding agent,也可以接 Claude Code、Codex、Gemini CLI 这类外部 Agent。
我对这个方向挺感兴趣。很多 AI 编程工具喜欢重新造一个界面,但开发者真正高频停留的地方,还是终端、编辑器、浏览器。Warp 如果把 Agent、命令行、上下文管理揉得足够顺,它可能会变成一个很自然的 AI 开发入口。
怎么用:
普通用户直接下载 Warp: https://www.warp.dev
想从源码跑,可以:
./script/bootstrap./script/run
做提交前检查:
./script/presubmit
适合谁: 适合终端重度用户,尤其是喜欢把 AI 助手放进真实开发流里的人。它不是单纯聊天窗口,而是更靠近开发现场。
3. openai/symphony
项目地址: https://github.com/openai/symphony
Symphony 是 OpenAI 开源的一个 Agent 编排项目。它想解决的问题比「让一个 Agent 写代码」更往后一层:当任务越来越多时,怎么管理一群 Agent 的工作。
它的思路是把项目任务拆成相互隔离的实现运行。每个 Agent 处理自己的任务,并提供证据,比如 CI 状态、PR review 反馈、复杂度分析、演示视频。人不需要一直盯着 Agent 打字,而是像管理项目一样管理它们的产出。
这个项目目前还偏工程预览,不适合不看文档就往生产环境里塞。但它代表了一个很值得注意的方向:未来 AI 编程可能不是「我问一句,它答一句」,而是「我维护任务板,它自己派工、交付、证明自己做完了」。
怎么用:
有两条路。
第一种,按官方 spec 自己实现:
Implement Symphony according to:https://github.com/openai/symphony/blob/main/SPEC.md
第二种,看官方实验性的 Elixir 参考实现:
https://github.com/openai/symphony/blob/main/elixir/README.md
适合谁: 适合团队负责人、工程平台团队,或者正在研究多 Agent 协作的人。普通个人开发者可以先看思路,不一定急着部署。
4. forrestchang/andrej-karpathy-skills
项目地址: https://github.com/forrestchang/andrej-karpathy-skills
这个项目很小,但传播很快。它把 Andrej Karpathy 对 LLM 编程问题的观察,整理成一份 CLAUDE.md 指南。
核心不是某个神奇命令,而是给编码 Agent 上几条「规矩」:
这几个点看起来普通,但真的很实用。很多 AI 写代码的灾难现场,本质上不是模型不会写,而是它太自信、太爱扩写、太喜欢顺手「优化」旁边的代码。
怎么用:
Claude Code 插件方式:
/plugin marketplace add forrestchang/andrej-karpathy-skills/plugin install andrej-karpathy-skills@karpathy-skills
单项目使用也可以直接下载 CLAUDE.md:
curl -o CLAUDE.md https://raw.githubusercontent.com/forrestchang/andrej-karpathy-skills/main/CLAUDE.md
已有项目可以追加进去:
curl https://raw.githubusercontent.com/forrestchang/andrej-karpathy-skills/main/CLAUDE.md >> CLAUDE.md
适合谁: 适合所有正在用编码 Agent 的人。尤其是你已经遇到过「它把事情做大了」「它乱改了我没让它动的文件」这种情况。
5. obra/superpowers
项目地址: https://github.com/obra/superpowers
Superpowers 是一整套 Agent 开发方法论。它不只给你几个 prompt,而是把需求澄清、方案设计、任务拆分、工作区隔离、TDD、代码审查、收尾合并都做成技能流程。
这个项目最打动我的地方是,它没有假装 Agent 天生靠谱。它默认 Agent 需要流程约束,需要小步验证,需要在每个阶段留下证据。
它支持的工具也比较多:Claude Code、OpenAI Codex、Cursor、OpenCode、Gemini CLI、GitHub Copilot CLI 都有对应安装路径。
Codex CLI 里可以这样装:
/plugins
然后搜索:
superpowers
选择 Install Plugin。
Codex App 里更简单:打开侧边栏 Plugins,在 Coding 分类里找到 Superpowers,点加号安装。
适合谁: 适合想把 AI 编程流程做得更稳的人。如果你只是偶尔让 AI 改一行代码,它可能有点重;但如果你经常让 Agent 做多步开发,它很值得研究。
我的判断
这 5 个项目放在一起看,信号很清楚:AI 编程正在进入「流程化」阶段。
以前大家问的是:哪个模型更强?哪个 Agent 更会写? 现在更实际的问题变成了:怎么让它少犯错?怎么让它解释自己的工作?怎么让多个 Agent 协作?怎么把好习惯沉淀成可复用的技能?
我会优先建议这样试:
如果你是个人开发者,先看 andrej-karpathy-skills 和 mattpocock/skills。这两个上手成本低,收益也直接。
如果你在用终端做大量开发,可以试试 Warp。
如果你在团队里管理复杂任务,或者对多 Agent 协作感兴趣,再去看 Symphony 和 Superpowers。
AI 编程工具现在不缺热闹。真正值得关注的是:哪些项目能让我们少返工,少被 AI 带偏,把时间花在判断和设计上。
这才是我最近最想追的方向。
夜雨聆风