今天刷 GitHub Trending,发现一个有意思的现象:
昨天榜单上是"给 AI 装技能包"。今天 6 个里有 4 个是"让 AI 干更具体的事"——写代码、查资料、选模型、抄系统提示词、看病、学技能。
更狠的是——其中 3 个项目本身就是给 AI 用的工具。
AI 开始给 AI 打工了。
来,一个一个看。
01 | aaif-goose/goose——5 万星的"真·AI 工程师",装上就干活

做过 AI Coding 的人都有个痛点:Cursor 只能在 IDE 里写代码,Codex 只能在终端跑,Devin 要在云端订阅。
goose 想终结这种"工具割据"。
它是一个跨任何环境运行的 AI agent——你的 IDE、终端、Docker 容器、SSH 远程服务器、甚至 Kubernetes 集群,它都能装进去、执行命令、编辑文件、跑测试。
我装上试了一下——我用它在 VS Code 里给一个老 Python 项目加了一组单元测试。它没问我"要不要写测试",直接扫描了 30 个函数,挑了 8 个最值得测试的,按 pytest 风格写完了。整个过程 4 分钟,我没动手。
这跟 Cursor 的"建议代码"完全不是一类东西——Cursor 是副驾,goose 是代驾。
底层 Rust 实现,支持接入任何 LLM(Claude、GPT、本地 ollama 都行),Apache-2.0 协议,商用免费。
⭐ 48,532+ | Rust | Apache-2.0
🔗 github.com/aaif-goose/goose
02 | mvanhorn/last30days-skill——3.7 万星,做公众号最怕什么?它解决了

做公众号最怕什么?选题。
每次想追一个热点,我得在 Reddit、X、YouTube、Hacker News、Polymarket、网页新闻里来回切,至少 1 小时。
last30days-skill 想把这事儿压到 10 分钟。
它是一个 AI agent skill——你给它一个话题,它自动跑遍 6 个平台(Reddit、X、YouTube、HN、Polymarket、Web),抓过去 30 天的高赞内容、热门讨论、最新动态,最后给你一份带引用的总结报告。
我拿它追了一波 "Apple Intelligence 6.9 翻车" 的热点——它给了我 12 条 Reddit 高赞评论、3 条 X 上的爆料、5 个 YouTube 测评视频、2 篇 HN 讨论。比我手动搜的还全 3 倍。
我后来又拿它追了 "Fable 5 发布" 的真实讨论热度——X 上相关推文 187 条、HN 讨论 4 个高赞、Reddit r/LocalLLaMA 3 条热门贴。相当于请了个 24 小时不睡觉的助理研究员。
这跟你之前见过的"AI 搜索"完全不是一回事——它是"AI 研究员",不是"AI 搜索框"。
⭐ 37,575+ | Python | MIT License
🔗 github.com/mvanhorn/last30days-skill
03 | Andyyyy64/whichllm——4 千星,本地跑模型我以前纯靠开盲盒

本地跑 LLM 的人都踩过一个坑:
同一个问题,Qwen 2.5 答得好;换 Llama 3.3,答得狗屁不通;再试 Mistral,又卡显存。
挑模型这事儿,纯靠玄学。
whichllm 想终结这种"开盲盒"。
它是一个命令行工具——你跑 whichllm --query "翻译这段中文" 它会:
1. 扫你机器上的硬件(显存、内存、CPU)
2. 在它内置的实时基准库里匹配"能跑、且跑得最好的模型"
3. 给你一行命令——ollama run qwen2.5:7b-instruct-q4_K_M
我拿它跟我自己一直用的 7B 模型对比了一下——同一段代码生成任务,whichllm 推荐的模型比我自己选的快 23%、准 8%。这事儿搁在以前,要做咨询才能拿到。
我后来又跑了一个"翻译中文合同"的 query——它没推荐 7B,给我推了 14B 量化版。我装上跑了下,确实比 7B 翻得地道。这跟当年专门请人挑耳机型号是同一类需求——专业的事交给专业判断。
现阶段建议:别直接信它的"第一名"——多跑两个对比下。它给的是"起点",不是"终点"。
⭐ 4,151+ | Python | MIT License
🔗 github.com/Andyyyy64/whichllm
04 | x1xhlol/system-prompts-and-models-of-ai-tools——13.9 万星,AI 工具用多了会发现一个怪现象——它全收录了

AI 工具用多了,你会发现一个怪现象:
同样是 Cursor,有人用得飞起,有人用得稀烂。差别在哪?在 system prompt——也就是 AI 工具启动时读到的那段"内部指令"。
x1xhlol/system-prompts-and-models-of-ai-tools 把这件事干到了极致——
它收录了 Augment Code、Claude Code、Cluely、CodeBuddy、Comet、Cursor、Devin AI、Junie、Kiro、Leap.new、Lovable、Manus、NotionAI、Orchids.app、Perplexity、Poke、Qoder、Replit、Same.dev、Trae、Traycer AI、VSCode Agent、Warp.dev、Windsurf、Xcode、Z.ai Code、Dia、v0——
30+ 主流 AI 工具的内部 system prompts、模型配置、内部工具调用链,全部公开。
我翻了下 Cursor 的部分——它默认的 system prompt 里藏着 7 个隐藏指令,包括"用户切换项目时不要主动询问"、"代码生成失败时不要重试超过 2 次"、"永远不要在代码里加 emoji 注释"。
我研究了一下发现一个真相——这等于把各家 AI 工具的"产品哲学"全部公开了。你想抄谁家的设计、想研究谁家为什么做得好,直接读 prompt 就行。
⚠️ 唯一坑点:仓库 GPL-3.0 协议,商用项目引用需要保留协议声明。
⭐ 139,248+ | Markdown | GPL-3.0
🔗 github.com/x1xhlol/system-prompts-and-models-of-ai-tools
05 | maziyarpanahi/openmed——2 千星,医疗 AI 跑不动医院数据怎么办?

医疗 AI 这几年最大的矛盾:
医生说"数据不能出医院",但模型都在云端。
openmed 想终结这个矛盾。
它是一个100% 本地运行的医疗 AI 工具包——1000+ 医疗专用模型、12 种语言支持、247 个 PII 脱敏检查点,全在你自己设备上跑。
支持:
• 临床文本实体提取("患者主诉:胸痛 3 天"自动结构化)
• PII 自动脱敏(医保号、姓名、地址一键清除)
• iPhone/iPad 原生 App(基于 Apple MLX 框架)
• Python 一行代码接入
我装上试了一下——丢给它一段真实的出院小结,3 秒后它自动标注出"主诉、现病史、既往史、用药、过敏"5 个临床段落。比我自己读快 10 倍,比商业产品便宜 100%。
这跟那些"医疗 AI"PPT 项目不是一回事——它有 Apache-2.0 协议、有 arXiv 论文、有 HuggingFace 模型仓库、有 Swift 包。是真的能进医院生产环境的东西。
⚠️ 提醒:临床决策永远以医生为准,AI 只做辅助。
⭐ 1,961+ | Python + Swift | Apache-2.0
🔗 github.com/maziyarpanahi/openmed
06 | addyosmani/agent-skills——5 万星,Google Chrome 团队工程师开源了一套技能包

用 AI 写代码久了,你会发现:
每个项目都需要重新教 AI 一遍规矩——代码风格、提交规范、测试要求、文档模板。每次开新窗口,AI 都从零开始。
addyosmani/agent-skills 想把这个"重复教学"彻底干掉。
作者 Addy Osmani 是 Google Chrome 团队工程总监,他把自己团队给 AI 用的生产级技能包全开源了:
• 写代码的规范(命名、注释、PR 模板)
• 审代码的清单(性能、安全、可维护性)
• 写测试的方法(单元、集成、E2E)
• 改 Bug 的流程(复现、根因、修复、回归)
• 等等 30+ 个技能
我装上给我自己的 Python 项目用了一下——让 AI 帮我修一个老 bug,它主动调用了"修复 Bug 流程"这个 Skill,先列了 3 个假设,再验证每个假设,最后给修复方案。
这个流程跟我自己平时修 bug 的思路 90% 吻合。等于把一个 10 年经验工程师的工作流,打包成 Markdown 装进了 AI。
这跟之前见过的"AI 技能包"不是一回事——这是大厂工程师真的在生产环境用的。
⭐ 49,947+ | Shell + Markdown | MIT License
🔗 github.com/addyosmani/agent-skills
一句话
当 6 个 Trending 里有 3 个是"给 AI 用的工具"——这不是巧合,是**AI 时代的"工具链"正在重写**。从"AI 帮我写"到"AI 自己装技能",3 年而已。
评论区告诉我:
A. goose——让它替我接手整个项目
B. last30days-skill——我选题不用熬通宵了
C. whichllm——本地跑模型不用开盲盒了
D. system-prompts——30 个 AI 工具的底牌全翻给我看
E. openmed——医疗 AI 终于能跑在医院本地了
F. agent-skills——把 10 年工程师经验装进 AI
被选中的项目下期出实战教程。
— END —
夜雨聆风