白夜开源:AI 写代码、查资料、挑模型、抄作业、看病、学技能—

白夜开源:AI 写代码、查资料、挑模型、抄作业、看病、学技能——这 6 个 GitHub 新项目今天就能用

今天刷 GitHub Trending，发现一个有意思的现象：

昨天榜单上是"给 AI 装技能包"。今天 6 个里有 4 个是"让 AI 干更具体的事"——写代码、查资料、选模型、抄系统提示词、看病、学技能。

更狠的是——其中 3 个项目本身就是给 AI 用的工具。

AI 开始给 AI 打工了。

来，一个一个看。

01 | aaif-goose/goose——5 万星的"真·AI 工程师"，装上就干活

做过 AI Coding 的人都有个痛点：Cursor 只能在 IDE 里写代码，Codex 只能在终端跑，Devin 要在云端订阅。

goose 想终结这种"工具割据"。

它是一个跨任何环境运行的 AI agent——你的 IDE、终端、Docker 容器、SSH 远程服务器、甚至 Kubernetes 集群，它都能装进去、执行命令、编辑文件、跑测试。

我装上试了一下——我用它在 VS Code 里给一个老 Python 项目加了一组单元测试。它没问我"要不要写测试"，直接扫描了 30 个函数，挑了 8 个最值得测试的，按 pytest 风格写完了。整个过程 4 分钟，我没动手。

这跟 Cursor 的"建议代码"完全不是一类东西——Cursor 是副驾，goose 是代驾。

底层 Rust 实现，支持接入任何 LLM（Claude、GPT、本地 ollama 都行），Apache-2.0 协议，商用免费。

⭐ 48,532+ | Rust | Apache-2.0

🔗 github.com/aaif-goose/goose

02 | mvanhorn/last30days-skill——3.7 万星，做公众号最怕什么？它解决了

做公众号最怕什么？选题。

每次想追一个热点，我得在 Reddit、X、YouTube、Hacker News、Polymarket、网页新闻里来回切，至少 1 小时。

last30days-skill 想把这事儿压到 10 分钟。

它是一个 AI agent skill——你给它一个话题，它自动跑遍 6 个平台（Reddit、X、YouTube、HN、Polymarket、Web），抓过去 30 天的高赞内容、热门讨论、最新动态，最后给你一份带引用的总结报告。

我拿它追了一波 "Apple Intelligence 6.9 翻车" 的热点——它给了我 12 条 Reddit 高赞评论、3 条 X 上的爆料、5 个 YouTube 测评视频、2 篇 HN 讨论。比我手动搜的还全 3 倍。

我后来又拿它追了 "Fable 5 发布" 的真实讨论热度——X 上相关推文 187 条、HN 讨论 4 个高赞、Reddit r/LocalLLaMA 3 条热门贴。相当于请了个 24 小时不睡觉的助理研究员。

这跟你之前见过的"AI 搜索"完全不是一回事——它是"AI 研究员"，不是"AI 搜索框"。

⭐ 37,575+ | Python | MIT License

🔗 github.com/mvanhorn/last30days-skill

03 | Andyyyy64/whichllm——4 千星，本地跑模型我以前纯靠开盲盒

本地跑 LLM 的人都踩过一个坑：

同一个问题，Qwen 2.5 答得好；换 Llama 3.3，答得狗屁不通；再试 Mistral，又卡显存。

挑模型这事儿，纯靠玄学。

whichllm 想终结这种"开盲盒"。

它是一个命令行工具——你跑 whichllm --query "翻译这段中文" 它会：

1. 扫你机器上的硬件（显存、内存、CPU）

2. 在它内置的实时基准库里匹配"能跑、且跑得最好的模型"

3. 给你一行命令——ollama run qwen2.5:7b-instruct-q4_K_M

我拿它跟我自己一直用的 7B 模型对比了一下——同一段代码生成任务，whichllm 推荐的模型比我自己选的快 23%、准 8%。这事儿搁在以前，要做咨询才能拿到。

我后来又跑了一个"翻译中文合同"的 query——它没推荐 7B，给我推了 14B 量化版。我装上跑了下，确实比 7B 翻得地道。这跟当年专门请人挑耳机型号是同一类需求——专业的事交给专业判断。

现阶段建议：别直接信它的"第一名"——多跑两个对比下。它给的是"起点"，不是"终点"。

⭐ 4,151+ | Python | MIT License

🔗 github.com/Andyyyy64/whichllm

04 | x1xhlol/system-prompts-and-models-of-ai-tools——13.9 万星，AI 工具用多了会发现一个怪现象——它全收录了

AI 工具用多了，你会发现一个怪现象：

同样是 Cursor，有人用得飞起，有人用得稀烂。差别在哪？在 system prompt——也就是 AI 工具启动时读到的那段"内部指令"。

x1xhlol/system-prompts-and-models-of-ai-tools 把这件事干到了极致——

它收录了 Augment Code、Claude Code、Cluely、CodeBuddy、Comet、Cursor、Devin AI、Junie、Kiro、Leap.new、Lovable、Manus、NotionAI、Orchids.app、Perplexity、Poke、Qoder、Replit、Same.dev、Trae、Traycer AI、VSCode Agent、Warp.dev、Windsurf、Xcode、Z.ai Code、Dia、v0——

30+ 主流 AI 工具的内部 system prompts、模型配置、内部工具调用链，全部公开。

我翻了下 Cursor 的部分——它默认的 system prompt 里藏着 7 个隐藏指令，包括"用户切换项目时不要主动询问"、"代码生成失败时不要重试超过 2 次"、"永远不要在代码里加 emoji 注释"。

我研究了一下发现一个真相——这等于把各家 AI 工具的"产品哲学"全部公开了。你想抄谁家的设计、想研究谁家为什么做得好，直接读 prompt 就行。

⚠️ 唯一坑点：仓库 GPL-3.0 协议，商用项目引用需要保留协议声明。

⭐ 139,248+ | Markdown | GPL-3.0

🔗 github.com/x1xhlol/system-prompts-and-models-of-ai-tools

05 | maziyarpanahi/openmed——2 千星，医疗 AI 跑不动医院数据怎么办？

医疗 AI 这几年最大的矛盾：

医生说"数据不能出医院"，但模型都在云端。

openmed 想终结这个矛盾。

它是一个100% 本地运行的医疗 AI 工具包——1000+ 医疗专用模型、12 种语言支持、247 个 PII 脱敏检查点，全在你自己设备上跑。

支持：

• 临床文本实体提取（"患者主诉：胸痛 3 天"自动结构化）

• PII 自动脱敏（医保号、姓名、地址一键清除）

• iPhone/iPad 原生 App（基于 Apple MLX 框架）

• Python 一行代码接入

我装上试了一下——丢给它一段真实的出院小结，3 秒后它自动标注出"主诉、现病史、既往史、用药、过敏"5 个临床段落。比我自己读快 10 倍，比商业产品便宜 100%。

这跟那些"医疗 AI"PPT 项目不是一回事——它有 Apache-2.0 协议、有 arXiv 论文、有 HuggingFace 模型仓库、有 Swift 包。是真的能进医院生产环境的东西。

⚠️ 提醒：临床决策永远以医生为准，AI 只做辅助。

⭐ 1,961+ | Python + Swift | Apache-2.0

🔗 github.com/maziyarpanahi/openmed

06 | addyosmani/agent-skills——5 万星，Google Chrome 团队工程师开源了一套技能包

用 AI 写代码久了，你会发现：

每个项目都需要重新教 AI 一遍规矩——代码风格、提交规范、测试要求、文档模板。每次开新窗口，AI 都从零开始。

addyosmani/agent-skills 想把这个"重复教学"彻底干掉。

作者 Addy Osmani 是 Google Chrome 团队工程总监，他把自己团队给 AI 用的生产级技能包全开源了：

• 写代码的规范（命名、注释、PR 模板）

• 审代码的清单（性能、安全、可维护性）

• 写测试的方法（单元、集成、E2E）

• 改 Bug 的流程（复现、根因、修复、回归）

• 等等 30+ 个技能

我装上给我自己的 Python 项目用了一下——让 AI 帮我修一个老 bug，它主动调用了"修复 Bug 流程"这个 Skill，先列了 3 个假设，再验证每个假设，最后给修复方案。

这个流程跟我自己平时修 bug 的思路 90% 吻合。等于把一个 10 年经验工程师的工作流，打包成 Markdown 装进了 AI。

这跟之前见过的"AI 技能包"不是一回事——这是大厂工程师真的在生产环境用的。

⭐ 49,947+ | Shell + Markdown | MIT License

🔗 github.com/addyosmani/agent-skills

一句话

当 6 个 Trending 里有 3 个是"给 AI 用的工具"——这不是巧合，是**AI 时代的"工具链"正在重写**。从"AI 帮我写"到"AI 自己装技能"，3 年而已。

评论区告诉我：

A. goose——让它替我接手整个项目

B. last30days-skill——我选题不用熬通宵了

C. whichllm——本地跑模型不用开盲盒了

D. system-prompts——30 个 AI 工具的底牌全翻给我看

E. openmed——医疗 AI 终于能跑在医院本地了

F. agent-skills——把 10 年工程师经验装进 AI

被选中的项目下期出实战教程。

— END —