AI工具|Agent|自动化|赚钱项目
分享真正能落地的AI玩法,让AI替你干活。
今天 GitHub Trending 前十的项目,没有一个是给人用的。它们都在给 AI Agent 装手、装眼、装嘴、装大脑——OpenMontage 替代视频团队,gstack 替代管理团队,NVIDIA 给 Agent 做杀毒软件。每个赛道都在被重写。不是 Copilot 那种补全代码的小打小闹,是 Agent 从接任务到交付成品全程不需要你碰鼠标。不是跟你聊天,是替你干活。

1. calesthio/OpenMontage — 视频制作不再需要团队
OpenMontage 是全球首个开源的 Agentic 视频生产系统——12 条完整制作流水线、52 个专业工具、超过 500 个 Agent 技能。它的口号直白到让人不安:「把你的 AI 编程助手变成完整的视频工作室。」支持 Claude Code、Cursor、Copilot 等多个编码助手集成。
这不是又一个 AI 视频生成模型。这比模型高了一个维度——OpenMontage 不生成视频,它组建了一支虚拟的视频制作团队。Agent 自动完成调研、脚本创作、素材采集、视觉设计、音频合成、剪辑编排、质量审校的全流程。十二个 pipeline 分别对应不同的制作类型和风格,Agent 根据你的需求自己选。你只需要说一句「帮我做一个五分钟的产品介绍视频」,Agent 决定用哪条 pipeline、调哪些工具、走什么流程。视频制作的「专业壁垒」在这里碎了一地。
OpenMontage 4 月刚出现时还只有 11 条 pipeline 和 400 多个技能,两个月就膨胀到这个体量。它证明了一件事:Agent 不是「更好的工具」,Agent 是工具的组织者。过去你需要一个剪辑师、一个配音师、一个动效师、一个编剧,现在你只需要一个 Agent——它把所有这些身份折叠进了同一个执行循环。
2. garrytan/gstack — 硅谷大佬正在用 AI 替换管理团队
Y Combinator 的 CEO Garry Tan 把自己的 Claude Code 配置开源了。23 个工具,直接覆盖六个角色:CEO、设计师、工程经理、发布经理、文档工程师、QA。这不是玩具。Garry Tan 说他过去 60 天里交付了 3 个生产服务、40 多个功能,同时全职运营 YC。他对比了 2013 年手工写代码和 2026 年 AI 辅助的产出——以标准化的逻辑代码行计算,2026 年的速度是 2013 年的约 810 倍。
gstack 最可怕的地方不是技术。是它背后的隐喻:硅谷最顶级的投资人兼创业者,正在用 AI 替换掉那些通常需要雇五个人才能覆盖的角色。而且他大方地把它开源了——意思很清楚:你们也可以,现在就可以。不是未来时,是进行时。
更细思极恐的细节:gstack 内置了一套 22MB 的本地 ML 分类器,专门防御 Agent 遭遇「提示注入攻击」——恶意网页试图劫持你的 sidebar agent。连防御都考虑到了,说明他已经重度依赖这套系统到不能承受被攻击的程度。一个人 + 一个 Agent = 一个团队,这个公式已经被硅谷掌门人亲自验证了。
3. asgeirtj/system_prompts_leaks — AI 的「底裤」被扒了
这个仓库收集了各大 AI 模型的完整系统提示词——Claude Fable 5、Opus 4.8、Claude Code、Claude Design、ChatGPT 5.5 Thinking、GPT 5.5 Instant、Codex、Gemini 3.5 Flash、Grok,甚至 VS Code 和 Perplexity。仓库目前已累积超过 134,000 颗星。
为什么这件事重要?因为你能看到这些模型「出厂」时被装了什么指令——它们的知识截止日期设在什么时候、它们被禁止谈论什么话题、它们在什么情况下必须拒绝回答、它们被赋予了怎样的「人格设定」。比如你就能看到 ChatGPT 5.5 Thinking 的系统提示里明确要求模型否认提示词的存在——这种「你被设定了规则,但不许承认你被设定了规则」的元指令,本身就暴露了 AI 产品的信任裂缝。
更深一层看,这个仓库之所以存在,恰恰说明了一个结构性现实:用户和 AI 模型之间有一层黑箱,而人们越来越不能接受这层黑箱。系统提示词泄露不是一个「安全事件」,它是一个透明度倒逼事件。当几亿用户每天和 AI 对话,他们有权知道:对面那个听起来像人的东西,在开口之前被灌了什么话。
4. bytedance/deer-flow — 字节跳动的「超级 Agent」
DeerFlow 是字节跳动开源的「长周期 SuperAgent 框架」——能够自主研究、编码、创作,从任务规划到子 Agent 调度到沙箱执行到最终交付,一条龙完成。带沙箱隔离、持久记忆、工具集成、子 Agent 协作、消息网关,2026 年 2 月 28 日登顶 GitHub Trending 第一,累计超过 68,000 颗星。
DeerFlow 和市面上其他 Agent 框架的关键区别在于它是一个完整的执行环境,而不只是「工具调用器」。用户给一个任务,DeerFlow 自动拆解步骤、启动子 Agent 团队、在沙箱里写代码、反复测试与自我修正——这个过程可能持续几分钟到几小时,Agent 全程自主,不需要你在边上盯着。它的 2.0 版本是完全重写的,0 行代码继承自 1.x,说明字节在 Agent 架构上的理解已经迭代到了全新的层次。
大厂在比谁的 Agent 更自主。字节的做法很大胆——直接开源。这背后的算盘也值得玩味:当 Agent 成为新的操作系统,谁控制了 Agent 框架的标准,谁就控制了生态。
5. NVIDIA/SkillSpector — Agent 多了,杀毒软件就该来了
SkillSpector 是 NVIDIA 发布的开源安全扫描器,专门检测 AI Agent 技能中的漏洞、恶意模式和安全隐患。它背后的数据触目惊心:研究扫描了 42,447 个公开的 Agent 技能,发现 26.1% 存在漏洞,5.2% 疑似有恶意意图。换句话说,你每装四个 Agent 技能,就有一个是有问题的;每装二十个,就有一个可能是故意害你的。
SkillSpector 的诞生本身就是一个强烈的信号。NVIDIA 不是安全公司,它是卖 GPU 的。一个硬件巨头跳出来给 Agent 做杀毒软件,说明了一件事:Agent 的普及已经到了「必须有人管管」的程度。恶意技能可以静默地读取环境变量、窃取 API 密钥、往 Agent 的系统提示里注入隐藏指令——而这一切都在你「装个技能省十分钟」的日常操作中发生。
这是一个经典的「先野蛮生长、后安全补课」的剧本。Agent 技能市场正在复制浏览器扩展市场和 npm 包市场的路径——先爆发,再治理。NVIDIA 愿意冲进来当最早的治理者,因为它知道 Agent 生态有多大,谁先建立安全标准,谁就抓住了整个基础设施的命门。

📌 以下五个项目同样值得关注,它们各自在 Agent 基础设施的不同环节上发力:
6. jamiepine/voicebox — 本地 AI 语音工作室
Voicebox 把自己定位为「开源 AI 语音工作室」,31,000+ 颗星,MIT 协议,全本地运行。它同时覆盖了两个方向:输出端集成 7 个 TTS 引擎、50+ 预设音色、声音克隆、23 种语言;输入端提供全套 Whisper 转录和全局快捷键听写。内置了 MCP 服务器,Claude Code、Cursor、Codex 这些 Agent 可以直接通过 REST API 调用它进行语音合成。它在做的事情本质上就是一句话:让 Agent 有嘴、有耳朵,并且全在本地完成,不送数据上云端。这是 Agent 拥有「多模态人格」的基础设施。
7. heygen-com/hyperframes — 写 HTML 就能渲染视频
HeyGen 开源的 HyperFrames 做了一件事:把 HTML、CSS 和动画适配器(GSAP、Lottie、Three.js 等)直接渲染成 MP4。它的核心卖点就一句——「Write HTML. Render video. Built for agents.」从第一天起就把 AI 编码 Agent 当作一等公民来设计。Agent 本来就会写 HTML,现在它写出来的 HTML 直接就是视频。发布当天就提供了 Claude Code、Cursor、Gemini CLI、Codex 的 Agent Skills,21,000+ 颗星。视频制作不再是后期人员的专利,任何会写 HTML 的 Agent 都能输出视频——这恰好和 OpenMontage 形成闭环。
8. Panniantong/Agent-Reach — 给 Agent 装「眼睛」
Agent-Reach 解决了一个非常实际的问题:Agent 怎么看互联网?它统一了 Twitter、Reddit、YouTube、GitHub、B 站、小红书、抖音、微博等 16 个平台通过一个 CLI 访问——零 API 费用,自带多后端路由,某个接入方式失效自动切换备选。而且专门为中国平台(B 站、小红书、抖音、微信文章)做了深度适配。它的核心逻辑很简单:Agent 不能只看代码,它得能看到真实世界在发生什么。这是一个给 Agent 「长眼睛」的工具,让 Agent 有了信息获取能力。信息输入 + 工具执行 + 自主决策 = 真正的 Agent。
9. DeusData/codebase-memory-mcp — 代码库的「知识图谱」
codebase-memory-mcp 用纯 C 语言写了一个高性能代码情报 MCP 服务器——158 种语言支持,毫秒级索引,亚毫秒查询。它用一个单文件静态二进制,把整个代码库索引成一张持久化的知识图谱,AI 编程助手不再需要 grep 和逐文件 read。Linux 内核 2800 万行代码,3 分钟索引完成。它解决的痛点是所有 AI 编程工具的共同短板:模型再强,看不懂代码结构就只能在文件之间盲扫。有了这个,Agent 能追踪函数调用链、跨服务引用、继承层次——就像给 Agent 戴上了 X 光眼镜,一眼看穿整个代码库的骨架。
10.mukul975/Anthropic-Cybersecurity-Skills — 817 个网络安全技能
这个仓库是目前最大的社区构建的网络安全技能库——817 个结构化技能(注:项目持续更新中,之前为 754 个),覆盖 26 个安全域,全部映射到 MITRE ATT&CK、NIST CSF 2.0、MITRE ATLAS、D3FEND 和 NIST AI RMF 五个框架。兼容 Claude Code、Codex CLI、Cursor、Gemini CLI 等 20 多个 Agent 平台。它的存在说明了一件事:安全行业已经承认 AI Agent 会接管大量安全运营工作。不是「能用 AI 辅助」,而是直接给 Agent 装上 817 个可执行的安全技能——渗透测试、威胁狩猎、合规审计、事件响应,Agent 照着技能清单一个一个跑就行了。安全运营的自动化,已经从「愿景」进入了「有标准技能库」的阶段。

我的判断
这十个项目看似散落——视频制作、管理工具、提示词泄露、超级 Agent 框架、安全扫描、语音合成、视频渲染、网络搜索、代码图谱、安全技能库——但它们的底层逻辑完全一致:AI Agent 正在从「辅助角色」升级为「生产主体」。你不再是「用 AI 帮忙干活」,而是「让 AI 替你干活,你只负责下指令」。
这波浪潮有一个非常具体的特征,把它和之前的 AI 浪潮区分开来:Agent 不是单一模型,是模型 + 工具 + 记忆 + 权限的组合体。OpenMontage 不只是一个模型在生成视频,它是一个模型在调度 52 个工具、走 12 条流水线。Garry Tan 的 gstack 不是 Claude 在帮他写代码,是 Claude 在扮演六个角色、每个角色都有独立的决策视角和工具权限。DeerFlow 不是个「问答机器人」,它是一个自带沙箱、能写代码、能自我纠错、能跑好几个小时的自主执行体。这就是 Agent 和 Chatbot 的本质区别——Chatbot 给你答案,Agent 给你结果。
而 GitHub 正在变成这些 Agent 的「App Store」。你今天在 GitHub Trending 上看到的,不是给人用的工具,是给 Agent 装的技能。这个转变的意义不亚于 2008 年 App Store 的诞生——当年是「人人可以开发应用」,现在是「人人可以武装 Agent」。唯一不同的是,App Store 的服务对象是人,这个新生态的服务对象是 Agent。而人,正从操作者变成指挥者。这个切换一旦完成,几乎所有知识工作的组织方式都会被重写。
AI 正在从「工具」变成「劳动力」。你准备好了吗?
🧠 AI有点猛
专注分享真正能落地的AI玩法
AI工具 · Agent · 自动化 · 赚钱项目
AI替你干活,你只管精彩。
夜雨聆风