每个人都在跑多个 AI agent,然后在十几个终端窗口之间切换,靠系统通知猜哪个卡住了。这不是效率,这是噪音。今天这 6 个项目,有的在解决「如何管住一群 agent」,有的在给 AI 喂真正的专业知识,还有一个悄悄冲到了 5 万 star。
————————————————

01 cmux — 为 AI Agent 时代重新设计的 macOS 终端
分类:效率工具 语言:Swift ⭐ 今日新增:696 总 Star:19k
同时跑 5 个 Claude Code session,你怎么知道哪个需要你回答?macOS 原生通知只会说「Claude is waiting for your input」,完全没有上下文,根本没法判断优先级。
cmux 把这个问题直接砍掉了。它基于 Ghostty 的渲染引擎,用 Swift/AppKit 原生构建,不是 Electron。核心设计很简单:每个 pane 完成任务时,边框发出蓝色光晕,侧边栏对应 tab 同步高亮,Cmd+Shift+U 直接跳到最新未读 pane。
侧边栏能显示每个 workspace 的 git branch、关联 PR 状态、工作目录、监听端口和最新通知文本。cmux claude-teams 一条命令启动 Claude Code 的 teammate 模式,所有 teammate 以原生 split 形式展开,不需要 tmux。
还有一个内置浏览器,能 split 在终端旁边,支持 accessibility tree 快照、元素点击、表单填写,直接让 Claude Code 操纵你的 dev server。
💡 cmux 最适合 macOS 上并行跑多个 Claude Code / Codex session 的用户——需要感知哪个 agent 在等你。Ghostty 更适合追求极致终端性能的单任务用户;tmux 更适合服务器端多路复用。
开源地址:https://github.com/manaflow-ai/cmux
————————————————

02 knowledge-work-plugins — Anthropic 亲自下场,给每个职能写了一套 Claude 插件
分类:AI/LLM 语言:Python ⭐ 今日新增:550 总 Star:14.1k
Claude 很聪明,但它不知道你们公司的 OKR 放在 Notion 哪个页面,不知道你们的销售用 Close 还是 HubSpot。每次都要手动交代上下文,Claude 越强大这个摩擦越明显。
Anthropic 这次直接开源了他们内部用的 11 套插件:sales、finance、legal、data、marketing、product-management、customer-support、HR、bio-research 等。每套插件是一个目录,里面是 Markdown 技能文件和 .mcp.json 连接器配置。无代码,无构建步骤。
以 data 插件为例:它内置了写 SQL、可视化分析、统计方法选择、结果验证的技能文件,通过 .mcp.json 连接 Snowflake/BigQuery/Databricks,/data:write-query 这样的 slash command 直接可调用。
这套设计思路是:技能文件编码领域最佳实践,连接器桥接实际工具,插件做的事是「让 Claude 变成真正懂你业务的那个人」,而不只是一个聪明的问答机器。
💡 如果你的团队在用 Claude Cowork 或 Claude Code,且想快速给不同职能定制 Claude 的工作方式,这套插件是最快路径。如果你需要高度定制的 agent 逻辑或复杂流程编排,LangChain/AutoGen 更合适。
开源地址:https://github.com/anthropics/knowledge-work-plugins
————————————————

03 pi — 54,000 star 的开源 coding agent,你可能从没听说过
分类:AI/工具 语言:TypeScript ⭐ 今日新增:456 总 Star:54k
54k star,222 个版本发布,你可能真的没注意到它。pi 是一个 monorepo 形式的 AI agent 工具包,核心是 coding agent CLI,但它做的事比单纯的 coding agent 要更底层。
它有 4 个独立包:coding agent CLI、agent runtime(工具调用+状态管理)、统一多 provider LLM API(支持 OpenAI、Anthropic、Google 等)、TUI 库(差异渲染的终端 UI)。
最有意思的一点:作者在公开征集用户的 agent 使用 session 数据,上传到 Hugging Face,用真实 OSS 任务来训练和改进 coding agent,而不是靠玩具 benchmark。
供应链安全做得很扎实:直接依赖锁定精确版本,.npmrc 设置 save-exact=true 和 min-release-age=2,package-lock.json 作为唯一依赖 ground truth,还有 pre-commit 钩子防止意外提交 lockfile 变更。
💡 你需要一个完全开源、可审计、可 fork 定制的 coding agent 基础设施,或者你在构建自己的 agent 产品需要稳健底层 runtime,选 pi。Claude Code 和 Codex 在「开箱即用、体验流畅」上更有优势,但那是黑盒。
开源地址:https://github.com/earendil-works/pi
————————————————

04 Superset — 在你本机跑一支 Claude Code 军团
分类:效率工具/AI 编排 语言:TypeScript ⭐ 今日新增:60 总 Star:11.1k
同时开 10 个 coding agent,每个做一个独立的任务,不互相干扰,完成后一键 review diff,有问题直接在内置编辑器里改——这是 Superset 想解决的问题。
它的核心机制是 git worktree:每个 agent 任务对应一个独立的 worktree(独立的 git branch + 工作目录),agent 在里面怎么折腾都不影响主分支。任务完成后,内置 diff viewer 让你 review 改动,确认后再合并。
支持几乎所有主流 CLI agent:Claude Code、Codex、Gemini CLI、OpenCode、Pi、Amp Code、Cursor Agent 等。README 的描述很直接:「如果它能在终端里跑,就能在 Superset 里跑。」
和 cmux 有区别:cmux 是在一个终端窗口里管理多个 session,更像是「终端增强」;Superset 是专门为「并行 agent 任务编排 + 代码 review」设计的独立桌面应用,有自己的 worktree 管理、diff viewer 和 workspace preset。
💡 你需要并行派发多个 agent 任务,且每个任务需要代码隔离和独立 review 流程,选 Superset。cmux 适合在同一工作目录下管理多个 agent session;tmux 适合对环境没有特殊要求、追求极简的用户。
开源地址:https://github.com/superset-sh/superset
————————————————

05 Anthropic-Cybersecurity-Skills — 754 个安全技能,让 AI Agent 拥有高级分析师的判断力
分类:安全/AI 语言:Python ⭐ 今日新增:930 总 Star:8.4k
全球网络安全岗位缺口 480 万(2024 年 ISC2 数据)。AI Agent 理论上可以帮忙,但让 Claude 分析一个内存 dump,它知道应该跑 Volatility3,但不知道该用哪个 plugin、先检查什么、怎么验证结果。
这个项目的逻辑是:给 Agent 一套「执行手册」,而不是让它凭 general knowledge 猜测。754 个技能文件,覆盖 26 个安全领域(云安全、威胁狩猎、恶意软件分析、数字取证、渗透测试等),每个文件都有 YAML frontmatter(供 Agent 快速扫描)和详细的 Workflow 段落(供 Agent 步骤执行)。
每个技能都同时映射到 5 个行业框架:MITRE ATT&CK、NIST CSF 2.0、MITRE ATLAS(AI/ML 对抗威胁)、MITRE D3FEND(防御对策)、NIST AI RMF。执行完某个技能,可以直接告诉你它覆盖了哪些合规要求。
用法:npx skills add mukul975/Anthropic-Cybersecurity-Skills,然后在 Claude Code / Cursor / Codex CLI 里直接调用。注意:这是社区项目,不是 Anthropic 官方出品,命名有些误导。
💡 你在用 Claude Code / Copilot 做安全相关调研、分析或 IR,想让 AI Agent 有系统化的安全操作知识,选这个库。商业 SIEM 解决的是生产环境持续监控问题,不是一个替代关系;自建安全 Prompt 灵活但成本高。
开源地址:https://github.com/mukul975/Anthropic-Cybersecurity-Skills
————————————————

06 Dexter — 「Claude Code 做代码研究,Dexter 做金融研究」
分类:AI/金融 语言:TypeScript ⭐ 今日新增:229 总 Star:26.4k
分析一只股票的基本面,你需要翻 10-K、看季度财报、对比竞品、查行业趋势……这些工作每一步都需要判断,不是简单的查询。Dexter 的定位就是这个:一个自主的金融研究 Agent。
核心机制是 plan-execute-reflect 循环:接到问题后,先分解成具体研究步骤,再逐步执行(实时调取财务数据),然后自我验证——检查结果是否完整、逻辑是否自洽,如果不满意就重新迭代。
数据源接的是 financialdatasets.ai(收入表、资产负债表、现金流量表)和 Exa(网页搜索),还支持通过 WhatsApp 直接提问——给自己发消息,Dexter 自动跑分析返回结果。
调试机制:每次查询会在 .dexter/scratchpad/ 里生成 JSONL 文件,记录每一步工具调用、Agent 推理过程和最终摘要,出错了可以精确追溯。⚠️ 仅供教育目的,不能用于实际投资决策。
💡 你是个人投资者或学生,想用 AI 辅助做基本面研究,需要一个可复现推理过程的工具,选 Dexter。Bloomberg 是专业机构生产工具,数据质量和实时性远超 Dexter;自建 pipeline 适合有工程能力且有特定数据需求的场景。
开源地址:https://github.com/virattt/dexter
————————————————
今天 GitHub 有一个值得注意的信号:越来越多的项目不是在「做一个 AI 产品」,而是在「给 AI 搭基础设施」——terminal 层、编排层、专业知识层,各自分工。这个生态成熟之后,AI Agent 能做到什么,现在还很难预测。
你现在在用哪类工具来管理多个 AI Agent?是自己拼 tmux,还是已经用上了专门的编排工具?欢迎评论区聊聊。
夜雨聆风