多端口打开了,AI帮不了你——这6个项目正在改变这件事

每个人都在跑多个 AI agent，然后在十几个终端窗口之间切换，靠系统通知猜哪个卡住了。这不是效率，这是噪音。今天这 6 个项目，有的在解决「如何管住一群 agent」，有的在给 AI 喂真正的专业知识，还有一个悄悄冲到了 5 万 star。

————————————————

01 cmux — 为 AI Agent 时代重新设计的 macOS 终端

分类：效率工具　语言：Swift　⭐ 今日新增：696　总 Star：19k

同时跑 5 个 Claude Code session，你怎么知道哪个需要你回答？macOS 原生通知只会说「Claude is waiting for your input」，完全没有上下文，根本没法判断优先级。

cmux 把这个问题直接砍掉了。它基于 Ghostty 的渲染引擎，用 Swift/AppKit 原生构建，不是 Electron。核心设计很简单：每个 pane 完成任务时，边框发出蓝色光晕，侧边栏对应 tab 同步高亮，Cmd+Shift+U 直接跳到最新未读 pane。

侧边栏能显示每个 workspace 的 git branch、关联 PR 状态、工作目录、监听端口和最新通知文本。cmux claude-teams 一条命令启动 Claude Code 的 teammate 模式，所有 teammate 以原生 split 形式展开，不需要 tmux。

还有一个内置浏览器，能 split 在终端旁边，支持 accessibility tree 快照、元素点击、表单填写，直接让 Claude Code 操纵你的 dev server。

💡 cmux 最适合 macOS 上并行跑多个 Claude Code / Codex session 的用户——需要感知哪个 agent 在等你。Ghostty 更适合追求极致终端性能的单任务用户；tmux 更适合服务器端多路复用。

开源地址：https://github.com/manaflow-ai/cmux

————————————————

02 knowledge-work-plugins — Anthropic 亲自下场，给每个职能写了一套 Claude 插件

分类：AI/LLM　语言：Python　⭐ 今日新增：550　总 Star：14.1k

Claude 很聪明，但它不知道你们公司的 OKR 放在 Notion 哪个页面，不知道你们的销售用 Close 还是 HubSpot。每次都要手动交代上下文，Claude 越强大这个摩擦越明显。

Anthropic 这次直接开源了他们内部用的 11 套插件：sales、finance、legal、data、marketing、product-management、customer-support、HR、bio-research 等。每套插件是一个目录，里面是 Markdown 技能文件和 .mcp.json 连接器配置。无代码，无构建步骤。

以 data 插件为例：它内置了写 SQL、可视化分析、统计方法选择、结果验证的技能文件，通过 .mcp.json 连接 Snowflake/BigQuery/Databricks，/data:write-query 这样的 slash command 直接可调用。

这套设计思路是：技能文件编码领域最佳实践，连接器桥接实际工具，插件做的事是「让 Claude 变成真正懂你业务的那个人」，而不只是一个聪明的问答机器。

💡 如果你的团队在用 Claude Cowork 或 Claude Code，且想快速给不同职能定制 Claude 的工作方式，这套插件是最快路径。如果你需要高度定制的 agent 逻辑或复杂流程编排，LangChain/AutoGen 更合适。

开源地址：https://github.com/anthropics/knowledge-work-plugins

————————————————

03 pi — 54,000 star 的开源 coding agent，你可能从没听说过

分类：AI/工具　语言：TypeScript　⭐ 今日新增：456　总 Star：54k

54k star，222 个版本发布，你可能真的没注意到它。pi 是一个 monorepo 形式的 AI agent 工具包，核心是 coding agent CLI，但它做的事比单纯的 coding agent 要更底层。

它有 4 个独立包：coding agent CLI、agent runtime（工具调用+状态管理）、统一多 provider LLM API（支持 OpenAI、Anthropic、Google 等）、TUI 库（差异渲染的终端 UI）。

最有意思的一点：作者在公开征集用户的 agent 使用 session 数据，上传到 Hugging Face，用真实 OSS 任务来训练和改进 coding agent，而不是靠玩具 benchmark。

供应链安全做得很扎实：直接依赖锁定精确版本，.npmrc 设置 save-exact=true 和 min-release-age=2，package-lock.json 作为唯一依赖 ground truth，还有 pre-commit 钩子防止意外提交 lockfile 变更。

💡 你需要一个完全开源、可审计、可 fork 定制的 coding agent 基础设施，或者你在构建自己的 agent 产品需要稳健底层 runtime，选 pi。Claude Code 和 Codex 在「开箱即用、体验流畅」上更有优势，但那是黑盒。

开源地址：https://github.com/earendil-works/pi

————————————————

04 Superset — 在你本机跑一支 Claude Code 军团

分类：效率工具/AI 编排　语言：TypeScript　⭐ 今日新增：60　总 Star：11.1k

同时开 10 个 coding agent，每个做一个独立的任务，不互相干扰，完成后一键 review diff，有问题直接在内置编辑器里改——这是 Superset 想解决的问题。

它的核心机制是 git worktree：每个 agent 任务对应一个独立的 worktree（独立的 git branch + 工作目录），agent 在里面怎么折腾都不影响主分支。任务完成后，内置 diff viewer 让你 review 改动，确认后再合并。

支持几乎所有主流 CLI agent：Claude Code、Codex、Gemini CLI、OpenCode、Pi、Amp Code、Cursor Agent 等。README 的描述很直接：「如果它能在终端里跑，就能在 Superset 里跑。」

和 cmux 有区别：cmux 是在一个终端窗口里管理多个 session，更像是「终端增强」；Superset 是专门为「并行 agent 任务编排 + 代码 review」设计的独立桌面应用，有自己的 worktree 管理、diff viewer 和 workspace preset。

💡 你需要并行派发多个 agent 任务，且每个任务需要代码隔离和独立 review 流程，选 Superset。cmux 适合在同一工作目录下管理多个 agent session；tmux 适合对环境没有特殊要求、追求极简的用户。

开源地址：https://github.com/superset-sh/superset

————————————————

05 Anthropic-Cybersecurity-Skills — 754 个安全技能，让 AI Agent 拥有高级分析师的判断力

分类：安全/AI　语言：Python　⭐ 今日新增：930　总 Star：8.4k

全球网络安全岗位缺口 480 万（2024 年 ISC2 数据）。AI Agent 理论上可以帮忙，但让 Claude 分析一个内存 dump，它知道应该跑 Volatility3，但不知道该用哪个 plugin、先检查什么、怎么验证结果。

这个项目的逻辑是：给 Agent 一套「执行手册」，而不是让它凭 general knowledge 猜测。754 个技能文件，覆盖 26 个安全领域（云安全、威胁狩猎、恶意软件分析、数字取证、渗透测试等），每个文件都有 YAML frontmatter（供 Agent 快速扫描）和详细的 Workflow 段落（供 Agent 步骤执行）。

每个技能都同时映射到 5 个行业框架：MITRE ATT&CK、NIST CSF 2.0、MITRE ATLAS（AI/ML 对抗威胁）、MITRE D3FEND（防御对策）、NIST AI RMF。执行完某个技能，可以直接告诉你它覆盖了哪些合规要求。

用法：npx skills add mukul975/Anthropic-Cybersecurity-Skills，然后在 Claude Code / Cursor / Codex CLI 里直接调用。注意：这是社区项目，不是 Anthropic 官方出品，命名有些误导。

💡 你在用 Claude Code / Copilot 做安全相关调研、分析或 IR，想让 AI Agent 有系统化的安全操作知识，选这个库。商业 SIEM 解决的是生产环境持续监控问题，不是一个替代关系；自建安全 Prompt 灵活但成本高。

开源地址：https://github.com/mukul975/Anthropic-Cybersecurity-Skills

————————————————

06 Dexter — 「Claude Code 做代码研究，Dexter 做金融研究」

分类：AI/金融　语言：TypeScript　⭐ 今日新增：229　总 Star：26.4k

分析一只股票的基本面，你需要翻 10-K、看季度财报、对比竞品、查行业趋势……这些工作每一步都需要判断，不是简单的查询。Dexter 的定位就是这个：一个自主的金融研究 Agent。

核心机制是 plan-execute-reflect 循环：接到问题后，先分解成具体研究步骤，再逐步执行（实时调取财务数据），然后自我验证——检查结果是否完整、逻辑是否自洽，如果不满意就重新迭代。

数据源接的是 financialdatasets.ai（收入表、资产负债表、现金流量表）和 Exa（网页搜索），还支持通过 WhatsApp 直接提问——给自己发消息，Dexter 自动跑分析返回结果。

调试机制：每次查询会在 .dexter/scratchpad/ 里生成 JSONL 文件，记录每一步工具调用、Agent 推理过程和最终摘要，出错了可以精确追溯。⚠️ 仅供教育目的，不能用于实际投资决策。

💡 你是个人投资者或学生，想用 AI 辅助做基本面研究，需要一个可复现推理过程的工具，选 Dexter。Bloomberg 是专业机构生产工具，数据质量和实时性远超 Dexter；自建 pipeline 适合有工程能力且有特定数据需求的场景。

开源地址：https://github.com/virattt/dexter

————————————————

今天 GitHub 有一个值得注意的信号：越来越多的项目不是在「做一个 AI 产品」，而是在「给 AI 搭基础设施」——terminal 层、编排层、专业知识层，各自分工。这个生态成熟之后，AI Agent 能做到什么，现在还很难预测。

你现在在用哪类工具来管理多个 AI Agent？是自己拼 tmux，还是已经用上了专门的编排工具？欢迎评论区聊聊。