YC掌门人亲自下场开源自己的AI工具链,今天GitHub还有5个你不该错过的项目

这周的 Trending 里，有一个很特别的信号：YC CEO 亲自把自己用了半年的 AI 工具链开源了，声称 2026 年代码产出是 2013 年的 240 倍。同期还出现了 AI Agent 安全治理框架、金融 K 线基础模型、开源 CRM......方向分散，但每个都值得看。

————————————————

01 gstack — YC CEO 的 23 个 Claude Code 专属工具

分类：AI/工具　语言：TypeScript　⭐ 今日新增：640　总 Star：103k

Garry Tan 是 Y Combinator 的 President & CEO，手上过了几千家创业公司。他在 3 月的一个播客里说，自己从 2025 年 12 月起就基本没有手打过代码。这句话被很多人截图传播，但没人知道他具体在用什么。

这个仓库就是答案。gstack 把 Claude Code 变成了一个虚拟工程团队——23 个 slash command，覆盖 CEO 战略评审、设计咨询、安全审计、QA 测试、发布管理，每个都是独立的 Markdown 文件，直接拿来就能用。

他在 README 里提供了一个量化数据：2026 年代码产出（按逻辑变更行数）相比 2013 年是每天 810 倍，年度累计是 2013 全年的 240 倍。一个人，兼职，同时跑着 YC。这不是 PR，是实测数据，附了完整方法论和重现脚本。

项目结构很清晰：/office-hours 是第一步，6 个强制问题逼你重新理解自己在做什么。/review 找生产级 bug，/qa 打开真实浏览器测试，/ship 跑测试打 PR。每个 skill 喂给下一个，没有东西掉链子。

💡 与 OpenCode / Codex CLI 的区别：gstack 不是独立工具，是 Claude Code 的扩展层，零技术栈要求（纯 Markdown），但绑定 Claude 生态。如果你已经在用 Claude Code 且觉得它缺少结构感，gstack 是最低成本的升级路径；如果你想模型无关，选 Codebuff 或 OpenCode。

开源地址：https://github.com/garrytan/gstack

————————————————

02 stop-slop — 一个 Markdown 文件，让 AI 别再说「诚然...毋庸置疑...值得注意」

分类：AI/工具　语言：无　⭐ 今日新增：345　总 Star：4.4k

你让 AI 写文章，它说「诚然，这是一个值得深思的领域」。你让它改，它改成「毋庸置疑，这个问题颇为复杂」。这类 AI 腔不是模型限制，是缺少明确的禁止词表。

stop-slop 就是这个词表。一个 SKILL.md 加三个 reference 文件，定义了三类 AI 文风陷阱：禁用词组（喉咙清嗓式开头、强调拐杖词、商业套话、副词泛滥）、结构陷阱（二元对立、否定式列举、戏剧性碎片化）、句子级规则（不用 Wh- 开头、不用破折号、主动语态）。

用法很直接：把 SKILL.md 上传到 Claude Projects 知识库，或者放进 system prompt，AI 就会按规则校对。自带 1-10 打分维度：直接性、节奏感、信任读者程度、真实感、信息密度。低于 35/50 就重写。

💡 与手动 prompt 工程的区别：stop-slop 是可复用的规则文件，有具体词单，可以 fork 加入团队专属词汇；一次性 prompt 每次重新写、容易被模型忽略。适合写公众号、博客、产品文案的场景；如果是代码注释或技术文档，这套规则过于严格，不必引入。

开源地址：https://github.com/hardikpandya/stop-slop

————————————————

03 agent-governance-toolkit — Microsoft 出品，AI Agent 的零信任安全框架

分类：AI/安全　语言：Python / TypeScript　⭐ 今日新增：271　总 Star：2.3k

你的 AI Agent 能调用 send_email，也能调用 query_database。OAuth scope 控制它能连哪些服务，但控制不了它连上之后做什么。当五个 Agent 共享同一个 API key，出了问题你不知道是哪个干的。

这是 Microsoft 这个工具的出发点：应用层策略执行，而不是靠提示词让 Agent 自律。README 里有一个数据点：Prompt-based safety 在红队测试中策略违规率 26.67%，AGT 的应用层执行：0.00%。

核心用法极简：两行代码，每次调用都走 YAML 策略引擎，拒绝就抛 GovernanceDenied，自动留下审计日志。策略文件里可以写「禁止 drop/delete/truncate」、「send_email 需要安全团队审批」，这些规则在代码层面强制执行。

覆盖 5 种语言 SDK（Python/TypeScript/.NET/Rust/Go），支持 15+ AI 框架（LangGraph、CrewAI、AutoGen、OpenAI Agents SDK 等），有符合 OWASP Agentic Top 10 的合规验证工具。

💡 与 OPA / IAM 的关系：OPA 在 API 层做策略，IAM 在网络/服务层做权限，AGT 在应用代码层做 Agent 行为约束——三层不同，可以叠加而非替代。适合构建会自主执行操作的 Agent 且有合规审计需求的场景；如果 Agent 只是读数据回答问题，加这层未必必要。

开源地址：https://github.com/microsoft/agent-governance-toolkit

————————————————

04 Kronos — 专为金融 K 线设计的基础模型，已被 AAAI 2026 接收

分类：AI/金融　语言：Python　⭐ 今日新增：245　总 Star：26k

给金融时序数据用通用时序预测模型，一直是个凑合方案。K 线数据（OHLCV）有高噪声、市场微观结构依赖、跨资产分布差异大等特性，通用 Transformer 天然不适配。

Kronos 的思路是：先用专门的分词器把连续 K 线数据量化成层级离散 token（处理 OHLCV 的高维相关性），再用自回归 Transformer 在这些 token 上预训练。本质是给金融市场设计一套「语言」，然后让模型学这门语言。

训练数据覆盖 45 个全球交易所，论文已被 AAAI 2026 接收（arXiv: 2508.02739）。开源了三个尺寸模型（4.1M/24.7M/102.3M 参数），Hugging Face 可直接下载。有 live demo 可以看 BTC/USDT 24 小时预测效果。

README 里有一处诚实提示：提供的 A 股回测 pipeline 是「简化演示」，真实量化策略还需要风险因子中性化、组合优化等额外工作。

💡 与 TimesFM / FinGPT 的区别：TimesFM 是通用时序，金融数据只是其覆盖的一部分；FinGPT 聚焦金融文本情感，不做价格预测；Kronos 专注 K 线 OHLCV 预测，领域垂直度最高。适合研究量化策略、想在 K 线数据上试预训练基础模型的场景；如果需求是分析财报文本或新闻情感，FinGPT 更直接。

开源地址：https://github.com/shiyu-coder/Kronos

————————————————

05 Twenty — 开源版 Salesforce，v2.7 刚刚发布

分类：前端/全栈　语言：TypeScript　⭐ 今日新增：231　总 Star：46.5k

CRM 这个赛道很奇怪：Salesforce 太重，HubSpot 免费版太残，大多数开源方案太老。Twenty 的切入角度是「开发者构建的 CRM」——你可以像改代码一样改 CRM 的数据模型、视图、工作流。

v2.7.0 昨天（5 月 25 日）刚发布。核心架构是 define → publish 的 App 开发模式：用 TypeScript defineObject 定义数据 schema，然后 npx twenty app:publish --private 推到你的 workspace。数据 schema、视图布局、AI agent 都可以用代码定义和版本控制。

技术栈：NestJS + PostgreSQL + Redis + React + Jotai，12k+ commits，活跃度有保障。支持 Cloud 托管（twenty.com）和自托管（Docker Compose），还提供了 SDK 供自定义扩展。

💡 与 Salesforce / HubSpot 的区别：Salesforce 和 HubSpot 是低代码配置，易用性强但定制天花板低；Twenty 是代码级定制，数据完全自有，但需要工程师维护。适合技术团队，需要把 CRM 数据 schema 纳入版本控制或深度集成内部系统的场景；如果团队没有工程师，Salesforce/HubSpot 的易用性更有保障。

开源地址：https://github.com/twentyhq/twenty

————————————————

06 Codebuff — 在 175 个任务上以 61% vs 53% 赢过 Claude Code 的终端编码工具

分类：AI/开发工具　语言：TypeScript　⭐ 今日新增：112　总 Star：6k

AI 编码工具越来越多，大多数的核心是「把你的问题和代码塞给一个大模型」。Codebuff 的不同在于：用多个专门的 Agent 协作——File Picker Agent 理解项目结构，Planner Agent 规划改动顺序，Editor Agent 执行，Reviewer Agent 验证。

README 里公布了一个 eval 数据：在 175+ 个真实开源项目编码任务上，Codebuff 61% vs Claude Code 53%。方法论在 evals/README.md 里，可以自己跑验证。

模型灵活性是另一个差异点：Claude Code 绑定 Anthropic，Codebuff 走 OpenRouter，支持 Claude/GPT/Qwen/DeepSeek 等，不同任务可以用不同模型。还有一个免费版 Freebuff（广告支持）：npm install -g freebuff 直接用，无需订阅和 API key 配置。

💡 与 Claude Code / Aider 的区别：Claude Code 生态最完整，skills 体系成熟，但绑定 Anthropic 订阅；Aider 完全免费但自定义能力弱；Codebuff 在模型自由度和 Agent 可定制性上居中，自测 eval 胜出但需自行验证。适合想要模型灵活、不想被单一订阅锁定的场景；如果已经重度依赖 Claude Code workflow，迁移成本需要评估。

开源地址：https://github.com/CodebuffAI/codebuff

————————————————

今天的六个项目，有三个直接与 AI Agent 工作流有关（gstack、AGT、Codebuff），一个解决 AI 内容质量（stop-slop），一个是金融领域垂直应用，一个是给开发者用的 CRM 基础设施。

AI 工具链的内卷已经开始了——你现在用的是哪套？欢迎评论区聊聊。