这周的 Trending 里,有一个很特别的信号:YC CEO 亲自把自己用了半年的 AI 工具链开源了,声称 2026 年代码产出是 2013 年的 240 倍。同期还出现了 AI Agent 安全治理框架、金融 K 线基础模型、开源 CRM......方向分散,但每个都值得看。
————————————————

01 gstack — YC CEO 的 23 个 Claude Code 专属工具
分类:AI/工具 语言:TypeScript ⭐ 今日新增:640 总 Star:103k
Garry Tan 是 Y Combinator 的 President & CEO,手上过了几千家创业公司。他在 3 月的一个播客里说,自己从 2025 年 12 月起就基本没有手打过代码。这句话被很多人截图传播,但没人知道他具体在用什么。
这个仓库就是答案。gstack 把 Claude Code 变成了一个虚拟工程团队——23 个 slash command,覆盖 CEO 战略评审、设计咨询、安全审计、QA 测试、发布管理,每个都是独立的 Markdown 文件,直接拿来就能用。
他在 README 里提供了一个量化数据:2026 年代码产出(按逻辑变更行数)相比 2013 年是每天 810 倍,年度累计是 2013 全年的 240 倍。一个人,兼职,同时跑着 YC。这不是 PR,是实测数据,附了完整方法论和重现脚本。
项目结构很清晰:/office-hours 是第一步,6 个强制问题逼你重新理解自己在做什么。/review 找生产级 bug,/qa 打开真实浏览器测试,/ship 跑测试打 PR。每个 skill 喂给下一个,没有东西掉链子。
💡 与 OpenCode / Codex CLI 的区别:gstack 不是独立工具,是 Claude Code 的扩展层,零技术栈要求(纯 Markdown),但绑定 Claude 生态。如果你已经在用 Claude Code 且觉得它缺少结构感,gstack 是最低成本的升级路径;如果你想模型无关,选 Codebuff 或 OpenCode。
开源地址:https://github.com/garrytan/gstack
————————————————

02 stop-slop — 一个 Markdown 文件,让 AI 别再说「诚然...毋庸置疑...值得注意」
分类:AI/工具 语言:无 ⭐ 今日新增:345 总 Star:4.4k
你让 AI 写文章,它说「诚然,这是一个值得深思的领域」。你让它改,它改成「毋庸置疑,这个问题颇为复杂」。这类 AI 腔不是模型限制,是缺少明确的禁止词表。
stop-slop 就是这个词表。一个 SKILL.md 加三个 reference 文件,定义了三类 AI 文风陷阱:禁用词组(喉咙清嗓式开头、强调拐杖词、商业套话、副词泛滥)、结构陷阱(二元对立、否定式列举、戏剧性碎片化)、句子级规则(不用 Wh- 开头、不用破折号、主动语态)。
用法很直接:把 SKILL.md 上传到 Claude Projects 知识库,或者放进 system prompt,AI 就会按规则校对。自带 1-10 打分维度:直接性、节奏感、信任读者程度、真实感、信息密度。低于 35/50 就重写。
💡 与手动 prompt 工程的区别:stop-slop 是可复用的规则文件,有具体词单,可以 fork 加入团队专属词汇;一次性 prompt 每次重新写、容易被模型忽略。适合写公众号、博客、产品文案的场景;如果是代码注释或技术文档,这套规则过于严格,不必引入。
开源地址:https://github.com/hardikpandya/stop-slop
————————————————

03 agent-governance-toolkit — Microsoft 出品,AI Agent 的零信任安全框架
分类:AI/安全 语言:Python / TypeScript ⭐ 今日新增:271 总 Star:2.3k
你的 AI Agent 能调用 send_email,也能调用 query_database。OAuth scope 控制它能连哪些服务,但控制不了它连上之后做什么。当五个 Agent 共享同一个 API key,出了问题你不知道是哪个干的。
这是 Microsoft 这个工具的出发点:应用层策略执行,而不是靠提示词让 Agent 自律。README 里有一个数据点:Prompt-based safety 在红队测试中策略违规率 26.67%,AGT 的应用层执行:0.00%。
核心用法极简:两行代码,每次调用都走 YAML 策略引擎,拒绝就抛 GovernanceDenied,自动留下审计日志。策略文件里可以写「禁止 drop/delete/truncate」、「send_email 需要安全团队审批」,这些规则在代码层面强制执行。
覆盖 5 种语言 SDK(Python/TypeScript/.NET/Rust/Go),支持 15+ AI 框架(LangGraph、CrewAI、AutoGen、OpenAI Agents SDK 等),有符合 OWASP Agentic Top 10 的合规验证工具。
💡 与 OPA / IAM 的关系:OPA 在 API 层做策略,IAM 在网络/服务层做权限,AGT 在应用代码层做 Agent 行为约束——三层不同,可以叠加而非替代。适合构建会自主执行操作的 Agent 且有合规审计需求的场景;如果 Agent 只是读数据回答问题,加这层未必必要。
开源地址:https://github.com/microsoft/agent-governance-toolkit
————————————————

04 Kronos — 专为金融 K 线设计的基础模型,已被 AAAI 2026 接收
分类:AI/金融 语言:Python ⭐ 今日新增:245 总 Star:26k
给金融时序数据用通用时序预测模型,一直是个凑合方案。K 线数据(OHLCV)有高噪声、市场微观结构依赖、跨资产分布差异大等特性,通用 Transformer 天然不适配。
Kronos 的思路是:先用专门的分词器把连续 K 线数据量化成层级离散 token(处理 OHLCV 的高维相关性),再用自回归 Transformer 在这些 token 上预训练。本质是给金融市场设计一套「语言」,然后让模型学这门语言。
训练数据覆盖 45 个全球交易所,论文已被 AAAI 2026 接收(arXiv: 2508.02739)。开源了三个尺寸模型(4.1M/24.7M/102.3M 参数),Hugging Face 可直接下载。有 live demo 可以看 BTC/USDT 24 小时预测效果。
README 里有一处诚实提示:提供的 A 股回测 pipeline 是「简化演示」,真实量化策略还需要风险因子中性化、组合优化等额外工作。
💡 与 TimesFM / FinGPT 的区别:TimesFM 是通用时序,金融数据只是其覆盖的一部分;FinGPT 聚焦金融文本情感,不做价格预测;Kronos 专注 K 线 OHLCV 预测,领域垂直度最高。适合研究量化策略、想在 K 线数据上试预训练基础模型的场景;如果需求是分析财报文本或新闻情感,FinGPT 更直接。
开源地址:https://github.com/shiyu-coder/Kronos
————————————————

05 Twenty — 开源版 Salesforce,v2.7 刚刚发布
分类:前端/全栈 语言:TypeScript ⭐ 今日新增:231 总 Star:46.5k
CRM 这个赛道很奇怪:Salesforce 太重,HubSpot 免费版太残,大多数开源方案太老。Twenty 的切入角度是「开发者构建的 CRM」——你可以像改代码一样改 CRM 的数据模型、视图、工作流。
v2.7.0 昨天(5 月 25 日)刚发布。核心架构是 define → publish 的 App 开发模式:用 TypeScript defineObject 定义数据 schema,然后 npx twenty app:publish --private 推到你的 workspace。数据 schema、视图布局、AI agent 都可以用代码定义和版本控制。
技术栈:NestJS + PostgreSQL + Redis + React + Jotai,12k+ commits,活跃度有保障。支持 Cloud 托管(twenty.com)和自托管(Docker Compose),还提供了 SDK 供自定义扩展。
💡 与 Salesforce / HubSpot 的区别:Salesforce 和 HubSpot 是低代码配置,易用性强但定制天花板低;Twenty 是代码级定制,数据完全自有,但需要工程师维护。适合技术团队,需要把 CRM 数据 schema 纳入版本控制或深度集成内部系统的场景;如果团队没有工程师,Salesforce/HubSpot 的易用性更有保障。
开源地址:https://github.com/twentyhq/twenty
————————————————

06 Codebuff — 在 175 个任务上以 61% vs 53% 赢过 Claude Code 的终端编码工具
分类:AI/开发工具 语言:TypeScript ⭐ 今日新增:112 总 Star:6k
AI 编码工具越来越多,大多数的核心是「把你的问题和代码塞给一个大模型」。Codebuff 的不同在于:用多个专门的 Agent 协作——File Picker Agent 理解项目结构,Planner Agent 规划改动顺序,Editor Agent 执行,Reviewer Agent 验证。
README 里公布了一个 eval 数据:在 175+ 个真实开源项目编码任务上,Codebuff 61% vs Claude Code 53%。方法论在 evals/README.md 里,可以自己跑验证。
模型灵活性是另一个差异点:Claude Code 绑定 Anthropic,Codebuff 走 OpenRouter,支持 Claude/GPT/Qwen/DeepSeek 等,不同任务可以用不同模型。还有一个免费版 Freebuff(广告支持):npm install -g freebuff 直接用,无需订阅和 API key 配置。
💡 与 Claude Code / Aider 的区别:Claude Code 生态最完整,skills 体系成熟,但绑定 Anthropic 订阅;Aider 完全免费但自定义能力弱;Codebuff 在模型自由度和 Agent 可定制性上居中,自测 eval 胜出但需自行验证。适合想要模型灵活、不想被单一订阅锁定的场景;如果已经重度依赖 Claude Code workflow,迁移成本需要评估。
开源地址:https://github.com/CodebuffAI/codebuff
————————————————
今天的六个项目,有三个直接与 AI Agent 工作流有关(gstack、AGT、Codebuff),一个解决 AI 内容质量(stop-slop),一个是金融领域垂直应用,一个是给开发者用的 CRM 基础设施。
AI 工具链的内卷已经开始了——你现在用的是哪套?欢迎评论区聊聊。
夜雨聆风