你有没有这种感觉:AI帮你写的代码越来越多,但debug的时间反而更长了?
AI 写代码的悖论:产出翻倍,质量打骨折。
GitHub 上最近有个项目 3 天冲上 3.6 万 Star,它教 AI 一个反直觉的道理——最好的代码,是你没写的那行。
一、ponytail:给 AI 装上「懒人脑」
不是让 AI 写更多,而是让它学会三思后删
这个名叫 ponytail 的项目,核心逻辑极其简单:在 AI 编码 Agent 的 prompt 里注入「懒人 senior 思维」。
什么意思?普通模式下,AI 接到「实现用户登录」的需求,会哗啦啦生成 500 行代码——JWT 封装、密码加密、session 管理、多设备踢下线……全塞进去。功能全,但 80% 你用不上。
ponytail 模式下,AI 会先问自己三个问题:
→ 这功能真的现在就需要吗?(YAGNI)
→ 能不能用 10 行替代 100 行?(简单优先)
→ 删掉这段,测试还能过吗?(最小可行)
结果:代码量减少 60-80%,bug 密度反而下降。
动手试试:npx ponytail 启动后,配合 Claude Code 或 Codex 使用,Agent 会自动切换到「懒人模式」。实测一个中型 CRUD 项目,少写了 200+ 行无效代码,Code Review 时间从 40 分钟降到 12 分钟。
二、shadcn/improve:让贵的模型做规划,便宜的模型干活
分层策略才是 AI 编码的性价比最优解
另一个值得关注的项目是 shadcn/improve(5.4K Star),它的思路跟 ponytail 异曲同工,但更偏向成本优化。
核心策略:用 Claude Opus / GPT-5 这类最贵的模型做 架构审查 + 任务规划,生成详细的执行计划后,丢给 Claude Sonnet / DeepSeek-V4 等便宜模型去执行。
shadcn/improve 的分层执行策略
实际场景:重构一个支付模块
① Opus 审查现有代码 → 发现 3 处安全隐患 + 2 处性能瓶颈
② Opus 输出分步重构计划(带验收标准)
③ Sonnet 按计划逐条执行,每条只改 20-50 行
结果:API 调用成本降了 70%,重构质量反而更高
这个思路跟 ponytail 搭配使用效果翻倍:ponytail 控制「写不写」,improve 控制「谁来写」。
三、open-code-review:阿里的免费 Code Review 外挂
写完代码不等于完事,审查环节才是最该用 AI 的地方
阿里巴巴开源的 open-code-review(7.9K Star)是经过内部大规模验证的代码审查工具。它不是简单地跑 lint,而是用混合架构——确定性规则引擎 + LLM 语义分析——做深度审查。
实测效果:提交 PR 前跑一遍,能在 30 秒内 发现「看似正确但隐藏 bug」的逻辑错误——这种问题人工 CR 经常漏掉。
三件套组合拳:
→ ponytail:写之前先想「能不能不写」——减少无用代码
→ improve:贵的模型定方向,便宜的模型搬砖——降本增效
→ open-code-review:提交前自动审查——堵住漏网之鱼
总结——
AI 时代的程序员,比拼的不再是「谁写得快」,而是 「谁删得准」。ponytail 教 AI 偷懒,improve 帮 AI 省钱,open-code-review 帮 AI 纠错——三件套下来,你的代码库会瘦身 40%,而你每天能早下班 2 小时。这不是偷懒,是 工程素养。
💬 你用 AI 写代码时,有没有遇到过「生成了一大堆最后全删了」的经历?你平常是怎么控制 AI 不乱写的?
📂 更多同类内容,点击合集「程序员效率工具库」→
如果觉得有用,点个「在看」↘
夜雨聆风