乐于分享
好东西不私藏

我试遍了所有AI编程工具后,发现真正的高手都在用这个极简方案

我试遍了所有AI编程工具后,发现真正的高手都在用这个极简方案

只有4个工具、不到1000 Token的系统提示词,却在基准测试中击败了一众”全家桶”。Pi的极简哲学,正在重新定义AI编程工具的设计方向。


2026年初,一个叫OpenClaw的项目在互联网上病毒式传播——它是一个连接到你聊天工具的AI助手,能自主运行代码、管理任务、甚至自我进化。几天之内,GitHub星标暴涨,各大科技媒体争相报道。

但鲜为人知的是,OpenClaw的底层引擎并不是什么庞然大物,而是一个只有4个工具的极简编程Agent——Pi

Pi的创建者Mario Zechner(网名badlogic)可不是新手。他是知名开源游戏框架libGDX的作者,在开源社区深耕十余年。他构建Pi的动机很简单:市面上的AI编程工具越来越臃肿,他受够了


二、Pi是什么:极简到极致的编程Agent

一句话概括:Pi是一个只有4个工具的终端AI编程Agent,通过极致精简的核心 + 强大的扩展系统,让你按自己的方式构建AI编程工具。

Pi的核心理念印在它的标语里:“Adapt Pi to your workflows, not the other way around”(让Pi适应你的工作流,而不是反过来)。

目前Pi在GitHub上已获得43,800+星标,支持15+ LLM提供商,采用MIT开源协议。


三、4个工具凭什么打败”全家桶”

这是最让人震惊的部分。Pi的全部工具只有4个:

工具
功能
read
读取文件内容(支持文本和图片)
write
创建或覆写文件
edit
精确文本替换编辑
bash
执行Shell命令

系统提示词不到1000 Token。 作为对比,Claude Code的系统提示词动辄上万Token,包含各种安全检查、工具约束和行为指南。

Pi的态度是:前沿模型经过大量RL训练,天生就理解什么是编程Agent。你不需要10000 Token来告诉它”你是一个编程助手”

Mario在Terminal-Bench 2.0基准测试中验证了这一点:Pi + Claude Opus的成绩与Codex、Claude Code等原生工具不相上下,甚至更好。


四、”六不”哲学:为什么越少越好

Pi最独特的地方不是它有什么,而是它刻意不做什么。Mario明确列出了Pi不会支持的特性,每一条都有深刻的技术考量。

4.1 不支持MCP

MCP(Model Context Protocol)服务器是当前AI工具的热门趋势。但Mario认为这是上下文的黑洞

  • • Playwright MCP:21个工具,13.7K Token
  • • Chrome DevTools MCP:26个工具,18K Token

这意味着还没开始工作,7-9%的上下文窗口就被吃掉了

Pi的替代方案?让Agent用bash调用CLI工具。 Agent需要某个能力时,自己读README学会用,只在需要时付出Token成本。

4.2 不支持子Agent

Claude Code经常在处理复杂任务时生成子Agent,但你完全看不到子Agent在做什么——黑箱中的黑箱。

Pi的方案:如果需要生成子Agent,通过bash启动另一个Pi实例。你可以在tmux中观察它,甚至可以随时介入。完全可观测。

4.3 不支持Plan模式

Mario认为Plan模式本质上就是只读分析+最终写个Markdown文件。为什么不让Agent直接写文件呢?

# PLAN.md## 目标重构认证系统,支持OAuth## 当前步骤正在执行第3步——授权端点实现

文件化的计划可以跨会话共享、版本控制,比临时的Plan模式靠谱得多。

4.4 不做权限弹窗

Pi默认YOLO模式——不弹权限确认,不检查命令安全性。Mario的观点很犀利:其他工具的安全措施基本都是”安全剧场”。一旦Agent能写代码和执行代码,游戏基本就结束了。

4.5 不内置Todo

Todo列表往往让模型更困惑——增加了需要跟踪和更新的状态,反而引入更多出错机会。Pi的方案:把待办事项写到Markdown文件里,Agent自己读写维护。

4.6 不支持后台Bash

需要运行开发服务器?用tmux。需要调试程序?在tmux里开LLDB。后台进程管理带来的复杂性(进程追踪、输出缓冲、退出清理)完全不需要内置,Shell工具早已解决。


五、Pi的独特武器:会话树

这是Pi最被低估的特性。Pi的会话不是线性的,而是树状结构

什么意思?想象你在开发一个功能,Agent写到一半发现一个工具坏了。你可以:

  1. 1. 从当前会话分叉出一个分支,去修复那个工具
  2. 2. 修复完成后,回到主会话
  3. 3. Pi会自动总结分支上发生的事情

这种”会话分支”能力在其他工具中几乎不存在,但在实际开发中极其实用。它让你可以随时做”支线任务”而不污染主线上下文。


六、Pi的扩展系统:让Agent自己造工具

Pi的极简核心不是”功能少”,而是把功能的选择权交给你。它提供三种扩展方式:

6.1 Extensions(扩展)

可以自定义TUI组件、注册工具、修改Agent行为。Armin Ronacher(Flask框架作者、Pi的深度用户)开发了多个扩展:

  • • /answer:自动提取Agent回复中的问题,格式化为输入框
  • • /todos:可视化待办事项管理器
  • • /review:代码审查界面(支持commit、diff、PR审查)
  • • /files:会话中涉及的文件管理器

最关键的是:这些扩展都是让Pi自己写的。 你描述需求,Pi生成代码,热重载测试,循环迭代直到能用。

6.2 Skills(技能)

技能是按需加载的能力包,采用Agent Skills标准。Agent只在需要时才读取完整指令——渐进式信息披露,不浪费上下文。

Pi兼容Claude Code和Codex的技能目录,可以直接复用:

{  "skills": [    "~/.claude/skills",    "~/.codex/skills"  ]}

6.3 Pi Packages(Pi包)

通过npm安装的完整功能模块,可以包含工具、扩展和技能。


七、OpenClaw:Pi的最佳证明

OpenClaw的爆红并非偶然。它的核心就是Pi Agent + 通信接口——把Pi的编程能力接到WhatsApp、Slack等聊天工具上。

Peter Steinberger(OpenClaw的创建者)选择Pi作为底层引擎,正是因为Pi的极简核心足够稳定,扩展系统足够灵活。OpenClaw证明了Pi的设计理念是正确的:

不需要一个”全能”的Agent框架。你需要一个足够小、足够稳、足够可扩展的基础,然后让Agent在上面构建自己需要的一切。


八、pi-mono:七合一的Agent工具包

Pi不是一个单文件项目,而是一个精心设计的Monorepo,包含7个独立的包:

包名
功能
@mariozechner/pi-ai
统一LLM API,支持20+提供商
pi-agent-core
Agent运行时,工具调用+状态管理
pi-coding-agent
终端编程Agent(核心产品)
pi-tui
终端UI框架,差分渲染,组件系统
pi-mom
自管理Slack机器人
pi-web-ui
Web端AI聊天组件
pi-pods
vLLM部署管理器(GPU Pod)

其中pi-ai是最值得关注的底层库:

  • • 跨提供商上下文切换:在一个会话中从Claude切到GPT再到Gemini,上下文无缝传递
  • • 结构化工具结果:工具可以同时返回LLM用的文本和UI用的结构化数据
  • • 全程可中断:从请求到工具调用,任何阶段都可以abort,并返回部分结果
  • • 浏览器兼容:可以直接在浏览器中运行

九、5分钟上手

安装

npm install -g @anthropic-ai/pi

配置API Key

export ANTHROPIC_API_KEY=your-key-here

启动

cd ~/your-projectpi

就这么简单。没有配置向导,没有插件市场,没有权限设置。打开就能用。

如果你想用其他模型

pi --provider openai --model gpt-5.1-codexpi --provider google --model gemini-2.5-flash

甚至可以在会话中途切换模型——Pi会自动处理不同提供商之间的上下文转换。


十、Pi适合你吗?

Pi不是适合所有人的工具。它有一个明确的目标用户画像:

适合Pi的人

  • • 喜欢终端工作流的开发者
  • • 对现有工具的”臃肿感”感到不满
  • • 愿意花时间定制自己的工具链
  • • 重视可观测性——想看到Agent的每一步操作
  • • 使用多种LLM模型,希望灵活切换

不适合Pi的人

  • • 需要GUI界面的开发者
  • • 希望开箱即用、零配置
  • • 严格的安全合规要求(Pi是YOLO模式)
  • • 团队协作场景(Pi更偏个人工具)

写在最后

Pi的故事揭示了一个有趣的规律:在AI工具越来越复杂的时代,真正的突破往往来自”做减法”。

4个工具、不到1000 Token的系统提示词、刻意不支持6个”标配”功能——这种看似疯狂的极简主义,背后是对AI编程本质的深刻理解:

前沿模型不需要被手把手教导。它们需要的,是一个透明、可控、不挡路的工作环境。

Mario Zechner用Pi证明了:当你不再试图用复杂的框架去”管理”AI,而是给AI一个简洁的环境让它自己发挥时,结果可以非常好。

正如Armin Ronacher所说:Pi让我们看到了软件的未来——软件构建软件,Agent扩展Agent。


相关链接:

  • • GitHub仓库:https://github.com/badlogic/pi-mono
  • • 作者博文:https://mariozechner.at/posts/2025-11-30-pi-coding-agent/
  • • Armin Ronacher的评测:https://lucumr.pocoo.org/2026/1/31/pi/
  • • Pragmatic Engineer专访:https://newsletter.pragmaticengineer.com/p/building-pi-and-what-makes-self-modifying
  • • OpenClaw项目:https://github.com/psteger/openclaw

如果觉得有用,欢迎点赞、在看、转发三连。你的支持是我持续分享的动力。