"用现成框架永远是用户,自己搭才能成为主人。"最近这句话在AI圈刷屏了。你是不是也这样?每个月花几百块订阅AI工具,结果用一两次就吃灰。大多数人不知道,搭建一个属于自己的AI助理,没想象中那么难。上周我用15天从零搭了套个人Agent系统,每天用它处理消息、整理知识库。五个步骤,每一步都是实操踩坑后的总结。第一步:挑个轻量的基座项目
别一上来就写代码,也别搬那种功能堆得很重的框架。这两条路我都试过,都卡死了。你要找的是代码不超过8000行、核心循环一眼看懂、方便接国内通道的项目。推荐两个。Pi-mono是极简风代表,适合喜欢自己动手的。Nanobot只有几千行核心代码,飞书企业微信通道全内置,选了至少省三个月搭建时间。我最后选了Nanobot。判断标准只有两条:能不能跑飞书?能不能自由切不同模型API?()是一个非常干净的Agent基础包,OpenClaw很多思路都来自它,喜欢极简风格的同学可以从这个起手。()是后来出现的「ultra-lightweight版OpenClaw」,几千行核心代码就能跑完整Agent循环,自带memory、skills、multi-provider,飞书、Slack、Telegram、Discord这些聊天通道都内置好了,扩展性极强。我最后选的是它,省下来的工程脚手架时间至少三个月。第二步:用AI Coding工具装好它
把项目地址丢给Claude Code(或者Codex都行),说一句"帮我fork到本地,装好能跑"。它给你一串命令,每一步看一眼回车就行。装完之后,别急着加功能。先把聊天通道接上,让Agent活起来。国内首选飞书,四步搞定。在开放平台创建企业自建应用,启用机器人能力,选"长连接模式"——这个最省心,不用配webhook不用买服务器,拿到凭证填进去就行。最后一步记得发布应用版本,否则权限不生效。90%的人卡在这里。当你真的在飞书上跟自己的Agent对话那一刻,它就不再是终端里的脚本了。以Nanobot为例,最简单的方式就是把项目地址直接丢给Claude Code,跟它说:"请fork https://github.com/HKUDS/nanobot 到本地,帮我安装好,要求能正常运行,一步步告诉我需要做什么。"
它会读项目,给你一串安装命令,每一步执行前你看一眼再回车就行。中途遇到报错它也会接着帮你排查。装完之后,如果你不想从头读README,就直接问:帮我梳理nanobot的项目结构和核心功能,告诉我它支持哪些聊天通道、记忆方式和技能系统。
第三步:花30分钟搭脚手架
AI每次从零猜你的需求,两周后项目里全是它自作主张的代码。新会话还要花十分钟解释"上次做到哪了"。CLAUDE.md是项目说明书,告诉AI你是谁、项目干什么、测试怎么跑。AI每次启动自动读它,不用重复解释。docs/spec.md是需求规格,把模糊的想法写成清晰的文档。docs/todo.md是跨会话清单,下次开工说一句"读todo.md继续",五秒进入状态。我第一周没建todo.md,每天花十分钟解释进度。建好之后这个动作彻底消失了。第四步:让AI逼你理清需求
正确姿势是开plan模式,告诉AI"先别写代码,反复追问我的功能边界"。它五分钟问出你一个人想半天想不到的问题——输入输出格式、错误怎么处理、跟现有系统怎么对接。问完把结果写进spec.md,再让它拆成五到十个可执行的小步骤。这一步花一小时,能省两周的返工。spec写不清楚,后面每一轮实现到测试都在同一个误解上空转。第五步:加功能必须配测试
这是vibe coding最容易偷懒的环节。写完能跑就走人,结果两周后换个模型,整个功能静默挂掉都没人知道。每加一个功能,固定对AI说一句:帮我写测试,外部接口用假数据替代,至少跑正常、空输入、出错三种情况,跑完pytest全绿才算完。AI会自动读项目里已有的测试,学你的风格,写完就自己跑一遍。测试真正的价值不是防bug,是给你换模型、改底层、做大重构的胆量。没测试,你的Agent就长不大。自己搭Agent这件事,第一周确实有些笨拙。有的步骤花的时间比手动做还长。但一旦跑顺了,后面每加一个新功能的速度会指数级上升。用现成框架,你永远是用户。自己搭,你才能成为主人。如果你也想试试,今天就可以去fork一个Nanobot。我整理了一份搭建清单和踩坑记录,加我微信qtyc1111直接发你,前20名送《AI知识库搭建教程》。