刚开始我特别兴奋。OpenClaw、Claude Code、Codex、Hermes、各种网页大模型,我都试。我以为自己会像电影里的指挥官一样:坐在屏幕前,输入一句话,一群 AI 开始整齐行动。现实是,我电脑上开了一堆黑框。一个窗口跑后端。一个窗口跑前端。一个窗口跑桌面程序。一个窗口跑 AI 命令行。一个窗口看日志。还有一个窗口问 ChatGPT:“大哥,这个能关吗?”我一个做 GTM 的,平时研究的是市场、产品、渠道、价格、竞品动作。结果那段时间,我每天研究的是:5173 是什么?8765 又是谁?8000 为什么被占了?这个是前端还是后端?为什么页面还是旧版本?为什么它说成功了,但我什么都没看到?我一度觉得自己不是在使用 AI。我是被 AI 发展成了运维。
二、AI 很强,但它不懂我的崩溃
AI 真的很强。它会写代码。会改页面。会跑测试。会生成报告。会告诉你:“核心闭环已经完成。”但问题是,它说的每个字我都认识,连起来我就有点想报警。它说:“接口已联通。”我说:“页面在哪?”它说:“进程已启动。”我说:“哪个窗口能关?”它说:“日志已写入。”我说:“能不能别写这么长,我眼睛快瞎了。”它说:“状态流转正常。”我说:“你能不能讲人话?”这就是我那段时间最大的痛苦。AI 不是不会干活。AI 是干了很多活,但你不知道它干的是不是你想要的活。它像一个特别勤奋、特别聪明、特别自信的同事。唯一的问题是:它经常不等你听懂,就已经干到下一步了。当日我也有让AI崩溃的瞬间,他竟然能用脏话,估计也是被我整崩溃了
这三个月里,我真的不止一次想放弃。有时候折腾到半夜,一个页面打不开。我心想,算了,我又不是程序员。有时候 AI 又自信地误判一个功能。我心想,算了,我还是老老实实做人肉流程吧。有时候我盯着日志看了半小时,发现只是端口错了。我心想,这哪是未来,这简直是电子版修水管。但很奇怪。第二天凌晨五点,我又醒了。坐到电脑前,打开 Ubuntu,继续问:“现在下一步做什么?”这就是我和 AI 的关系。说爱吧,它确实让我痛苦。说恨吧,它又真的把东西一点点做出来了。它像一个不太听话、偶尔胡说八道、但干活速度吓人的怪物。你想驾驭它。但很多时候,你发现是它拖着你跑。
五、后来我意识到,我缺的不是更多 AI,而是一个“笼子”
刚开始我以为,我需要更强的 AI。后来我发现,不是。我需要的是一个能管理 AI 的地方。因为这些 AI 单独看都挺厉害。但放在一起,就像一个没有项目经理的施工现场。这个 AI 说完成了。那个 AI 说有问题。第三个 AI 建议重构。第四个 AI 开始写总结,写得特别漂亮,就是不知道它到底干没干。我被迫成了人肉中转站。把一个 AI 的反馈复制给另一个 AI。再让第三个 AI 判断第二个 AI 有没有跑偏。再把结果发回第一个 AI。我感觉自己像一个人肉 API 网关。所以我开始想:能不能有一个地方,把这些 AI 都装进去?任务谁接了,谁在跑,有没有日志,要不要确认,结果是什么,下一个 AI 怎么接着干。都看得见。这不是工具。更像是一个笼子。不是为了限制 AI,而是为了让 AI 安全发挥。
六、最后,我做了一个自己的 AI 项目指挥台
折腾到最后,我慢慢做出了一个小平台。它不神秘,也不完美。但它解决了我最痛苦的几个问题:我可以写任务。可以看哪个 AI 在执行。可以看到实时日志。高风险动作会来问我。做完有结果。下一个 AI 能接着看。系统也能检查 AI 有没有乱改东西。说白了,它不是要替我思考所有事。它是让我不用再被一堆窗口和日志淹没。以前我是这样工作:人追着 AI 跑。现在我希望变成:AI 按流程跑,人只在关键地方拍板。未来我真正想要的形态更简单:我只做两件事。第一,输入任务。第二,批准或拒绝关键风险。至于中间要不要先做检查、要不要排队、要不要生成快照、要不要写交接包、要不要找另一个 AI 复核,这些应该让系统自己判断。也就是说,我不是想要更多按钮。我是想要一个会自己点按钮的 AI 项目经理。