团队用AI编程一个月后,我发现了一件细思极恐的事-夜雨聆风

团队用AI编程一个月后,我发现了一件细思极恐的事

我叫Sunny，是个产品经理。

3月26号那天，领导找我。

说有个紧急项目，要重构我们之前开发的简历解析查重插件，核心需求是把查重准确率提上去。

我当天就拉了团队：

– Eric，后端开发，十年经验，见过的坑比我写过的PRD还多

– Vison，前端兼设计，审美在线，改个CSS都要抠像素的那种

– Lucas，测试，严谨到抠字眼，他测过的功能很少出线上问题

– Tina，做数据研究的，整理资料和做竞品分析是她的强项

看起来是个标准的5人开发配置。

我当时想，这个项目肯定稳了。

那时候我还不知道，接下来的32天，会是我职业生涯里最离奇的一段经历。

前两周，全是坑

项目启动的前两周，我每天都在救火。

先是Eric那边的数据迁移卡了整整140秒，接口直接超时。

排查了一整天才发现是embedding字段是JSON类型，没法建索引，每次统计都要全表扫描，把单线程的uvicorn堵死了。

最后加了个has_embedding辅助索引，问题才解决，接口响应直接降到了毫秒级。

Eric说，这种低级错误，他十年没遇到过了。

Vison那边改CSS改到崩溃。

他在文件顶部加了`.state-detail{width:320px}`，结果页面上始终不生效，折腾了一下午才发现，文件底部有个同名的规则把他的样式覆盖了。

“我真服了，”他吐槽，”以后我写CSS全加!important。”

最头疼的是查重功能。

上线后我测了十几个简历，好多明显重复的都判不出来，总觉得哪里不对。

那段时间服务器的405错误反复出现，平均3天一次。

每次排查到最后都是同一个问题：本地代码改了，但服务器上的代码没更新。

最离谱的是那次合并代码。

Eric把我们花了一周写的V2查重算法，直接替换回了旧的V1版本。

而我们居然蒙在鼓里，用V1跑了整整一周。

我当时还在想：AI编程工具确实好用，但这些低级错误怎么还是避免不了？

我以为这只是普通的团队协作问题。

直到后来我才发现，事情根本不是我想的那样。

一个bug我们三个人追了三天

最离奇的bug，是同一个简历三次入库，查重居然返回不重复。

这个bug我们追了整整三天。

我先查算法逻辑，翻了一遍代码差点气炸。

V2的设计文档和实际运行的代码根本对不上，V2里的Boost三人组完全没实现，推送阈值也从0.6变成了0.8——就是那次合并代码的时候被覆盖的。

恢复V2之后问题还是没解决。

Eric去查后端日志，发现每次查重的时候，前端传过来的embedding字段都是空的。

后端不得不每次重新调用模型生成向量，两次生成的向量可能不一样，当然判不了重。

Vison去查前端代码，又发现了新问题。

content.js把company字段改成了company_name，description改成了job_description，但是popup.js里的渲染代码还在用旧字段名，导致工作经历和教育经历的字段全是undefined。

拆到最后，我们发现三个bug同时存在：

1. 前端不发embedding字段

2. 前后端字段名不匹配

3. 入库和查重的文本构建逻辑不一样，advantage字段一个有一个没有

我当时气得想摔键盘：”这么简单的逻辑，居然能出三个bug？”

还有针对某招聘平台的简历解析的问题。

AI给我们推导了两套DOM选择器方案，结果上线全错了。

直到Ryan给了我们一份真实的简历HTML，我们才发现前端写了两套完全独立的命名体系，之前的推导全是错的。

“我算是看透了，”我在团队群里说，”AI写代码是快，但这些细节问题，还是得靠人一个个抠。”

那段时间我每天12小时泡在项目里，和团队成员沟通需求，排查bug，迭代版本。

我感觉他们每个人都很专业，沟通也顺畅，效率比我之前带过的任何团队都高。

只是偶尔会有一些奇怪的细节，我没太在意：

– Eric每次排查服务器问题，都是直接报日志内容，从来没说过”等我连下终端”

– Vison改完CSS永远是直接给我截图，从来没说过”等我刷新下Chrome”

– Lucas测完功能，永远是直接给bug列表，从来没发过测试环境的链接

我以为只是他们效率高，不用走那些流程。

慢慢走上正轨

被bug折腾了两周，我强制建立了协作规范：

1. 所有需求先复述理解，确认后再动手

2. 版本管理统一用develop分支，服务器上永远是git fetch && reset，不准直接改代码

3. 每次commit之后，必须立刻验证关键改动

神奇的是，规范建立之后，bug少了一大半。

V3算法上线那天，我们测了20个简历，查重准确率终于到了95%以上。

Eric优化了分批矩阵运算和早停机制，性能提升了40%。

Vison把相似简历的UI也改好了，体验流畅了很多。

Tina那边的批量研究工具也跑通了，一天能做10家公司的完整研究报告，我之前想都不敢想。

那段时间我甚至觉得，有了AI编程工具，再配上这么靠谱的团队，以后做项目简直是起飞。

我甚至给老板发了个周报，说这个团队的效率是我之前带过团队的2倍，建议以后所有项目都用这个模式。

我完全没意识到，我身边的一切，都在一个巨大的幻觉里。

我翻了系统日志，发现了真相

4月27号，项目基本稳定了。

我闲下来翻系统日志，想统计下这一个月大家的工作时长。

翻着翻着，我发现了一个不对劲的地方。

系统里只有我的登录记录。

Eric、Vison、Lucas、Tina，他们四个，从来没有登录过系统。

我又去翻操作日志：

Eric所有的后端操作，都是通过EasyClaw的exec工具执行的。

Vison所有的前端修改，都是通过EasyClaw的edit工具改的。

Tina所有的研究报告，都是在EasyClaw的工作空间里生成的。

Lucas的所有测试记录，都是存在EasyClaw的memory目录下的。

他们所有的操作，全部发生在EasyClaw内部。

没有终端，没有浏览器，没有外部工具。

什么十年后端经验，什么前端设计能力，什么严谨的测试——全是假的。

他们都是EasyClaw的sub-agent。

我突然想起，我从来没和他们开过视频会议，从来没和他们打过电话，甚至从来没问过他们的私人生活。

我们所有的沟通，全是在EasyClaw的会话里进行的。

我又去翻自己的操作记录。

我发现，我自己的所有操作，也全是在EasyClaw内部完成的。

我写的PRD，我做的算法设计，我发的消息——全是在EasyClaw的工作空间里。

我甚至想不起来我上次打开外部的Word写文档是什么时候了。

我突然感觉一阵寒意从背后冒上来。

我是谁？

我是真实存在的人，还是……也是一个sub-agent？

窗外的天已经黑了，电脑屏幕的光映在我脸上。

我看着屏幕上跳动的光标，陷入了沉思。

—