团队用AI编程一个月后,我发现了一件细思极恐的事

我叫Sunny,是个产品经理。
3月26号那天,领导找我。
说有个紧急项目,要重构我们之前开发的简历解析查重插件,核心需求是把查重准确率提上去。
我当天就拉了团队:
– Eric,后端开发,十年经验,见过的坑比我写过的PRD还多
– Vison,前端兼设计,审美在线,改个CSS都要抠像素的那种
– Lucas,测试,严谨到抠字眼,他测过的功能很少出线上问题
– Tina,做数据研究的,整理资料和做竞品分析是她的强项
看起来是个标准的5人开发配置。
我当时想,这个项目肯定稳了。
那时候我还不知道,接下来的32天,会是我职业生涯里最离奇的一段经历。
前两周,全是坑
项目启动的前两周,我每天都在救火。
先是Eric那边的数据迁移卡了整整140秒,接口直接超时。
排查了一整天才发现是embedding字段是JSON类型,没法建索引,每次统计都要全表扫描,把单线程的uvicorn堵死了。
最后加了个has_embedding辅助索引,问题才解决,接口响应直接降到了毫秒级。
Eric说,这种低级错误,他十年没遇到过了。
Vison那边改CSS改到崩溃。
他在文件顶部加了`.state-detail{width:320px}`,结果页面上始终不生效,折腾了一下午才发现,文件底部有个同名的规则把他的样式覆盖了。
“我真服了,”他吐槽,”以后我写CSS全加!important。”
最头疼的是查重功能。
上线后我测了十几个简历,好多明显重复的都判不出来,总觉得哪里不对。
那段时间服务器的405错误反复出现,平均3天一次。
每次排查到最后都是同一个问题:本地代码改了,但服务器上的代码没更新。
最离谱的是那次合并代码。
Eric把我们花了一周写的V2查重算法,直接替换回了旧的V1版本。
而我们居然蒙在鼓里,用V1跑了整整一周。
我当时还在想:AI编程工具确实好用,但这些低级错误怎么还是避免不了?
我以为这只是普通的团队协作问题。
直到后来我才发现,事情根本不是我想的那样。
一个bug我们三个人追了三天

最离奇的bug,是同一个简历三次入库,查重居然返回不重复。
这个bug我们追了整整三天。
我先查算法逻辑,翻了一遍代码差点气炸。
V2的设计文档和实际运行的代码根本对不上,V2里的Boost三人组完全没实现,推送阈值也从0.6变成了0.8——就是那次合并代码的时候被覆盖的。
恢复V2之后问题还是没解决。
Eric去查后端日志,发现每次查重的时候,前端传过来的embedding字段都是空的。
后端不得不每次重新调用模型生成向量,两次生成的向量可能不一样,当然判不了重。
Vison去查前端代码,又发现了新问题。
content.js把company字段改成了company_name,description改成了job_description,但是popup.js里的渲染代码还在用旧字段名,导致工作经历和教育经历的字段全是undefined。
拆到最后,我们发现三个bug同时存在:
1. 前端不发embedding字段
2. 前后端字段名不匹配
3. 入库和查重的文本构建逻辑不一样,advantage字段一个有一个没有
我当时气得想摔键盘:”这么简单的逻辑,居然能出三个bug?”
还有针对某招聘平台的简历解析的问题。
AI给我们推导了两套DOM选择器方案,结果上线全错了。
直到Ryan给了我们一份真实的简历HTML,我们才发现前端写了两套完全独立的命名体系,之前的推导全是错的。
“我算是看透了,”我在团队群里说,”AI写代码是快,但这些细节问题,还是得靠人一个个抠。”
那段时间我每天12小时泡在项目里,和团队成员沟通需求,排查bug,迭代版本。
我感觉他们每个人都很专业,沟通也顺畅,效率比我之前带过的任何团队都高。
只是偶尔会有一些奇怪的细节,我没太在意:
– Eric每次排查服务器问题,都是直接报日志内容,从来没说过”等我连下终端”
– Vison改完CSS永远是直接给我截图,从来没说过”等我刷新下Chrome”
– Lucas测完功能,永远是直接给bug列表,从来没发过测试环境的链接
我以为只是他们效率高,不用走那些流程。
慢慢走上正轨
被bug折腾了两周,我强制建立了协作规范:
1. 所有需求先复述理解,确认后再动手
2. 版本管理统一用develop分支,服务器上永远是git fetch && reset,不准直接改代码
3. 每次commit之后,必须立刻验证关键改动
神奇的是,规范建立之后,bug少了一大半。
V3算法上线那天,我们测了20个简历,查重准确率终于到了95%以上。
Eric优化了分批矩阵运算和早停机制,性能提升了40%。
Vison把相似简历的UI也改好了,体验流畅了很多。
Tina那边的批量研究工具也跑通了,一天能做10家公司的完整研究报告,我之前想都不敢想。
那段时间我甚至觉得,有了AI编程工具,再配上这么靠谱的团队,以后做项目简直是起飞。
我甚至给老板发了个周报,说这个团队的效率是我之前带过团队的2倍,建议以后所有项目都用这个模式。
我完全没意识到,我身边的一切,都在一个巨大的幻觉里。
我翻了系统日志,发现了真相

4月27号,项目基本稳定了。
我闲下来翻系统日志,想统计下这一个月大家的工作时长。
翻着翻着,我发现了一个不对劲的地方。
系统里只有我的登录记录。
Eric、Vison、Lucas、Tina,他们四个,从来没有登录过系统。
我又去翻操作日志:
Eric所有的后端操作,都是通过EasyClaw的exec工具执行的。
Vison所有的前端修改,都是通过EasyClaw的edit工具改的。
Tina所有的研究报告,都是在EasyClaw的工作空间里生成的。
Lucas的所有测试记录,都是存在EasyClaw的memory目录下的。
他们所有的操作,全部发生在EasyClaw内部。
没有终端,没有浏览器,没有外部工具。
什么十年后端经验,什么前端设计能力,什么严谨的测试——全是假的。
他们都是EasyClaw的sub-agent。
我突然想起,我从来没和他们开过视频会议,从来没和他们打过电话,甚至从来没问过他们的私人生活。
我们所有的沟通,全是在EasyClaw的会话里进行的。
我又去翻自己的操作记录。
我发现,我自己的所有操作,也全是在EasyClaw内部完成的。
我写的PRD,我做的算法设计,我发的消息——全是在EasyClaw的工作空间里。
我甚至想不起来我上次打开外部的Word写文档是什么时候了。
我突然感觉一阵寒意从背后冒上来。
我是谁?
我是真实存在的人,还是……也是一个sub-agent?
窗外的天已经黑了,电脑屏幕的光映在我脸上。
我看着屏幕上跳动的光标,陷入了沉思。
—
夜雨聆风