为什么真正用起来 AI 的人,会走向文档驱动开发
本文是《如何快速高效地构建 AI 研发团队》的第三支柱文章。
第一支柱:如何找到你的第一个 AI 布道者
如果前两篇讲的是:谁先把 AI 带进团队,以及团队为什么开始愿意信它。
那第三支柱真正要解决的,就是另一件更难的事:
这种信任,怎么不只停留在个人体验里,而开始变成组织可以继承的能力。
前两篇其实已经把路走到一半了。
第一支柱讲的是,为什么一个团队要先有布道者。
第二支柱讲的是,为什么团队会从“不敢用”慢慢走到“离不开”。
但如果你真的把这两件事往前推进,第三个问题迟早会跳出来,而且一定比前两个更麻烦:
大家开始认真用了,然后呢?
用着用着,你会发现,问题不再是“愿不愿意用 AI”,而是另外一个更难听、也更难躲的问题:
我们的工作,到底有没有清楚到足够让 AI 接住。
这就是第三支柱。
它不是在讲“文档很重要”这种废话。
它讲的是:一个人、一支团队、甚至整个 AI 圈,是怎么一步步被现实逼到这里来的。
一、2024 年底,整个圈子都还沉浸在“它居然会写”
现在回头看,2024 年底其实是个很有意思的时间点。
大家已经不再像 2023 年那样,只把 AI 当成一个新鲜聊天玩具。那一波最原始的震撼已经过去了,真正开始吸引人的,是另一种感觉:
-
它不只是会聊天 -
它不只是会写几段漂亮的废话 -
它开始真的能帮你做点事
那个阶段,整个圈子的情绪都差不多:新鲜、兴奋、跃跃欲试。
你会看到很多人分享自己怎么让 AI 写代码、怎么让 AI 帮忙整理需求、怎么一晚上做完原来几天才能摸出来的原型。整个气氛是热的,甚至有点燥。很多人第一次觉得,这东西不是科幻,也不是玩具,而是已经能下场了。
我也是在那个时候第一次认真碰 Cursor。
一开始当然也上头。
你会觉得,原来很多以前要自己慢慢啃的事情,现在突然有人在旁边给你递答案。你问一句,它答一句;你补一点背景,它就往前接一点;你刚觉得卡住,它已经先把一个方向铺出来了。
这种感觉很容易让人误会,以为难题已经解决了。
但我的兴奋没有持续太久。
因为我玩了不到一周,注意力就从“它会不会写”变成了另一个更烦的问题:
它为什么老是接不住前面的事。
二、我第一次真正不舒服,不是因为它写错,而是因为它断了
当时 Cursor 还不稳定,文本编辑会卡。现在说起来像一个“版本早期的小毛病”,但我当时真正被打到的,不是卡顿本身,而是卡顿之后那种熟悉的断裂感。
你前面花了十几分钟把一个问题讲清楚,把边界讲清楚,把“什么不能碰”也讲清楚了。那一轮它答得很好,甚至会给你一种错觉:这次真的对上了。
结果一重启,它又变成了一个第一次认识这个项目的人。
那种感觉很怪。
不是“它答错了一道题”的怪。
是“你们刚建立起来的关系突然没了”的怪。
你要重新解释背景。
重新讲约束。
重新讲这个任务为什么是现在做。
重新讲什么叫做完。
重新讲为什么 A 方案不能碰。
如果只是一次两次,人会觉得正常。
但它反复这样,你就会慢慢意识到:
这里真正掉的,不是记忆,而是接续。
也就是从那时候开始,我脑子里第一次认真出现一个念头:
既然它接不住,那能不能我自己补一层。
三、我最早想补的,不是“能力”,而是“session”
很多人第一次认真用 AI,会先去研究 prompt。
我也不是没研究过。
但我很快发现,问题根本不在于“这一句怎么问得更准”,而在于“下一轮怎么还能接着做”。于是我开始想的就不是 prompt,而是别的东西:
-
能不能有一个 session,把这一轮做完的东西存下来 -
能不能有一份 rule,把那些每次都要重讲的边界固定下来 -
能不能让模型在每轮结束时,自己做总结、自己做压缩、自己把关键判断留下来
现在回头看,这些想法都不算惊世骇俗。
但在当时,对我来说,它们意味着一个很大的转向:
我开始不再把 AI 当成一个“答题器”,而开始把它当成一个需要交接的工作对象。
那个时候我甚至认真想过,要不要把这件事做成插件。
因为站在当时的感受里,你会觉得这像一个很明确的问题:
好,现在我知道它断在哪里了。
那我是不是只要补一层 session 和记忆层,就能把问题解决掉?
后来我才知道,不会那么简单。
因为你很快会撞到更深的一层:
不是“能不能存”,而是“到底该存什么”。
什么算这一轮真正值得继承的判断?
什么只是中间过程里的噪音?
什么应该写成规则,什么应该写成阶段状态,什么应该留在具体任务里?
走到这里,你其实已经不是在研究一个小插件问题了。
你已经开始被逼着理解:工作本身的结构是什么。
四、后来我去做大项目,才发现这根本不只是 AI 的问题
再后来我去做一个更大的项目,人一下子就被现实工作吞进去了。
那种阶段很真实,跟“研究 AI”几乎没关系。每天脑子里装的是:
-
文档补没补齐 -
方案有没有对齐 -
评审能不能过 -
决策是谁拍的 -
这件事交出去之后谁来接 -
接回来之后下一步又该谁动
人一旦被这种工作压上一段时间,会突然明白一件事:
AI 接不住上下文,和团队接不住上下文,其实是同一个问题。
一个新人接手为什么慢?
因为很多关键东西没写下来。
一个任务换人为什么总要重新讲一遍?
因为前面留下来的不是结构,而是碎片。
一个项目为什么总靠几个老同事兜底?
因为真正重要的判断,只活在他们脑子里。
以前这些问题,我们会把它叫做沟通问题、协作问题、组织问题。
但 AI 一进来,这些毛病一下子就被照得很清楚。
因为人还能靠经验、靠默契、靠“我大概知道你什么意思”去兜。
AI 不会。
你不写,它就真的不知道。
你不固定,它就真的会漂。
你不交接,它就真的只能从头猜。
也就是在那个阶段,我第一次真正把这两件事对上:
让 AI 接得住,和让团队接得住,本质上是同一件事。
这对我来说是个很大的转折。
因为在那之前,我还把“AI 工具”和“日常项目管理”看成两条线。前者是新东西,后者是老问题。后来我才明白,不是两条线,它们撞到一起之后,照出来的是同一个结构性缺口。
五、2025 年中再回来,我反而更确定:窗口变大不等于问题解决
到 2025 年中,我再回来认真用这些工具的时候,体验已经比 2024 年底好很多了。
Cursor 稳定了,上下文窗口也大了。很多人会很自然地得出一个判断:
工具成熟了,问题解决了。
但我那时反而更清楚地意识到:
窗口变大解决的只是“能多装一点”,它没有解决“怎么接续”。
因为真正让你崩溃的,从来不是“它忘了一句上文”,而是:
-
你换个模型,前面的判断丢一半 -
你隔一周回来,要花半天找回项目状态 -
你把任务交给同事,他还是只能靠猜你的意图 -
你想把 AI 变成执行者,但它没有稳定上下文就只能偶尔灵光
这时候,你会自然把注意力放到另一件事上:
能不能把工作写成一种“谁来都能接”的状态。
也就是从这里开始,我对 rule 文件产生了比以前更深的兴趣。
不是因为它能让模型“更听话”,而是因为它逼着你把原来只存在于脑子里的东西,开始往外写:
-
默认原则是什么 -
哪些边界不能碰 -
什么叫完成 -
什么叫看起来有结果,但其实还没做完 -
下一轮要先看什么,哪些步骤不能跳
这些东西一旦写下来,你会立刻得到一种非常实用的收益:
你不再需要在每一次对话、每一次交接、每一次换模型时,重新解释世界观。
更重要的是,你会开始上瘾。
不是上瘾于“写文档”这件事。
而是上瘾于另一种感觉:
原来一个任务真的可以不靠你亲自在场,也还能往前走。
原来你离开一会儿,再回来,不用重新找半天状态。
原来你换一个模型,不需要再从头讲一遍项目背景。
原来你把事情交给别人,不一定非得再开一个长会。
这种感觉一旦出现,人很难再退回去了。
因为你第一次体验到,工作不是只能靠脑子硬记,也可以靠结构续上。
六、那几年整个 AI 圈,其实也在从“prompt 热”慢慢走向“工作流热”
如果你回头看那两年的 AI 圈,会发现很多变化表面上是在变工具,底层其实是在换问题。
一开始大家讨论的重点,更多还是:
-
哪个模型更强 -
prompt 怎么写更准 -
哪个产品回答更像人 -
哪个 demo 更惊艳
但越往后,这些话题就会慢慢让位给另一类问题:
-
上下文怎么保存 -
规则怎么进入工作流 -
多轮任务怎么持续 -
模型切换怎么不断 -
谁来 review,谁来收束,谁来接下一轮
这不是因为大家突然都爱上“流程化”了。
而是因为只要你真的开始做事,你迟早都会撞上这些问题。
也就是说,第三支柱不是我一个人的私人兴趣。
它其实是整个 AI 使用者群体,在从“尝鲜”走向“认真工作”之后,迟早都会走到的一道坎。
七、所以我后来做的那些事,表面上像在加文档,实际上是在补接续能力
再往后,这条线就越长越清楚了。
一开始只是 rule。
后来发现只有 rule 不够。
再后来发现,session 也只是第一层。
再往后,你会开始自然长出别的东西:
-
哪些是不能漂的真源 -
哪些是需求清单 -
哪些要写成 spec -
哪些地方需要审查 -
哪些阶段需要统筹 -
哪些信息必须在交接时显式留下来
如果只从表面看,会觉得这是在“加文档”“加流程”“加约束”。
但我心里其实一直很清楚,我做的不是这些。
我做的是另一件更底层的事:
给工作补一层接续能力。
如果没有这层能力,会发生什么?
-
一个人走了,很多东西没人接得上 -
模型一换,前面的判断散掉一半 -
任务一转手,就得重新解释半天 -
看起来大家都很忙,实际上每一轮都在重复找回上下文
如果有了这层能力,会发生什么?
-
这轮做完的东西,不会随着会话一起消失 -
下一个人接的时候,不用再从头猜 -
下一个模型接的时候,也不是从零认识项目 -
工作开始从“靠脑子记住”变成“靠结构接得住”
这时候你再回头看,文档驱动开发就完全不是“文档更多”这四个字能概括的了。
八、第三支柱真正解决的,不是“写文档”,而是“让信任变成组织能力”
如果第一支柱解决的是:谁先站出来把这件事带起来。
第二支柱解决的是:为什么团队开始愿意相信。
那第三支柱真正解决的,就是:
这种信任,怎么不只停在个人体验上,而开始变成组织可继承的能力。
这件事为什么重要?
因为一个人信了,不代表团队就会。
一个人会用,不代表换个人还能接。
一次 AI 输出特别好,不代表下一次也稳。
只有当工作开始被写成一种可交接、可复用、可执行的结构时,AI 才会从“偶尔惊艳”变成“稳定可用”。
我后来越来越相信,真正能把 AI 带进团队的,不是讲得多热闹,而是能不能把这种接续做出来:
这轮结束时,留下的不是一句“我搞定了”,而是一份能被下一轮继承的上下文。
九、故事走到今天,我才意识到我们一直在往一层 harness 靠
到这一步,很多东西就不再是“写几份文档”能解决的。
因为你会发现,你真正要解决的是一整串连续动作:
-
怎么进入一个项目 -
怎么执行而不漂 -
怎么收束这一轮做了什么 -
怎么把结果交给下一轮 -
怎么换人、换模型、换时间之后还能继续
你一开始只是想把上下文记住。
后来你会发现,要记住的不只是信息,还有:
-
当前阶段是什么 -
做过哪些决定 -
哪些决策是不可逆的 -
下一步到底该干什么
后来我再看这条路,才越来越意识到:我们今天在做的很多努力,本质上都在往一层更完整的东西收。
不是聊天。
不是单次生成。
不是某一次“哇它写得好快”。
而是让工作在跨轮次、跨人、跨模型的时候,依然不散。
业内有人把这层东西叫做 harness:它不是模型本身,而是那层让工作能进入、能执行、能交接、能恢复的结构。
我不是说这个词是我们提的。不是。
只是当你一路从“上下文断裂”走到“规则沉淀”,再走到“文档结构”,再走到“审查、统筹、交接”,最后你会发现,你其实一直在做同一件事:
让一轮工作的终点,成为下一轮的起点。
十、写在最后
这就是我为什么最后会走到文档驱动开发。
不是因为它听起来高级。
也不是因为我突然喜欢写文档。
而是因为当你真的想把 AI 变成工作的一部分,你迟早会发现:没有这层接续结构,很多事情只能靠人硬扛。
今天回头看,我觉得这两年我最大的变化,不是“我更会用 AI 了”。
真正的变化是,我越来越不相信那种一次性解决问题的幻觉了。
以前我也会期待:有没有一个更强的模型,有没有一个更聪明的 agent,有没有一套更厉害的 prompt,能一下把事情全做对。
后来我越来越确定,没有这种东西。
真正能把事情做稳的,不是某一次特别聪明的输出,而是一层可以反复接续的工作结构。你今天做完,明天还能接;你交给别人,别人能接;你换个模型,它也还能接。只有这种“接得住”的能力建立起来,AI 才会从一个偶尔惊艳的工具,慢慢变成工作的一部分。
所以回头看我这一路,表面上像是在研究 rule、session、文档、交接,实际上做的始终是同一件事:
给工作造一个不会随着会话结束而散掉的骨架。
如果第三支柱一定要落成一句最朴素的话,那就是:
文档驱动开发,不是为了把文档写得更漂亮,而是为了让工作真正连续起来。
夜雨聆风