为什么真正用起来 AI 的人,会走向文档驱动开发-夜雨聆风

为什么真正用起来 AI 的人,会走向文档驱动开发

本文是《如何快速高效地构建 AI 研发团队》的第三支柱文章。

总纲：如何快速高效地构建 AI 研发团队

第一支柱：如何找到你的第一个 AI 布道者

第二支柱：从不敢用到离不开：团队信任 AI 的 3 个阶段

如果前两篇讲的是：谁先把 AI 带进团队，以及团队为什么开始愿意信它。

那第三支柱真正要解决的，就是另一件更难的事：

这种信任，怎么不只停留在个人体验里，而开始变成组织可以继承的能力。

前两篇其实已经把路走到一半了。

第一支柱讲的是，为什么一个团队要先有布道者。

第二支柱讲的是，为什么团队会从“不敢用”慢慢走到“离不开”。

但如果你真的把这两件事往前推进，第三个问题迟早会跳出来，而且一定比前两个更麻烦：

大家开始认真用了，然后呢？

用着用着，你会发现，问题不再是“愿不愿意用 AI”，而是另外一个更难听、也更难躲的问题：

我们的工作，到底有没有清楚到足够让 AI 接住。

这就是第三支柱。

它不是在讲“文档很重要”这种废话。

它讲的是：一个人、一支团队、甚至整个 AI 圈，是怎么一步步被现实逼到这里来的。

一、2024 年底，整个圈子都还沉浸在“它居然会写”

现在回头看，2024 年底其实是个很有意思的时间点。

大家已经不再像 2023 年那样，只把 AI 当成一个新鲜聊天玩具。那一波最原始的震撼已经过去了，真正开始吸引人的，是另一种感觉：

它不只是会聊天
它不只是会写几段漂亮的废话
它开始真的能帮你做点事

那个阶段，整个圈子的情绪都差不多：新鲜、兴奋、跃跃欲试。

你会看到很多人分享自己怎么让 AI 写代码、怎么让 AI 帮忙整理需求、怎么一晚上做完原来几天才能摸出来的原型。整个气氛是热的，甚至有点燥。很多人第一次觉得，这东西不是科幻，也不是玩具，而是已经能下场了。

我也是在那个时候第一次认真碰 Cursor。

一开始当然也上头。

你会觉得，原来很多以前要自己慢慢啃的事情，现在突然有人在旁边给你递答案。你问一句，它答一句；你补一点背景，它就往前接一点；你刚觉得卡住，它已经先把一个方向铺出来了。

这种感觉很容易让人误会，以为难题已经解决了。

但我的兴奋没有持续太久。

因为我玩了不到一周，注意力就从“它会不会写”变成了另一个更烦的问题：

它为什么老是接不住前面的事。

二、我第一次真正不舒服，不是因为它写错，而是因为它断了

当时 Cursor 还不稳定，文本编辑会卡。现在说起来像一个“版本早期的小毛病”，但我当时真正被打到的，不是卡顿本身，而是卡顿之后那种熟悉的断裂感。

你前面花了十几分钟把一个问题讲清楚，把边界讲清楚，把“什么不能碰”也讲清楚了。那一轮它答得很好，甚至会给你一种错觉：这次真的对上了。

结果一重启，它又变成了一个第一次认识这个项目的人。

那种感觉很怪。

不是“它答错了一道题”的怪。

是“你们刚建立起来的关系突然没了”的怪。

你要重新解释背景。

重新讲约束。

重新讲这个任务为什么是现在做。

重新讲什么叫做完。

重新讲为什么 A 方案不能碰。

如果只是一次两次，人会觉得正常。

但它反复这样，你就会慢慢意识到：

这里真正掉的，不是记忆，而是接续。

也就是从那时候开始，我脑子里第一次认真出现一个念头：

既然它接不住，那能不能我自己补一层。

三、我最早想补的，不是“能力”，而是“session”

很多人第一次认真用 AI，会先去研究 prompt。

我也不是没研究过。

但我很快发现，问题根本不在于“这一句怎么问得更准”，而在于“下一轮怎么还能接着做”。于是我开始想的就不是 prompt，而是别的东西：

能不能有一个 session，把这一轮做完的东西存下来
能不能有一份 rule，把那些每次都要重讲的边界固定下来
能不能让模型在每轮结束时，自己做总结、自己做压缩、自己把关键判断留下来

现在回头看，这些想法都不算惊世骇俗。

但在当时，对我来说，它们意味着一个很大的转向：

我开始不再把 AI 当成一个“答题器”，而开始把它当成一个需要交接的工作对象。

那个时候我甚至认真想过，要不要把这件事做成插件。

因为站在当时的感受里，你会觉得这像一个很明确的问题：

好，现在我知道它断在哪里了。

那我是不是只要补一层 session 和记忆层，就能把问题解决掉？

后来我才知道，不会那么简单。

因为你很快会撞到更深的一层：

不是“能不能存”，而是“到底该存什么”。

什么算这一轮真正值得继承的判断？

什么只是中间过程里的噪音？

什么应该写成规则，什么应该写成阶段状态，什么应该留在具体任务里？

走到这里，你其实已经不是在研究一个小插件问题了。

你已经开始被逼着理解：工作本身的结构是什么。

四、后来我去做大项目，才发现这根本不只是 AI 的问题

再后来我去做一个更大的项目，人一下子就被现实工作吞进去了。

那种阶段很真实，跟“研究 AI”几乎没关系。每天脑子里装的是：

文档补没补齐
方案有没有对齐
评审能不能过
决策是谁拍的
这件事交出去之后谁来接
接回来之后下一步又该谁动

人一旦被这种工作压上一段时间，会突然明白一件事：

AI 接不住上下文，和团队接不住上下文，其实是同一个问题。

一个新人接手为什么慢？

因为很多关键东西没写下来。

一个任务换人为什么总要重新讲一遍？

因为前面留下来的不是结构，而是碎片。

一个项目为什么总靠几个老同事兜底？

因为真正重要的判断，只活在他们脑子里。

以前这些问题，我们会把它叫做沟通问题、协作问题、组织问题。

但 AI 一进来，这些毛病一下子就被照得很清楚。

因为人还能靠经验、靠默契、靠“我大概知道你什么意思”去兜。

AI 不会。

你不写，它就真的不知道。

你不固定，它就真的会漂。

你不交接，它就真的只能从头猜。

也就是在那个阶段，我第一次真正把这两件事对上：

让 AI 接得住，和让团队接得住，本质上是同一件事。

这对我来说是个很大的转折。

因为在那之前，我还把“AI 工具”和“日常项目管理”看成两条线。前者是新东西，后者是老问题。后来我才明白，不是两条线，它们撞到一起之后，照出来的是同一个结构性缺口。

五、2025 年中再回来，我反而更确定：窗口变大不等于问题解决

到 2025 年中，我再回来认真用这些工具的时候，体验已经比 2024 年底好很多了。

Cursor 稳定了，上下文窗口也大了。很多人会很自然地得出一个判断：

工具成熟了，问题解决了。

但我那时反而更清楚地意识到：

窗口变大解决的只是“能多装一点”，它没有解决“怎么接续”。

因为真正让你崩溃的，从来不是“它忘了一句上文”，而是：

你换个模型，前面的判断丢一半
你隔一周回来，要花半天找回项目状态
你把任务交给同事，他还是只能靠猜你的意图
你想把 AI 变成执行者，但它没有稳定上下文就只能偶尔灵光

这时候，你会自然把注意力放到另一件事上：

能不能把工作写成一种“谁来都能接”的状态。

也就是从这里开始，我对 rule 文件产生了比以前更深的兴趣。

不是因为它能让模型“更听话”，而是因为它逼着你把原来只存在于脑子里的东西，开始往外写：

默认原则是什么
哪些边界不能碰
什么叫完成
什么叫看起来有结果，但其实还没做完
下一轮要先看什么，哪些步骤不能跳

这些东西一旦写下来，你会立刻得到一种非常实用的收益：

你不再需要在每一次对话、每一次交接、每一次换模型时，重新解释世界观。

更重要的是，你会开始上瘾。

不是上瘾于“写文档”这件事。

而是上瘾于另一种感觉：

原来一个任务真的可以不靠你亲自在场，也还能往前走。

原来你离开一会儿，再回来，不用重新找半天状态。

原来你换一个模型，不需要再从头讲一遍项目背景。

原来你把事情交给别人，不一定非得再开一个长会。

这种感觉一旦出现，人很难再退回去了。

因为你第一次体验到，工作不是只能靠脑子硬记，也可以靠结构续上。

六、那几年整个 AI 圈，其实也在从“prompt 热”慢慢走向“工作流热”

如果你回头看那两年的 AI 圈，会发现很多变化表面上是在变工具，底层其实是在换问题。

一开始大家讨论的重点，更多还是：

哪个模型更强
prompt 怎么写更准
哪个产品回答更像人
哪个 demo 更惊艳

但越往后，这些话题就会慢慢让位给另一类问题：

上下文怎么保存
规则怎么进入工作流
多轮任务怎么持续
模型切换怎么不断
谁来 review，谁来收束，谁来接下一轮

这不是因为大家突然都爱上“流程化”了。

而是因为只要你真的开始做事，你迟早都会撞上这些问题。

也就是说，第三支柱不是我一个人的私人兴趣。

它其实是整个 AI 使用者群体，在从“尝鲜”走向“认真工作”之后，迟早都会走到的一道坎。

七、所以我后来做的那些事，表面上像在加文档，实际上是在补接续能力

再往后，这条线就越长越清楚了。

一开始只是 rule。

后来发现只有 rule 不够。

再后来发现，session 也只是第一层。

再往后，你会开始自然长出别的东西：

哪些是不能漂的真源
哪些是需求清单
哪些要写成 spec
哪些地方需要审查
哪些阶段需要统筹
哪些信息必须在交接时显式留下来

如果只从表面看，会觉得这是在“加文档”“加流程”“加约束”。

但我心里其实一直很清楚，我做的不是这些。

我做的是另一件更底层的事：

给工作补一层接续能力。

如果没有这层能力，会发生什么？

一个人走了，很多东西没人接得上
模型一换，前面的判断散掉一半
任务一转手，就得重新解释半天
看起来大家都很忙，实际上每一轮都在重复找回上下文

如果有了这层能力，会发生什么？

这轮做完的东西，不会随着会话一起消失
下一个人接的时候，不用再从头猜
下一个模型接的时候，也不是从零认识项目
工作开始从“靠脑子记住”变成“靠结构接得住”

这时候你再回头看，文档驱动开发就完全不是“文档更多”这四个字能概括的了。

八、第三支柱真正解决的，不是“写文档”，而是“让信任变成组织能力”

如果第一支柱解决的是：谁先站出来把这件事带起来。

第二支柱解决的是：为什么团队开始愿意相信。

那第三支柱真正解决的，就是：

这种信任，怎么不只停在个人体验上，而开始变成组织可继承的能力。

这件事为什么重要？

因为一个人信了，不代表团队就会。

一个人会用，不代表换个人还能接。

一次 AI 输出特别好，不代表下一次也稳。

只有当工作开始被写成一种可交接、可复用、可执行的结构时，AI 才会从“偶尔惊艳”变成“稳定可用”。

我后来越来越相信，真正能把 AI 带进团队的，不是讲得多热闹，而是能不能把这种接续做出来：

这轮结束时，留下的不是一句“我搞定了”，而是一份能被下一轮继承的上下文。

九、故事走到今天，我才意识到我们一直在往一层 harness 靠

到这一步，很多东西就不再是“写几份文档”能解决的。

因为你会发现，你真正要解决的是一整串连续动作：

怎么进入一个项目
怎么执行而不漂
怎么收束这一轮做了什么
怎么把结果交给下一轮
怎么换人、换模型、换时间之后还能继续

你一开始只是想把上下文记住。

后来你会发现，要记住的不只是信息，还有：

当前阶段是什么
做过哪些决定
哪些决策是不可逆的
下一步到底该干什么

后来我再看这条路，才越来越意识到：我们今天在做的很多努力，本质上都在往一层更完整的东西收。

不是聊天。

不是单次生成。

不是某一次“哇它写得好快”。

而是让工作在跨轮次、跨人、跨模型的时候，依然不散。

业内有人把这层东西叫做 harness：它不是模型本身，而是那层让工作能进入、能执行、能交接、能恢复的结构。

我不是说这个词是我们提的。不是。

只是当你一路从“上下文断裂”走到“规则沉淀”，再走到“文档结构”，再走到“审查、统筹、交接”，最后你会发现，你其实一直在做同一件事：

让一轮工作的终点，成为下一轮的起点。

十、写在最后

这就是我为什么最后会走到文档驱动开发。

不是因为它听起来高级。

也不是因为我突然喜欢写文档。

而是因为当你真的想把 AI 变成工作的一部分，你迟早会发现：没有这层接续结构，很多事情只能靠人硬扛。

今天回头看，我觉得这两年我最大的变化，不是“我更会用 AI 了”。

真正的变化是，我越来越不相信那种一次性解决问题的幻觉了。

以前我也会期待：有没有一个更强的模型，有没有一个更聪明的 agent，有没有一套更厉害的 prompt，能一下把事情全做对。

后来我越来越确定，没有这种东西。

真正能把事情做稳的，不是某一次特别聪明的输出，而是一层可以反复接续的工作结构。你今天做完，明天还能接；你交给别人，别人能接；你换个模型，它也还能接。只有这种“接得住”的能力建立起来，AI 才会从一个偶尔惊艳的工具，慢慢变成工作的一部分。

所以回头看我这一路，表面上像是在研究 rule、session、文档、交接，实际上做的始终是同一件事：

给工作造一个不会随着会话结束而散掉的骨架。

如果第三支柱一定要落成一句最朴素的话，那就是：

文档驱动开发，不是为了把文档写得更漂亮，而是为了让工作真正连续起来。