乐于分享
好东西不私藏

为什么真正用起来 AI 的人,会走向文档驱动开发

为什么真正用起来 AI 的人,会走向文档驱动开发

本文是《如何快速高效地构建 AI 研发团队》的第三支柱文章。

总纲:如何快速高效地构建 AI 研发团队

第一支柱:如何找到你的第一个 AI 布道者

第二支柱:从不敢用到离不开:团队信任 AI 的 3 个阶段

如果前两篇讲的是:谁先把 AI 带进团队,以及团队为什么开始愿意信它。

那第三支柱真正要解决的,就是另一件更难的事:

这种信任,怎么不只停留在个人体验里,而开始变成组织可以继承的能力。

前两篇其实已经把路走到一半了。

第一支柱讲的是,为什么一个团队要先有布道者。

第二支柱讲的是,为什么团队会从“不敢用”慢慢走到“离不开”。

但如果你真的把这两件事往前推进,第三个问题迟早会跳出来,而且一定比前两个更麻烦:

大家开始认真用了,然后呢?

用着用着,你会发现,问题不再是“愿不愿意用 AI”,而是另外一个更难听、也更难躲的问题:

我们的工作,到底有没有清楚到足够让 AI 接住。

这就是第三支柱。

它不是在讲“文档很重要”这种废话。

它讲的是:一个人、一支团队、甚至整个 AI 圈,是怎么一步步被现实逼到这里来的。

一、2024 年底,整个圈子都还沉浸在“它居然会写”

现在回头看,2024 年底其实是个很有意思的时间点。

大家已经不再像 2023 年那样,只把 AI 当成一个新鲜聊天玩具。那一波最原始的震撼已经过去了,真正开始吸引人的,是另一种感觉:

  • 它不只是会聊天
  • 它不只是会写几段漂亮的废话
  • 它开始真的能帮你做点事

那个阶段,整个圈子的情绪都差不多:新鲜、兴奋、跃跃欲试。

你会看到很多人分享自己怎么让 AI 写代码、怎么让 AI 帮忙整理需求、怎么一晚上做完原来几天才能摸出来的原型。整个气氛是热的,甚至有点燥。很多人第一次觉得,这东西不是科幻,也不是玩具,而是已经能下场了。

我也是在那个时候第一次认真碰 Cursor。

一开始当然也上头。

你会觉得,原来很多以前要自己慢慢啃的事情,现在突然有人在旁边给你递答案。你问一句,它答一句;你补一点背景,它就往前接一点;你刚觉得卡住,它已经先把一个方向铺出来了。

这种感觉很容易让人误会,以为难题已经解决了。

但我的兴奋没有持续太久。

因为我玩了不到一周,注意力就从“它会不会写”变成了另一个更烦的问题:

它为什么老是接不住前面的事。

二、我第一次真正不舒服,不是因为它写错,而是因为它断了

当时 Cursor 还不稳定,文本编辑会卡。现在说起来像一个“版本早期的小毛病”,但我当时真正被打到的,不是卡顿本身,而是卡顿之后那种熟悉的断裂感。

你前面花了十几分钟把一个问题讲清楚,把边界讲清楚,把“什么不能碰”也讲清楚了。那一轮它答得很好,甚至会给你一种错觉:这次真的对上了。

结果一重启,它又变成了一个第一次认识这个项目的人。

那种感觉很怪。

不是“它答错了一道题”的怪。

是“你们刚建立起来的关系突然没了”的怪。

你要重新解释背景。

重新讲约束。

重新讲这个任务为什么是现在做。

重新讲什么叫做完。

重新讲为什么 A 方案不能碰。

如果只是一次两次,人会觉得正常。

但它反复这样,你就会慢慢意识到:

这里真正掉的,不是记忆,而是接续。

也就是从那时候开始,我脑子里第一次认真出现一个念头:

既然它接不住,那能不能我自己补一层。

三、我最早想补的,不是“能力”,而是“session”

很多人第一次认真用 AI,会先去研究 prompt。

我也不是没研究过。

但我很快发现,问题根本不在于“这一句怎么问得更准”,而在于“下一轮怎么还能接着做”。于是我开始想的就不是 prompt,而是别的东西:

  • 能不能有一个 session,把这一轮做完的东西存下来
  • 能不能有一份 rule,把那些每次都要重讲的边界固定下来
  • 能不能让模型在每轮结束时,自己做总结、自己做压缩、自己把关键判断留下来

现在回头看,这些想法都不算惊世骇俗。

但在当时,对我来说,它们意味着一个很大的转向:

我开始不再把 AI 当成一个“答题器”,而开始把它当成一个需要交接的工作对象

那个时候我甚至认真想过,要不要把这件事做成插件。

因为站在当时的感受里,你会觉得这像一个很明确的问题:

好,现在我知道它断在哪里了。
那我是不是只要补一层 session 和记忆层,就能把问题解决掉?

后来我才知道,不会那么简单。

因为你很快会撞到更深的一层:

不是“能不能存”,而是“到底该存什么”。

什么算这一轮真正值得继承的判断?

什么只是中间过程里的噪音?

什么应该写成规则,什么应该写成阶段状态,什么应该留在具体任务里?

走到这里,你其实已经不是在研究一个小插件问题了。

你已经开始被逼着理解:工作本身的结构是什么。

四、后来我去做大项目,才发现这根本不只是 AI 的问题

再后来我去做一个更大的项目,人一下子就被现实工作吞进去了。

那种阶段很真实,跟“研究 AI”几乎没关系。每天脑子里装的是:

  • 文档补没补齐
  • 方案有没有对齐
  • 评审能不能过
  • 决策是谁拍的
  • 这件事交出去之后谁来接
  • 接回来之后下一步又该谁动

人一旦被这种工作压上一段时间,会突然明白一件事:

AI 接不住上下文,和团队接不住上下文,其实是同一个问题。

一个新人接手为什么慢?

因为很多关键东西没写下来。

一个任务换人为什么总要重新讲一遍?

因为前面留下来的不是结构,而是碎片。

一个项目为什么总靠几个老同事兜底?

因为真正重要的判断,只活在他们脑子里。

以前这些问题,我们会把它叫做沟通问题、协作问题、组织问题。

但 AI 一进来,这些毛病一下子就被照得很清楚。

因为人还能靠经验、靠默契、靠“我大概知道你什么意思”去兜。

AI 不会。

你不写,它就真的不知道。

你不固定,它就真的会漂。

你不交接,它就真的只能从头猜。

也就是在那个阶段,我第一次真正把这两件事对上:

让 AI 接得住,和让团队接得住,本质上是同一件事。

这对我来说是个很大的转折。

因为在那之前,我还把“AI 工具”和“日常项目管理”看成两条线。前者是新东西,后者是老问题。后来我才明白,不是两条线,它们撞到一起之后,照出来的是同一个结构性缺口。

五、2025 年中再回来,我反而更确定:窗口变大不等于问题解决

到 2025 年中,我再回来认真用这些工具的时候,体验已经比 2024 年底好很多了。

Cursor 稳定了,上下文窗口也大了。很多人会很自然地得出一个判断:

工具成熟了,问题解决了。

但我那时反而更清楚地意识到:

窗口变大解决的只是“能多装一点”,它没有解决“怎么接续”。

因为真正让你崩溃的,从来不是“它忘了一句上文”,而是:

  • 你换个模型,前面的判断丢一半
  • 你隔一周回来,要花半天找回项目状态
  • 你把任务交给同事,他还是只能靠猜你的意图
  • 你想把 AI 变成执行者,但它没有稳定上下文就只能偶尔灵光

这时候,你会自然把注意力放到另一件事上:

能不能把工作写成一种“谁来都能接”的状态。

也就是从这里开始,我对 rule 文件产生了比以前更深的兴趣。

不是因为它能让模型“更听话”,而是因为它逼着你把原来只存在于脑子里的东西,开始往外写:

  • 默认原则是什么
  • 哪些边界不能碰
  • 什么叫完成
  • 什么叫看起来有结果,但其实还没做完
  • 下一轮要先看什么,哪些步骤不能跳

这些东西一旦写下来,你会立刻得到一种非常实用的收益:

你不再需要在每一次对话、每一次交接、每一次换模型时,重新解释世界观。

更重要的是,你会开始上瘾。

不是上瘾于“写文档”这件事。

而是上瘾于另一种感觉:

原来一个任务真的可以不靠你亲自在场,也还能往前走。

原来你离开一会儿,再回来,不用重新找半天状态。

原来你换一个模型,不需要再从头讲一遍项目背景。

原来你把事情交给别人,不一定非得再开一个长会。

这种感觉一旦出现,人很难再退回去了。

因为你第一次体验到,工作不是只能靠脑子硬记,也可以靠结构续上。

六、那几年整个 AI 圈,其实也在从“prompt 热”慢慢走向“工作流热”

如果你回头看那两年的 AI 圈,会发现很多变化表面上是在变工具,底层其实是在换问题。

一开始大家讨论的重点,更多还是:

  • 哪个模型更强
  • prompt 怎么写更准
  • 哪个产品回答更像人
  • 哪个 demo 更惊艳

但越往后,这些话题就会慢慢让位给另一类问题:

  • 上下文怎么保存
  • 规则怎么进入工作流
  • 多轮任务怎么持续
  • 模型切换怎么不断
  • 谁来 review,谁来收束,谁来接下一轮

这不是因为大家突然都爱上“流程化”了。

而是因为只要你真的开始做事,你迟早都会撞上这些问题。

也就是说,第三支柱不是我一个人的私人兴趣。

它其实是整个 AI 使用者群体,在从“尝鲜”走向“认真工作”之后,迟早都会走到的一道坎。

七、所以我后来做的那些事,表面上像在加文档,实际上是在补接续能力

再往后,这条线就越长越清楚了。

一开始只是 rule。

后来发现只有 rule 不够。

再后来发现,session 也只是第一层。

再往后,你会开始自然长出别的东西:

  • 哪些是不能漂的真源
  • 哪些是需求清单
  • 哪些要写成 spec
  • 哪些地方需要审查
  • 哪些阶段需要统筹
  • 哪些信息必须在交接时显式留下来

如果只从表面看,会觉得这是在“加文档”“加流程”“加约束”。

但我心里其实一直很清楚,我做的不是这些。

我做的是另一件更底层的事:

给工作补一层接续能力。

如果没有这层能力,会发生什么?

  • 一个人走了,很多东西没人接得上
  • 模型一换,前面的判断散掉一半
  • 任务一转手,就得重新解释半天
  • 看起来大家都很忙,实际上每一轮都在重复找回上下文

如果有了这层能力,会发生什么?

  • 这轮做完的东西,不会随着会话一起消失
  • 下一个人接的时候,不用再从头猜
  • 下一个模型接的时候,也不是从零认识项目
  • 工作开始从“靠脑子记住”变成“靠结构接得住”

这时候你再回头看,文档驱动开发就完全不是“文档更多”这四个字能概括的了。

八、第三支柱真正解决的,不是“写文档”,而是“让信任变成组织能力”

如果第一支柱解决的是:谁先站出来把这件事带起来。

第二支柱解决的是:为什么团队开始愿意相信。

那第三支柱真正解决的,就是:

这种信任,怎么不只停在个人体验上,而开始变成组织可继承的能力。

这件事为什么重要?

因为一个人信了,不代表团队就会。

一个人会用,不代表换个人还能接。

一次 AI 输出特别好,不代表下一次也稳。

只有当工作开始被写成一种可交接、可复用、可执行的结构时,AI 才会从“偶尔惊艳”变成“稳定可用”。

我后来越来越相信,真正能把 AI 带进团队的,不是讲得多热闹,而是能不能把这种接续做出来:

这轮结束时,留下的不是一句“我搞定了”,而是一份能被下一轮继承的上下文。

九、故事走到今天,我才意识到我们一直在往一层 harness 靠

到这一步,很多东西就不再是“写几份文档”能解决的。

因为你会发现,你真正要解决的是一整串连续动作:

  • 怎么进入一个项目
  • 怎么执行而不漂
  • 怎么收束这一轮做了什么
  • 怎么把结果交给下一轮
  • 怎么换人、换模型、换时间之后还能继续

你一开始只是想把上下文记住。

后来你会发现,要记住的不只是信息,还有:

  • 当前阶段是什么
  • 做过哪些决定
  • 哪些决策是不可逆的
  • 下一步到底该干什么

后来我再看这条路,才越来越意识到:我们今天在做的很多努力,本质上都在往一层更完整的东西收。

不是聊天。

不是单次生成。

不是某一次“哇它写得好快”。

而是让工作在跨轮次、跨人、跨模型的时候,依然不散。

业内有人把这层东西叫做 harness:它不是模型本身,而是那层让工作能进入、能执行、能交接、能恢复的结构。

我不是说这个词是我们提的。不是。

只是当你一路从“上下文断裂”走到“规则沉淀”,再走到“文档结构”,再走到“审查、统筹、交接”,最后你会发现,你其实一直在做同一件事:

让一轮工作的终点,成为下一轮的起点。

十、写在最后

这就是我为什么最后会走到文档驱动开发。

不是因为它听起来高级。

也不是因为我突然喜欢写文档。

而是因为当你真的想把 AI 变成工作的一部分,你迟早会发现:没有这层接续结构,很多事情只能靠人硬扛。

今天回头看,我觉得这两年我最大的变化,不是“我更会用 AI 了”。

真正的变化是,我越来越不相信那种一次性解决问题的幻觉了。

以前我也会期待:有没有一个更强的模型,有没有一个更聪明的 agent,有没有一套更厉害的 prompt,能一下把事情全做对。

后来我越来越确定,没有这种东西。

真正能把事情做稳的,不是某一次特别聪明的输出,而是一层可以反复接续的工作结构。你今天做完,明天还能接;你交给别人,别人能接;你换个模型,它也还能接。只有这种“接得住”的能力建立起来,AI 才会从一个偶尔惊艳的工具,慢慢变成工作的一部分。

所以回头看我这一路,表面上像是在研究 rule、session、文档、交接,实际上做的始终是同一件事:

给工作造一个不会随着会话结束而散掉的骨架。

如果第三支柱一定要落成一句最朴素的话,那就是:

文档驱动开发,不是为了把文档写得更漂亮,而是为了让工作真正连续起来。