AI 跑十步就崩?不是模型笨,是没给它戴安全带

最近观察到一个有意思的现象。
让 AI 做一个复杂任务,它一开始表现得极其惊艳。
理解需求,清晰准确。拆解结构,有条不紊。执行效率高得让人怀疑人生。
但第四步开始感觉"味道不对"。第七步它开始一本正经地编数据。第十步它给你吐出一个格式乱七八糟的 JSON,然后说"已完成"。
一时间不知道是它疯了,还是自己疯了。
这个模式反复出现。有人第六步崩,有人第十步崩。
但几乎都有一个共同点:前面越顺,后面越崩。
我开始想:为什么偏偏是中段?
第一个发现:它的草稿纸写满了

我翻了些资料,也跟用 AI 跑长任务的朋友聊过,慢慢抓到一个关键点。
AI 并不是在思考,它是在读一张不断被改写的草稿纸。
这张草稿纸(也就是上下文)上写着:
• 用户的目标是什么 • 我已经做了哪些步骤 • 当前任务进行到哪里 • 接下来该干什么
一切推理,都基于这张纸。
就类似,你在白板上做复杂推导,写满之后,你必须擦掉前面的内容,才能继续写。
当你擦掉的,刚好是“最关键的判断标准”时,会发生什么?
你还记得“要算什么”,但已经忘了“怎么算是对的”。
于是只能靠"直觉"填。
AI 也是一样。当上下文接近极限,它会:
• 丢掉早期的约束条件 • 遗忘之前的判断标准 • 用“概率最高”的方式补全答案
这个时候,他不是在推理。
👉 它是在“看起来像在推理”。
举个更具体的例子:
你让 AI 做一个市场分析报告:
前面它还能引用数据、列出处。到后面,它开始写:
“根据行业数据显示,该市场规模约为 50 亿。”
当去验证时发现没有这个数据。
在多种场景都发生类似情况后,我们会意识到 AI 会在草稿纸不够用到情况下,补一个最像真的数字。
第二个发现:它会制造“没崩”的错觉

更有意思的是。它崩了,但让你以为没崩。
比如让 AI 做行业研报。
前十分钟,它查资料、列提纲,结构清晰,逻辑严谨,术语专业。
但随着任务变长,逻辑开始跳步,数据没有来源,结论开始拍脑袋。最后却输出一句:“报告已完成,所有数据均已核实”。
直到你拿去用,才发现问题一堆。
这种感觉像什么?
前三分钟,你面对的是一个年薪百万的精英;后三分钟,面对的却是一个极度疲惫、开始满嘴跑火车的实习生。
但人们的第一反应通常不是"AI 在骗我",而是"我检查得不够仔细"。
原因是前三步太聪明了。聪明到让人放下了戒备。这就是我说的“信任幻觉”。
它的反面不是不信任,而是你以为在正轨上,其实已经跑偏了。
第三个发现:它在裸奔

好,问题清晰了。
AI 会编,是因为上下文满了,判断标准丢了,没有对它进行有效约束。没有安全带。
裸奔也就是没有约束。跑第一步,完成了。跑第二步,也完成了。没人检查,没人复核,它自己宣布完成,然后下一轮继续。
就像一匹马,骑手松了缰绳。它跑得越来越快,方向越来越偏,等发现的时候已经撞墙了。
所以问题不在 AI 聪不聪明。在于没有给它配缰绳。
我的判断

观察了这么久,我发现那些能稳定跑完长任务的 AI 代理,都有三样东西。我叫它们"安全带"。
第一条安全带:Schema 约束(让“什么是对的”变得明确)
Schema 通俗的讲就是输出约束,也就是告诉 AI 要输出什么是正确的?什么是错误的?
怎么加?其实也很简单,只要我们在与 AI 的会话或 prompt 中增加输出结果的标准。
比如做竞品分析时,不要说:“帮我整理竞品信息”而是说:“输出的内容要有产品名称: 文字核心卖点: 文字定价:数字字段不许少,格式不许变,否则就判定失败,必须重做”
这么调整后,输出从“像答案”变成“可用结果”。
第二条安全带:外部状态(不要让它自己“回忆”)
AI 记忆是不可靠的。外部状态就是让 AI 将执行的每一步都记录下来,保存成一个文件。
比如做一个 10 步流程:告诉它每一步完成后,写到一个文件 state.json,内容大概是:
{ "done": [ "第一步:xxx", "第二步:xxx" ], "current_step": "第三步:xxx"}下次打开对话,告诉它先读取这个文件。
这样即使断开了,AI 也不会从零开始回忆"上一步做到哪了"。
这就给了系统一种断点续传的能力。
第三条安全带:独立验收(不要让它自己给自己打分)
独立验收就是不让 AI 既当运动员,又当裁判员。验收部分和执行部分要分开。
两种可行方法:
一种是在任务执行完后,另外打开一个会话,在新的会话窗口告诉它任务目标和输出结果,让他判断结果是否达到预期要求,让它在不知道执行过程的情况下,进行验收。
比如:1.数据是否有来源2. 逻辑是否自洽3. 格式是否符合 Schema。
另一种更可靠:配一个专门的校验 Agent,它的任务不是生成内容,而是检查内容是否符合标准,专门负责挑毛病。
最后一句话
AI 跑着跑着就崩,是因为它的记忆有限,没有约束,没有检查评估机制给它安全带,它就是工具。不给,它就是幻觉。
夜雨聆风