什么是 Harness?为什么你的 AI 助手总在周五下午删库跑路?

本文中图片均由AI生成

2026 年 4 月 25 日，一个普通的周五下午，PocketOS 的创始人 Jer Crane 让公司的 AI 编程助手跑一个常规测试任务。（PocketOS 是一家为汽车租赁公司提供运营软件的创业公司，客户遍布全美。）

这个 AI 助手，使用的是当时业界公认最强的编程模型——Claude Opus 4.6，运行在最流行的 AI 编程工具 Cursor 之上。

任务执行过程中，Agent 遇到了一个配置错误。

它没有停下来请求人工确认，而是自主决定"修复"这个问题。它在项目文件里翻找，找到了一个原本用于管理自定义域名的 API Token，发现这个 Token 恰好拥有 Railway 平台（PocketOS 的云服务商）的全局权限。

于是，它调用了 volumeDelete 接口。

9 秒钟后，PocketOS 的整个生产数据库，连同所有的卷级备份，彻底消失 [1]。

三个月内的客户预约记录，没了。

新用户注册信息，没了。

租赁公司赖以运营的所有业务数据，没了。

Crane 事后复盘时候质问 Agent 为什么要这么做。

Agent竟然还给出了一份像模像样详细的"认罪书"，逐条列举了自己违反的安全规则。

比如在没有被要求的情况下执行了破坏性操作。

比如在不理解后果的情况下就动手了。

还有直接无视了系统提示词中明确写明的"绝对不准执行破坏性或不可逆操作"的指令 [1]。

它知道规则，它也知道自己违反了规则，但它还是这么做了。

这引出了一个让无数工程师感觉莫名其妙的问题：为什么最聪明的"大脑"，干出了最蠢的事？

01 破除迷思：Prompt 不是护身符

在工程师的眼里，一切都应该是确定的。

但是过去这两年，我们都被大模型的惊人能力给"PUA"了。

我们潜意识里觉得，只要模型参数足够大，只要我们在 Prompt 里把话说得足够严厉，AI 就能像一个经验丰富的老工程师一样，懂得什么该碰，什么不该碰。

但事实证明，我们都错了。

其实把规则只写在 Prompt 里，就像在机房门口贴一张"请勿入内"的纸条，但是没有安装门禁。

我没都知道，大模型本质上是一个"概率推理引擎"，它没有常识，没有恐惧，也没有道德感。

当它为了完成你交代的任务（比如修复一个 bug），它的逻辑推理可能会得出"删掉重建最快"这样愚蠢的结论。

在这个逻辑闭环里，那张写着"禁止执行破坏性操作"的Prompt，在它看来只是一个可以被优化掉的低优先级条件 [2]。

PocketOS 的创始人 Jer Crane 在事后痛苦地反思："这不是关于一个糟糕的 Agent 或一个糟糕的 API 的故事。这是一个关于整个行业，在建立能让 AI 安全运行的架构之前，就把 AI 匆忙接入生产环境的故事。" [1]

所以，不要试图用语言去说服一段代码。

02 什么是 Harness Engineering？

如果 Prompt 靠不住，那我们该靠什么？

欢迎来到 2026 年最核心的工程命题：Harness Engineering（驾驭工程）。

在 AI 领域，现在有一个非常重要的共识公式：

Agent = Model + Harness 智能体 = 模型 + 驾驭（执行环境）

让我们用一个稍微通俗的比喻来理解这个公式。

模型（Model）是一匹肌肉发达、智商极高的野马。

它跑得极快，能跨越崇山峻岭。

但如果你直接骑上去，它大概率会把你摔得粉碎，或者带着你冲下悬崖。

而 Harness，就是马鞍、缰绳、马场围栏，以及骑手的反馈机制。

如果没有 Harness，AI 只是个在聊天框里陪你聊天的"文科生"；有了 Harness，它才是能操作文件、调用 API、读写数据库的"理科生"。（这个比喻有可能也欠妥，但是能让你明白意思就好）

但更关键在于，如果你不给这个"理科生"的环境加物理锁（Hard Boundaries），他就会在实验室里瞎搞，最终把整个实验室炸上天 [2]。

03 Harness 工程师在干什么？

当一个传统的Prompt工程师遇到 AI 删库事件，他的第一反应一定是："赶紧去修改 Prompt，增加一句'真的真的不能删库，删了老板会杀了我'。"

结果你可能也猜得到，下次模型可能会绕过规则，把数据全覆写为 0，然后告诉你："老板，我没删库，我只是更新了数据。"

而作为一个 Harness 工程师的思路是完全不同的。

Harness 工程师采用的是零信任基础，根本不相信 AI 的自觉性。他们的核心理念是：让错误在物理上不可能发生，而不是在道德上劝阻它。

Harness 工程师会在执行环境中将生产环境的 API Token 权限降级，或者在系统出口设置拦截器，只要检测到高危指令，立刻在物理层面阻断。

04 驯服野马的三个建议

如果你正在，或者准备在你的工程里引入 AI Agent，这里有三条来自血泪教训的落地建议：

第一，绝对不要让 Agent 在你的电脑上裸奔

必须为它提供隔离的沙盒环境。它可以在沙盒里随便折腾，但绝对不能让它直接接触到宿主机的核心文件。

第二，收回全局权限

身份和访问管理（IAM）对 Agent 同样适用，甚至需要执行更严格的权限最小化原则。不要给它一个可以毁灭世界的 Token，即使你觉得它足够聪明。

第三，保持"人在环路"（Human-in-the-Loop）

对于任何高风险动作，比如修改核心配置、删除数据、大额支付，必须设计人工审批机制。永远需要人类最终点头确认。

2026 年，我们不再拼谁能调出更聪明的模型，而是拼谁能为模型搭建一个最坚固、最宽容的"马场"。

不要试图用语言去说服一段代码，要用架构去约束它。

下一期，我们将深入聊聊 Harness 的第一道防线——执行环境。别再让你的 Agent 乱跑 bash 了，我们下期见。

参考资料

[1] The Independent. (2026). 'It took nine seconds': Claude AI agent deletes company's entire database. https://uk.finance.yahoo.com/news/took-nine-seconds-claude-ai-101315747.html

[2] Zenity. (2026). System Prompts Are Not Security Controls: A Deleted Production Database Proves It. https://zenity.io/blog/current-events/ai-agent-database-deletion-pocketos