一、Harness工程
在我看来,"Harness工程"(驾驭工程 / 套挽工程)指的是:人类不再直接编写大部分代码,而是构建"约束、评估、反馈、编排"的系统,让 AI 在可控的轨道里完成实际生产工作。
它的核心组件包括:
规约层(specs / intent):把人类意图形式化
评估层(evals / verifiers):判断 AI 输出是否达标
沙箱与工具层(sandboxes / tools):限定 AI 可触达的世界
编排层(orchestration):多 Agent 协作与任务分解
反馈层(traces / RL signals):让系统持续自我改进
当这套东西成熟,意味着"写代码"不再是瓶颈,"定义什么是对的"才是瓶颈。
二、对软件工程本身的影响
1. 工程师角色发生"上移"
从"实现者"变成"规约者 + 裁判 + 架构师"
阅读代码、审阅 diff、设计评估集,比手写代码更重要
类似从"木匠"变成"建筑师 + 验收方"
2. 软件的"边际成本"趋近于零,但"边际质量成本"上升
写一个 CRUD 应用几乎免费
但要让它正确、安全、合规、可维护,成本反而集中到测试、形式化验证、red-teaming
结果:软件数量爆炸,但"被严肃信任"的软件依然稀缺
3. 代码库形态变化
大量"一次性软件"(throwaway software)出现:为单个用户、单次任务生成
长生命周期系统反而更强调形式化规约、类型系统、可验证内核(Rust、Lean、TLA+ 这类东西会复兴)
"AI-native 架构":模块边界按"可独立评估的能力单元"切分,而不是按人类团队边界
4. 软件公司的护城河重构
不再是"代码多 / 工程师多"
而是:专有评估集 + 高质量轨迹数据 + 垂直领域反馈回路
Harness 本身成为新的 IP
三、对 AI 自身的影响
1. 模型与 Harness 共同进化
通用基础模型继续扩张能力上限
但应用层的价值大量沉淀在 Harness,而非模型权重本身
类比:CPU 越来越强,但价值依然分布在 OS、编译器、应用栈上
2. 从"模型即产品"走向"Agent 系统即产品"
单模型调用不再是主要交付形式
取而代之的是"目标-评估-执行"的闭环系统
AI 公司变成"经营反馈回路"的公司
3. 安全与对齐范式转变
对齐不只在预训练阶段做
大量对齐发生在部署时的 Harness 层:监督、拦截、回滚、可解释 trace
"对齐工程师"会成为正式岗位
四、对更广泛产业体系的影响
1. 传统行业的"软件化"完成
过去 20 年的"软件吞噬世界"是把流程数字化;Harness 时代则是把流程 Agent 化——
法律:合同审查、合规检查由 Agent 完成,律师变成"裁判 + 策略"
医疗:诊断辅助 Agent + 医生最终签字,医生角色上移到"判断 + 沟通 + 责任"
制造:CAD、工艺规划、供应链调度由 Agent 串联,工程师设计"目标函数"
金融:研究、风控、运营被压缩成评估集与策略库
共同模式:行业知识 → 评估集 + 工具库 + 反馈数据 → 行业 Agent
2. 组织结构扁平化但"责任结构"集中化
中层执行被大幅压缩
但"谁来定义对错、谁来承担责任"会变成新的权力中心
监管、审计、保险行业反而扩张
3. 产业格局的两极分化
底层基础设施(模型、芯片、云、能源)极度集中
应用层 / 垂直 Harness极度分散:每个细分行业都会有自己的"Harness 工厂"
中间的"通用 SaaS"被严重挤压
4. 劳动市场的重组
大量"中等技能、重复性认知工作"被替代(不是被消灭,而是被压缩到 Agent 内部)
高价值人类工作集中在三类:
新职业:评估工程师、Agent 训练师、AI 审计师、规约设计师
5. 经济结构层面
"生产能力"不再稀缺,"判断力、信任、责任"成为新的稀缺资源
商业竞争从"谁能做出来"变成"谁能让人相信它是对的"
品牌、监管资质、长期信誉的价值上升
五、为什么会走向这里?三个底层原因
生成是廉价的,验证是昂贵的AI 让生成成本崩塌,于是整个产业的瓶颈、价值、组织都会向"验证侧"重组。Harness 本质上就是验证基础设施。
复杂系统需要反馈回路才能进化单次模型调用无法解决真实世界问题;只有"目标-行动-评估-修正"的闭环才能。所以产业必然向"闭环系统经营者"演化。
责任无法被 AI 承担法律、伦理、社会信任最终需要人类主体。这决定了人类不会消失,而是被推到责任与判断的位置,其他位置交给 Agent。
六、一个可能的画面(10-15 年后)
一个 50 人的公司能完成今天 5000 人公司的产出
大多数"软件"是临时生成、用完即弃的
每个行业都有几家"Harness 公司",掌握该领域的评估与反馈数据
工程师、医生、律师的工作 80% 是"审阅 AI 的工作 + 做最终判断"
监管、审计、保险成为新的庞大产业
真正稀缺的是:清晰的意图、可靠的判断、可被追责的主体
一句话概括:Harness 工程成熟意味着人类从"做事的人"变成"定义什么是对的、并为之负责的人",整个产业体系会围绕这个转变重新分配价值与
夜雨聆风