
1. 引言:别再只盯着“模型马力”了
进入 2026 年,AI 工程圈正在发生一次非常明显的认知转向。
很多团队还在讨论:
模型参数到底要不要更大? Agent Workflow 要不要再复杂一点? 状态机是不是应该设计成 DAG? 多 Agent 协作要不要再套一层调度器?
但真正跑在前面的团队,已经悄悄换了方向。
过去一年里,有几个非常典型的案例:
OpenAI 通过精细的指令协议,让 Codex 接近“零手写代码”; Cursor 用后台 Agent 自动检测代码冲突,让 IDE 开始进入“自动驾驶”阶段; Anthropic 则通过多层记忆系统与 CLAUDE.md 约束,让复杂任务具备长期一致性。
这些实践背后,其实都指向同一个核心:
Harness Engineering(驾驭工程)。
这个概念非常形象。
AI 模型像一匹能力极强的马,而工程系统真正重要的,并不是继续增强“马力”,而是如何通过缰绳、马具、路线和规则,把它稳定地引导到正确方向。
很多人误以为 AI 工程的核心是“模型能力”。
但现实越来越清楚:
真正决定系统价值的,不是模型本身,而是你如何组织、约束、沉淀和复用知识。
因为 Workflow 只是管道。
真正重要的,是流过管道的东西。
如果没有垂直领域知识,再复杂的 Agent 系统,也只是一个一次性的“智能工具”;它不会成长,也不会积累,更不会形成真正的壁垒。
2. Harness Engineering 的本质:不是流程,而是“知识驱动”
在很多 AI 团队的实践里,Harness Engineering 通常由三部分组成:
一、上下文工程(Context Engineering)
包括:
长短期记忆 知识检索 渐进式上下文注入 历史状态管理
它解决的问题是:
AI 在当前时刻“知道什么”。
二、架构约束(Architecture)
包括:
Agent 编排 状态机设计 Workflow 调度 安全边界 权限隔离
它解决的问题是:
AI 在什么规则下行动。
三、持续治理(Governance)
包括:
质量门禁 知识生命周期管理 自动衰减 评估与审计
它解决的问题是:
AI 如何长期保持可靠。
但很多团队现在有一个典型误区:
他们把绝大部分精力,都放在了“流程设计”上。
比如:
Workflow 要不要 16 阶段? 状态机是否应该可回滚? Agent Router 怎么设计? DAG 如何并行化?
这些当然重要。
但它们更像是在“修高速公路”。
真正的问题是:
路上到底跑什么车?
没有知识沉淀的 Workflow,本质上只是空转。
你会发现:
每次项目都重新踩坑; 每次模型升级都得重写流程; 每次上下文丢失都得重新解释业务; 每个 Agent 都像“失忆患者”。
问题不在 Agent。
问题在于:
你的系统没有形成知识闭环。
3. 为什么 Workflow 可以被替代,而知识无法被替代?
这是很多团队直到今天都没意识到的一件事。
Workflow 是会过时的。
模型升级后:
Prompt 会变; Tool Call 会变; Agent 架构会变; 调度逻辑会变; 上下文窗口会变。
甚至今天精心设计的状态机,半年后都可能被更强的模型能力直接“抹平”。
但有一样东西不会失效:
你在垂直领域积累的知识。
比如:
为什么当初做这个架构决策; 哪种方案在生产环境里翻过车; 哪些 API 有隐藏副作用; 某类业务规则为什么不能简化; 哪些“经验主义”其实是关键约束。
这些东西,才是真正昂贵的资产。
因为它们:
无法从模型参数里直接获得; 无法靠 Prompt 临时生成; 无法被公开数据集训练出来。
它们只能来自:
长期真实业务实践。
这才是 AI 工程真正的复利。
4. 一个成熟 AI 团队,如何构建知识系统?
很多团队的问题,不是“不重视知识”。
而是:
不知道如何把知识工程化。
真正有效的知识系统,通常需要同时解决三件事:
怎么存? 怎么分类? 怎么演化?
第一层:知识分层
一个成熟团队,往往会把知识拆成不同层级。
Layer 0:个人偏好
比如:
IDE 设置 Prompt 风格 编码习惯 本地工具链
这是个人资产。
Layer 1:团队技术知识
比如:
技术规范 架构模式 通用组件 基础设施经验
这是团队共享资产。
Layer 2:业务知识
比如:
风控规则 订单状态机 审批流程 业务约束
这是领域资产。
Layer 3:项目知识
比如:
某项目的特殊设计 某次事故复盘 临时 workaround 项目上下文
这是项目生命周期资产。
真正关键的一点是:
项目知识必须能够“向上提升”。
也就是说:
一个项目里验证过的经验,如果具备通用性,就应该自动沉淀为团队级资产。
否则团队永远在重复交学费。
5. 最反直觉的一点:知识库必须“会腐烂”
很多人以为:
知识库越大越好。
其实完全相反。
AI 系统最大的风险之一,就是:
陈旧知识污染上下文。
一个过时的架构决策,可能比“没有知识”更危险。
因为 Agent 会默认它是正确的。
所以成熟的 AI 团队,开始引入一种非常重要的机制:
知识衰减(Knowledge Decay)
核心逻辑很简单:
长时间没人引用的知识,可信度下降; 长时间没人验证的经验,需要降级; 已经过时的规则,必须自动退出活跃索引。
例如:
12 个月没人引用的 proven 条目,降级; 6 个月没人验证的 verified 条目,回退; 长期无人使用的 draft,自动归档。
与此同时,还会结合类似“Lint”的机制:
检查冲突; 检查孤儿文档; 检查过期引用; 检查循环依赖。
本质上:
知识库不是图书馆,而是“活体系统”。
它必须持续新陈代谢。
6. AI 工程真正难的,不是生成,而是“上下文控制”
很多团队在 Agent 系统里遇到的真正瓶颈,其实不是模型能力。
而是:
上下文膨胀。
知识一多,Prompt 就越来越长。
最终:
Token 爆炸; 检索失控; Agent 开始“胡吃海塞”; 模型注意力迅速下降。
所以先进团队现在普遍开始采用:
分层索引 + 查询预算
而不是“全量喂给模型”。
一个典型结构通常是:
Layer A:全景目录
几十行。
只告诉 Agent:
知识库里“有什么”。
Layer B:分类摘要
几百行。
提供:
标题 标签 成熟度 摘要
帮助 Agent 判断:
要不要深入读取。
Layer C:完整内容
只有真正需要时才加载。
这种模式最大的价值在于:
把“上下文消费”变成一种精确行为。
而不是无节制的信息投喂。
很多团队在这里,能直接把上下文规模压缩一个数量级。
7. AI 工程的下一个瓶颈:不是模型,而是“人在等待”
再先进的 Workflow,只要中间卡了一个“等待人工确认”,效率都会断崖式下降。
很多团队真实的交付周期其实是:
Agent 工作 2 小时; 等人审批 18 小时。
最终:
系统大量时间浪费在“人在不在”。
所以越来越多团队开始做:
全异步 AI 工程。
比如:
手机远程审批; 异步架构确认; Agent 后台持续执行; 自动知识归档; 自动经验提取。
本质上是在让 AI 系统:
从“工具”变成“持续运行的生产系统”。
8. 真正的 AI 护城河:不是模型,而是“知识复利”
今天的大模型能力已经越来越接近“基础设施”。
模型差距仍然存在,但已经不像两年前那样决定生死。
真正拉开团队差距的,开始变成:
是否具备领域知识沉淀; 是否形成知识闭环; 是否拥有长期演化能力; 是否让系统“越用越聪明”。
这是很多人忽视的一件事:
模型提升具有概率性,但知识沉淀具有确定性。
模型可能下个月就被新版本超越。
但你的:
业务理解 故障经验 架构演化 决策逻辑 领域规则
会持续复利。
而这,才是真正无法被轻易复制的东西。
9. 结语:别再只修 Workflow 了,开始建设“知识基础设施”
未来几年,Agent、Workflow、Tool Use、长上下文、自动编排,都会逐渐标准化。
很多今天看起来“高门槛”的工程能力,未来都会成为基础能力。
但有一样东西不会:
领域知识。
它决定了:
AI 是否真正理解业务; Agent 是否能长期稳定演化; 系统是否能形成复利; 团队是否拥有不可替代性。
所以,一个 AI 团队最重要的问题,也许不再是:
“我们该用哪个模型?”
而是:
“我们的知识,是否正在持续沉淀为资产?”
因为最终:
Skill 会变化,工具链会变化,模型会变化。
但真正长期存在的,永远是知识本身。
夜雨聆风