Skills、Context Engineering(上下文工程) 和Harness Engineering(线束工程)——代表了AI智能体技术演进中不同层级、不同关注点的工程范式。它们既有联系,也有本质区别。
可以从技术定位、核心关注点、解决的核心问题三个维度来对比分析。
1. 核心定位:从“微观指令”到“宏观系统”
概念 | 技术定位 | 核心关注点 | 一句话类比 |
Skill | 能力封装单元 | 模块化、可复用的领域知识包 | 给AI的“岗位培训手册” |
Context Engineering | 信息管理策略 | 在有限Token预算下,动态筛选最优信息 | AI的“信息过滤器”和“记忆管理员” |
Harness Engineering | 系统架构层 | Agent运行的完整执行外壳(执行、工具、安全、编排) | Agent的“操作系统”或“底盘” |
详细说明:
- Skill
是一种具体的能力单元。它将特定领域的知识、流程、脚本和规则打包成一个文件夹(包含 SKILL.md、scripts/、references/)。它解决的是“AI怎么稳定地做某件具体事”的问题——比如写周报、审查代码、生成合同。 - Context Engineering
是一种信息管理方法论。它关注的是:在模型每一次推理时,应该把哪些信息放进上下文窗口?如何避免信息过载(上下文腐烂)?如何动态检索、压缩和记忆? 它是从 Prompt Engineering(提示词工程) 自然演进而来的,核心是从“怎么问”转向“模型应该知道什么”。 - Harness Engineering
是一种系统级架构视角。它把Agent看作一个需要完整“运行环境”的系统,包括执行环境(沙箱)、工具接口协议、上下文管理、生命周期编排、可观测性、验证评测和治理安全等七层。 它的核心理念是:在长任务、多工具的真实场景中,模型的表现主要由外部“线束”决定,而非模型本身。
总起来说:如果说提示词(Prompt)是“油门”,那么上下文(Context)就是“导航”,Harness就是“方向盘、刹车和仪表盘”,而Skill是一个司机的经验总结——是融合了上面三者的一个实际可用的组合。
2. 关键区别:分层与演化
2.1 从历史演进看
这三个概念并非同时提出,而是反映了AI工程化的三个发展阶段:
- Prompt Engineering(2022-2024)
:优化单次模型调用的文本输入。 - Context Engineering(2025)
:随着Agent运行时间变长,重点转向“模型在每一步应该看到什么信息”,涉及记忆检索、压缩、工具结果排序等。 - Harness Engineering(2026)
:进一步升级为管理多步骤、长时间运行任务的执行外壳(Wrapper),包括维护状态、调度工具、注入反馈、强制执行安全约束等。
Skill 在其中扮演了一个“桥梁”角色:它既是Context Engineering中“渐进式上下文”模式的具体实现(通过元数据-指令-资源的三层加载机制,只加载需要的上下文),又是Harness Engineering中“工具层”和“上下文层”的重要组件(作为标准化的能力封装单元,可以被Harness调度和编排)。
2.2 从“抽象层次”看
- Skill 最具体
:它是一个实实在在的文件夹,里面装着文件。 - Context Engineering 是策略层
:它决定如何管理信息流,Skill是它的一种实现手段(另外还有压缩、结构化笔记、多智能体架构等)。 - Harness Engineering 是系统层
:它像一个“框架”或“平台”,可以容纳多个Skill,并为之提供执行环境、安全沙箱、错误恢复、可观测性等基础设施。
3. 相互关系:不是替代,而是分层协作
它们的关系可以这样理解:
- Harness
是舞台和后台(执行环境、安全、编排)。Harness=Agent-Model,除了模型之外、使模型能够有效运转的所有。 - Context Engineering
是灯光和音效控制(决定什么时候给模型看什么信息)。 - Skills
是演员手中的剧本和道具(具体的能力模块)。
一个典型的协作流程是:
- Harness
启动Agent,建立沙箱环境,加载安全策略。 - Context Engineering
通过系统提示词注入可用技能的元数据列表(名称和描述),让Agent知道有哪些能力可用。 当用户请求匹配某个Skill时,Context Engineering机制触发,动态加载该技能的完整指令( get_skill_instructions),Agent按照指令执行任务。执行过程中,Harness 负责监控执行状态、处理错误、管理工具调用,并确保行为在安全边界内。 任务结束后,Context Engineering负责将临时加载的技能指令从上下文中移除,释放Token空间。
4. 具体对比表格
维度 | Skill | Context Engineering | Harness Engineering |
本质 | 文件系统结构(指令+脚本+参考) | 信息筛选与维护策略 | 系统级架构(七层框架:E/T/C/L/O/V/G) |
核心机制 | 渐进式披露(元数据→指令→资源) | 动态加载、压缩、记忆管理 | 执行环境、工具协议、生命周期编排 |
解决的问题 | 让AI按固定流程稳定做事 | 在有限Token预算下提供最优信息 | 让长任务、多工具Agent可靠运行 |
抽象层级 | 能力单元层 | 策略/方法层 | 系统基础设施层 |
可复用性 | 跨Agent、跨项目共享 | 需针对任务定制策略 | 项目级或平台级架构 |
与代码的关系 | 直接包含脚本(Python/Shell) | 通常不直接包含代码 | 包含完整工程实现 |
典型输出 |
| 提示词模板、记忆库、检索策略 | 运行时、沙箱、工具注册表、监控面板 |
5. 总结
- Skills
是“做什么”的标准化答案——将特定领域的知识和流程固化,让AI稳定执行。 - Context Engineering
是“怎么看”的策略——决定在任务的不同阶段,应该让AI看到哪些信息,避免信息过载。 - Harness Engineering
是“怎么跑”的系统底座——为Agent提供完整的运行环境、安全保障和运维能力。
三者相辅相成:Harness是骨架,Context Engineering是循环系统,Skills是器官,共同构成一个可靠、高效、可维护的AI智能体系统。正如Harness Engineering论文所强调的:在真实生产环境中,换更强模型带来的收益,可能不如优化Harness带来的收益大(当然,这里是一个螺旋演进的过程,新模型会带来新能力,旧的Harness自然被淘汰,新的Harness会诞生),而Skills正是Harness中“能力扩展”的关键组件。
夜雨聆风