下面是推荐的两本书(链接在文末):

“驾驭工程(Harness Engineering)”的核心理念:AI 模型本质上是不稳定的部件,系统的可靠性不能指望模型自身不犯错,而必须依赖严格的底层约束结构 。包括不限于:
●控制与心跳:Prompt 不是“人设”,而是分层拼装的控制平面 ;Query Loop(主循环)才是代理的心跳,负责维持跨轮状态与连续性 。
●执行与权限:工具是必须受管的执行接口,尤其要对 Bash 等高风险工具实施高压限制 ;权限永远先于能力,系统必须支持拒绝(Deny)或要求审批(Ask) 。
●治理与恢复:上下文是昂贵的工作内存,压缩(Compact)的目的是重建工作语义而非写总结 ;错误、截断和中断是主路径,必须设计分层恢复、续写和熔断机制 。
●分工与落地:多代理的本质是隔离不确定性与独立验证,防止模型“既当裁判又当运动员” ;团队落地需先划定验证标准与行为底线,再将经验转化为可复用的 Skill 。

本书对比了 Claude Code 与 Codex,指出两者虽都基于“不信任模型”的工程共识,但在“秩序安放位置”上走向了不同的设计分支 :
●控制面与连续性:Claude Code 采用动态装配线,靠主循环(Loop)的现场调度维持连续性 ;Codex 则依赖带编号的结构化片段(Fragment),靠线程(Thread)与持久化状态桥维持秩序 。
●工具与审批:Claude Code 侧重运行时编排与现场审批 ;Codex 侧重明确的 Schema 契约与独立策略语言(Exec Policy) 。
●本地治理:Claude Code 倾向将经验收编为现场记忆(如 CLAUDE.md),贴近任务现场 ;Codex 则将其挂载为结构化资产与事件系统(如 AGENTS.md 与 Hook 引擎),便于审计分发 。
●多代理协作:Claude Code 用多代理做运行时职责分区 ;Codex 则通过工具化委派与记录,确保整个协作链条可追溯 。
●核心定调:Claude Code 像灵活兜底的现场监工(运行时优先) ;Codex 像建章立制的法务部门(显式控制面优先) 。
书籍原文地址:
https://harness-books.agentway.dev/index.html
可以下载PDF或者在线阅读
也可以联系cathywangyue,联系入群等事宜。
夜雨聆风