当AI 不再只是输出一段文本,而是参与一个完整的责任链条。它需要知道谁让它做事,它做了什么,它为什么这么做,它什么时候需要人类介入,人类又是如何修改它的结果的。这些信息不仅对业务流程重要,对审计、合规、风控、责任界定同样重要。这也是为什么企业级 AI 不能只靠“更强的模型”。模型再强,也无法替代“协作协议”。因为企业不是在玩prompt 游戏,而是在运行真实的业务。业务需要规则,需要边界,需要证据,需要可追责的流程。模型可以生成内容,但模型无法定义协作关系。模型可以给出答案,但模型无法解释责任链条。于是 CHAP 出现了。它不是一个模型,也不是一个工具,而是 AI 生态里缺失的一层。它补上了“人类和 AI 如何一起完成可审计的工作”这个空白。在整个 AI 协议栈里,MCP 负责工具调用,A2A负责 agent 互操作,Workflow 负责调度,而 CHAP 则负责协作语法。它定义了任务如何被分配,草稿如何被修改,审核如何被记录,交接如何被追踪,证据如何被保存。它让人类和 AI 在同一个“协作空间”里工作,而不是在一堆散乱的 UI、日志和聊天记录里拼凑真相。这项研究来自 Brightbeam AI 的三位核心成员。他们不是在做模型,而是在做“AI 协作基础设施”。项目地址也已经公开,任何人都可以去看参考实现和规范文档。(https://github.com/BrightbeamAI/chap)
01 为什么需要CHAP协议?
如果说过去的 AI 是“助手”,那现在的 AI 正在变成“操作型智能体”。它不再只是回答问题,而是参与业务流程。它会处理工单,会写邮件,会生成合同,会做 triage,会跑分析,会给出建议。它甚至会主动请求人类确认风险,或者在遇到权限边界时自动升级。图1:主体系统演化中的三波。第一波以孤立的对话助理为中心。Wave II增加了计划、内存、工具使用和早期多代理编排。第三波以共享的人工代理工作区为中心,在这里,人类、代理和服务在明确的政策和共享审计下进行协作。当 AI 变成“参与者”,问题就变了。我们不再关心它能不能写一段好看的文案,而是关心它在整个流程里扮演什么角色。谁让它做事。它用了哪些证据。它的草稿被谁修改了。为什么修改。它什么时候需要人工介入。它什么时候应该拒绝决策。它什么时候应该升级。这些问题不是 UI 问题,而是协作问题。它们必须被记录,必须被结构化,必须能被重放。否则企业根本无法在真实业务里放心使用 AI。然而现有的协议都只解决了局部问题。MCP 让 agent 能调用工具。A2A让 agent 能互相通信。OIDC 解决身份。SCITT 解决透明日志。Workflow 解决调度和重试。但没有任何协议定义“人类和 AI 如何一起完成一项可追责的任务”。图2:代理协议栈。MCP处理代理到工具和代理到资源的访问;A2A处理代理间的互操作性;chap负责处理共享的人类代理工作区及其证据线索。身份、策略、工作流和透明度系统插入到这个堆栈中,而不是被它取代。缺少协作语法层。缺少可重放证据链。缺少结构化的 override。缺少明确的 abstain 和 escalate。缺少模式管理。缺少跨系统的协作边界。于是研究总结了九大核心需求。需要一个共享的工作空间。需要一个结构化的任务生命周期。需要结构化的人类审核。需要结构化的 override。需要明确的拒绝和升级。需要 shadow、trial、production 的模式管理。需要可组合的扩展。需要可移植的证据链。需要渐进式采用。同时 CHAP 也明确自己不做什么。它不定义证据语义,不定义时间模型,不定义置信度校准,不定义监管标准,不定义复杂语义图谱。它保持协议的“窄而稳”,把复杂性留给上层应用和profile。这是一种非常工程化的协议哲学。它只定义最小必要的协作语法,把所有领域差异都留给扩展层。它不试图成为“通用协作语言”,而是成为“可组合的协作基础设施”。
02 CHAP概览:Core + Profiles的协议哲学
CHAP 的设计非常干净。它把整个协议分成两层。最小核心负责定义协作的基本结构。可组合扩展负责定义协作的高级语义。图3:章采用模型。核心本身是有用的。当工作空间需要额外的协作、身份、控制、安全或审计功能时,配置文件会被分层。核心层只有六个概念。工作空间是协作边界。参与者是人类、agent、服务、群组或桥接实体。任务是协作的基本单位。工件是草稿、证据、决策、diff等内容载体。证据链是追加式日志。信封是消息的结构化包装。这些概念构成了一个“可审计的协作空间”。它们不关心业务逻辑,也不关心模型能力。它们只关心协作语义。扩展层则是 CHAP 的灵魂。它包含各种 profile。Review 定义审核流程。Override 定义结构化修改。Modes 定义运行模式。Routing 定义任务分发。Whisper 定义轻量级询问。Handoff 定义交接。Deliberation 定义多人决策。Identity 定义身份绑定。Signing 定义签名。Audit-SCITT 定义透明日志锚定。这些 profile 可以按需启用。一个简单的内部工具可以只用 Core。一个受监管的医疗系统可以启用 Review、Override、Identity、Signing、Audit-SCITT。一个跨组织协作的供应链系统可以启用 Routing、Bridge Participants、Federated Deployment。CHAP 的哲学很明确。核心保持稳定。扩展保持灵活。协作语义可组合。证据链可移植。部署方式可渐进。这就是 CHAP 的魅力。它不是一个“巨无霸协议”,而是一个“可组合的协作语法层”。它让人类和 AI 在同一个结构化空间里协作,而不是在一堆散乱的系统里拼凑真相。
CHAP 的设计从一开始就不是为了玩具项目,而是为了企业级、受监管、跨组织的协作场景。它必须面对安全、信任、合规、审计、隐私等一系列严肃问题。它的安全模型不是附加功能,而是协议的核心组成部分。Threat modelCHAP 假设系统可能遭遇重放攻击、消息篡改、身份伪造、证据链分叉、密钥泄露、恶意参与者等威胁。它的设计目标不是“避免所有风险”,而是“让风险可检测、可追踪、可恢复”。它通过签名、链式哈希、身份绑定、透明日志等机制构建防御。这是一种工程化的安全观。不是绝对安全,而是可验证安全。Signing和canonicalisation为了确保 envelope 不被篡改,CHAP 支持签名。为了确保签名可验证,它要求 canonicalisation。也就是说,消息必须有一个唯一的、可重建的标准形式。这让签名变得可靠,也让证据链变得可信。Identity bindingCHAP 不自己做身份认证,但它允许绑定外部身份系统。OIDC、VC、企业内部身份系统都可以接入。这让参与者的身份变得可验证,也让责任链条变得可追。Audit和transparencyCHAP 支持把证据链锚定到透明日志,比如 SCITT。这样即使内部系统被攻破,证据链也无法被悄悄篡改。这让协作历史变成“不可抵赖的事实”。Privacy和retentionCHAP 不强制保存所有内容。它允许 redaction、允许 retention policy、允许敏感内容脱敏。它的目标不是“保存一切”,而是“保存必要的证据”。Regulated AI governanceCHAP 不声称自己符合任何监管标准,但它提供了构建合规系统所需的基础设施。无论是欧盟 AI Act、NIST RMF、GMP Annex 11、SOX-404,还是金融、医疗、保险的行业规范,都可以在 CHAP 之上构建。CHAP 是治理层的底座,而不是治理层本身。
07 符合性与评估
CHAP 不是一个随便写写的协议。它有自己的符合性模型,也有自己的评估方法。Conformance levelsCHAP 定义了不同的符合性等级。最小实现只需要支持 Core。推荐实现需要支持常用 profiles。完全实现需要支持签名、身份、透明日志等高级功能。这让不同规模的系统都能渐进式采用 CHAP。What to evaluate评估 CHAP 实现时,重点不是 UI,而是协议语义。需要评估 envelope 是否正确处理,任务生命周期是否严格执行,证据链是否可重放,override是否结构化,模式切换是否基于证据。这是一种“协议级评估”,而不是“产品级评估”。Suggested evaluation questions系统是否能重放完整证据链,系统是否能检测非法 envelope,系统是否能正确处理 override,系统是否能执行模式管理,系统是否能支持跨组织协作,系统是否能在审计场景下提供可验证证据。这些问题决定了一个 CHAP 实现是否真正可靠。
CHAP 的研究里有一整章用户旅程。这些旅程不是虚构的,而是来自真实业务场景。它们展示了 CHAP 如何在不同场景里发挥作用。最小 Core 流程一个任务被创建,被分配,被执行,被完成。没有审核,没有 override,没有升级。它展示了 CHAP 的最小闭环。Drafter–Reviewer智能体写草稿,人类审核,人类修改,人类批准。它展示了 Review Profile 的价值。Override作为学习数据人类修改智能体输出,系统记录 diff、理由、标签。它展示了 override 如何成为模型训练和策略优化的信号。Abstain和Escalate智能体遇到风险,选择不决策,选择升级。它展示了责任边界的价值。Whisper智能体在执行中向人类发起轻量级询问。它展示了协作的流畅性。Shift handoff夜班交接给早班。任务状态、证据链、上下文全部结构化传递。它展示了协作的连续性。Multi-human deliberation多人投票,多人讨论,多人决策。它展示了协作的群体性。MCP tool-using agent智能体调用工具,工具输出变成 artefact,进入 evidence log。它展示了工具调用与协作语法的结合。A2A bridge participant跨系统协作,跨平台协作,跨组织协作。它展示了 CHAP 的生态潜力。图8:加权投票审议。当提议的信用超过个人审核权限阈值时,协调员将开始审议。授权审查员进行加权投票。当配置的规则得到满足时,协调员将结束审议。结果变成了一个可以被下游信贷发放任务引用的人工制品。
11 CHAP的意义与未来
CHAP 不是完美的。它有局限,也有未来。它需要更多互操作实现,它的 Profile 还在演进。 它需要更强的行业适配,它需要更广泛的生态支持。但这正是协议的生命力所在。它不是一成不变的标准,而是一个不断成长的生态。CHAP 的意义非常清晰。它是人机协作时代的基础设施。它定义了责任链条,而不是模型能力。它让 AI 真正进入可治理的生产系统。它让企业能够放心地把 AI 放进真实业务。它让协作变得结构化、可审计、可重放、可验证。如果说 MCP 是 agent 的“工具层”,A2A 是 agent 的“互操作层”,那么 CHAP 就是 agent 的“协作层”。它可能成为未来企业 AI 的 TCP/IP。它可能成为人类和智能体共同工作的基础协议。它不是一个模型。它不是一个框架。它是一种新的“协作语言”。它让 AI 不再只是助手,而是成为真正的“工作伙伴”。(END)参考资料:https://arxiv.org/pdf/2606.09751