从OpenClaw到P3394 架构

摘要

2024年初，IEEE P3394工作组提出了大语言模型Agent接口标准的五大核心架构：通用消息格式（UMF）、Agent能力清单（Agent Manifest）、通道与通道适配器与通道身份（Channel, Channel Adapter & Channel Identity）、会话框架（Session）、以及安全机制（Security）。两年后的今天，OpenClaw以30万+ GitHub星标横空出世，CoPaw定义了个人Agent工作站的新范式，Anthropic Agent Skills和OpenAI Agents SDK纷纷落地——它们所采用的架构，与P3394的设计不谋而合。本文深入剖析这一架构对齐，以及它对Agent互操作标准的深远意义。

引言：当预见变成现实

2024年初，当大多数人还在讨论LLM能不能写代码、能不能画图的时候，IEEE P3394工作组已经在思考一个更深层的问题：Agent之间如何通信？Agent如何被发现和调用？Agent如何跨平台、跨厂商协作？

我们提出了一个完整的Agent接口架构，包含五大核心主题。当时，这些设计更多是基于第一性原理的推演——我们相信Agent生态一定会走向这条路，但市场验证尚未到来。

两年后的2026年3月，验证以一种我们没有预料到的速度和规模到来了。

· · ·

P3394的五大核心架构

在深入对比之前，让我们先梳理P3394标准草案的五大核心主题：

一、通用消息格式（Universal Message Format, UMF）

Agent之间的通信需要一个统一的消息结构。UMF定义了消息的封装、载荷规范和传输格式，使得不同Agent、不同平台之间可以用同一种“语言”交流。这就像HTTP之于Web——不管你用什么浏览器、什么服务器，消息格式是统一的。

二、Agent能力清单（Agent Manifest）

Agent需要一种标准化的方式来声明自己“能做什么”。Agent Manifest定义了能力声明、输入/输出schema和本体论（ontology），使得Agent可以被发现、被理解、被调用。

三、通道、通道适配器与通道身份（Channels, Channel Adapters & Channel Identity）

这是P3394最具前瞻性的设计之一。我们认识到Agent不只通过API通信——Agent需要通道身份（Channel Identity）以在不同通信端点上可寻址；需要通道适配器（Channel Adapter）来处理不同通道的输入/输出；而行业需要定义标准通道（Channels），包括CLI、MCP、API、WhatsApp、Telegram、Slack、Email等，以便厂商为所有人实现通道适配器。

四、会话框架（Session）

Agent不是无状态的函数调用——它们在会话（Session）中运行。P3394定义了会话框架，包括Agent Arena（主Agent在会话中跨通道编排子Agent的模式）。

五、安全机制（Security）

Agent通信中的安全至关重要。P3394聚焦于消息内和会话上下文中的访问令牌（Access Token）处理和授权机制，POR（Proof of Receipt，接收证明）作为可选机制用于访问令牌的获取。

· · ·

OpenClaw：通道与UMF的大规模验证

2025年11月，奥地利开发者Peter Steinberger发布了OpenClaw。仅仅几个月后，这个项目就积累了超过30万GitHub星标，成为有史以来增长最快的开源AI Agent框架。

OpenClaw的核心理念惊人地简单：让你的AI Agent通过你已经在使用的消息通道与你交互。WhatsApp、Telegram、Slack、Discord、Signal、iMessage、Microsoft Teams、IRC、Matrix、飞书、LINE……OpenClaw支持20+个通道。

让我们对比一下OpenClaw的架构与P3394的设计：

通道适配器（Channel Adapter）——完全对齐

OpenClaw为每个消息平台实现了独立的适配器：WhatsApp用Baileys（WebSocket协议），Telegram用grammY（Bot API框架），Slack用OAuth应用。这正是P3394所设计的通道适配器模式——每个通道有自己的适配器实现，但上层Agent逻辑保持一致。

通用消息格式（UMF）——架构一致

OpenClaw的多通道架构依赖一个统一的消息路由层：一个长期运行的Gateway进程接收来自不同平台的消息，路由到同一个会话存储中。你可以在WhatsApp上开始对话，在Telegram上继续——因为上下文是共享的。这就是UMF的核心价值：消息格式的统一使得跨通道的无缝体验成为可能。

通道身份（Channel Identity）——隐式实现

OpenClaw通过DM配对（pairing）机制实现了通道身份：用户在每个通道上通过配对码与Agent建立身份关联。这保证了Agent知道“你是谁”，不管你通过哪个通道发消息。

OpenClaw的爆发式增长证明了一个核心观点：Agent的价值不在于它连接了什么LLM，而在于它能通过什么通道到达用户。这正是P3394两年前就认识到的。

· · ·

CoPaw：个人Agent工作站与会话框架的验证

如果说OpenClaw验证了P3394的通道和消息格式设计，那么阿里巴巴AgentScope团队开源的CoPaw（Co Personal Agent Workstation）则从另一个维度验证了P3394的会话框架和Agent Manifest设计。

CoPaw的核心定位是“个人Agent工作站”——一个完全模块化的平台，给予用户对AI助手的完全控制，从运行的模型到连接的通道。

会话框架（Session）——深度对齐

CoPaw内置了持久化长期记忆（persistent long-term memory），能主动捕获决策、偏好和待办事项。这种记忆不是简单的对话历史——它是Agent在会话中积累的结构化知识。这与P3394的Session架构理念高度一致：Agent在会话中运行，会话是Agent的核心执行上下文。

Agent Manifest——技能即能力声明

CoPaw将Skills（技能）作为一等公民：内置cron调度和自定义技能，技能从工作空间自动加载。每个技能本质上就是一个能力声明——有明确的输入、输出和触发条件。这与P3394的Agent Manifest设计异曲同工：Agent通过结构化的schema声明自己的能力，使其可被发现和调用。

多通道支持——架构趋同

CoPaw同样支持多通道部署，用户可以选择通过不同的通信应用与Agent交互。CoPaw的架构进一步证明：通道多样性不是可选特性，而是Agent工作站的基础需求。

· · ·

Agent SDK大厂的集体趋同

除了开源社区的验证，商业大厂的Agent SDK也在向P3394的架构方向趋同。

Anthropic Agent Skills（2025年10月发布）

Anthropic将Agent Skills发布为开放标准，每个Skill本质上就是一个结构化的能力包，包含指令、脚本和资源。Skills可以被动态发现和加载——这正是Agent Manifest的商业化实现。2026年，Anthropic进一步推出了企业级Skills管理和合作伙伴Skills生态（Canva、Notion、Figma、Atlassian等），验证了Agent Manifest不仅是技术概念，更是商业生态的基础。

OpenAI Agents SDK

OpenAI的Agents SDK定义了Agent、Handoff（委托）和Guardrail（护栏）三个核心原语。其中Handoff机制——Agent将任务委托给其他Agent——正是P3394 Agent Arena模式的体现。SDK内置了会话状态管理，支持通过MCP和多种工具与外部世界连接。

一个关键观察：CLI比MCP更强大

在实际部署中，一个令人意外的发现是：CLI作为通道，比MCP展现出更强大的集成能力。Claude Code通过CLI通道实现的Agent能力，远超纯MCP协议所能达到的范围。这个发现深刻验证了P3394的通道设计理念——通道不只是通信管道，更是集成接口。CLI、MCP、API都是通道，而P3394的UMF确保了不管通过哪个通道，消息格式和语义是一致的。

Google、Microsoft的趋同

Google的A2A（Agent-to-Agent）协议和Microsoft Agent Framework同样在向类似的架构模式靠拢：能力发现、会话管理、跨Agent编排、安全授权。整个行业正在独立地走向P3394两年前画出的蓝图。

· · ·

为什么是P3394？为什么是现在？

行业验证带来了一个悖论：P3394的设计被证明是正确的，但如果我们不加快发布，这个正确的设计可能变得无关紧要。

原因很简单：当每个厂商都在独立实现类似的架构时，它们会各自形成事实标准（de facto standards）。OpenClaw有自己的消息格式，Anthropic有自己的Skills规范，OpenAI有自己的Agents SDK接口。虽然架构理念趋同，但接口细节各不相同。

这正是IEEE P3394存在的意义：

不是发明新架构，而是为已经被验证的架构提供一个中立的、权威的、互操作的标准定义。就像IEEE 802.11没有发明无线网络，但它让所有无线设备能够互联——P3394的目标是让所有Agent能够互操作。

P3394的五大核心主题——UMF、Agent Manifest、Channels/Channel Adapter/Channel Identity、Session、Security——每一个都已经在真实产品中得到验证。现在需要的不是更多的架构辩论，而是将这些经过验证的设计固化为标准，发布出去，让整个生态受益。

窗口期不会永远存在。Agent互操作标准的竞争已经开始——MCP、A2A、ACP、OpenClaw、CoPaw……每一天不发布，就多一天让碎片化固化的风险。

· · ·

结语

两年前，我们在P3394中画了一张蓝图。两年后，全球最大的AI公司和最火的开源项目，正在用真实的代码和产品，验证这张蓝图的每一个角落。

从OpenClaw的30万星标到CoPaw的模块化工作站，从Anthropic Agent Skills到OpenAI Agents SDK，从CLI通道的崛起到Agent Arena的普及——行业走向P3394预见的方向，不是巧合，而是因为这是Agent互操作的必然架构。

IEEE P3394工作组将于2026年3月20日召开月度会议，主题是“State of the Union”——梳理行业验证，加速标准发布。我们邀请所有关心Agent互操作未来的技术同仁，关注并参与P3394的工作。

The architecture is validated. Now it’s time to ship the standard.

架构已验证。是时候发布标准了。

— END —