乐于分享
好东西不私藏

从OpenClaw到P3394 架构

从OpenClaw到P3394 架构

摘要

2024年初,IEEE P3394工作组提出了大语言模型Agent接口标准的五大核心架构:通用消息格式(UMF)、Agent能力清单(Agent Manifest)、通道与通道适配器与通道身份(Channel, Channel Adapter & Channel Identity)、会话框架(Session)、以及安全机制(Security)。两年后的今天,OpenClaw以30万+ GitHub星标横空出世,CoPaw定义了个人Agent工作站的新范式,Anthropic Agent Skills和OpenAI Agents SDK纷纷落地——它们所采用的架构,与P3394的设计不谋而合。本文深入剖析这一架构对齐,以及它对Agent互操作标准的深远意义。

引言:当预见变成现实

2024年初,当大多数人还在讨论LLM能不能写代码、能不能画图的时候,IEEE P3394工作组已经在思考一个更深层的问题:Agent之间如何通信?Agent如何被发现和调用?Agent如何跨平台、跨厂商协作?

我们提出了一个完整的Agent接口架构,包含五大核心主题。当时,这些设计更多是基于第一性原理的推演——我们相信Agent生态一定会走向这条路,但市场验证尚未到来。

两年后的2026年3月,验证以一种我们没有预料到的速度和规模到来了。

· · ·

P3394的五大核心架构

在深入对比之前,让我们先梳理P3394标准草案的五大核心主题:

一、通用消息格式(Universal Message Format, UMF)

Agent之间的通信需要一个统一的消息结构。UMF定义了消息的封装、载荷规范和传输格式,使得不同Agent、不同平台之间可以用同一种“语言”交流。这就像HTTP之于Web——不管你用什么浏览器、什么服务器,消息格式是统一的。

二、Agent能力清单(Agent Manifest)

Agent需要一种标准化的方式来声明自己“能做什么”。Agent Manifest定义了能力声明、输入/输出schema和本体论(ontology),使得Agent可以被发现、被理解、被调用。

三、通道、通道适配器与通道身份(Channels, Channel Adapters & Channel Identity)

这是P3394最具前瞻性的设计之一。我们认识到Agent不只通过API通信——Agent需要通道身份(Channel Identity)以在不同通信端点上可寻址;需要通道适配器(Channel Adapter)来处理不同通道的输入/输出;而行业需要定义标准通道(Channels),包括CLI、MCP、API、WhatsApp、Telegram、Slack、Email等,以便厂商为所有人实现通道适配器。

四、会话框架(Session)

Agent不是无状态的函数调用——它们在会话(Session)中运行。P3394定义了会话框架,包括Agent Arena(主Agent在会话中跨通道编排子Agent的模式)。

五、安全机制(Security)

Agent通信中的安全至关重要。P3394聚焦于消息内和会话上下文中的访问令牌(Access Token)处理和授权机制,POR(Proof of Receipt,接收证明)作为可选机制用于访问令牌的获取。

· · ·

OpenClaw:通道与UMF的大规模验证

2025年11月,奥地利开发者Peter Steinberger发布了OpenClaw。仅仅几个月后,这个项目就积累了超过30万GitHub星标,成为有史以来增长最快的开源AI Agent框架。

OpenClaw的核心理念惊人地简单:让你的AI Agent通过你已经在使用的消息通道与你交互。WhatsApp、Telegram、Slack、Discord、Signal、iMessage、Microsoft Teams、IRC、Matrix、飞书、LINE……OpenClaw支持20+个通道。

让我们对比一下OpenClaw的架构与P3394的设计:

通道适配器(Channel Adapter)——完全对齐

OpenClaw为每个消息平台实现了独立的适配器:WhatsApp用Baileys(WebSocket协议),Telegram用grammY(Bot API框架),Slack用OAuth应用。这正是P3394所设计的通道适配器模式——每个通道有自己的适配器实现,但上层Agent逻辑保持一致。

通用消息格式(UMF)——架构一致

OpenClaw的多通道架构依赖一个统一的消息路由层:一个长期运行的Gateway进程接收来自不同平台的消息,路由到同一个会话存储中。你可以在WhatsApp上开始对话,在Telegram上继续——因为上下文是共享的。这就是UMF的核心价值:消息格式的统一使得跨通道的无缝体验成为可能。

通道身份(Channel Identity)——隐式实现

OpenClaw通过DM配对(pairing)机制实现了通道身份:用户在每个通道上通过配对码与Agent建立身份关联。这保证了Agent知道“你是谁”,不管你通过哪个通道发消息。

OpenClaw的爆发式增长证明了一个核心观点:Agent的价值不在于它连接了什么LLM,而在于它能通过什么通道到达用户。这正是P3394两年前就认识到的。

· · ·

CoPaw:个人Agent工作站与会话框架的验证

如果说OpenClaw验证了P3394的通道和消息格式设计,那么阿里巴巴AgentScope团队开源的CoPaw(Co Personal Agent Workstation)则从另一个维度验证了P3394的会话框架和Agent Manifest设计。

CoPaw的核心定位是“个人Agent工作站”——一个完全模块化的平台,给予用户对AI助手的完全控制,从运行的模型到连接的通道。

会话框架(Session)——深度对齐

CoPaw内置了持久化长期记忆(persistent long-term memory),能主动捕获决策、偏好和待办事项。这种记忆不是简单的对话历史——它是Agent在会话中积累的结构化知识。这与P3394的Session架构理念高度一致:Agent在会话中运行,会话是Agent的核心执行上下文。

Agent Manifest——技能即能力声明

CoPaw将Skills(技能)作为一等公民:内置cron调度和自定义技能,技能从工作空间自动加载。每个技能本质上就是一个能力声明——有明确的输入、输出和触发条件。这与P3394的Agent Manifest设计异曲同工:Agent通过结构化的schema声明自己的能力,使其可被发现和调用。

多通道支持——架构趋同

CoPaw同样支持多通道部署,用户可以选择通过不同的通信应用与Agent交互。CoPaw的架构进一步证明:通道多样性不是可选特性,而是Agent工作站的基础需求。

· · ·

Agent SDK大厂的集体趋同

除了开源社区的验证,商业大厂的Agent SDK也在向P3394的架构方向趋同。

Anthropic Agent Skills(2025年10月发布)

Anthropic将Agent Skills发布为开放标准,每个Skill本质上就是一个结构化的能力包,包含指令、脚本和资源。Skills可以被动态发现和加载——这正是Agent Manifest的商业化实现。2026年,Anthropic进一步推出了企业级Skills管理和合作伙伴Skills生态(Canva、Notion、Figma、Atlassian等),验证了Agent Manifest不仅是技术概念,更是商业生态的基础。

OpenAI Agents SDK

OpenAI的Agents SDK定义了Agent、Handoff(委托)和Guardrail(护栏)三个核心原语。其中Handoff机制——Agent将任务委托给其他Agent——正是P3394 Agent Arena模式的体现。SDK内置了会话状态管理,支持通过MCP和多种工具与外部世界连接。

一个关键观察:CLI比MCP更强大

在实际部署中,一个令人意外的发现是:CLI作为通道,比MCP展现出更强大的集成能力。Claude Code通过CLI通道实现的Agent能力,远超纯MCP协议所能达到的范围。这个发现深刻验证了P3394的通道设计理念——通道不只是通信管道,更是集成接口。CLI、MCP、API都是通道,而P3394的UMF确保了不管通过哪个通道,消息格式和语义是一致的。

Google、Microsoft的趋同

Google的A2A(Agent-to-Agent)协议和Microsoft Agent Framework同样在向类似的架构模式靠拢:能力发现、会话管理、跨Agent编排、安全授权。整个行业正在独立地走向P3394两年前画出的蓝图。

· · ·

为什么是P3394?为什么是现在?

行业验证带来了一个悖论:P3394的设计被证明是正确的,但如果我们不加快发布,这个正确的设计可能变得无关紧要。

原因很简单:当每个厂商都在独立实现类似的架构时,它们会各自形成事实标准(de facto standards)。OpenClaw有自己的消息格式,Anthropic有自己的Skills规范,OpenAI有自己的Agents SDK接口。虽然架构理念趋同,但接口细节各不相同。

这正是IEEE P3394存在的意义:

不是发明新架构,而是为已经被验证的架构提供一个中立的、权威的、互操作的标准定义。就像IEEE 802.11没有发明无线网络,但它让所有无线设备能够互联——P3394的目标是让所有Agent能够互操作。

P3394的五大核心主题——UMF、Agent Manifest、Channels/Channel Adapter/Channel Identity、Session、Security——每一个都已经在真实产品中得到验证。现在需要的不是更多的架构辩论,而是将这些经过验证的设计固化为标准,发布出去,让整个生态受益。

窗口期不会永远存在。Agent互操作标准的竞争已经开始——MCP、A2A、ACP、OpenClaw、CoPaw……每一天不发布,就多一天让碎片化固化的风险。

· · ·

结语

两年前,我们在P3394中画了一张蓝图。两年后,全球最大的AI公司和最火的开源项目,正在用真实的代码和产品,验证这张蓝图的每一个角落。

从OpenClaw的30万星标到CoPaw的模块化工作站,从Anthropic Agent Skills到OpenAI Agents SDK,从CLI通道的崛起到Agent Arena的普及——行业走向P3394预见的方向,不是巧合,而是因为这是Agent互操作的必然架构。

IEEE P3394工作组将于2026年3月20日召开月度会议,主题是“State of the Union”——梳理行业验证,加速标准发布。我们邀请所有关心Agent互操作未来的技术同仁,关注并参与P3394的工作。

The architecture is validated. Now it’s time to ship the standard.

架构已验证。是时候发布标准了。

— END —