一、核心理念:从“对话”到“执行”的范式转移
OpenClaw 定位为本地优先的AI执行框架,而非传统聊天助手。其核心哲学是让AI真正“动手”完成任务,并遵循安全默认、本地优先、极简核心、无额外应用、社区驱动五大原则。这种定位使其区别于LangChain等编排框架,更接近于一个可直接操作系统的“数字员工”。
核心设计哲学基于五个不可动摇的原则:
安全默认:所有功能默认采用最严格的安全配置
本地优先:核心功能完全在本地运行,无强制云端依赖
极简核心:核心网关保持轻量与稳定,扩展通过插件实现
无额外应用:用户可在日常通讯平台中直接使用
社区驱动:完全开源,由社区主导开发迭代
二、分层解耦的总体架构
采用经典的四层架构,实现交互、智能、执行、安全的完全分离:
交互接入层:支持50+通讯平台(微信、飞书、Telegram等)统一接入,实现“无额外APP”的体验。
智能核心层:基于ReAct范式的“大脑”,负责意图理解、任务规划与决策。
工具执行层:提供“手脚”能力,包括文件操作、Shell执行、浏览器自动化等。
安全与运维层:提供沙箱隔离、权限控制、审计日志等保障。
三、中心辐射式通信与工作流引擎
中心辐射式架构:以 Gateway网关(默认18789端口)为中枢,所有子系统通过标准化接口与之通信。这种设计实现了交互渠道、AI推理、任务执行、能力扩展的完全解耦,并支持多Agent配置(通过不同工作区隔离工作与生活场景)。
节点化工作流引擎:将复杂任务拆解为Start、LLM、Tool、Condition、Loop、End等独立节点,支持灵活的流程编排与状态管理。

四、Skills扩展系统:自然语言驱动的能力进化
这是OpenClaw最精妙的设计,彻底改变了AI扩展方式:
自然语言定义:每个Skill就是一个包含YAML元数据的 Markdown文件(
SKILL.md),用自然语言写操作指南,无需编程即可扩展能力。三级渐进式披露:解决传统工具加载的Token浪费问题。
一级:仅注入Skill名称+描述(约24 token/个),50个Skill仅占约1200 token。
二级:AI判断相关时,动态调用
read工具读取完整SKILL.md。三级:深度资源(脚本、参考文档)仅在执行子任务时按需加载。
AI自举能力:内置
skill-creator元技能,允许AI 自己编写新Skill,甚至通过观察用户工作流自动提炼模式,实现“自我进化”。热重载与可移植性:支持文件监听热更新;完全兼容 AgentSkills开放标准,Skill可在Claude Code、OpenAI Codex等十余个平台间复用。
五、安全设计的双刃剑
内置安全机制:默认沙箱隔离、权限最小化、Skill级密钥注入(通过配置注入,执行后自动清除)、支持操作二次确认。
严峻的安全挑战:已披露 CVE-2026-25253 等漏洞,社区技能市场(ClawHub)中被发现存在恶意Skill(约12%-20%),提示注入、供应链攻击、数据泄露风险已被多家安全机构确认。这导致部分高校禁用,也催生了企业级加固方案(如广州数科的人脸认证版Cclawd)。
总结:架构创新的本质
OpenClaw的架构突破在于:
将“工具调用”提升为“知识引导”:通过自然语言Skill代替函数签名,极大降低了扩展门槛。
工程化解决Token效率:渐进式披露在Agent场景中实现了能力与成本的优雅平衡。
个人计算的新范式:通过本地优先+多渠道接入,试图成为凌驾于应用之上的“影子管家”,而非又一个独立App。
其设计思想对构建可扩展的AI Agent系统具有重要参考价值——但同时也警示,能力越强,责任边界与安全隔离越需前置设计。
夜雨聆风