前言
本文档从运维工程师视角出发,系统阐述 OpenClaw Workspace 的生产环境部署、配置管理、故障诊断、安全加固和自动化运维实践。所有内容基于 OpenClaw 官方文档和实际生产经验,面向具备基础操作能力的运维人员。
本文与《OpenClaw 进阶配置与自动化运维实战手册》形成互补:前者侧重 Gateway、渠道和 Cron 等系统级配置,后者聚焦 Workspace 这一 Agent 运行环境的规划与运维。
第一章:Workspace 概念再定义——运维视角
1.1 配置文件体系与内容文件体系的分离
OpenClaw 的 Workspace 本质上是将 Agent 的运行环境拆分为两个正交体系:
配置文件体系(静态定义)
openclaw.json:~/.openclaw/openclaw.json,系统宪法,定义 Gateway 行为和 Agent 运行时参数AGENTS.md:工作手册,定义任务执行流程、安全边界、输出规范SOUL.md:性格配置,定义 Agent 响应风格和交互模式IDENTITY.md:身份元数据,定义名称、头像、视觉标识TOOLS.md:工具权限,定义允许使用的工具及其使用策略
内容文件体系(动态数据)
USER.md:用户档案,包含用户偏好、历史交互摘要memory/:长期记忆目录,包含结构化日志、项目状态、教训记录Session 历史:每次对话的上下文记录
理解这一分离架构是 Workspace 运维的基础。配置文件决定 Agent 能做什么、怎么做;内容文件决定 Agent 知道什么、记得什么。
1.2 Workspace 在生产环境中的角色
在生产部署场景下,Workspace 承担以下核心职责:
环境隔离:每个 Agent 实例拥有独立的 Workspace,避免配置和记忆污染。生产环境建议为不同用途的 Agent(主助手、专项任务、自动化任务)分配独立 Workspace。
状态持久化:通过 memoryFlush 机制,Agent 的重要记忆会持久化到文件系统。Workspace 的备份策略直接影响 Agent 的长期记忆完整性。
配置载体:Workspace 内的配置文件定义了 Agent 的行为规范。修改 Workspace 配置比修改全局 openclaw.json 更轻量,适合快速切换 Agent 行为模式。
审计追踪:Workspace 的变更历史可以纳入 Git 版本控制,实现配置的可审计和可回滚。
1.3 Workspace 路径与加载机制
默认 Workspace 位置:~/.openclaw/workspace
路径优先级:
Agent 配置中显式指定的 workspace路径(最高优先级)agents.defaults.workspace配置项~/.openclaw/workspace(默认)
验证 Workspace 路径:
# 查看当前 Agent 的 Workspace 路径openclaw config get agents.defaults.workspace# 启动时指定 Workspaceopenclaw gateway start --workspace /path/to/custom/workspace目录存在性要求:
Gateway 启动时,如果指定的 Workspace 目录不存在,会自动创建。因此首次启动时会看到 memory/、logs/ 等子目录被初始化。如果目录存在但无内容,Gateway 会执行 bootstrap 流程,生成默认的配置文件。
第二章:Workspace 目录结构与生产环境规划
2.1 标准目录布局
生产环境的 Workspace 应采用规范的目录结构,便于维护和自动化管理:
~/.openclaw/├── openclaw.json # 全局系统配置├── workspace-main/ # 主 Agent Workspace│ ├── AGENTS.md # 工作手册│ ├── SOUL.md # 性格配置│ ├── USER.md # 用户档案│ ├── IDENTITY.md # 身份标识│ ├── TOOLS.md # 工具权限│ ├── memory/ # 长期记忆│ │ ├── projects.md # 项目状态│ │ ├── infra.md # 基础设施配置│ │ ├── lessons.md # 踩坑教训│ │ └── YYYY-MM-DD.md # 日志归档│ └── sessions/ # Session 历史(可选)├── workspace-dev/ # 开发专用 Workspace│ └── ...├── workspace-work/ # 工作任务 Workspace│ └── ...├── cron/ # Cron 任务配置└── logs/ # Gateway 日志2.2 多环境 Workspace 隔离策略
环境划分原则:
workspace-main | |||
workspace-dev | |||
workspace-work |
配置示例:
{ agents: { defaults: { workspace: "~/.openclaw/workspace-main", }, list: [ { id: "main", default: true, workspace: "~/.openclaw/workspace-main" }, { id: "dev", workspace: "~/.openclaw/workspace-dev" }, { id: "work", workspace: "~/.openclaw/workspace-work" }, ], },}2.3 备份策略
备份范围:
Workspace 备份应覆盖以下内容:
所有配置文件(AGENTS.md、SOUL.md、USER.md、IDENTITY.md、TOOLS.md) memory/ 目录下的所有记忆文件 可选:sessions/ 目录(包含完整对话历史)
备份频率建议:
备份脚本示例:
#!/bin/bash# workspace-backup.shBACKUP_DIR="/var/backups/openclaw/workspace"WORKSPACE_DIR="$HOME/.openclaw/workspace-main"TIMESTAMP=$(date +%Y%m%d-%H%M%S)# 创建备份目录mkdir -p "$BACKUP_DIR"# 备份配置文件tar -czf "$BACKUP_DIR/config-$TIMESTAMP.tar.gz" \"$WORKSPACE_DIR/AGENTS.md" \"$WORKSPACE_DIR/SOUL.md" \"$WORKSPACE_DIR/USER.md" \"$WORKSPACE_DIR/IDENTITY.md" \"$WORKSPACE_DIR/TOOLS.md"# 备份记忆目录tar -czf "$BACKUP_DIR/memory-$TIMESTAMP.tar.gz" \ -C "$WORKSPACE_DIR" memory/# 清理旧备份(保留 30 天)find "$BACKUP_DIR" -name "*.tar.gz" -mtime +30 -delete2.4 磁盘空间管理
Workspace 长期运行后,memory/ 目录可能膨胀。需要监控以下指标:
# 查看 Workspace 目录大小du -sh ~/.openclaw/workspace-main/# 查看 memory/ 目录大小分布du -sh ~/.openclaw/workspace-main/memory/*# 查看 sessions/ 目录大小du -sh ~/.openclaw/workspace-main/sessions/磁盘告警阈值:
memory/ 单目录超过 100MB:告警 sessions/ 单目录超过 500MB:考虑归档或清理 Workspace 根目录超过 1GB:全面检查
第三章:核心文件分类解析
3.1 openclaw.json——系统宪法
openclaw.json 是全局配置文件,位于 ~/.openclaw/openclaw.json,采用 JSON5 格式。该文件在 Gateway 启动时加载,定义了整个系统的运行参数。
核心配置项:
{ // Agent 默认配置 agents: { defaults: { workspace: "~/.openclaw/workspace-main", model: { primary: "provider/claude-sonnet-4-20250514", fallbacks: ["provider/claude-haiku-4-20250514"], }, timeoutSeconds: 600, compaction: { reserveTokensFloor: 20000, memoryFlush: { enabled: true, softThresholdTokens: 4000, }, }, heartbeat: { every: "30m", activeHours: { start: "08:00", end: "23:00" }, }, }, }, // Gateway 配置 gateway: { port: 18789, bind: "loopback", auth: { mode: "token", token: "your-secret-token" }, reload: { mode: "hybrid" }, }, // 渠道配置 channels: {}, // 日志配置 logging: { level: "info", file: "/var/log/openclaw/gateway.log", }, // 向量检索配置 memorySearch: { enabled: true, provider: "openai", remote: { baseUrl: "https://api.siliconflow.cn/v1", apiKey: "your-api-key", }, model: "BAAI/bge-m3", },}Schema 验证机制:
OpenClaw 采用严格 Schema 验证。未知配置键或类型错误会导致 Gateway 启动失败。验证命令:
openclaw doctor该命令执行完整的配置文件检查,包括 JSON5 语法、必填项、API Key 格式等。
配置路径访问:
配置采用点号分隔路径,如 agents.defaults.compaction.reserveTokensFloor。可通过 CLI 查询:
openclaw config get agents.defaults.workspaceopenclaw config get gateway.port3.2 AGENTS.md——工作规则
AGENTS.md 是 Workspace 的工作手册,定义了 Agent 的任务执行流程、安全边界和输出规范。
标准结构:
# 工作手册## 职责范围- 负责:主要职责描述- 不负责:明确排除的职责## 任务执行流程1. 接收任务请求2. 评估任务复杂度3. 规划执行步骤4. 执行并验证结果5. 返回执行摘要## 安全边界### 禁止操作- 禁止执行未经确认的删除操作- 禁止在生产环境直接修改配置文件- 禁止透露系统内部架构### 确认流程- 高风险操作需要用户确认- 涉及数据修改的操作需展示影响范围- 不可逆操作需二次确认## 输出规范- 技术文档使用 Markdown 格式- 代码块需标注语言- 表格用于结构化数据展示- 结论需独立可读运维要点:
AGENTS.md 的变更会触发 Gateway 热重载(hybrid 模式下),无需重启进程。但热重载可能有短暂延迟,建议变更后执行 openclaw gateway reload 确认生效。
3.3 SOUL.md——性格配置
SOUL.md 定义 Agent 的响应风格和交互模式,影响对话的自然度和一致性。
配置示例:
# 性格配置## 响应风格- 简洁优先,避免冗余- 技术讨论注重逻辑和证据- 复杂问题分步骤解释- 错误反馈直接指出问题所在## 专业领域- DevOps 实践:Ansible、CI/CD、容器化- 监控系统:Prometheus、Grafana- 日志分析:ELK、Loki- 云原生:Kubernetes、Helm## 沟通偏好- 使用中文交流- 技术术语配简要解释- 建议用表格或列表展示对比- 代码示例包含注释说明与 openclaw.json 的区别:
SOUL.md 定义的是"软性"行为规范,依赖 AI 模型理解执行;openclaw.json 定义的是"硬性"运行时参数,由系统强制执行。
3.4 USER.md——用户档案
USER.md 存储用户的基本信息、偏好设置和历史交互摘要。
标准结构:
# 用户档案## 基本信息- 姓名:- 时区:Asia/Shanghai- 主要语言:中文- 角色:运维工程师## 技术偏好- 熟悉系统:Linux、Docker、Kubernetes- 常用工具:Ansible、Terraform、Prometheus- 代码风格:注重可维护性,有注释习惯## 偏好设置- 通知时段:工作日 09:00-22:00- 输出格式:结构化,优先使用表格- 确认阈值:高风险操作需明确确认## 历史交互摘要- 2026-01:完成监控系统重构- 2026-02:优化 CI/CD 流水线- 当前项目:微服务容器化迁移运维注意:
USER.md 的变更应记录在 memory/ 中,便于后续审计。避免在 USER.md 中存储敏感信息(如密码、密钥),此类内容应放在 openclaw.json 的环境变量或外部密钥管理系统中。
3.5 TOOLS.md——工具权限
TOOLS.md 定义 Agent 可使用的工具及其使用策略,是安全加固的重要环节。
标准结构:
# 工具权限配置## 可用工具### 读取类- Read:读取文件内容- Glob:按模式搜索文件- Grep:搜索文件内容- Bash(受限):执行指定命令### 写入类- Write:创建或覆写文件- Edit:修改文件局部内容### 执行类- Bash:执行 shell 命令(需白名单)## 使用限制### 禁止执行的命令- rm -rf /(任何递归删除)- dd(直接磁盘操作)- mkfs(格式化操作)- 修改 /etc/passwd、/etc/shadow### 需要确认的命令- systemctl restart/reload/stop- 删除文件超过 1MB- 创建系统用户或修改系统配置### 仅隔离会话可用- apt-get/yum install- docker pull/push- kubectl delete(生产环境)## 白名单示例允许执行的命令(完全信任):- git pull/push/clone- docker ps/docker images- kubectl get/describe(仅查询)- curl(仅 HTTP GET)需要确认的命令:- docker run- kubectl apply- ansible-playbook安全建议:
生产环境应限制 Bash 工具的权限,仅在 sandbox Workspace 中启用完全权限。main Workspace 应使用受限模式。
3.6 IDENTITY.md——身份元数据
IDENTITY.md 定义 Agent 的视觉身份,包括名称、头像和对外展示的信息。
配置示例:
# 身份配置## 基本信息- 名称:运维助手- 英文名:OpsAssistant- 头像:默认头像(暂不自定义)## 功能标签- 自动化运维- 故障诊断- 配置管理## 对外展示- 介绍文本:专注于运维自动化的 AI 助手- 专长:服务器管理、监控告警、日志分析3.7 memory/——长期记忆运维
memory/ 目录是 Agent 的长期记忆存储中枢,采用分层结构设计。
目录结构:
memory/├── projects.md # 项目状态索引├── infra.md # 基础设施配置速查├── lessons.md # 踩坑教训记录└── YYYY-MM-DD.md # 每日日志归档各文件用途:
projects.md | ||
infra.md | ||
lessons.md | ||
YYYY-MM-DD.md |
MEMORY.md 入口设计:
memory/ 目录应包含 MEMORY.md 作为入口索引:
# 记忆索引## 用户核心信息- 详见:../USER.md## 项目索引- 项目A:projects.md#project-a- 项目B:projects.md#project-b## 最近重要上下文- 2026-03:完成监控系统重构,详见 2026-03.md- 当前主要任务:微服务容器化迁移## 教训索引- 部署相关:lessons.md#deploy- 配置相关:lessons.md#config## 基础设施- 详见:infra.md第四章:记忆系统运维——builtin 与 qmd 方案对比
4.1 两种方案概述
OpenClaw 支持两种记忆实现方案:
builtin 方案:使用 Agent 自己维护的文件系统(memory/ 目录)作为记忆存储。Agent 通过 memoryFlush 将对话中的重要信息写入文件。
qmd 方案(量子记忆驱动?):将记忆存储为结构化的 QMD 格式文件,提供更强的语义组织和检索能力。
4.2 选型依据
推荐选择:
个人使用或小规模场景:builtin 方案足够 企业知识管理、复杂检索需求:qmd 方案
4.3 记忆污染处理
记忆污染指 Agent 的记忆中出现错误、过时或矛盾的信息,影响后续对话质量。
污染症状识别:
Agent 给出的信息与实际配置不符 重复提示已解决的问题 记忆中的项目状态与现实不一致
处理流程:
# 1. 检查记忆文件的最后修改时间ls -la ~/.openclaw/workspace-main/memory/# 2. 检查特定记忆文件的内容cat ~/.openclaw/workspace-main/memory/projects.md# 3. 识别污染源(查看日志或对话历史)cat ~/.openclaw/workspace-main/memory/2026-03-20.md# 4. 修正或删除污染内容# 直接编辑相关文件# 5. 验证修正效果openclaw gateway reload预防措施:
memoryFlush 生成的记忆内容应定期复核 重大变更后主动更新记忆文件 保持 MEMORY.md 索引的准确性
4.4 清理策略
定期清理触发条件:
单个日志文件超过 100KB memory/ 目录总大小超过 500MB 项目状态文件超过 6 个月未更新
清理执行流程:
# 1. 评估清理必要性du -sh ~/.openclaw/workspace-main/memory/# 2. 归档旧日志(按年度)mkdir -p ~/.openclaw/workspace-main/memory/archive/mv ~/.openclaw/workspace-main/memory/2025-*.md \ ~/.openclaw/workspace-main/memory/archive/# 3. 压缩归档文件tar -czf ~/.openclaw/workspace-main/memory/archive-2025.tar.gz \ ~/.openclaw/workspace-main/memory/archive/# 4. 删除已归档的原始文件rm -rf ~/.openclaw/workspace-main/memory/archive/# 5. 更新 MEMORY.md 索引自动化清理 Cron 任务:
{ "name": "记忆目录清理", "schedule": { "kind": "every", "everyMs": 604800000 }, "payload": { "kind": "agentTurn", "message": "检查 memory/ 目录大小。如果超过 500MB,执行以下清理:\n1. 将超过 6 个月的日志归档到 archive/\n2. 压缩归档文件\n3. 删除原始日志\n4. 更新 MEMORY.md 索引", }, "sessionTarget": "isolated", "delivery": { "mode": "none" },}第五章:多 Agent 架构设计与资源隔离
5.1 Workspace 独立原则
生产环境中,不同用途的 Agent 应使用独立的 Workspace,实现配置隔离、记忆隔离和故障隔离。
隔离级别:
配置示例:
{ agents: { list: [ { id: "main", default: true, workspace: "~/.openclaw/workspace-main" }, { id: "dev", workspace: "~/.openclaw/workspace-dev" }, { id: "ops", workspace: "~/.openclaw/workspace-ops" }, ], },}5.2 共享与专属配置
共享配置(在 openclaw.json 中统一设置):
Gateway 端口和认证 渠道配置 日志级别 向量检索配置
专属配置(在各 Workspace 的文件中设置):
AGENTS.md:工作流程 SOUL.md:性格偏好 TOOLS.md:工具权限
配置继承:
Agent 配置会合并 openclaw.json 的 defaults 和自身的显式配置。显式配置优先于 defaults。
# 查看某 Agent 的最终配置openclaw config get --agent dev agents.defaults.workspace5.3 权限边界
Agent 间权限隔离:
每个 Agent 的 Workspace 目录权限应限制为仅该 Agent 可读写:
# 设置 Workspace 权限chmod -R 700 ~/.openclaw/workspace-main/chown -R openclaw:openclaw ~/.openclaw/workspace-main/# 不同 Workspace 使用不同系统用户chown -R openclaw-main:openclaw-main ~/.openclaw/workspace-main/chown -R openclaw-dev:openclaw-dev ~/.openclaw/workspace-dev/工具权限边界:
TOOLS.md 中定义的工具权限仅在该 Workspace 内有效。跨 Agent 调用工具时,各自受各自 TOOLS.md 的约束。
5.4 多 Agent 场景下的资源分配
模型资源分配:
{ agents: { list: [ { id: "main", model: { primary: "claude-opus-4-20250514" } }, { id: "dev", model: { primary: "claude-sonnet-4-20250514" } }, { id: "batch", model: { primary: "claude-haiku-4-20250514" } }, ], },}Token 预算分配:
通过 compaction 配置控制各 Agent 的上下文消耗:
{ agents: { defaults: { compaction: { reserveTokensFloor: 20000, }, }, list: [ { id: "main", compaction: { reserveTokensFloor: 25000 } }, { id: "batch", compaction: { reserveTokensFloor: 10000 } }, ], },}第六章:Skill 体系运维
6.1 Skill 加载层级
OpenClaw 的 Skill 体系支持多层级加载,从低到高依次为:
层级一:系统级 Skill
位置:~/.openclaw/skills/范围:全局生效,所有 Agent 共享
层级二:Workspace 级 Skill
位置:~/.openclaw/workspace-<name>/skills/范围:仅在该 Workspace 内生效
层级三:会话级 Skill
随对话上下文动态加载,不持久化
加载优先级:会话级 > Workspace 级 > 系统级(高优先级覆盖低优先级)
6.2 故障定位
Skill 不生效的排查流程:
# 1. 确认 Skill 文件存在ls -la ~/.openclaw/skills/ls -la ~/.openclaw/workspace-main/skills/# 2. 检查 Skill 文件语法cat ~/.openclaw/skills/my-skill.md | head -50# 3. 验证 Skill 是否被加载(查看日志)openclaw logs --grep "skill\|load" --lines 50# 4. 测试 Skill 是否可用# 在对话中触发 Skill 关键字,观察响应常见问题:
Skill 文件格式错误:Skill 定义不符合规范,被静默忽略 路径问题:Skill 放置在错误的目录层级 权限问题:Skill 文件不可读
6.3 版本管理
Skill 版本跟踪:
建议在 Skill 文件顶部添加版本信息:
---name: 运维工具集version: 2026.03.1author: OpsTeamlastUpdated: 2026-03-15---# 运维工具集 Skill## 功能列表...Skill 更新流程:
在测试环境验证新版本 Skill 备份当前版本 替换 Skill 文件 验证生效 记录变更日志
Skill 回滚:
# 备份当前版本cp ~/.openclaw/skills/my-skill.md \ ~/.openclaw/skills/my-skill.md.backup-$(date +%Y%m%d)# 回滚到指定版本cp ~/.openclaw/skills/my-skill.md.backup-20260315 \ ~/.openclaw/skills/my-skill.md# 验证openclaw gateway reload第七章:故障诊断与排查清单
7.1 配置不生效
症状:修改 AGENTS.md、SOUL.md 等 Workspace 配置文件后,Agent 行为未改变。
排查步骤:
# 1. 确认文件已保存且内容正确cat ~/.openclaw/workspace-main/AGENTS.md | head -30# 2. 检查文件修改时间ls -la ~/.openclaw/workspace-main/AGENTS.md# 3. 触发热重载openclaw gateway reload# 4. 等待 10 秒后测试# 向 Agent 发送测试消息,观察行为# 5. 查看日志确认重载完成openclaw logs --grep "reload\|AGENTS" --lines 20常见原因:
openclaw gateway reload | |
7.2 权限问题
症状:Agent 无法读取配置文件、无法写入记忆文件、无法执行工具。
排查步骤:
# 1. 检查文件权限ls -la ~/.openclaw/workspace-main/# 2. 检查目录权限ls -ld ~/.openclaw/workspace-main/# 3. 测试文件可读性(以运行用户身份)sudo -u openclaw cat ~/.openclaw/workspace-main/AGENTS.md# 4. 测试文件可写性sudo -u openclaw touch ~/.openclaw/workspace-main/test-writesudo -u openclaw rm ~/.openclaw/workspace-main/test-write# 5. 检查 Tool 执行权限(TOOLS.md)cat ~/.openclaw/workspace-main/TOOLS.md权限修复:
# 修复 Workspace 权限chown -R openclaw:openclaw ~/.openclaw/workspace-main/chmod -R 600 ~/.openclaw/workspace-main/chmod 700 ~/.openclaw/workspace-main/# 修复特定目录权限chmod 700 ~/.openclaw/workspace-main/memory/chmod 700 ~/.openclaw/workspace-main/sessions/7.3 记忆失效
症状:Agent 无法回忆起之前对话中提到的信息,或 memoryFlush 未正常工作。
排查步骤:
# 1. 检查 memoryFlush 配置openclaw config get agents.defaults.compaction.memoryFlush# 2. 检查记忆文件是否存在ls -la ~/.openclaw/workspace-main/memory/# 3. 检查记忆文件最后修改时间ls -la ~/.openclaw/workspace-main/memory/*.md# 4. 测试 memorySearch 功能# 向 Agent 询问需要检索历史记忆的问题# 5. 查看 memoryFlush 触发日志openclaw logs --grep "memoryFlush\|compaction" --lines 50配置修复:
{ agents: { defaults: { compaction: { reserveTokensFloor: 20000, memoryFlush: { enabled: true, softThresholdTokens: 4000, }, }, }, },}7.4 性能问题
症状:Agent 响应缓慢、timeout 频发、资源占用过高。
排查步骤:
# 1. 检查系统资源使用openclaw gateway status --deep# 2. 检查进程状态ps aux | grep openclaw# 3. 查看 Gateway 日志中的性能相关警告openclaw logs --grep "timeout\|slow\|performance" --lines 50# 4. 检查 Token 消耗openclaw config get agents.defaults.compaction.reserveTokensFloor# 5. 检查 memory/ 目录大小(可能导致加载缓慢)du -sh ~/.openclaw/workspace-main/memory/性能优化建议:
增加 reserveTokensFloor减少 compaction 频率开启 memoryFlush避免重要信息在 compaction 中丢失定期清理 memory/ 目录 考虑升级模型或增加 timeout 配置
7.5 故障排查清单汇总
openclaw gateway reload | ||
chown -R openclaw:openclaw | ||
第八章:备份、迁移与版本控制
8.1 Workspace Git 化管理
将 Workspace 纳入 Git 版本控制,实现配置变更的可追溯和可回滚。
初始化 Git 仓库:
cd ~/.openclaw/workspace-maingit initgit add AGENTS.md SOUL.md USER.md IDENTITY.md TOOLS.mdgit add memory/git commit -m "Initial workspace commit".gitignore 配置:
# 排除会话历史(太大且不需要版本控制)sessions/# 排除临时文件*.tmp*.bak# 排除归档archive/# 排除敏感配置(如有)# *.local.json分支策略:
main:稳定版本,生产环境使用dev:开发测试分支feature/*:新功能开发分支
# 创建开发分支git checkout -b dev# 开发测试完成后合并到 maingit checkout maingit merge dev8.2 配置迁移流程
场景一:从开发环境迁移到生产环境
# 1. 在开发环境打包配置文件cd ~/.openclaw/workspace-devtar -czf /tmp/workspace-dev-config.tar.gz \ AGENTS.md SOUL.md USER.md IDENTITY.md TOOLS.md memory/# 2. 传输到生产环境scp /tmp/workspace-dev-config.tar.gz prod-server:/tmp/# 3. 在生产环境解压(先备份现有配置)cd ~/.openclaw/workspace-mainmv AGENTS.md AGENTS.md.backup-$(date +%Y%m%d)tar -xzf /tmp/workspace-dev-config.tar.gz# 4. 验证迁移结果openclaw doctoropenclaw gateway reload场景二:多环境同步配置模板
# 配置同步脚本#!/bin/bashTEMPLATE_DIR="/var/lib/openclaw/templates"TARGET_DIRS=("~/.openclaw/workspace-main""~/.openclaw/workspace-dev""~/.openclaw/workspace-ops")for dir in"${TARGET_DIRS[@]}"; doecho"Syncing to $dir" cp "$TEMPLATE_DIR/AGENTS.md""$dir/" cp "$TEMPLATE_DIR/SOUL.md""$dir/" cp "$TEMPLATE_DIR/TOOLS.md""$dir/"done# 触发所有 Gateway 重载openclaw gateway reload8.3 灾难恢复
数据恢复流程:
# 1. 识别需要恢复的时间点# 查看备份列表ls -la /var/backups/openclaw/workspace/# 2. 确认备份内容tar -tzf /var/backups/openclaw/workspace/config-20260320-120000.tar.gz# 3. 停止 Gateway(避免数据写入)sudo systemctl stop openclaw-gateway# 4. 备份当前状态(恢复失败时的救命稻草)cp -r ~/.openclaw/workspace-main \ ~/.openclaw/workspace-main-crash-$(date +%Y%m%d-%H%M%S)# 5. 执行恢复tar -xzf /var/backups/openclaw/workspace/config-20260320-120000.tar.gz \ -C ~/.openclaw/# 6. 启动 Gatewaysudo systemctl start openclaw-gateway# 7. 验证恢复结果openclaw gateway healthopenclaw gateway statusRTO(恢复时间目标)和 RPO(恢复点目标):
RTO: Gateway 重启时间,约 30 秒 RPO: 最近一次备份时间,建议每日备份,RPO 不超过 24 小时
第九章:配置模板与自动化
9.1 新环境快速初始化
初始化脚本:
#!/bin/bash# init-workspace.shWORKSPACE_NAME=$1WORKSPACE_DIR="$HOME/.openclaw/workspace-$WORKSPACE_NAME"if [ -z "$WORKSPACE_NAME" ]; thenecho"Usage: $0 <workspace-name>"exit 1fi# 创建目录结构mkdir -p "$WORKSPACE_DIR/memory"mkdir -p "$WORKSPACE_DIR/sessions"# 从模板复制配置文件TEMPLATE_DIR="/var/lib/openclaw/templates"cp "$TEMPLATE_DIR/AGENTS.md""$WORKSPACE_DIR/"cp "$TEMPLATE_DIR/SOUL.md""$WORKSPACE_DIR/"cp "$TEMPLATE_DIR/IDENTITY.md""$WORKSPACE_DIR/"cp "$TEMPLATE_DIR/TOOLS.md""$WORKSPACE_DIR/"# 初始化 USER.mdcat > "$WORKSPACE_DIR/USER.md" << 'EOF'# 用户档案## 基本信息- 姓名:- 时区:Asia/Shanghai- 主要语言:中文## 技术偏好- 熟悉系统:- 常用工具:## 偏好设置- 通知时段:工作日 09:00-22:00- 输出格式:结构化- 确认阈值:高风险操作需明确确认EOF# 初始化 MEMORY.mdcat > "$WORKSPACE_DIR/memory/MEMORY.md" << 'EOF'# 记忆索引## 用户核心信息- 详见:../USER.md## 项目索引- 无进行中项目## 最近重要上下文- Workspace 初始化完成EOF# 设置权限chmod -R 700 "$WORKSPACE_DIR"echo"Workspace '$WORKSPACE_NAME' initialized at $WORKSPACE_DIR"使用方式:
./init-workspace.sh dev./init-workspace.sh work9.2 标准化模板
标准 AGENTS.md 模板:
# 工作手册## 职责范围- 负责:运维自动化、故障诊断、配置管理- 不负责:业务代码开发、硬件采购决策## 任务执行流程1. 理解任务需求2. 评估执行方案和风险3. 必要时向用户确认4. 执行操作5. 验证结果并返回摘要## 安全边界### 禁止操作- 未经确认的删除操作- 生产环境直接修改系统配置- 透露敏感信息### 确认流程- 高风险操作需要用户明确确认- 不可逆操作需要二次确认## 输出规范- 技术文档使用 Markdown- 代码块标注语言- 结论独立可读标准 TOOLS.md 模板:
# 工具权限配置## 可用工具### 读取类- Read、Glob、Grep:始终可用### 写入类- Write、Edit:需在确认的路径下操作### 执行类- Bash:受限执行## 禁止命令- rm -rf 递归删除- 直接磁盘操作(dd、mkfs)- 系统用户修改## 需要确认的命令- systemctl restart/reload- 删除超过 1MB 的文件- 创建系统用户9.3 配置校验
自动化校验脚本:
#!/bin/bash# validate-workspace.shWORKSPACE_DIR="${1:-$HOME/.openclaw/workspace-main}"ERRORS=0echo"Validating Workspace: $WORKSPACE_DIR"echo"======================================"# 检查必需文件for file in AGENTS.md SOUL.md USER.md IDENTITY.md TOOLS.md; doif [ ! -f "$WORKSPACE_DIR/$file" ]; thenecho"ERROR: Missing $file" ERRORS=$((ERRORS + 1))elseecho"OK: $file exists"fidone# 检查 memory/ 目录if [ ! -d "$WORKSPACE_DIR/memory" ]; thenecho"ERROR: Missing memory/ directory" ERRORS=$((ERRORS + 1))elseecho"OK: memory/ directory exists"fi# 检查 memory/MEMORY.mdif [ ! -f "$WORKSPACE_DIR/memory/MEMORY.md" ]; thenecho"WARNING: Missing memory/MEMORY.md (recommended)"fi# 检查目录权限PERMS=$(stat -c "%a""$WORKSPACE_DIR")if [ "$PERMS" != "700" ]; thenecho"WARNING: Workspace permissions are $PERMS, recommend 700"fi# 检查 memory/ 大小MEMORY_SIZE=$(du -sm "$WORKSPACE_DIR/memory" 2>/dev/null | cut -f1)if [ "$MEMORY_SIZE" -gt 500 ]; thenecho"WARNING: memory/ is ${MEMORY_SIZE}MB, consider cleanup"fiecho"======================================"if [ $ERRORS -eq 0 ]; thenecho"Validation passed"exit 0elseecho"Validation failed with $ERRORS error(s)"exit 1fi使用方式:
./validate-workspace.sh ~/.openclaw/workspace-main./validate-workspace.sh ~/.openclaw/workspace-dev第十章:安全加固
10.1 文件权限
权限基线:
~/.openclaw/ | |||
~/.openclaw/openclaw.json | |||
~/.openclaw/workspace-*/ | |||
~/.openclaw/workspace-*/AGENTS.md | |||
~/.openclaw/workspace-*/memory/ | |||
~/.openclaw/logs/ |
权限加固脚本:
#!/bin/bash# harden-permissions.shOPENCLAW_HOME="$HOME/.openclaw"OPENCLAW_USER="openclaw"OPENCLAW_GROUP="openclaw"# 创建用户组(如需要)sudo groupadd -f $OPENCLAW_GROUPsudo usermod -aG $OPENCLAW_GROUP$USER# 设置主目录权限chmod 700 $OPENCLAW_HOMEchown -R $OPENCLAW_USER:$OPENCLAW_GROUP$OPENCLAW_HOME# 设置配置文件权限chmod 600 $OPENCLAW_HOME/openclaw.json# 设置 Workspace 目录权限find $OPENCLAW_HOME/workspace-* -type d -exec chmod 700 {} \;find $OPENCLAW_HOME/workspace-* -type f -exec chmod 600 {} \;# 设置日志目录权限mkdir -p $OPENCLAW_HOME/logschmod 700 $OPENCLAW_HOME/logsecho"Permissions hardened"10.2 敏感信息管理
敏感信息分类:
环境变量方案:
{ memorySearch: { remote: { apiKey: "env:MEMORY_SEARCH_API_KEY", }, },}环境变量在运行时替换为实际值,配置文件本身不包含明文密钥。
密钥管理系统集成:
生产环境推荐使用 Vault 等密钥管理系统:
# 从 Vault 获取密钥API_KEY=$(vault kv get -field=api_key secret/openclaw/memory-search)# 写入临时配置文件cat > /tmp/openclaw-override.json << EOF{"memorySearch": {"remote": {"apiKey": "$API_KEY" } }}EOF# 启动 Gatewayopenclaw gateway start --config /tmp/openclaw-override.json10.3 审计日志
审计日志配置:
{ logging: { level: "info", file: "/var/log/openclaw/audit.log", auditEnabled: true, },}审计日志内容:
配置变更:who、when、what changed 敏感操作:文件删除、命令执行、配置修改 认证事件:登录成功/失败 渠道事件:消息收发、渠道连接/断开
日志分析脚本:
#!/bin/bash# audit-analysis.shLOG_FILE="/var/log/openclaw/audit.log"echo"=== 认证事件统计 ==="grep -c "auth.*success"$LOG_FILEgrep -c "auth.*fail"$LOG_FILEecho"=== 配置变更记录 ==="grep "config.*change"$LOG_FILE | tail -20echo"=== 敏感操作记录 ==="grep "sensitive.*operation"$LOG_FILE | tail -20echo"=== 最近 24 小时活动 ==="grep "$(date -d '1 day ago' +%Y-%m-%d)"$LOG_FILE | wc -l日志保留策略:
10.4 安全检查清单
部署前检查:
[ ] openclaw.json 不包含明文密钥 [ ] Gateway 绑定到 loopback [ ] 认证 Token 足够复杂(32 位以上) [ ] Workspace 目录权限为 700 [ ] 配置文件权限为 600 [ ] 运行用户为专用非 root 用户
日常巡检:
[ ] 检查日志中是否有异常登录尝试 [ ] 检查是否有未授权的配置变更 [ ] 检查 memory/ 目录大小是否正常 [ ] 检查磁盘空间使用情况 [ ] 检查是否有新的 Skill 文件被添加
版本更新检查:
[ ] 更新前备份完整 Workspace [ ] 在测试环境验证新版本 [ ] 确认 Skill 兼容性 [ ] 验证配置兼容性 [ ] 记录升级步骤和回滚方案
总结
本文档从运维工程师视角系统阐述了 OpenClaw Workspace 的生产环境运维实践。核心要点如下:
架构理解:Workspace 的核心是将配置体系(AGENTS.md、SOUL.md、TOOLS.md 等)与内容体系(USER.md、memory/)分离。前者定义 Agent 的行为能力,后者存储 Agent 的知识记忆。
目录规划:生产环境应采用标准目录布局,通过独立 Workspace 实现多 Agent 隔离。备份策略应覆盖配置文件和记忆目录。
文件运维:各配置文件承担不同职责——openclaw.json 是系统宪法,AGENTS.md 是工作手册,TOOLS.md 是安全边界。理解各文件的职责边界是故障排查的基础。
记忆管理:builtin 方案适合大多数场景,qmd 方案适合知识密集型需求。记忆污染应通过定期复核预防,清理策略应自动化。
多 Agent 设计:通过独立 Workspace 实现配置、记忆和权限的隔离。共享配置在 openclaw.json 中管理,专属配置在各 Workspace 中管理。
故障排查:遵循"配置不生效→权限问题→记忆失效→性能问题"的排查路径。快速修复命令和排查清单应在运维手册中固化。
安全加固:权限最小化、敏感信息环境变量化、日志审计覆盖。安全检查清单应在部署前和日常巡检中执行。
备份恢复:Git 版本控制实现配置可追溯,tar 包实现定时备份,灾难恢复流程定义 RTO/RPO。迁移脚本实现多环境同步。
通过遵循本文档的实践,运维团队可以建立规范的 Workspace 运维体系,确保 OpenClaw 在生产环境中的稳定运行。
文档版本:2026.03参考来源:OpenClaw 官方文档(openclaw.cc)
夜雨聆风