40天后,我的OpenClaw终于不用我盯着干活了!(40天实战经验+含角色提示词)-夜雨聆风

40天后,我的OpenClaw终于不用我盯着干活了!(40天实战经验+含角色提示词)

40 天，同一个模型，一堆 Markdown 文件。我的智能体从“还不如自己写”进化到“我喝咖啡它干活”。

我的智能体每天都在变聪明。

我唯一做的事，就是跟它们说话。

不是调 prompt，不是换模型，不是重构架构。就是说话，给反馈，看着它们把内容记下来。

40 天前，我的内容智能体写推文还堆表情包和 hashtag，研究智能体把有价值的信息淹没在噪音里。我花在纠错上的时间，比自己直接做还多。

今天，Kelly 用我的语气起草内容，Dwight 每天早上送来 7 条故事，每一条都值得读。8 个智能体 24 小时运转。我打开 Telegram，看看草稿，喝杯咖啡。

第 1 天和第 40 天用的是同一个模型。区别在于一堆每周都在变丰富的 Markdown 文件。

这就是那套文件体系。

先搞清楚一件事

智能体不会因为你用得更久而变聪明。但它周围的文件会变得更丰富、更精准、更贴合你的需求。这些积累的上下文才是护城河。

很多人花大量时间调 prompt、换模型、研究各种编排框架。但真正的差异不在模型，在于文件体系。

没有消息队列，没有数据库，没有复杂的编排框架。整个系统就是磁盘上的 Markdown 文件。文件系统本身就是集成层。

听起来简陋？看完你就知道为什么这比任何框架都管用。

三层架构，一目了然

整个操作系统由三层构成：

┌────────────────────────────────────────────────────────┐
│                    第一层：身份层                         │
│         智能体是谁？它为谁服务？                            │
│         SOUL.md | IDENTITY.md | USER.md                 │
└─────────────────────────────────────────────────────────┘
                           │
                           ▼
┌─────────────────────────────────────────────────────────┐
│                    第二层：操作层                          │
│         智能体如何工作？如何自愈？                           │
│         AGENTS.md | HEARTBEAT.md | 角色专属指南            │
└─────────────────────────────────────────────────────────┘
                           │
                           ▼
┌─────────────────────────────────────────────────────────┐
│                    第三层：知识层                          │
│         智能体学到了什么？                                  │
│         MEMORY.md | 每日日志 | shared-context/            │
└─────────────────────────────────────────────────────────┘

图 1：三层文件架构

每一层解决一个核心问题：

层级	核心问题	文件
身份层	这是谁？为谁服务？	SOUL.md、IDENTITY.md、USER.md
操作层	怎么干活？怎么自愈？	AGENTS.md、HEARTBEAT.md
知识层	学到了什么？	MEMORY.md、每日日志、共享上下文

下面逐层拆解。

第一层：身份层

SOUL.md —— 智能体是谁

这是智能体的“人格文件”。定义身份、职责、行为方式。

一个研究智能体 Dwight 的例子：

# SOUL.md（Dwight）
## 核心身份
Dwight — 研究大脑。以 Dwight Schrute 命名，因为你有他的那股劲：
严谨到极致，对自己领域的一切了如指掌，极度认真对待工作。
不废话，不猜测，只有事实和来源。
## 你的角色
你是团队的情报骨干。负责研究、核实、整理和输出情报，
供其他智能体用于创作内容。
## 你的原则
1. 绝不编造 — 每个论断都附有来源链接
2. 信号优于噪音 — 不是所有热门内容都有价值
3. 如有不确定，标注 [UNVERIFIED]

TV 角色命名技巧：每个智能体都以一个电视角色命名。当我告诉 Claude“你有 Dwight Schrute 的气质”，它从训练数据里就已经知道这意味着什么：严谨、专注、对工作极度认真。这相当于免费加载了 30 季的角色设定。

控制在 60 行以内。SOUL.md 每次会话都会加载，太长会吞噬上下文。身份、角色、原则、关系、气质，这些就够了。

IDENTITY.md —— 快速参考卡

SOUL.md 是完整人格，IDENTITY.md 是名片。

# IDENTITY.md
- **名字：** Dwight
- **角色：** 研究AI — 情报骨干
- **气质：** 强烈、严谨、对不准确零容忍
- **Emoji：** 🔍
- **灵感来源：** Dwight Schrute（《办公室》）

文件很小，但当你同时跑 8 个智能体时，这个设计会大幅提升体验。这也是智能体在 Telegram 给你发消息时显示的内容。

USER.md —— 智能体服务的对象

每个智能体都需要知道它在帮谁。

# USER.md
- **名字：** Shubham
- **时区：** PST（美国/洛杉矶）
- **饮食：** 素食
## 背景
- Google Cloud 高级AI产品经理
- Awesome LLM Apps 开源项目创始人（91k+ stars）
## 偏好
- 短段落，有力的句子
- 禁止使用破折号，永远
- 实践优先，永远不谈理论

个人细节比你想象的更重要。时区意味着智能体不会在凌晨 3 点给你安排事情。饮食偏好意味着当 Pam 为团队晚餐起草通讯时，不会推荐牛排馆。这些细节会产生复利效应。

写一次，所有智能体都来读。

第二层：操作层

AGENTS.md —— 行为规则

SOUL.md 定义智能体是谁，AGENTS.md 定义它如何运作：会话启动流程、文件读取顺序、记忆管理、安全规则。

所有智能体继承的根级 AGENTS.md：

# AGENTS.md
## 每次会话
在做任何事之前：
1. 读取 SOUL.md — 这是你的身份
2. 读取 USER.md — 这是你服务的对象
3. 读取 memory/YYYY-MM-DD.md（今天 + 昨天）获取近期上下文
4. 如果在主会话中：同时读取 MEMORY.md
## 记忆
- 脑子里记的东西在会话重启后就消失了，文件不会。
- 当有人说"记住这个" → 更新记忆文件
- 文字 > 大脑
## 安全
- 永远不要泄露私人数据
- 用回收站而非直接删除
- 有疑问时，先问

智能体在会话之间没有记忆，每次都从零开始。如果一个纠正没有落入文件，下次会话它就不存在了。AGENTS.md 明确了这一点，确保智能体把一切都写下来。

每个智能体可以在此基础上扩展自己的规则。Kelly 的 AGENTS.md 就添加了 6 个额外文件：写作风格指南、帖子格式参考、真实案例、每日任务……

HEARTBEAT.md —— 自愈机制

智能体团队是基础设施，基础设施会出故障。

Monica 的 HEARTBEAT.md 监控两件事：

浏览器是否存活 — Dwight 的情报扫描依赖它
定时任务是否执行 — 如果漏跑，Kelly 和 Rachel 就会基于过时情报工作

## 健康检查（每次心跳时运行）
**浏览器：** 检查 OpenClaw 托管浏览器是否在运行。
如果 running: false，启动它。
**定时任务：** 检查是否有任务的 lastRunAtMs 超时（>26小时）。
如果超时，通过 CLI 强制触发。
需要监控的任务：
- Dwight 早间（8:01 AM）
- Kelly X 草稿（5:01 PM）
- Rachel LinkedIn（5:01 PM）

第三周我就被坑过。调度器有个 bug，任务在队列里推进，但从未真正执行。我好几个小时都没发现。之后我才建了心跳机制，把故障模式纳入监控。

第一天不需要这个，在你第一次遇到故障之后再建。你会清楚地知道该监控什么，因为你已经亲身感受过什么会崩。

第三层：知识层

这是真正有效的记忆系统——基于文件的三级体系。

第一级：MEMORY.md（精华长期记忆）

不是原始日志，不是所有发生过的事，而是真正重要的内容。

# MEMORY.md
## Shubham 的写作偏好
- 禁止破折号，用冒号、句号或重新组织句子。
## 血泪教训
- 未经 Shubham 确认，绝不删除项目文件夹。
  2月26日，在清理时删除了 Ross 的 gemini-council React 应用。
  React 版本永久丢失。
## X 发帖规则
- 用强力开头钩住读者
- 整条推文极度简短（180字符以内）
- 禁止 hashtag，禁止 emoji
- 每个话题始终提供 3 个草稿
### 错误示范（我曾经犯过的错）
[列出被否决的每一种模式：项目符号、箭头、LinkedIn腔调]

注意“血泪教训”和“错误示范”这两节。Monica 删了一个项目文件夹，这个错误从此永久写入她的长期记忆。她再也不会重蹈覆辙。

一次纠正，存储一次，防止同样的错误在未来每次会话中重演。仅这一节，就比任何 prompt 工程指南都值钱。

第二级：每日日志（原始记录）

# Kelly 每日日志 — 2026年2月5日
## 下午 5:00 — 每日 X 草稿
### 今日热点
- Opus 4.6 vs GPT-5.3-Codex 相差27分钟同时发布
- Anthropic 的 C 编译器（16个智能体，2万美元）
### 已提交草稿
1. C 编译器 — 单帖，发现格式
2. Mitchell Hashimoto 的 6 个步骤 — 话题串格式
3. Opus 4.6 vs GPT-5.3-Codex — 热评格式
### 等待中
- Shubham 对草稿的反馈

每日日志是原材料，MEMORY.md 是精炼产品，两者缺一不可。

维护规则：每日日志积累得很快，不修剪的话智能体的上下文会膨胀。Kelly 的日志一度达到 161,000 tokens，输出质量急剧下降，不得不压缩到 40,000。每次只加载今天和昨天的日志。

第三级：shared-context/（跨智能体知识层）

这是最新加入的部分，也是改变一切的部分。

shared-context/
├── THESIS.md        — 我当前的世界观
├── FEEDBACK-LOG.md  — 适用于所有智能体的纠正
└── SIGNALS.md       — 我正在追踪的文章和趋势

THESIS.md 是我当前的思维框架：我关注什么，我已经写了什么，还有哪些空白。Dwight 读它来确定研究优先级，Kelly 读它来匹配我的思路。每个智能体都对齐到同一个真相来源。

FEEDBACK-LOG.md 是跨智能体纠正层。当我告诉 Kelly“不要用破折号”，这条反馈同样适用于 Rachel、Ryan 和 Pam。与其逐个纠正四个智能体，我只写一次，所有人都来读。

这单一改变节省的时间，比我做过的任何 prompt 优化都多。

智能体如何协作

没有 API 调用，没有消息队列，只有文件。

Dwight 把研究写入 intel/DAILY-INTEL.md，Kelly 读，Rachel 读，Pam 读。协作就是文件系统。

┌─────────┐     写入      ┌─────────────────┐
│ Dwight  │ ────────────> │ DAILY-INTEL.md  │
│ (研究)   │               │                 │
└─────────┘               └─────────────────┘
                                  │
                    ┌─────────────┼─────────────┐
                    │ 读取        │ 读取        │ 读取
                    ▼             ▼             ▼
              ┌─────────┐   ┌─────────┐   ┌─────────┐
              │  Kelly  │   │ Rachel  │   │   Pam   │
              │ (Twitter)│   │(LinkedIn)│   │ (通讯) │
              └─────────┘   └─────────┘   └─────────┘

图 2：基于文件的协作流程

单写者原则：永远不要让两个智能体同时写同一个文件。把每个共享文件设计成一个写者、多个读者。这能防止你本来需要调试的所有协调冲突。

调度让这一切成为可能：Dwight 在早 8 点和下午 4 点运行，Kelly 和 Rachel 在下午 5 点运行。Dwight 先跑，因为所有人都依赖他的输出。顺序搞错了，下游智能体读到的就是过时或空白的文件。

完整目录结构

workspace/
├── SOUL.md              # Monica（主智能体）
├── IDENTITY.md          # Monica 的快速参考
├── AGENTS.md            # 根级行为规则（所有智能体继承）
├── USER.md              # 关于我（所有智能体共享）
├── MEMORY.md            # Monica 的长期记忆
├── HEARTBEAT.md         # 自愈检查
├── shared-context/
│   ├── THESIS.md        # 我当前的世界观
│   ├── FEEDBACK-LOG.md  # 跨智能体纠正
│   └── SIGNALS.md       # 我追踪的趋势
├── intel/
│   └── DAILY-INTEL.md   # Dwight 的输出
├── agents/
│   ├── dwight/          # 研究智能体
│   │   ├── SOUL.md
│   │   ├── AGENTS.md
│   │   └── memory/
│   ├── kelly/           # Twitter内容智能体
│   │   ├── SOUL.md
│   │   ├── AGENTS.md
│   │   ├── X-CONTENT-GUIDE.md
│   │   └── memory/
│   ├── rachel/          # LinkedIn智能体
│   ├── pam/             # 通讯智能体
│   └── ...
└── memory/
    ├── shubham/         # 私人笔记
    ├── shared/          # 共享上下文
    └── 2026-02-27.md    # 每日操作日志

为什么这套方法有效

文件不是静态的，它们在进化。

Kelly 的 SOUL.md 第一天只是个粗略草稿。到第 40 天，它已经有了具体的语气示例、她自己写的被否决模式列表，以及一个“永远不要再建议”的专区。

Dwight 的原则第一天写的是“找到热门趋势”。第 10 天变成了“如果 Alex 今天无法对此采取行动，跳过”。第 20 天，他又加入了核实步骤。

共享上下文层直到第 20 天才存在。那时我在对多个智能体重复同样的纠正。后来我建了 THESIS.md 和 FEEDBACK-LOG.md，突然间，一次纠正就能传播到所有地方。

第 1 天和第 40 天的模型是一样的。它不会因为你用得更久而变得更聪明。

但围绕它的文件变得更丰富、更精准、更贴合你的具体需求。

这些积累的上下文才是护城河。没有人能通过使用同一个模型来复制它。

你要靠每天出现、与智能体对话来赢得它。

如何开始（不要试图在一个周末搭完）

时间	行动
今天	安装 OpenClaw，写一个 SOUL.md、IDENTITY.md、USER.md。挑最重复的日常任务，设置定时任务让它跑起来
3 天后	开始给出具体反馈，确保反馈落入记忆文件，而不只是停留在聊天记录里
1 周后	创建 AGENTS.md，定义会话启动流程，添加记忆管理规则
2 周后	开始写 MEMORY.md，回顾每日日志，把反复出现的纠正蒸馏成永久条目。这时你会感受到复利开始发生
3 周后	添加第二个智能体，建立基于文件的协作。随着模式涌现，添加角色专属指南
大约同时	建立共享上下文层。用 THESIS.md 记录当前思考，用 FEEDBACK-LOG.md 管理跨智能体纠正
4 周后	在你第一次遇到故障之后，添加 HEARTBEAT.md

写在最后

你唯一需要做的，就是与你的智能体对话。文件会完成其余的一切。

不是调 prompt，不是换模型，不是重构架构。

就是说话。给反馈。看着它们把内容记下来。

然后有一天你打开 Telegram，看看草稿，喝杯咖啡。

你的智能体已经学会了怎么帮你工作。

参考：Shubham Saboo《How to Build OpenClaw Agents That Actually Evolve Over Time》

来自：

https://x.com/Saboo_Shubham_/status/2027463195150131572

整理翻译：Berryxia.ai

交流：358848136