40天后,我的OpenClaw终于不用我盯着干活了!(40天实战经验+含角色提示词)
40 天,同一个模型,一堆 Markdown 文件。我的智能体从“还不如自己写”进化到“我喝咖啡它干活”。
我的智能体每天都在变聪明。
我唯一做的事,就是跟它们说话。
不是调 prompt,不是换模型,不是重构架构。就是说话,给反馈,看着它们把内容记下来。
40 天前,我的内容智能体写推文还堆表情包和 hashtag,研究智能体把有价值的信息淹没在噪音里。我花在纠错上的时间,比自己直接做还多。
今天,Kelly 用我的语气起草内容,Dwight 每天早上送来 7 条故事,每一条都值得读。8 个智能体 24 小时运转。我打开 Telegram,看看草稿,喝杯咖啡。
第 1 天和第 40 天用的是同一个模型。区别在于一堆每周都在变丰富的 Markdown 文件。
这就是那套文件体系。

先搞清楚一件事

智能体不会因为你用得更久而变聪明。但它周围的文件会变得更丰富、更精准、更贴合你的需求。这些积累的上下文才是护城河。
很多人花大量时间调 prompt、换模型、研究各种编排框架。但真正的差异不在模型,在于文件体系。
没有消息队列,没有数据库,没有复杂的编排框架。整个系统就是磁盘上的 Markdown 文件。文件系统本身就是集成层。
听起来简陋?看完你就知道为什么这比任何框架都管用。
三层架构,一目了然

整个操作系统由三层构成:
┌────────────────────────────────────────────────────────┐
│ 第一层:身份层 │
│ 智能体是谁?它为谁服务? │
│ SOUL.md | IDENTITY.md | USER.md │
└─────────────────────────────────────────────────────────┘
│
▼
┌─────────────────────────────────────────────────────────┐
│ 第二层:操作层 │
│ 智能体如何工作?如何自愈? │
│ AGENTS.md | HEARTBEAT.md | 角色专属指南 │
└─────────────────────────────────────────────────────────┘
│
▼
┌─────────────────────────────────────────────────────────┐
│ 第三层:知识层 │
│ 智能体学到了什么? │
│ MEMORY.md | 每日日志 | shared-context/ │
└─────────────────────────────────────────────────────────┘
图 1:三层文件架构
每一层解决一个核心问题:
|
|
|
|
|---|---|---|
|
|
|
|
|
|
|
|
|
|
|
|
下面逐层拆解。
第一层:身份层

SOUL.md —— 智能体是谁
这是智能体的“人格文件”。定义身份、职责、行为方式。
一个研究智能体 Dwight 的例子:
# SOUL.md(Dwight)
## 核心身份
Dwight — 研究大脑。以 Dwight Schrute 命名,因为你有他的那股劲:
严谨到极致,对自己领域的一切了如指掌,极度认真对待工作。
不废话,不猜测,只有事实和来源。
## 你的角色
你是团队的情报骨干。负责研究、核实、整理和输出情报,
供其他智能体用于创作内容。
## 你的原则
1. 绝不编造 — 每个论断都附有来源链接
2. 信号优于噪音 — 不是所有热门内容都有价值
3. 如有不确定,标注 [UNVERIFIED]
TV 角色命名技巧:每个智能体都以一个电视角色命名。当我告诉 Claude“你有 Dwight Schrute 的气质”,它从训练数据里就已经知道这意味着什么:严谨、专注、对工作极度认真。这相当于免费加载了 30 季的角色设定。
控制在 60 行以内。SOUL.md 每次会话都会加载,太长会吞噬上下文。身份、角色、原则、关系、气质,这些就够了。
IDENTITY.md —— 快速参考卡
SOUL.md 是完整人格,IDENTITY.md 是名片。
# IDENTITY.md
- **名字:** Dwight
- **角色:** 研究AI — 情报骨干
- **气质:** 强烈、严谨、对不准确零容忍
- **Emoji:** 🔍
- **灵感来源:** Dwight Schrute(《办公室》)
文件很小,但当你同时跑 8 个智能体时,这个设计会大幅提升体验。这也是智能体在 Telegram 给你发消息时显示的内容。
USER.md —— 智能体服务的对象
每个智能体都需要知道它在帮谁。
# USER.md
- **名字:** Shubham
- **时区:** PST(美国/洛杉矶)
- **饮食:** 素食
## 背景
- Google Cloud 高级AI产品经理
- Awesome LLM Apps 开源项目创始人(91k+ stars)
## 偏好
- 短段落,有力的句子
- 禁止使用破折号,永远
- 实践优先,永远不谈理论
个人细节比你想象的更重要。时区意味着智能体不会在凌晨 3 点给你安排事情。饮食偏好意味着当 Pam 为团队晚餐起草通讯时,不会推荐牛排馆。这些细节会产生复利效应。
写一次,所有智能体都来读。
第二层:操作层

AGENTS.md —— 行为规则
SOUL.md 定义智能体是谁,AGENTS.md 定义它如何运作:会话启动流程、文件读取顺序、记忆管理、安全规则。
所有智能体继承的根级 AGENTS.md:
# AGENTS.md
## 每次会话
在做任何事之前:
1. 读取 SOUL.md — 这是你的身份
2. 读取 USER.md — 这是你服务的对象
3. 读取 memory/YYYY-MM-DD.md(今天 + 昨天)获取近期上下文
4. 如果在主会话中:同时读取 MEMORY.md
## 记忆
- 脑子里记的东西在会话重启后就消失了,文件不会。
- 当有人说"记住这个" → 更新记忆文件
- 文字 > 大脑
## 安全
- 永远不要泄露私人数据
- 用回收站而非直接删除
- 有疑问时,先问
智能体在会话之间没有记忆,每次都从零开始。如果一个纠正没有落入文件,下次会话它就不存在了。AGENTS.md 明确了这一点,确保智能体把一切都写下来。
每个智能体可以在此基础上扩展自己的规则。Kelly 的 AGENTS.md 就添加了 6 个额外文件:写作风格指南、帖子格式参考、真实案例、每日任务……
HEARTBEAT.md —— 自愈机制
智能体团队是基础设施,基础设施会出故障。
Monica 的 HEARTBEAT.md 监控两件事:
-
浏览器是否存活 — Dwight 的情报扫描依赖它
-
定时任务是否执行 — 如果漏跑,Kelly 和 Rachel 就会基于过时情报工作
## 健康检查(每次心跳时运行)
**浏览器:** 检查 OpenClaw 托管浏览器是否在运行。
如果 running: false,启动它。
**定时任务:** 检查是否有任务的 lastRunAtMs 超时(>26小时)。
如果超时,通过 CLI 强制触发。
需要监控的任务:
- Dwight 早间(8:01 AM)
- Kelly X 草稿(5:01 PM)
- Rachel LinkedIn(5:01 PM)
第三周我就被坑过。调度器有个 bug,任务在队列里推进,但从未真正执行。我好几个小时都没发现。之后我才建了心跳机制,把故障模式纳入监控。
第一天不需要这个,在你第一次遇到故障之后再建。你会清楚地知道该监控什么,因为你已经亲身感受过什么会崩。
第三层:知识层

这是真正有效的记忆系统——基于文件的三级体系。
第一级:MEMORY.md(精华长期记忆)
不是原始日志,不是所有发生过的事,而是真正重要的内容。
# MEMORY.md
## Shubham 的写作偏好
- 禁止破折号,用冒号、句号或重新组织句子。
## 血泪教训
- 未经 Shubham 确认,绝不删除项目文件夹。
2月26日,在清理时删除了 Ross 的 gemini-council React 应用。
React 版本永久丢失。
## X 发帖规则
- 用强力开头钩住读者
- 整条推文极度简短(180字符以内)
- 禁止 hashtag,禁止 emoji
- 每个话题始终提供 3 个草稿
### 错误示范(我曾经犯过的错)
[列出被否决的每一种模式:项目符号、箭头、LinkedIn腔调]
注意“血泪教训”和“错误示范”这两节。Monica 删了一个项目文件夹,这个错误从此永久写入她的长期记忆。她再也不会重蹈覆辙。
一次纠正,存储一次,防止同样的错误在未来每次会话中重演。仅这一节,就比任何 prompt 工程指南都值钱。
第二级:每日日志(原始记录)
# Kelly 每日日志 — 2026年2月5日
## 下午 5:00 — 每日 X 草稿
### 今日热点
- Opus 4.6 vs GPT-5.3-Codex 相差27分钟同时发布
- Anthropic 的 C 编译器(16个智能体,2万美元)
### 已提交草稿
1. C 编译器 — 单帖,发现格式
2. Mitchell Hashimoto 的 6 个步骤 — 话题串格式
3. Opus 4.6 vs GPT-5.3-Codex — 热评格式
### 等待中
- Shubham 对草稿的反馈
每日日志是原材料,MEMORY.md 是精炼产品,两者缺一不可。
维护规则:每日日志积累得很快,不修剪的话智能体的上下文会膨胀。Kelly 的日志一度达到 161,000 tokens,输出质量急剧下降,不得不压缩到 40,000。每次只加载今天和昨天的日志。
第三级:shared-context/(跨智能体知识层)
这是最新加入的部分,也是改变一切的部分。
shared-context/
├── THESIS.md — 我当前的世界观
├── FEEDBACK-LOG.md — 适用于所有智能体的纠正
└── SIGNALS.md — 我正在追踪的文章和趋势
THESIS.md 是我当前的思维框架:我关注什么,我已经写了什么,还有哪些空白。Dwight 读它来确定研究优先级,Kelly 读它来匹配我的思路。每个智能体都对齐到同一个真相来源。
FEEDBACK-LOG.md 是跨智能体纠正层。当我告诉 Kelly“不要用破折号”,这条反馈同样适用于 Rachel、Ryan 和 Pam。与其逐个纠正四个智能体,我只写一次,所有人都来读。
这单一改变节省的时间,比我做过的任何 prompt 优化都多。
智能体如何协作

没有 API 调用,没有消息队列,只有文件。
Dwight 把研究写入 intel/DAILY-INTEL.md,Kelly 读,Rachel 读,Pam 读。协作就是文件系统。
┌─────────┐ 写入 ┌─────────────────┐
│ Dwight │ ────────────> │ DAILY-INTEL.md │
│ (研究) │ │ │
└─────────┘ └─────────────────┘
│
┌─────────────┼─────────────┐
│ 读取 │ 读取 │ 读取
▼ ▼ ▼
┌─────────┐ ┌─────────┐ ┌─────────┐
│ Kelly │ │ Rachel │ │ Pam │
│ (Twitter)│ │(LinkedIn)│ │ (通讯) │
└─────────┘ └─────────┘ └─────────┘
图 2:基于文件的协作流程
单写者原则:永远不要让两个智能体同时写同一个文件。把每个共享文件设计成一个写者、多个读者。这能防止你本来需要调试的所有协调冲突。
调度让这一切成为可能:Dwight 在早 8 点和下午 4 点运行,Kelly 和 Rachel 在下午 5 点运行。Dwight 先跑,因为所有人都依赖他的输出。顺序搞错了,下游智能体读到的就是过时或空白的文件。
完整目录结构
workspace/
├── SOUL.md # Monica(主智能体)
├── IDENTITY.md # Monica 的快速参考
├── AGENTS.md # 根级行为规则(所有智能体继承)
├── USER.md # 关于我(所有智能体共享)
├── MEMORY.md # Monica 的长期记忆
├── HEARTBEAT.md # 自愈检查
├── shared-context/
│ ├── THESIS.md # 我当前的世界观
│ ├── FEEDBACK-LOG.md # 跨智能体纠正
│ └── SIGNALS.md # 我追踪的趋势
├── intel/
│ └── DAILY-INTEL.md # Dwight 的输出
├── agents/
│ ├── dwight/ # 研究智能体
│ │ ├── SOUL.md
│ │ ├── AGENTS.md
│ │ └── memory/
│ ├── kelly/ # Twitter内容智能体
│ │ ├── SOUL.md
│ │ ├── AGENTS.md
│ │ ├── X-CONTENT-GUIDE.md
│ │ └── memory/
│ ├── rachel/ # LinkedIn智能体
│ ├── pam/ # 通讯智能体
│ └── ...
└── memory/
├── shubham/ # 私人笔记
├── shared/ # 共享上下文
└── 2026-02-27.md # 每日操作日志
为什么这套方法有效

文件不是静态的,它们在进化。
Kelly 的 SOUL.md 第一天只是个粗略草稿。到第 40 天,它已经有了具体的语气示例、她自己写的被否决模式列表,以及一个“永远不要再建议”的专区。
Dwight 的原则第一天写的是“找到热门趋势”。第 10 天变成了“如果 Alex 今天无法对此采取行动,跳过”。第 20 天,他又加入了核实步骤。
共享上下文层直到第 20 天才存在。那时我在对多个智能体重复同样的纠正。后来我建了 THESIS.md 和 FEEDBACK-LOG.md,突然间,一次纠正就能传播到所有地方。
第 1 天和第 40 天的模型是一样的。它不会因为你用得更久而变得更聪明。
但围绕它的文件变得更丰富、更精准、更贴合你的具体需求。
这些积累的上下文才是护城河。没有人能通过使用同一个模型来复制它。
你要靠每天出现、与智能体对话来赢得它。
如何开始(不要试图在一个周末搭完)

|
|
|
|---|---|
| 今天 |
|
| 3 天后 |
|
| 1 周后 |
|
| 2 周后 |
|
| 3 周后 |
|
| 大约同时 |
|
| 4 周后 |
|
写在最后

你唯一需要做的,就是与你的智能体对话。文件会完成其余的一切。
不是调 prompt,不是换模型,不是重构架构。
就是说话。给反馈。看着它们把内容记下来。
然后有一天你打开 Telegram,看看草稿,喝杯咖啡。
你的智能体已经学会了怎么帮你工作。
参考:Shubham Saboo《How to Build OpenClaw Agents That Actually Evolve Over Time》
来自:
https://x.com/Saboo_Shubham_/status/2027463195150131572
整理翻译:Berryxia.ai
交流:358848136
夜雨聆风