OpenClaw 指令与 Token 优化

本手册整合了 OpenClaw 的通用命令、飞书（Lark）特化操作以及深度 Token 成本控制策略。

在对话框输入 / 即可触发，是管理 AI 状态最直接的方式。

分类	指令	功能描述	Token 优化/省钱效果
会话控制	`/new`	开启全新会话，彻底清空历史记忆。	最高级优化：上下文归零，仅保留系统提示词开销。
	`/compact`	[核心] 压缩当前对话，生成上下文摘要。	大幅降本：将数万 Token 的冗长历史压缩至几百。
	`/reset`	重置 Agent 运行状态，清除临时变量。	终止因逻辑死循环导致的重复 Token 浪费。
临时任务	`/btw [内容]`	发起“顺便提一下”的提问（By the way）。	防污染：该对话不存入历史，避免干扰后续核心任务。
状态监控	`/usage`	开启/关闭回复末尾的 Token 消耗统计。	透明化：实时监控消耗，防止 API 账单超出预算。
	`/context`	查看当前上下文的详细组成及占比。	诊断：精准定位哪个文件或插件在“偷跑”流量。
	`/status`	查看当前模型、运行环境及健康度。	确认是否误用了昂贵模型（如 Claude 3.5 Sonnet）。
模型工具	`/model [名]`	快速切换 AI 模型（如 gpt-4o-mini）。	策略优化：简单任务切低价模型，复杂任务切高阶模型。
	`/memory`	检索本地知识库或持久化长期记忆。	RAG 模式：按需抓取片段，比全量读入省钱 90% 以上。

在飞书多用户协作场景下，Token 消耗往往更快，建议采用以下交互方案：

通过调整底层参数，实现自动化的 Token 缩减：

当上下文占用接近模型上限时，自动触发刷新：

"compaction":{"memoryFlush":true,// 压缩前将关键决策存入局部存储"tokenThreshold":80000// 达到 80k Token 时自动执行压缩}

开启 Query-based Memory Delivery