你的 AI 助手半夜挂了怎么办?OpenClaw 网关运维完全指南
你搭好了 OpenClaw,接好了飞书,选了模型,一切跑得很顺。
然后有一天早上醒来,飞书群里没人回了。
一看日志,Gateway 进程没了。或者更糟——进程还在,但卡死了,消息发出去石沉大海。
别慌。这篇文章就是教你怎么让 Gateway 稳如老狗,出了问题能快速定位和恢复。
一、Gateway 是什么?
先说清楚一个概念。
OpenClaw 的核心叫 Gateway(网关)。它是一个长期运行的后台进程,负责:
– 接收来自飞书、Telegram、WhatsApp 等渠道的消息
– 把消息交给 LLM 处理
– 调用工具(搜索、日历、文件……)
– 把回复发回给渠道
Gateway 一挂,整个系统就停了。所以运维的核心就是:确保 Gateway 一直活着,挂了能自动拉起来。
二、启动管理:别靠手动
最危险的启动方式是什么?
openclaw gateway start
然后关掉终端。
Gateway 跟着终端一起死了。
正确做法:用系统服务管理
Windows:
# 用 NSSM 把 OpenClaw 注册为 Windows 服务 nssm install OpenClaw \"C:\\Program Files\\nodejs\\node.exe\" # 参数填 openclaw gateway start 的完整路径 # 设置自动重启
macOS / Linux:
# 用 systemd(Linux) sudo systemctl enable openclaw sudo systemctl start openclaw # 用 launchd(macOS) # 在 ~/Library/LaunchAgents 里放一个 plist
最简方案:用 PM2
npm install -g pm2 pm2 start openclaw -- gateway start pm2 save # 保存当前进程列表 pm2 startup # 设置开机自启
PM2 的好处是自带自动重启、日志管理、监控,一行命令搞定。
三、热更新:不停机升级
OpenClaw 支持热更新,意思是升级配置或代码不需要重启进程。
更新配置
# 修改 openclaw.json 后,让 Gateway 重新加载 openclaw gateway restart
或者用 SIGUSR1 信号(Linux/macOS):
kill -USR1 $(pgrep -f openclaw)
更新 OpenClaw 本身
npm update openclaw-cn openclaw gateway restart
💡 更新前建议先 `openclaw gateway status` 确认当前状态,更新后再跑一次确认正常。
四、认证安全:别让你的 AI 变成公共聊天机器人
Gateway 默认只监听 localhost,但如果你的机器有公网 IP,或者用了 Tailscale 组网,就得注意认证。
设置 Gateway Token
在 `openclaw.json` 里:
{ \"gateway\": { \"token\": \"你的随机密钥\" } }
生成随机密钥:
node -e \"console.log(require('crypto').randomBytes(32).toString('hex'))\"
API Key 管理
你的 LLM API Key 存在哪里?
❌ 不要这样做:
– 明文写在配置文件里提交到 Git
– 写在环境变量里但没加密
✅ 推荐做法:
# 方案 1:环境变量(最简单) export OPENAI_API_KEY=\"sk-xxx\" export DASHSCOPE_API_KEY=\"sk-xxx\" # 方案 2:用 1Password / Bitwarden CLI 管理 op item get \"OpenAI Key\" --password # 方案 3:OpenClaw 内置密钥管理 openclaw config set secrets.openai sk-xxx
密钥泄露了怎么办?立刻轮换:
1. 去对应平台生成新 Key
2. 更新配置
3. 在平台吊销旧 Key
4. 重启 Gateway
五、沙箱策略:限制工具权限
不是所有工具都应该对所有渠道开放。
{ \"gateway\": { \"sandbox\": { \"enabled\": true, \"allowedTools\": [\"web_search\", \"feishu_calendar\", \"message\"], \"blockedTools\": [\"exec\", \"browser\"] } } }
核心原则:
– 工具白名单 > 黑名单(默认禁止,按需开放)
– 群聊渠道的工具权限 < 私聊渠道
– `exec` 工具慎用,除非你确定知道它在执行什么
六、日志监控:出问题先看这里
查看日志
# 实时查看 openclaw gateway logs --follow # 查看最近 100 行 openclaw gateway logs --lines 100 # 搜索错误 openclaw gateway logs | grep -i error
用 PM2 看日志(推荐)
pm2 logs openclaw # 实时 pm2 logs openclaw --lines 200 # 最近 200 行 pm2 logs openclaw --err # 只看错误
关键日志位置
| 日志类型 | 位置 |
|---|---|
| Gateway 运行日志 | `~/.openclaw/logs/gateway.log` |
| 错误日志 | `~/.openclaw/logs/error.log` |
| 会话日志 | `~/.openclaw/sessions/` |
设置日志告警
如果你用 PM2:
pm2 install pm2-logrotate # 日志轮转,防止磁盘爆满 pm2 set pm2-logrotate:max_size 100M # 单个日志最大 100MB
想接入告警?可以写个简单脚本:
# 每分钟检查一次错误日志 tail -n 5 ~/.openclaw/logs/error.log | grep -q \"FATAL\" && \\ curl -X POST \"你的Webhook\" -d '{\"text\":\"OpenClaw Gateway 出现严重错误\"}'
七、日常巡检清单
每天花 2 分钟检查这些:
– [ ] `openclaw gateway status` — 进程在跑吗?
– [ ] 最近 24 小时有没有新错误?
– [ ] 磁盘空间够吗?(日志可能吃满磁盘)
– [ ] API Key 快过期了吗?
– [ ] OpenClaw 有新版吗?`npm outdated`
八、常见故障速查
| 症状 | 原因 | 解决 | |
|---|---|---|---|
| 消息不发回复 | LLM API 超时 | 检查网络 + API Key 是否有效 | |
| Gateway 启动失败 | 端口被占用 | `netstat -ano \\ | findstr 3000` 查占用进程 |
| 飞书消息收不到 | Token 过期 | 重新配置飞书 OAuth | |
| 工具调用报错 | 权限不足 | 检查 sandbox 配置 | |
| 内存暴涨 | 会话太多 | 定期清理旧会话 |
写在最后
Gateway 运维的核心就三句话:
1. 自动重启 — 挂了能自己起来
2. 日志可见 — 出了问题知道在哪看
3. 权限最小 — 不该开的工具别开
做到这三点,你的 AI 助手就能 7×24 小时稳定运转,你该睡觉睡觉,该摸鱼摸鱼。
觉得有用? 转发给正在折腾 AI 的朋友,少踩一个坑是一个。
关注我,获取更多AI 变现之路
「AI 部署笔记」 专注分享:
✅ AI 工具实战教程
✅ 副业变现案例
✅ 自动化运营方案
点击上方蓝字\”AI 部署笔记\” → 右上角\”…\” → 设为星标⭐
回复\”副业\”获取 AI 变现手册(限前 10 名)
夜雨聆风