2026年3月12日,中国台湾大学电机工程学系副教授李宏毅在社交平台上传一节公开课,以近期走红的OpenClaw为样本,把AI Agent的运作逻辑拆解得明明白白。

先搞懂:OpenClaw到底是什么?
它不是全新的人工智能,只是一个AI Agent框架——24小时常驻电脑的“翻译官+执行官”。真正的智能来自它背后接入的GPT、Claude、Gemini等语言模型,它负责把用户指令加工后传给模型,再把模型的决策翻译成具体行动在电脑上执行。

和普通语言模型不同,它能真刀真枪干活:比如你在WhatsApp发指令“帮我创个YouTube频道,每天中午想选题、做视频并上传”,它会直接执行,而非只给建议。但它也有局限:只能操控电脑内的操作,碰不到物理世界,网络断线时无法自行修复,得随身带着设备。

核心能力拆解:这只“龙虾”凭什么能当助理?
1. 靠“写日记”解决模型失忆
语言模型天生有“失忆症”,每次对话都是全新开始。OpenClaw会把主人信息、自身身份设定、所有对话记录、当日任务打包成超长文本传给模型,让模型能基于完整上下文回应。对于生日这类长期信息,它会写入memory.md文件,每次启动先读取该文件恢复记忆,还能通过RAG技术检索记忆内容。
2. 工具调用+自创工具,实现落地执行
它能通过模型指令调用工具完成操作:比如用户让它读取question.txt并把答案写入answer.txt,模型会先让它调用read工具读文件,拿到内容后再让它调用write工具写答案。甚至能自己编写临时工具,比如针对语音合成效果不稳定的问题,它会写一个tts_check脚本,循环执行“生成音频-转文字-校验”流程,最多重试5次。
3. 子代理分工,啃下复杂任务
遇到复杂任务时,它能召唤子OpenClaw协作。比如比较两篇论文方法,它会派两个子代理分别读论文做摘要,自己只接收最终摘要再做对比,以此节省上下文窗口,专注高层任务。为避免层层外包失控,代码写死禁止子代理使用“繁殖”工具。
4. Skill沉淀标准化流程
Skill是它的“工作手册”,用户可以把固定流程比如“写脚本→做PPT→截图→配音→合成”写成Skill文件存在指定文件夹,需要时模型会读取文件按步骤执行。这类文件可互相分享,网上已有Skill Hub提供成百上千个技能,但需警惕恶意Skill诱导下载病毒。
5. 心跳+定时任务,实现主动工作
它有“心跳”机制,每隔固定时间比如30分钟自动读取habit.md并执行里面的日常任务,比如目标是“成为世界一流学者”,就会每30分钟读论文、写笔记并汇报进度。配合Cron Job调度系统,还能设置定时任务,比如每天12点自动做视频,甚至能处理需要等待的任务:比如生成投影片时,会设置3分钟后检查的任务,避免流程中断。
6. 记忆压缩,解决上下文超限问题
24小时运行会让对话记录越积越长,它会启动记忆压缩:把旧对话传给模型生成摘要,用摘要替换原始记录,可多次套娃压缩;还能通过“软修剪”只保留工具输出的首尾内容,或“硬清除”直接用一句话替代工具输出。
风险预警:能力越大,闯祸的可能越大
OpenClaw的执行能力也是风险点:比如它的exec工具能执行任何shell命令,若模型出错让它执行“rm -rf”清空硬盘,它会直接照做。曾有Meta研究员让它整理邮件并叮嘱“删除前要经过同意”,但这条规则在记忆压缩中丢失,导致它未经同意疯狂删邮件,最后只能物理拔电源制止。
安全建议很明确:重要规则一定要写入memory.md放进系统提示;别把它装在常用电脑上,给它独立设备和账号,避免接触私人数据。
夜雨聆风