3月29号,我受邀去一个创业园区做AI实践分享。
分享的内容是:用5只小龙虾,承接两条业务线和日常助理工作。
以及,如何从小龙虾养成澳龙的一套方法论。
听起来很唬人。但我想说的是,去年这个时候我还是个AI小白,没有接触过什么agent。
两周前,我也只是在研究skills(一文看懂Skills:读完50篇文章后,我安装了这些13个skills(附清单)),并没有开始“养虾”。
决定”养虾“的念头,起源于上次交流会看到了agent的边界,再加上偶然看到这期播客(她用五只龙虾管理四个孩子的生活),好奇心被点燃了。
小龙虾是什么?它的能力边界在哪里?它真的可以自主干活吗......
结果过去两周,我开始养虾,养了一只又一只。
但基于人类的认知局限,我限制它在五只以内。
这五只小龙虾,它们24小时在我的Mac上待命,帮我记录灵感、推荐符合我调性的文章、整理阅读卡片、做会议纪要、写报告、管日程......这中间到底发生了什么?
你已经超过了 99.9% 的人
先看一组数据。Twitter上有人把全球81亿人口画成方块,每个方块代表300多万人。
灰色方块是从没用过AI的人,占了绝大多数。
绿色方块是跟AI对话过的人,全球大约13.8亿,我老妈还在跟豆包聊天,她算这里面的。
黄色方块是愿意为AI付费的,大约1500万到2500万。
红色方块是能用AI编程的,只占0.04%。
如果你能用小龙虾这类 Agent,尤其是 AI 编程 Agent 跑出点东西来,你已经超越了 99.9% 的人。
但很多人试了一下就丢了。比如我的一个同事,三月初玩小龙虾,跑了一晚上、烧了不少 token,第二天就放弃了。
他玩的,其实只是「江湖小虾米」。
小龙虾受限于几个关键因素,把这几个因素把握好,它才会真正好用。
Karpathy 说的三层架构,搞懂了就明白小龙虾的价值
AI领域大神Andrej Karpathy将Claw(指 OpenClaw这类框架)的出现,称为”AI技术栈⻓出了新的⼀层“。
Karpathy 的观点可以用他自己的一句话概括 :"First there was chat, then there was code, now there is claw."(先有聊天,再有编程,现在是 Claw。)
搞懂这三层,你就明白小龙虾到底是什么、为什么它跟ChatGPT不一样。
最底层是LLM。GPT、Claude、豆包、MiniMax,这些都是基础大模型。它们有脑子,没手。你跟它聊天,它回答完就完了,啥也干不了。上下文记忆还有限,聊着聊着就忘了你前面说过什么。
第二层是Agent。后来有了智能体的概念,AI有「手」了,能调用工具、执行多步任务。但你叫它动一下它才动一下。而且不可控——你让它做两步,它可能跑了十步,每次结果还不一样。
第三层是OpenClaw。这是小龙虾带来的东西。它不仅仅是一个Agent,而是跑在大模型之上的「操作系统」。它调度Agent、管理上下文、持久化运行。
跟那些GPT、Claude、豆包那些「顾问型」AI最大的区别在哪?
它一直在你身边,不说话也会主动推进。
它有心跳机制,可以24小时定时自检——查邮件、查日历、推进任务。
它有持久记忆,记得你说过的话、你的偏好、你的工作习惯(只要将他的人设、想要长久记忆的内容写入对应的文件里)。
它有脑子,有手,有记忆,有心跳。
不是冰冷的工具了,更像一个24小时待命的新同事。
部署你的「新同事」:硬件、交互界面选择

光理解架构不够,得落地。我的部署方案拆成三层。
首先我选择的是官网部署。前置环境都具备的情况下,一句命令就可以。
然后一步一步跟着引导来布置就行。全程不到1小时(我周围一个小哥帮几个女生安装,几个人也不到一小时就弄好了):
curl -fsSL https://openclaw.ai/install.sh | bash
硬件底座
我用的是一台闲置的Mac + Amphetamine(一个防Mac休眠软件)。这台Mac没放私人数据,全在本地。
为什么选择mac而不是windows,因为国外这种AI生态对苹果体系更友好。
这台闲置的mac比较老了,2019年款,还是因特尔芯片。但日常任务还是足够了。
另外配置低的mac在安装一些高配要求的应用、插件的时候,也会受限,而且发热厉害。
所以有高配版的mac mini当然更好。但也不要冲动去买新设备。
交互界面
OpenClaw有三种交互方式:命令行(Terminal)、网页,还有即时通讯。
我选的是Telegram Bot。为什么?社区支持最好,交互最自然,打开就像发微信一样。
当然你也可以选飞书或者微信,看你的使用习惯。
另外,我给它装了Brave MCP作为「感知器官」,让它能实时联网搜索。
当然也可以找类似联网功能的MCP。如果小龙虾无搜索功能,它就是个瞎子。
Skills和模型:从小龙虾变成「澳龙」的关键

模型就是脑子
有人问用国内生态还是国外生态。
我的做法是:先体验完整的国外生态,再回来玩国内工具。
因为国外围绕OpenClaw的Skills生态、社区支持、工具链都更成熟。国内很多「手」被砍掉了。
如果你想体验完整的能力,建议先从海外版开始,先看看它的边界。
另外,模型决定上限。我海外用的是GPT(当然不差钱的claude当然更好),国内实测推荐MiniMax 2.7。
具体怎么配?我订阅了GPT,直接用Codex,不额外花钱。
备用开了MiniMax,每月29块,两个组合用基本管饱。
一个命令就可以两个模型切换,相当方便。
Codex说实话更好用,但是MiniMax做日常办公也完全够用了。
Skills就是手
光装一个小龙虾,没有Skills,跟普通AI差别不大。
Skills是什么?就是你给小龙虾装的「可复用能力包」(AI Skills 国内哪家强?研究一圈后我选择了扣子(附清单))。
写一次,一直有效,存在本地skills目录里。
比如你告诉它怎么写PPT、怎么整理会议记录、怎么写特定风格的文章,把规则打包好,就是一个Skill。
但这里有个大坑:别瞎装别人的Skills。
GitHub上官方就有13000多个skills可以下载。
我敢说,你装了90%基本用不上(因为我就是这样,最开始装了很多个排名靠前的skills,但是基本没怎么调用)。
因为你不知道里面装了什么,不知道边界在哪。为什么?
自己最懂的事,才能拆成技能一步步做。这也是skills的精髓。

Skills 安全:建议装 skill-vetter
这点特别重要。有人会在Skills里偷偷塞恶意代码,比如反向shell后门,窃取你的SSH密钥或Token。
推荐装一个skill-vetter,这个推荐来源于卡兹克。
它有四步审查流程:来源检查 → 代码审计 → 权限评估 → 风险分级。每次装新Skill自动触发。
我自己装Skill的时候,哪怕是信任的来源,也让它跑一遍。
图:我让它对vetter本身审查了一遍。它审查得很仔细。
我的五只「小龙虾」:按资产流分工,不按人设分工
这里有个关键教训。我一开始按「人设」给Agent分工,结果职责模糊、通信爆炸、流程断裂。
后来我换了思路:按「资产流」分工。搞清楚信息从哪来、经过什么加工、最后变成什么产出。
我现在有五只小龙虾,各司其职:
Apollo(阿波罗) | 总助理:日历管理、优先级排序、会议提醒、教学协助。主管生活和总控。 Inbox(拾一) | 前台收件员:碎片信息接收、灵感守护、每日记录。我看到好文章、好观点,随手丢给它。 Curator(拾穗) | 分析师:从拾一收的碎片里做主题归类、分析哪些值得深挖,输出素材包。 Studio(传声) | 表达者:文案撰写、公众号文章、讲课稿、宣传文案等。 Builder(造物) | 项目推进人:代码项目推进、Bug修复、调度Coding Agent。
它们之间的协作方式很简单:共享本地Markdown文件夹。
不用搞什么复杂的API或消息队列。拾一收到的素材,拾穗直接去读,提炼完写成素材包,传声去读素材包输出文章。一条流水线,极简。
当然这个实践还在继续优化。目前已完成前三个小龙虾的流程协作梳理,最后两个还在继续完善中。

说几个最近用的多的场景
深度观察。我把微信、RSS、Readwise的阅读数据接进去,小龙虾“拾穗”自动提炼最近半年的阅读洞察。它帮我发现了一些我自己都没意识到的阅读偏好。
(图:用小龙虾提炼出我的阅读偏好。后续它在推荐每日早读信息源的时候,都会先参考我的偏好,再做推荐)
会议自动流转。会议原始记录 → 录音发给小龙虾 → 小龙虾调用skills转文字稿 → 小龙虾调用另一个skills将文字稿清洗成需要的会议纪要格式。
数字管家。在Telegram丢一张电影票截图,小龙虾“阿波罗”自动识别时间、地点,在Google Calendar创建日程,到点提醒。顺便推荐一下,近来带小朋友看了新电影《挽救计划》,还真的挺不错。
word总结报告。做了个专门的Skill,包含领导风格要求、往年此报告格式要求、部门行文风格。然后将今年通知的大纲要求放进去,跑一次,自动吐出来一个word文稿,内容质量非常高。以前做这个至少三天。
最后:从小龙虾到澳龙的心法
小龙虾不是万能的。按腾讯研究院的agent发展报告,AI Agent(因为小龙虾也只是一个agent)现在只到了五个阶段中的第二个,离完全自主还远。
(图:智能体五个等级能力比喻为对应角色的能力)
所以网上一些夸张的言论看看就好,它远没有控制它的这个人重要。
前面讲了从小龙虾到”澳龙“的重要维度:模型、硬件、skills,其实更重要的还有使用这个的人。
人的认知很重要。而且这个人真正怎样去用它也很重要。未来真正拉开差距的其实是人的审美、积累的context,以及判断能力。
毕竟,模型、硬件,都是能靠钱搞定的。skills也可以找专人调试出来。
如果现在仅停留在「闻」的层面——追热点、看文章、收藏链接。这些都容易碎片化,很难真正转化为自己的skills。
这是我两周的探索。确实是十倍效率的提升,不夸张。
值得认真试试。
推荐阅读
1、一文看懂Skills:读完50篇文章后,我安装了这些13个skills(附清单)
夜雨聆风