乐于分享
好东西不私藏

不管是workbuddy,还是openclaw、hermes等其他小龙虾,都必须要知道的12个基础知道,避免踩大坑

不管是workbuddy,还是openclaw、hermes等其他小龙虾,都必须要知道的12个基础知道,避免踩大坑

自从openclaw开源到现在,龙虾热一直居高不下
今天这个虾,明天那个虾,层出不穷,眼花缭乱的
今天栋仔就把试用了市面上90%的虾踩了各种的坑后,总结出来的12个最基本的知识,也是最容易踩的坑,分享给你,一定要收藏起来,多读几次。

1.不管什么虾,底层的东西都是一样的
其实不管是openclaw、hermes、Qclaw、飞书Claw、扣子claw,还是workbuddy等,底层的东西都基本是一样的
很多人就像最初的我一样,痴迷于研究各种虾,今天这个虾出来了研究这个虾,明天那个虾出来了研究那个虾,最后龙虾倒是养了一堆,活是真没干多少。
我研究了至少十个不同的虾,发现了一个共同的特点,就是底层的东西是一样一样的。
token怎么算、上下文怎么管理、规则怎么写、技能怎么搭建、记忆怎么处理等
只要把这些都搞明白了,管它是什么虾,都是一样的
我们最后只需要选一个我们用着顺手丝滑的去狠狠地研究它就可以了
养虾的最终目的,是让它能给我实打实地干活来的。
从今天开始,请专注养一只虾,养好它。

2.小龙虾是能干活的员工,不是陪聊机器人
很多人对AI的认知,还停留在chatgpt出来那会的,一直没有升级过
以前的AI是你问他什么,他给你一堆的建议,最终事儿还是你来干的
现在小龙虾是能够实打实地给你干活的
很多人,打开小龙虾,还是掉进了以前的老习惯里了
把它当个陪聊和查资料的了,一打开就只会问:
今天天气怎么样?
这简直是拿着屠龙刀去杀猪了,拿着核弹去轰蚊子了
简直让人笑不活了
AI在发展,我们的思维也在跟着进化的
AI时代,驾驭AI我们需要更高阶的思维
人永远不可能问AI超出认知以外的问题,也永远无法驾驭AI去做超出认知以外的事儿。
看着是老生常谈,但每天都在真实发生着。
从今天开始,不要把小龙虾当成陪聊的了,先让它给你干一件简单的事儿开始,比如:每天固定时间给你推送行业前沿最新的新闻

3.同样的虾,不同人用为什么差距这么大
有基础的同学都知道,不管是龙虾还是其他agent,底层都是由三个东西构成的
大模型、工具、上下文
大模型决定了上限,决定了虾是不是有脑子,够不够聪明
工具是手,是技能,决定了它能做什么事儿
上下文是认知,决定了怎么去做,也就是做事的方式
那决定这个差距的到底是哪一个呢?
大模型不用考虑,做大模型就那么几家的
而工具,大家装的应该也都差不多的
真正决定差距的是上下文,准确地说是上下文的管理
模型决定了上限,上下文才是决定下限的
这个就是木桶原理一样的
跟人是一样的,脑子聪不聪明决定了上限,但认识做事方式才是决定下限的,才是拉到人与人之间差距的。

4.同一个任务窗口上下文越多,龙虾越容易抽风
这个坑我也是踩了不少的,以前总是一个任务窗口非要用到龙虾抽风抽的不要不要的才舍得关掉重新开个新窗口
每个大模型能处理的上下文都是有容量限制的,换句话说就是脑子是有容量的 ,超出了这个容易它就不记得了。
比如有的大模型只能处理200K的上下文,塞满了就装不了新东西了
这个时候,很多agent会直接进行上下文压缩,好腾出新的空间来处理新的内容的
压缩的本质是什么?就是删掉一部分上下文的细节,一删很多关键信息就没了
它就忘了很多东西,它就会发挥自己的“聪明才智”瞎处理一通,这就是抽风的由来。
一抽风你不满意,就继续给它发消息修改
结果刚压缩的容易又满了,它又得继续压缩
一压缩就忘的更多了,抽风就更严重了
这就是很多人为什么用着用着就把键盘给砸了的原因
(别问我为什么知道,我不会告诉你,这是我今年买的第6个键盘了的…)

5.token的计算,计算是当前窗口下所有的上下文
不知道你们注意到没有,你在新旧窗口里都只发了“你好”两个字
新窗口和已经对话几十轮的窗口,消耗的token是不一样的
血泪史啊,这个坑现在想想心都在滴血的
你的任务窗口越满,每条消息消耗的token越多
200KB的中文,大概要消耗10万-20万的token
也就是说,如果你的窗口中已经有200KB的中文消息,你哪怕只发个“你好”两个字,也得消息十几二十万的token
而新窗口消耗的token基本可以忽略
这里跟4中是不是就出现了矛盾了?
又想要它不抽风有记忆,又不想要消耗太多的token,怎么办?
这里还真不是既要…又要…
这个就涉及到了agent的记忆管理了

6.agent的记忆,是怎么处理的?
经过很多版本的迭代,现在很多龙虾或是agent工具都有一个记忆功能的
比如workbuddy每次任务都会自动保存一个memory文件
但是经过多次的实战,这个自动保存不怎么靠谱
有些很关键的信息它压根没有存,反而存了一堆无关紧要的东西
你认为很重要的事,你可以主动要求它保存
这其实是短期记忆的处理
还有一个中期、长期的记忆处理问题
比如workbuddy的soul.md
记忆中的信息越精准,agent就会越了解你
建议定期迭代手动更新,自动更新的还是差点意思

7.agent喜欢自作聪明,乱猜你的意图
不管你是给agent提需求,还是让它动手做什么事儿,如果你的意图没有讲明白,它喜欢自作聪明胡乱猜你的意图,然后按它的猜测来做事儿
最后得到的,是它想给你的结果,可能就跟你要的结果相差十万八千里了
学过沟通的同学应该都知道,5W1H原则,就是when、where、who、what、why和how,这样才能将一件事情讲明白
我们跟agent沟通当然不用这么麻烦,只要求WWH就可以了
毕竟它是个AI,前面三个W我们可以不用讲
但是what、why和how必须得讲清楚的
有一个没有讲清楚,结果可能就歪了十万八千里
有人觉得为什么要跟AI讲why?它又不是人对吧
AI太聪明了,如果你不告诉它,它是真的觉得自己什么都会,猜的让你没脾气。
这就是跟喜恶同缘是一样的道理的
AI的优点是它太聪明了,缺点也是它太聪明了。

8.相信我,小白永远都比老油子好用
当你完成了agent各种配置后,特别是记忆和技能配置好后,不要一直迷恋你当前的聊天窗口
不要跟窗口谈恋爱,这个时候我们要学会做个渣男,一定要喜新厌旧的
不要觉得你跟它聊了这么久,它更了解你,你舍不得关
真的不是这样的
清爽有脑子,一定比塞得满满的脑子好用的
上下文太多,它越笨,可能简单的事情都给你搞砸了
新的任务,就开新的窗口
这也是上面我们为什么要强调记忆的重要性了
有了记忆,你不用担心它不了解你
上下文的原则:少即是多
 既好用,又省token

9.规则是启动时就加载的,技能是渐进加载的
有人可能会说,既然上下文少即是多
那为什么还要写一堆文件,又是rule,又是skill,memory的
这样算下来也是一大堆token的,一塞进去不就一下子就满了?
这里插一个小知识点,规则是agent一启动就加载的,而skill是在处理任务时需要的时候才加载的
没必要还在抓猪的环节,就是杀猪刀给抓手上不是
呃,这个比喻太TM俗了,我是个俗人
所以这里又要讲一个很关键的知识点
需要agent一启动就记住的东西我们要写进rule里面,在用到时才需要知道的东西我们就写进skill里面
这个不管你是用市场上现有的agent,还是自己开发agent,这个原则都好用。

10.通用的agent没有行业专业的agent好用
有句话说得好,什么都会的人,就是什么都不会
对于agent也是一样的适用的
底层的大模型是被喂过大量数据的,但是并不是每个数据的细节它都记着的,它记的是摘要的
对每个行业它都能回答一点,但不专业,它回答的永远都是通用的框架的
而且大模型给出的建议,永远都是,不过有功,但求无过的中性策略的
那怎么办呢?
每个人的行业不同,那就没办法用了吗?
其实我们只要给它再配一个专业的第二大脑就可以完美解决这个问题了
就是给它配个行业知识库,把你行业的专业知识集中起来,还有你自己脑子里面的东西都倒出来,给它装第二个脑子
这个也有多种解决方案的,比如:workbuddy+IMA;workbuddy+obsidian等等
你要相信,专打知识侵权案的律师,在处理侵权案子时,永远比什么案子都接的律师要专业。

11.每个agent一定要给它配好工位,不然它真的会随地大小便
很多人应该有过这种体验,在用龙虾做一个任务时,它经常会随便生成文件,然后随机乱放,最后交付时,你看着那一堆文件,这里一个,那里一个,不知道从哪里看起。
头大,感觉比自己做都累。
这个就像一个程序员,写了一堆只有他自己能看懂的源码,别人看都看不懂,谈何维护的。
所以,在开启任务时,或是在建新的agent时,一定要给它指定工作文件夹,并且文件存放规则,不然它是真的会随地大小便。
(不要问我为什么知道,我不会告诉你,我以前给它做过好久的铲屎官的)

12.能拆解成多个任务的工作,一定不要让一个agent去做
不要为了省事,让一个复杂的工作,交给同一个agent去完成
专业的事交给专业的人,同样的道理,专业的agent做专业的事儿。
这个也涉及到了AI时代的工作流程重构的问题,每个人的工作流程、每个企业的运行流程,都需要被重构以适应AI的优雅落地。
至于多agent怎么协作的问题,不是一句两句能讲清楚的,我们后面会专门出一期深入讲讲多agent怎么协作的问题。
好了,今天的内容先到这里,后面我们会分期讲讲rule/skill怎么写、多agent怎么协作、agent怎么自我进化等等。

看到这的,一定要点个关注,后面会有一个workbuddy在各行业怎么落地的电子书免费赠送,现在正在整理中,先点个关注加个星标,防止后面需要用到时找不到了。