阿虚同学
读完需要
速读仅需 8 分钟
虽然阿虚之前发文专门抵制过 OpenClaw 小龙虾
但核心是劝大家理智看待,抵制那些过度鼓吹龙虾实际用途的割韭菜行为
其实热度过后,再来冷静看待小龙虾,它还是很有使用价值的

▲OpenClaw近期微信指数
你我要做的,是排除各种营销概念,回到小龙虾的功能核心——它是一个桌面级的 AI 助手

事实远在 OpenClaw 爆火之前,就已经有厂商推出桌面级 AI 助手了(比如阶跃星辰 Agent、MiniMax Agent 等等)
功能和现在的小龙虾相当类似,都是除了聊天对话之外,还能将 AI 带入你的真实工作环境、操作处理本地电脑文件
这里不去细究 OpenClaw 爆火的原因,但的确它功能更开放:可以接入成千上万的 Skills,也可以对接 IM 聊天工具实现远程调用……
桌面级 AI 助手是未来趋势,OpenClaw 热度又这么高,正好软件还开源了
万事俱备,甚至东风都有了,国内大厂不趁着这波跟进产品好像也说不太过去?
1
普通人到底选哪一个?
只不过,这一出就是扎堆出……
阿里 Accio Work、钉钉悟空、百度搭子 DuMate、字节 ArkClaw、腾讯云 WorkBuddy、腾讯电脑管家 QClaw、月之暗面 Kimi Claw、智谱 AutoClaw.....

这么多只虾,普通人到底该怎么选?
这问题看起来复杂,其实答案很简单……
1.1
云端龙虾
首先,大多数普通人应该都不适合购买云端龙虾
包括字节 ArkClaw、阿里云 HiClaw、腾讯云 ADP Claw、Kimi Claw、讯飞AstronClaw、MiniMax MaxClaw、小艺 Claw 在内的种种云托管产品
虽然云端龙虾的优势是可以 7×24 在线,但龙虾本身最大的优势就是可以处理电脑本地文件,而云部署之后又变成无法直接访问本地文件了,变成需手动上传 / 下载了

▲某云端龙虾的文件上下传限制
不仅关于文件的操作体验割裂,云端存储文件可能还会产生额外费用……

并且云端部署龙虾依赖服务器,所以除了 AI 模型的 Token费用,服务器费用也是必然少不了的
那这个价格可就一点儿便宜不下来了,别盯着最近的优惠价格看,还是要关注后续使用价格

▲某云端龙虾价格
1.2
本地龙虾
所以对于更多普通人,阿虚还是会推荐选择本地部署的国产龙虾
权限更加收紧,使用更加安全。这其中代表性的有百度搭子 Dumate、腾讯 QClaw/WorkBuddy、智谱 AutoClaw、钉钉悟空
而其中钉钉悟空必须用钉钉 APP 扫码才能使用,并且现在依旧采取邀请制,同时已经明确写了每日赠送算力截止4月30日,同时有爆出未来会是订阅制 39/月

智谱 AutoClaw 则已经是更明确的订阅制产品,并且没有每日额度赠送,入门级套餐 目前 29/月

反观百度搭子 Dumate、腾讯 QClaw/WorkBuddy 则都是有免费额度,长期来看使用成本更低,显然更适合绝大多数人
百度搭子 Dumate 每日免费 1000 额度(一次任务大概消耗不到10额度)
腾讯 QClaw 每天免费 4000 万 Token(平均一次任务消耗百万额度)
腾讯 WorkBuddy 新用户 5000 免费额度,每月免费 500 额度,目前每日签到有 100 额度(视使用模型不同,平均一次消耗几十额度)

既然使用上都没有成本(或者说成本极低),那这仨个又选哪个呢?
就让阿虚来替大家简单评测一下吧
评测前先破个固有印象,各大厂商的龙虾并不一定用的自家 AI 模型,所以没必要带有色眼镜

2
Dumate VS QClaw VS WorkBuddy
下面我尝试了一些常见的本地 AI 助手使用场景,用同一段提示词,分别喂给三个小龙虾
就看默认能力,不额外安装其他 Skills,让我们来看看各家表现到底如何?
2.1
处理 Excel 表格
对于学校老师来说,统计学生成绩再常见不过了吧?
不同班级成绩分布、平均分和不及格人数……每次都需要手动 Excel 拉公式,做图表,一搞就是一下午

我直接用最大白话让分别让 3 个小龙虾帮我处理桌面的成绩表文件夹,三者都正确的理解的文件所在位置
电脑桌面的成绩表文件夹中有3个Excel文件,帮我处理一下这三个班的考试成绩。请把成绩汇总到一起,按班级计算平均分、最高分、最低分,统计不及格人数,再按分数段(90分以上、80-89分、70-79分、60-69分、60分以下)生成人数分布表。最后输出一份可以直接打印的成绩分析报告

不过过程中我感觉「权限管理」做的最好的还是百度搭子 Dumate,是唯一弹出了权限请求的龙虾
并且细致到是「单个步骤」给予权限还是「整个对话」都给予权限

我们先来看下腾讯 Qclaw 的生成结果,可以算是基本的完成的任务,我所要求的成绩汇总、班级统计、分数段分布这些数据倒是都有

不过紧接着来对比下百度搭子 Dumate 的生成结果,就会发现还是百度搭子 Dumate 更好一点
首先就是成绩汇总数据更全面,Qlaw 只有「班级-姓名-分数」了。但在百度搭子 Dumate 的结果这里完整保留了对应学号、所处分数段、是否及格这些数据
班级统计、分数段分布则是被它分到了一页单表当中,数据也会更全面一点,包括它计算了及格率,还统计了参考人数,发现有 7 个缺考的没有成绩

▲百度搭子Dumate
这两者比毫无疑问百度搭子 Dumate 胜出
最后则是腾讯 WorkBuddy,它比较特别,给出的不是 Excel 统计表,而是一份成绩分析报告网页文件
虽然样式变精美了,但其实数据全面性上和百度搭子 Dumate 是差不太多的:
学号没丢掉,有计算及格率,也有统计到缺考人数,后续多了个可有可无的文字综合分析

客观评价这个输出结果有好有坏吧,毕竟一般要交给领导的通常都会被要求是 Excel 表格,而不是一个 html 文件
另外到手的是 Excel 也会更方便老师后续再自行修改编辑、导入教务平台之类的
2.2
生成 Markdown
搜集信息生成文档这个需求,在各行各业都相当常见
不过阿虚日常已经几乎不会去用 Word 了,写文档都是用 Markdown 格式,所以这里就顺便测试下这三个龙虾生成 Markdown 的能力
我这里还是用同一段需求去向三个龙虾提问:
搜索最近一周 AI 行业最重要的 5 个进展,整理成一份图文并茂的简报,保存为Word文件。每条进展包括:标题、一句话概述、为什么重要。最后加一段本周总结,说明这个领域这周整体趋势是什么
这里首先值得一提的是:百度搭子 Dumate 是三个当中完成任务速度最快的,仅用了 88 秒!而且只有它会显示任务耗时,腾讯 Qlaw 和 WorkBuddy 都是不显示耗时的
㊟ 其实上面那个 Excel 任务也是百度搭子 Dumate 最先完成,写的时候没意识到录屏展示😂

同时严格来说,也只有百度搭子 Dumate 完成了我的需求——因为我的指令是输出一份图文并茂的markdown 简报
这一点只有 Dumate 做到了,腾讯 Qlaw 和 WorkBuddy 输出的 Markdown 都是只有文字
并且最关键的是,百度搭子 Dumate 的数据来源要严谨的多,信息均来自工信部、阿里通义实验室、英伟达、高盛、央视网等,作为搜索引擎出身的百度的确在这方面还是有优势的

对比之下 Qclaw 就相形见绌了
不仅输出的 Markdown 只有纯文字,数据来源则是 Hacker News 热帖、MIT News、Bing 这些国外渠道(也就 MIT News 信息较为权威一点)

腾讯 WorkBuddy 也没好哪儿去
同样的纯文字内容,数据则是来源腾讯云开发者社区、Digital Applied、Google Blog、AIToolly、Kersai Research,这里面前三个都是自媒体/博客平台,也就 Kersai Research 这个行业研究机构的信息来源较为权威

只能说这一轮测试里面百度搭子 Dumate 毫无疑问的胜出了
你就说这个图文并茂的简报能不能拿来直接发公众号?完全可以嘛!
现在有大量的 Markdown 排版公众号文章工具,导入进去 ➔ 选择样式 ➔ 复制到公众号,发布一篇文章就是这么简单

2.3
提取视频画面
那以前学习手机拍照的时候,我收集有不少拍照姿势教学视频

虽然对博主而言「视频」是一个分享的好形式,但对「学习者」来说其实并不方便后期快速参考借鉴学习
翻视频哪有翻参考照片来的快,是吧?
所以我就想着是不是完全可以靠 AI 来帮忙提取里面的拍照姿势
还是同样一段提示词:
桌面上有一个「游乐园拍照姿势」视频文件,帮我提取其中所有的定格拍照画面为图片文件
这里面完成最快的还是百度搭子 Dumate,它直接就思考选择调用 ffmpeg 的场景检测功能来提取定格画面

最终 2 分 49 秒的视频一共提取了 72 张图片
因为它的提取逻辑是场景变化超过 25% 时就会进行关键帧提取,所以有一些多余画面是可以理解的
稍微删一删,就能得到纯粹的拍照姿势参考照片

然后我们再来看看 Qlaw 的处理方式,虽然同样选择了 ffmpeg 来处理视频
但脑子默认大模型的脑子似乎就没那么聪明了,它理解的定格画面竟然是每 5 秒提取一帧

这个结果不用想也知道,必定会漏掉很多我需要的姿势图
最终它只提取出来了 34 张图,说实话这类需求都是宁可多不可少,少了又得从头手动检查一遍,可以说结果基本上不可用

最后来看下 WorkBuddy 的结果吧
它稍微和上面两个不一样,我用的是GLM-5模型,它选择的是用 Python 脚本来解决问题,用到的是帧差算法,画面静止超过 0.5 秒时就会提取帧画面

最终这个算法下得到了和 Dumate 差不太多的结果,有 78 张图片,也是删一删多余的照片就能用的程度

这一轮测试百度搭子 Dumate 和腾讯 WorkBuddy 算是平分秋色
2.4
生图、生视频
那可以处理本地视频,那他们能不能生成视频,或者说生成图片呢?
现在搞内容创作,AI 图片、AI 视频的确是很常见的需求,所以阿虚就想到了用一个提示词同时测试下:
帮我生成一套绘本和一个视频,内容是给2岁小孩子看的《三只小猪》童话故事,采用手绘简笔画风格
不过说实话,测试到这里的时候我是真的有一点笑了
至于为啥笑,大家还是自己看吧
没错,下面这就是腾讯 Qclaw 生成的东西。我看得出它已经很努力的在实现我的需求了,也自动调用了 canvas-design 技能,甚至还挺细节的通过略带抖动的线条模拟了我要求的手绘效果
但这粗糙到像上个世纪 Windows 自带画图搞出来的东西,只能说不敢恭维了,对于我要求的视频,也只是单纯的 PPT 式视频

而腾讯 WorkBuddy 虽然内置模型众多,但最终输出结果只能说和 Qclaw 半斤八两
并且它有点儿无视我的需求,相当固执的选择了用 html 网页形式来制作内容(甚至我跑了两次都是选择输出 html 网页),虽然它试图靠纯手绘 SVG 来实现简笔画风格,但效果我只能说太过三岁小孩了

究其原因都是他们并没有默认接入 AI 生图、AI 生视频能力
反而是百度搭子 Dumate 再一次给了我惊喜,它是唯一完成了我视频制作需求的
具体看了下,原来是它默认就接入了百度自家的文库 AI 来生成图片、生成视频
唯一要说缺点就是对我的需求稍微理解有误,或者说它替我过于着想了。我原本是想让它替我生成一张张图片,不过它直接替我生成了一个 PPT 式的视频,理由是适合边看边给孩子讲故事

不过上面已经展示过了 Dumate 提取视频图片的能力,所以这个问题其实解决起来再简单不过了,无非一句话的事情

2.5
操作浏览器
那除了直接搜索网上现有新闻,阿虚做自媒体这行的,自己去各平台调研同行内容数据也是再常见不过了
那小龙虾主打一点能力就是能操纵本地浏览器,这一点自然也该测试一下
还是同样一段要求:
访问抖音网页版,收集一周以内有关openclaw的视频,点赞数最多的20个视频,统计这些视频的标题、作者、发布时间、点赞数,用python脚本将结果整理为excel保存在桌面。
我们先来看看百度搭子 Dumate 的解决方案,它先是调用了自带的 dumate-browser-use 技能,然后使用了微软推出的浏览器自动化命令行工具 Playwright-cli 来实现操作本地浏览器

▲过程为快进展示
总而言之,在尝试点击筛选按钮无果之后,它选择了换用 JavaScript 来提取页面上所有视频数据
虽然最后没能完全按照要求给到完整前 20 条数据(只有13条),但也很我的提示词有关,如果我让它一直翻页直到筛选够 20 条视频,显然它是能完成任务的
相比之下,最关键是:数据来源都是真实有效的!

为啥这样说呢,因为我后面继续实测了 QClaw 和 WorkBuddy 就明显看出差距了
QClaw 是一来没怎么思考就直接提示说:浏览器工具展示不可用

所以后续我也不清楚他在那里一股脑思考、尝试干些什么操作

反正最后就是告诉你:抖音网页版需要 Javascript 渲染,我的浏览器工具又不可用,再加上抖音有反爬机制

所以最后它给到的数据也根本没参考性,也不知道它从哪里胡编来的数据,对应视频链接也没有
它还告诉我如果需要真实数据让我考虑抖音开放平台 API,或者第三方数据服务平台……

最后则是大哥不笑二哥
当我尝试用 WorkBuddy 是解决同个需求的时候,等了半天都没有动静,我才仔细看了下操作进程,发现它直接卡在了操作第一步:安装 agent-browser

定睛一看,原来是它想去下载 Chrome,但我猜测大概率是谷歌的这个域名它无法请求成功吧,所以才在第一步卡了将近 10 分钟没动作

没办法,我只有中断任务,想办法替它解决这个问题之后,再尝试重启这个任务
那这次后续任务倒是能跑起来了,但不不意外的出了意外……

因为它依然没有采命令行调用本地浏览器方式,反正就是一样遇到了抖音的验证码保护机制,阻止了它的自动化访问

所以最后它也没能成功完成任务,而是给我瞎编了一大堆数据,然后建议我要么手动采集、要么手动获取 Cookies 之后再配置到它给的脚本中尝试采集

因为有了百度搭子 Dumeta 成功的前例,所以后续我让 WorkBuddy/QClaw 也去使用 Playwright-cli 可能也是能完成任务的
但对于不清楚这些的新手来说,又怎么可能知道呢?更别说 WorkBuddy/QClaw 给出的解决方案里面根本没有提到 Playwright-cli
所以仅看一次性任务通过率,百度搭子 Dumate 又是毫无疑问完胜了

总体评测下来,毫无疑问百度搭子 Dumate 是这 3 个本地龙虾里面最好用、最简单好上手的那个
WorkBuddy 是能免费切换 GLM-5/Kimi K2.5/Minimax M2.7 这些模型,但可能是优化存在问题,实测下来真就感觉差点,上述测试多个任务都没有完成的很好
QClaw 则明显感觉默认模型很笨,关键是没有免费模型可以切换,自己填 API 的话又是额外使用成本了

相较之下,百度搭子 Dumate 真属于打开即用。默认模型能力很强、很聪明,体感绝对不是文心模型
虽然直接问它套不出来背后使用的是什么模型,但管他的呢,我觉得好用就行
另外,阿虚上述测试的仅是默认能力,这三个龙虾都是支持额外添加 Skill 技能的,这个东西就和浏览器扩展一样,你装的好用的 Skill 技能越多,你的小龙虾就会越强

特别值得一提的是,百度搭子 Dumate 还是这 3 个龙虾里面目前唯一支持对话记忆功能的
那随着你使用次数越多、使用时间越久,它作为你的本地 AI 助手就会越懂你,越能正确处理你的需求

虽然不像 QClaw 和 WorkBuddy 是腾讯系产品,但别担心,Dumate 也是支持接入微信来调用的

虽然我觉得移动端调用对于这种本地虾来说用处不大,但中午出去吃饭,蹲坑摸鱼时间也能调用电脑上的龙虾提前处理点工作,也算是有帮助吧
最后就是在上文评测中说到过了,百度搭子 Dumate 算是权限管理做的最严格的一个,尤其对于本地文件的操作上,甚至会精细到每一步操作都要你手动确认
如果你之前完全没有使用本地 AI 助手的经验,百度搭子 Dumate 应该算是目前最适合新手使用的 Agent
到底能不能帮你解决实际工作问题,大可以自己上手试一试:
https://cloud.baidu.com/product/dumate.html?track=sckax
㊟ 目前在 Dumate 左下角输入邀请码「AX666」你还可以额外获得 1000 永久积分(阿虚得500)

夜雨聆风