乐于分享
好东西不私藏

再见了,OpenClaw!小浣熊已经接管了我的浏览器

再见了,OpenClaw!小浣熊已经接管了我的浏览器

春节期间,OpenClaw大火,我们身边都掀起了一股养虾的热潮。我也养了。

但是有两个问题:一、OpenClaw太重,而且每次出了问题都要去命令行里面去修。隔三差五就来一个罢工真的很让人崩溃。二、安全问题,我身边还是有一大批人因为隐私至今没有使用它。

所以我一直在寻找一个轻量化、安全、易用的Agent。

但是,我使用了一圈,想要找一个有审美、懂创作、真正能独立自主干活的Agent,都没有让我满意的。 直到前几天,我朋友给我推荐了一款名叫办公小浣熊的Agent让我试用一下。

我试用的逻辑很简单,能够帮我干一些日常事务,能够稳定跑,能够随时和我手动干的工作接轨。

这也是我这次看办公小浣熊桌面端2.0最感兴趣的地方。

它不是一个单纯的网页版聊天机器人套壳。

它想做的是一个桌面端执行入口。

简单说,就是让小浣熊能看见你电脑里的文件,能操作浏览器,能读Excel,能处理你当前选中的内容,还能把结果沉淀到飞书这些团队协作系统里。

/办公小浣熊桌面端 2.0/

你有没有算过,你一天里有多少时间,是花在”搬运”上的?

文件在电脑某个文件夹里。

数据在那个打开了八百年的 Excel 里。

资料散在十几个浏览器标签里。

团队的东西又在飞书、企业微信、钉钉里。

而你的 AI 呢?被关在一个孤零零的对话框里。

于是你的工作流,长这样:

整理材料 → 上传给 AI → 打字提问 → 等它回答 → 把结果下载下来 → 再粘回你原来的地方。

AI 是挺强。

但它强得像一个隔着玻璃的专家——你得把所有东西捧到它面前,它看完给你个答案,你再自己捧回去。

这种割裂感,用得越久越难受。

你以为你请的是一个会动手的助理。

结果你请的,是一个特别能说的顾问。

办公小浣熊桌面端 2.0 想干掉的,就是这个”捧来捧去”

一句话说清它干了什么:

它把 AI 从对话框里放了出来,让它直接进到你的电脑里干活。

它是商汤基于日日新大模型做的,定位很直接——从”对话助手”变成”执行助手”。

不再是告诉你”你应该怎么做”,而是直接帮你把文件读出来、把数据分析出来、把网页整理出来、把文档生成出来,再把结果写回到你需要的地方去。

/本地文件,它直接读/

以前分析个 Excel,你得先把文件传上去,然后用一大堆提示词说清楚你要做的事情,临末还需要加上一条“其余部分保持不变”,否则因为幻觉问题,它老是悄咪咪帮你改东西

现在你可以直接在你的电脑里新建一个工作区,给小浣熊权限,直接对它说:帮我整理工作区文件,帮我生成一个报告

它自己去读、自己去算、自己给你出报告。20 多种文件格式,图片、文档、表格都接得住。

事实上,这个任务里我给它的都是我工作中没处扔的杂乱文件,它不但归纳整齐了,还给我出了一份文档整理报告

更让人安心的是那个”工作区”——你可以只开放某一个文件夹给它,它能碰什么、不能碰什么,边界你说了算。

/一句话,它帮你开浏览器/

这块是我没想到会这么顺手的。

我做内容,经常要抓热点。以前的标准动作是,开十几个标签页,一个个点进去,看新闻、追踪各家产品、模型榜单,再手动抠成一个草稿。一下午就这么没了。

现在我只需要直接跟它说自己的需求:我要写一篇关于办公agent的文章,帮我在chrome搜索相关信息,做一份报告,有用的网站帮我打开

很快,它开始自己开网页,自己阅读,自己整理。我就坐在那儿看它的思维链在跳动,输出结果如下:

与此同时,我的浏览器里几个网页也蹦到了我的眼前:

根据我前面给它的提示词,小浣熊帮我推荐了ChatGPT商业版、Claude for work

别说,还挺准。这两个确实是最近干活用的最多的。

很快,报告也好了,并且生成了markdown文件放在了我的工作区里。报告是这样的:

那种你平时要切十几个标签、复制粘贴半小时的活,变成了一句话的事。

到这里很多人可能要说了,OpenClaw不也有这些功能。但是一个体积大、安装复杂、每次干完活都不知道文件在哪的agent框架,和每次都能帮你把活儿干完、文件归类好的App,感受是不一样的。

小浣熊体量非常轻,几百M,和你电脑上安装了个飞书、钉钉没有区别。

/Quick Bar:选中啥,就处理啥/

这个设计非常细节,但是我觉得最有用的一点。

之前,平时我工作之前,都要打开豆包,挂个悬浮球在旁边,不是豆包模型有多聪明,而是你在工作的时候总会有一些小问题出现,比如翻译一下某句话的意思。

这个时候一个经常在手边的大模型的重要性就凸显出来了,但即使是悬浮球,总归还是需要点一下或者截图的。

小浣熊可以说是非常方便了,选中任何你想让它帮忙处理的文字、文件、图片然后按快捷键,一键直达。

Mac 上是 ⌘K,Windows 上是 Ctrl + K。

这玩意儿的精髓是,它不挑场景。你在看 PDF、看网页、看一份报告,随手选中一段,按一下快捷键,小浣熊就浮出来了,直接处理你选中的那段东西。

但真正让我「咦」了一下的,是它在 Word 里的样子。

从以上截图里可以看到,背景是一个word文档,我随便选中了一段,就可以随时唤醒、随时干活儿了。

到这儿我已经有点感觉了。这不是一个会说话的 AI,这是一个会动手的 AI。

/一键接入飞书/

AI时代的办公方式,是AI干一份活儿,人做最后的审核,二者能够完美衔接。

而不是——AI干AI的,人干人的。到最后还是得手动调,一天忙下来Control+C/V都快按冒烟了。

AI 产出的东西,第一次真正进到了团队的协作流里,而不是停在你一个人的聊天记录里。

现在飞书已经能连了。以我前面生成的报告为例,只需要在下方点击导出按钮,就可以把整个分析过程都导入到飞书文档中。如果想要把分析结果导出飞书文档,也可以直接跟小浣熊说,请把分析结果导入飞书文档 即可。

另外,官方跟我透露,企业微信和钉钉据说也快了,到时候扫码就能连。

/本地记忆:用得越久,越懂你/

这一条,对长期用的人最关键。

你可以让它记住你是谁、什么岗位、行业黑话、公司简称、你惯用的报告模板、你喜欢的汇报口吻。

在第一次打开小浣熊的时候,它就会检测你之前使用OpenClaw、Hermes等Agent的使用记忆

另外,你也可以在后台手动写入记忆:

记下来之后,后面每次干活,它都带着。

你不用每次重新解释一遍背景,它的输出也会越来越贴你的习惯。

这就是那句话的落地:从一个”通用助手”,慢慢变成一个”懂你工作的助手”。

/让 AI 在我电脑里乱动,我放心吗/

聊到这,肯定有人开始慌:

让 AI 自己在我电脑里动文件、改表格,万一它干错了呢?

这恰恰是桌面端 2.0 我觉得做得最稳的地方。

它用的是”云 + 本地”双引擎:

复杂的推理、规划、生成这些重活,交给云端模型;

连你电脑、读本地文件、操作浏览器这些事,由本地 Agent 干。

能在你电脑里处理完的敏感数据,就不往外传。

更关键的是,它有变更历史和一键回滚

AI 每次动手前后,系统自动留快照。

它干了啥、什么时候干的、改了哪个文件,你都能查。

觉得不对,一键回到改之前。

让 AI 自动干活的前提,是你随时能反悔。

这一点,比多几个花哨功能重要得多。

/  写在最后/

这两天大家都在聊Agent。

Claude Code、Codex、OpenClaw、各种能自己执行任务的工具,已经把整个AI圈搅得热热闹闹。

当行业天天讲智能体、工作流、自动化的时候,你可能会觉得离自己很远。

但我自己的感受是,真正有价值的 AI 产品,恰恰应该让这些大词消失。

你不需要知道它背后是不是 Agent。

你只需要知道,当你选中一段内容按下 ⌘K,它能不能帮你总结。

当你把 Excel 放进授权目录,它能不能帮你分析。当你说把结果沉淀到飞书,它能不能真的落地。

办公小浣熊桌面端 2.0 最打动我的地方,也在这里。

它不是在讲一个更聪明的聊天框。它在试图回答一个更现实的问题。

AI 到底怎么进入普通人的办公现场?

这个问题很大。也很土。

但我觉得,越土的问题,越接近生产力。

模型能力当然重要。但模型再强,如果永远困在一个输入框里,它就像一个被关在玻璃房里的天才。

你知道他很厉害。但你每次都得把世界切成一小块,递进去给他看。

桌面端、本地 Agent、浏览器操作、文件处理、企业系统连接,这些东西做的其实是同一件事。

这也是为什么我觉得未来办公 AI 的竞争,不会只比谁模型更强。

还会比谁更懂办公现场。谁更懂 Excel 里的脏数据。谁更懂飞书文档里的协作链路。谁更懂普通人不想配置一堆复杂流程。

谁更懂企业安全部门看到自动执行四个字时心里那一声卧槽。

说到底,我还是那个老观点。

技术真正改变世界的时候,往往不是它最炫的时候。

而是它开始变得顺手的时候。

另外,昨天还看到商汤小浣熊开了一个「商汤小浣熊真实任务挑战季」,奖池有 300w+

1. OPC 能力挑战赛有两个赛道:OPC 新手出道赛、OPC 高手创造赛

2. 21天真实任务打卡挑战

真实任务、真实场景、真实交付,一个人加 AI,也能成为一支队伍,感兴趣可以点击阅读原文了解下。