乐于分享
好东西不私藏

OpenClaw+DeepSeek也能看懂图了?一个免费方案

OpenClaw+DeepSeek也能看懂图了?一个免费方案

因为我自己配置的过程比较复杂,所以我就让小龙虾帮我总结了一个省流的版本,把这段话复制发给你自己的小龙虾(OpenClaw):

帮我配置图片理解能力。去智谱开放平台 open.bigmodel.cn 注册账号,拿到 API key 后设置到系统环境变量 ZHIPU_API_KEY。然后创建一个自定义技能:在 plugin-skills/ 下建 glm-vision/ 目录,写一个 Python 脚本调用 GLM-4.6V-Flash 模型的 chat/completions 接口,把图片 base64 编码后通过 image_url 传过去,支持批量分析和限流重试。最后把脚本路径和用法记到 TOOLS.md 里。以后我发图片给你,你就用这个来分析。


以下内容是我记的流水账,不感兴趣的朋友就可以跳过了😊

AI编程

今天继续来部署我的OpenClaw,其实,昨天晚上已经安装好了,但是不知道为啥,半夜连接又断了,发送消息它就没反应了,早上打开电脑调试了一下也没找出原因,就重新启动了一下openclaw网关服务,然后设置了一下开机启动。

早上安装好之后,就开始各种测试我的小龙虾能干啥了,比如先让他获取一下电脑信息。

然后就是给他安装各种技能了,一般都是找到一篇文章或者一个Github仓库就直接发给它,让它学习安装一下。

另外因为我电脑上已经提前安装好了飞书CLI,所以小龙虾还能直接访问我写的飞书文档,把我之前写的一个个人说明书也发给它看了,多多了解一下我。当然也有一些能力上确实不太支持的,比如用我的身份发送消息,感觉确实不太好,所以折腾了一下还是放弃了。

包括让它发送图片给我也是,教了它好久,不过好在教完之后基本它都能记住,以后就都会了。

然后就是陆陆续续安装了不少有意思的技能,主要是参考了这篇文章吧。

2026 OpenClaw必装的15个插件

然后就是让它能看懂我发的图片了,一开始尝试了一下用 summarize 这个技能,发现还是不行。Deep Seek 只支持纯文本的推理能力,不支持多模态识别,没有办法识别图片内容。

然后我就让他看看有没有其他的技能可以支持图片理解的。

查找了一圈也没有合适的,基本还是要用一个支持多模态的模型才行。

于是我转换了一个思路,看看怎么搞一个支持多模态的模型。先考虑是否可以本地部署一个,之前测试过 qwen 的小模型还是不错的。

但是它分析了一下,显卡内存太小了,能跑的模型都不太行,于是暂时放弃,想着看看有没有什么云端的模型可以理解图片,而且性价比高一些的。

本来想让它看看小米的,因为最近小米的模型不是大降价嘛,结果突然发现一个免费的支持图片理解的模型!

于是果断让它帮我配置一下,很快啊,去平台上注册登录一个账号,然后生成一个API KEY发给它就行了。

立马测试了一下,果然很好使,图里的小字都识别得很清楚。

最后让它总结了一下上面识别图片的流程,固化成一个技能,免得后面忘记了。

生活

晚上吃完饭出来骑车转一转,有点小雨,然后还有雷电,但是不是特别大吧?来到了猎德大桥边上,看到了挺壮观的,可能是因为今天比较热,然后那个江水都已经退下去了,边上出现了很大的海滩,之前一直没看过的。
我说人怎么这么少?一般来说,江边会有挺多人钓鱼的。原来水都已经退下去了,他们钓不到鱼了。
运动
昨晚睡眠质量一般,今天上午还是有点困困的,所以就暂停运动一天了。
睡眠

饮食

今天晚上出来吃椰子鸡了,好久没吃了。