事情要从公众号链接说起。
最近把 AI 工作流从本地迁移到 OpenClaw 云端,以为会丝滑过渡。结果第一天就翻车了——发了一个公众号链接让 OpenClaw 读取,它说"不行"。
"微信公众号有防爬机制,读取不了。"
行,那想办法解决一下?
"没办法,只能你自己打开看。"
我信了。直到第二天我又试了一次——
"抓到了!标题是《xxxxxx指南》..."
同一个链接,昨天说不行,今天又说行。这让我对openclaw陷入了信任危机。
说白了,发生了什么?
OpenClaw 后来给我复盘了:
问题不是"不能",是"方法没试够"。
但我发现了更深层的问题——
抓到了,但抓了个寂寞
很多公众号文章,正文压根不是文字,是一张或几张长图。
你 curl 抓半天,最后拿到的就是一个 <img> 标签。
文字呢? 图片里。
这是我在折腾第二天发现的新坑。
找到一个参考方案
我给 OpenClaw 发了一篇文章,说"看看这个 skill 能不能解决你的问题"。
它研究完告诉我:
项目叫 markdown-proxy 能把任意 URL 转成 Markdown 公众号、飞书、推文都能抓
但有个问题——这是 Claude Code 专用的 skill。
~/.claude/skills/ | ~/.openclaw/workspace/skills/ | |
npx skills add xxx | clawhub install xxx |
两个系统长得像,但装的是两条路。
💡 踩坑预警:markdown-proxy 发布在 GitHub,不在 ClawHub 上。想装?要么手动把文件下载到正确目录,要么自己写一个。听晨念一句劝:别硬装,适配一下更快。
OpenClaw 选择:自己移植过来。
新问题又来了
装完 markdown-proxy,我以为问题解决了。
直到测试了一个长图形式的公众号——
"抓到了,但正文是图片链接。"
markdown-proxy 只能把图片链接保留下来,不会识别图片里的文字。
又抓了个寂寞。
💡 踩坑预警:这是原版 markdown-proxy 的盲区——它只抓 HTML 结构,图片里的文字识别需要额外的视觉模型能力。
既然不够用,那就升级
OpenClaw 干了一件我没想到的事——它把 markdown-proxy 升级了。
升级内容
核心创新:图片 URL 自动调用视觉识别脚本,把图片里的文字"抠"出来。
npx -y bun "/root/.openclaw/workspace-xxx/skills/moments/scripts/vision-analyze.ts" "图片路径"
还有一件事
OpenClaw 没有止步于此。
它把升级后的 markdown-proxy,注入到了写作系统的素材采集流程里。
wechat-article(晨念公众号写作系统):
素材采集步骤 → 调用 markdown-proxy 公众号链接 → 自动识别长图
youboshi(XXX公众号写作系统):
素材采集步骤 → 调用 markdown-proxy 招聘公告链接 → 自动识别图片
效果:以后写文章需要参考链接,markdown-proxy 会自动接管处理。
最后
两天的折腾,换来一个升级版的 Skill 和一个更完善的工作流。
核心教训:
- AI 说"不行"时,多问几句"为什么"
:可能是方法没试够 - 现成的方案不一定完美适配
:该升级就升级 - 解决一个问题后,想想还有没有相关问题
:把能力注入到整个工作流
这是晨念与 OpenClaw 协作的第 39 篇记录。
夜雨聆风