乐于分享
好东西不私藏

《openclaw:一键抓取公众号的 skill 来了》

《openclaw:一键抓取公众号的 skill 来了》

各位道友请了!

我是猫来gogogo,一介  AI 散修  。

AI一天,人间一年。

1、背景:

我们知道,

公众号文章有严格的反爬机制,

页面结构也和普通网页不一样。

很多通用抓取工具,一上来就会遇到这些问题:

  • 请求被拦,返回异常内容

  • 抓不到正文,只拿到壳页面

  • 标题、封面、图片提取不完整

  • 抓出来一堆噪音,根本没法直接用

  • 同一个方案,换一篇文章就失效

所以我专门做了这个 skill。 专门解决 公众号文章抓取 这件事。

最终效果是:

  • 只需要提供公众号链接,这个 skill 就可以:

  • 抓出封面图,文章标题;

  • 抓出文章正文,包括图片;

  • 如果在飞书中,让小龙虾用这个skill,还会自动写飞书文档。

2、成果演示:

首先复制公众号链接,我以自己的一篇公众号为例:

原文链接:https://mp.weixin.qq.com/s/_rI1LdrY5KcZfMTsxBHIGw

然后在飞书中,把链接发给我的小龙虾,并让它抓取这篇公众号文章:

过了一会,不仅文章抓取好了,

飞书云文档也写好了,

我的编辑权限也打开了。

我们打开飞书文档看看效果,

文章标题、封面都在;

再继续往下看,

标题,代码块,图片都在,

完美~

接下来,你想基于公众号内容改写,

或者把多篇同类型的文章一起让AI分析都可以,

希望大家合理使用。

3、如何得到这个 skill ?

我已经开源到了 GitHub 上~

https://github.com/maolai7/agent-skills/tree/main/scrapling-article-fetch

直接复制 GitHub 链接给你的小龙虾,或者其他AI,让它自己安装就行。

如果不能打开GitHub, 后台私信【抓取公众号skill】,

我会自动回复你这个skill文件。

你把文件下载下来以后,

手动复制到你本地的 skills 文件夹目录下,就可以使用了。

如果有问题可以评论区留言,我再迭代优化。


感谢你看到最后。

这篇分享就到这里啦,希望其中的内容,  能给你带来一点点启发  。

如果你觉得有收获,欢迎点个「在看」和「转发」,

也欢迎关注我,之后我会继续  分享更多 AI 学习、使用和实践笔记。

我是「猫来gogogo」,一边学习,一边记录这个 AI 时代。

我们下次再见。

往期精彩推荐:

《如何在Windows系统养一个龙虾🦞 —— openclaw》

《openclaw:如何搭建一个AI团队?还能互相派活?》

《openclaw:赋予每个 agent 独立的人格和做事准则》