乐于分享
好东西不私藏

我做了一个把在线文档下载到本地的 Codex Skill

我做了一个把在线文档下载到本地的 Codex Skill

最近我做了一个 Codex 技能,叫 web-article-download

它的用途很简单:把常见的在线文档链接下载到本地。

比如微信公众号文章、GitHub 项目、PDF、DOCX、在线教程、博客文章,或者一些临时打开但之后可能不好找的网页资料。

项目已经开源:

https://github.com/ai-dcf/web-article-download

为什么做这个技能

我经常会遇到一种情况:

看到一篇文章,觉得以后可能会用到,于是先收藏。

看到一个 GitHub 项目,觉得不错,于是先 Star。

看到一份 PDF 或在线教程,也先把链接存起来。

但链接越存越多之后,真正再拿出来用的次数并不多。

一方面是因为资料分散在不同平台,找起来麻烦;另一方面是有些网页内容并不适合直接复制保存,格式容易乱,也不方便后续整理。

所以我想做一个简单一点的工具:给它一个链接,让它尽量把内容下载到本地,并按标题整理成目录。

这样至少在需要回看、检索、整理的时候,不用再从一堆收藏夹里重新翻。

它能做什么

目前 web-article-download 会尽量完成这些事情:

  • 识别链接类型
  • 下载网页或文件内容
  • 用标题创建本地目录
  • 保存为本地文件
  • 尽量生成 Markdown 和 HTML
  • 对 PDF、DOCX 等文件保留原始文件
  • 对 GitHub、公众号、普通网页采用不同处理方式

它不是一个复杂的知识库工具,也不负责后续的分类和总结。

它只做前面一步:把在线内容先保存下来。

如何安装

安装方式也比较直接。

把下面这句话发给 Codex:

安装 web-article-download 技能,地址:https://github.com/ai-dcf/web-article-download

Codex 会根据这个 GitHub 地址安装技能。

安装完成后,就可以在 Codex 里直接用自然语言调用。

使用方式

使用时只需要把链接发给 Codex,并说明要下载到本地。

例如下载一篇微信公众号文章:

https://mp.weixin.qq.com/s/PfhiPhb7aZzrVmW1WxFELg 下载这篇文章到本地

Codex 会调用 web-article-download,识别链接类型,然后保存内容。

下载飞书云文档

飞书文档也可以用类似方式处理。

https://waytoagi.feishu.cn/wiki/Nf0nwXlcWiueaSk5eVLcyXNLn2b 下载这篇文章到本地

执行完成后,会在本地生成对应的文档目录。

下载普通博客

普通博客文章也可以下载。

例如博客园文章:

https://www.cnblogs.com/Zhang-Xiang/p/20028472 下载这个文章到本地

这类网页以前我一般会直接收藏,现在更倾向于下载一份到本地。

不一定每篇都会再看,但至少需要的时候更容易找到。

为什么开源

这个需求并不复杂,但很常见。

开发者可能会保存技术文档和 GitHub 项目。

写作者可能会保存案例和参考资料。

产品经理可能会保存方案文档、竞品页面或行业资料。

如果只是保存链接,后面经常还要重新打开、重新复制、重新整理。

所以我把这个技能开源出来。它现在还只是一个偏实用的小工具,后续也可以继续补更多站点和文件类型的适配。

项目地址:

https://github.com/ai-dcf/web-article-download

如果你也经常需要把网页、公众号文章、GitHub 项目、PDF 或在线资料保存到本地,可以试一下。