我做了一个把在线文档下载到本地的 Codex Skill
最近我做了一个 Codex 技能,叫 web-article-download。
它的用途很简单:把常见的在线文档链接下载到本地。
比如微信公众号文章、GitHub 项目、PDF、DOCX、在线教程、博客文章,或者一些临时打开但之后可能不好找的网页资料。
项目已经开源:
https://github.com/ai-dcf/web-article-download
为什么做这个技能
我经常会遇到一种情况:
看到一篇文章,觉得以后可能会用到,于是先收藏。
看到一个 GitHub 项目,觉得不错,于是先 Star。
看到一份 PDF 或在线教程,也先把链接存起来。
但链接越存越多之后,真正再拿出来用的次数并不多。
一方面是因为资料分散在不同平台,找起来麻烦;另一方面是有些网页内容并不适合直接复制保存,格式容易乱,也不方便后续整理。
所以我想做一个简单一点的工具:给它一个链接,让它尽量把内容下载到本地,并按标题整理成目录。
这样至少在需要回看、检索、整理的时候,不用再从一堆收藏夹里重新翻。
它能做什么
目前 web-article-download 会尽量完成这些事情:
-
识别链接类型 -
下载网页或文件内容 -
用标题创建本地目录 -
保存为本地文件 -
尽量生成 Markdown 和 HTML -
对 PDF、DOCX 等文件保留原始文件 -
对 GitHub、公众号、普通网页采用不同处理方式
它不是一个复杂的知识库工具,也不负责后续的分类和总结。
它只做前面一步:把在线内容先保存下来。
如何安装
安装方式也比较直接。
把下面这句话发给 Codex:
安装 web-article-download 技能,地址:https://github.com/ai-dcf/web-article-download
Codex 会根据这个 GitHub 地址安装技能。

安装完成后,就可以在 Codex 里直接用自然语言调用。
使用方式
使用时只需要把链接发给 Codex,并说明要下载到本地。
例如下载一篇微信公众号文章:
https://mp.weixin.qq.com/s/PfhiPhb7aZzrVmW1WxFELg 下载这篇文章到本地
Codex 会调用 web-article-download,识别链接类型,然后保存内容。

下载飞书云文档
飞书文档也可以用类似方式处理。
https://waytoagi.feishu.cn/wiki/Nf0nwXlcWiueaSk5eVLcyXNLn2b 下载这篇文章到本地

执行完成后,会在本地生成对应的文档目录。

下载普通博客
普通博客文章也可以下载。
例如博客园文章:
https://www.cnblogs.com/Zhang-Xiang/p/20028472 下载这个文章到本地

这类网页以前我一般会直接收藏,现在更倾向于下载一份到本地。
不一定每篇都会再看,但至少需要的时候更容易找到。
为什么开源
这个需求并不复杂,但很常见。
开发者可能会保存技术文档和 GitHub 项目。
写作者可能会保存案例和参考资料。
产品经理可能会保存方案文档、竞品页面或行业资料。
如果只是保存链接,后面经常还要重新打开、重新复制、重新整理。
所以我把这个技能开源出来。它现在还只是一个偏实用的小工具,后续也可以继续补更多站点和文件类型的适配。
项目地址:
https://github.com/ai-dcf/web-article-download
如果你也经常需要把网页、公众号文章、GitHub 项目、PDF 或在线资料保存到本地,可以试一下。
夜雨聆风