乐于分享
好东西不私藏

批量下载任意公众号文章,这个开源工具能导出 HTML/Excel/Word 还带阅读量数据

批量下载任意公众号文章,这个开源工具能导出 HTML/Excel/Word 还带阅读量数据

你想备份某个公众号的全部历史文章,微信官方却不提供批量导出功能。手动一篇篇复制?不现实。

这个 GitHub 10.5k stars 的开源工具,三步就能导出任意公众号的全部文章,支持 HTML/Excel/Word 等六种格式,还能抓取阅读量和评论数据。

这不是爬虫脚本,是完整的内容资产备份方案

市面上有不少公众号文章下载工具,但大多数是命令行脚本,配置复杂、容易封号、排版丢失。这个项目的不同之处在于:

第一,开箱即用。不需要写代码、配环境,打开网站扫码就能用。对非技术用户友好。

第二,100% 还原排版。HTML 格式导出会打包图片和 CSS 样式,打开后跟原文基本一致(项目官方宣称可 100% 还原,实际测试中大部分文章的排版还原度确实很高)。不是纯文本 dump,是完整的离线存档。

第三,数据维度全。不只是文章正文,还能导出阅读量、点赞数、转发量、评论内容——这些数据对内容研究者、竞品分析者极其有价值。

项目目前 10.5k stars,1.8k forks,有 3 个 QQ 交流群(1群已满),社区活跃度不错。MIT 协议,可自由商用。

核心功能一览

这个工具以网站形式提供,核心流程是:搜索公众号 → 同步文章列表 → 筛选下载 → 多格式导出。

支持的导出格式:

格式
特点
HTML
100% 还原排版

,打包图片和样式到 ZIP,打开跟原文一致
Excel
表格形式,含标题、作者、发布时间、链接等元数据
JSON
结构化数据,适合程序二次处理
Markdown
纯文本标记,适合导入 Obsidian/Notion
TXT
纯文本,仅保留文字内容
Word
适合离线阅读和打印

文章筛选条件: – 按作者过滤 – 标题关键词搜索 – 发布时间范围 – 是否原创 – 所属合集

其他功能: – 合集批量下载 – 单篇 URL 直接下载 – 图片/视频分享消息下载 – 本地 IndexedDB 缓存,避免重复下载 – 代理池并发下载,支持断点续传 – 开放 RESTful API,支持第三方集成

三步上手

第一步:扫码登录

访问 https://down.mptext.top,点击【登录】,用微信扫描页面二维码。

注意:必须选择公众号服务号登录,不能用小程序登录,否则后续无法获取文章数据。

登录成功后,系统会生成一个 API 密钥(auth-key),有效期 4 天,过期后重新扫码即可。

第二步:添加公众号并同步文章列表

在【公众号管理】页面搜索目标公众号名称,点击【添加】,然后点击【同步】拉取全部历史文章。

系统会自动翻页,直到拉取完所有文章(微信接口每次最多返回 20 条)。同步后的文章列表会缓存在浏览器本地,下次打开不用重新拉取。

第三步:筛选文章并导出

进入【文章下载】页面,选择目标公众号,勾选需要的文章,点击【抓取】下载内容。

抓取完成后,点击【导出】选择格式。如果选 HTML,会得到一个 ZIP 文件,解压后用浏览器打开,排版、图片、样式跟原文基本一致。

进阶:抓取阅读量和评论数据

如果你需要文章的阅读量、点赞数、评论内容,需要额外配置 Credential。

Credential 是微信接口的认证参数(biz、uin、key、pass_ticket 等),每个公众号的 Credential 不同,有效期约 25 分钟。

项目提供了一个配套工具 wxdown-service 来自动抓取:

  1. 下载对应系统的 wxdown-service(Windows 直接运行 exe,macOS 需 Python 环境)
  2. 启动后安装 mitmproxy CA 证书
  3. 将系统代理设置为 127.0.0.1:65000
  4. 在电脑端微信内置浏览器中打开目标公众号文章
  5. 工具自动拦截并提取 Credential,同步到网站

抓取成功后,网站上就能显示该公众号的阅读量、点赞数、评论等数据,导出时也会包含这些字段。

项目地址: https://github.com/wechat-article/wxdown-service

私有化部署:数据完全自主可控

如果你担心在线版的数据安全,或者需要大量下载,可以私有化部署:

Docker 部署(推荐):

docker run -d -p 3000:3000 wechat-article/wechat-article-exporter

Cloudflare Pages 部署:

Fork 仓库后连接到 Cloudflare Pages,自动构建部署。

Vercel 一键部署:

点击仓库 README 中的 Vercel 部署按钮即可。

本地开发:

git clone https://github.com/wechat-article/wechat-article-exporter.git
cd wechat-article-exporter
npm install
npm run dev

关于代理节点

微信文章有跨域和防盗链限制,下载时需要代理节点转发请求。在线版默认使用公共代理,但每个节点每天限 10 万次请求,大量下载时可能排队。

建议搭建私有代理节点,项目仓库里有详细教程。代理节点越多,并发下载速度越快,推荐配置 5 个以上节点

局限与注意事项

这个工具不是万能的,有以下几个边界:

第一,你需要有一个公众号。扫码登录时必须用订阅号或服务号,没有的话需要先去微信公众平台注册一个。

第二,目标公众号需开启搜索。如果目标公众号关闭了「允许通过名称搜索」功能,可能搜索不到。

第三,阅读量抓取有门槛。需要额外配置 wxdown-service 和系统代理,对非技术用户有一定操作成本。

第四,公共代理有限速。大量下载建议私有化部署并搭建私有代理节点。

第五,版权归属原作者。通过本工具获取的文章内容,版权归文章原作者所有,请合理使用,勿用于商业侵权。

谁适合用这个工具

  • 公众号运营者
    :备份自己的历史文章,做内容复盘
  • 内容研究者
    :批量采集某个领域的公众号文章做分析
  • 竞品分析师
    :跟踪竞品公众号的发布节奏、阅读量变化
  • 知识管理爱好者
    :把优质公众号文章归档到本地或导入 Obsidian
  • 数据分析师
    :导出 JSON/Excel 做阅读量、评论的情感分析

怎么开始用

最快的体验方式:直接访问 https://down.mptext.top,扫码登录,搜索一个你常看的公众号,试着同步并导出几篇文章。

如果你有自己的服务器,Docker 一键部署:

docker run -d -p 3000:3000 wechat-article/wechat-article-exporter

需要阅读量数据?下载 wxdown-service 配合抓取 Credential。

项目地址:https://github.com/wechat-article/wechat-article-exporter

MIT 协议,可自由商用和二次开发。10.5k stars,社区持续维护更新。

现在打开 https://down.mptext.top,选一个你收藏夹里的公众号,看看它有多少篇历史文章你还没读过。