批量下载任意公众号文章,这个开源工具能导出 HTML/Excel/Word 还带阅读量数据

你想备份某个公众号的全部历史文章,微信官方却不提供批量导出功能。手动一篇篇复制?不现实。
这个 GitHub 10.5k stars 的开源工具,三步就能导出任意公众号的全部文章,支持 HTML/Excel/Word 等六种格式,还能抓取阅读量和评论数据。
这不是爬虫脚本,是完整的内容资产备份方案
市面上有不少公众号文章下载工具,但大多数是命令行脚本,配置复杂、容易封号、排版丢失。这个项目的不同之处在于:
第一,开箱即用。不需要写代码、配环境,打开网站扫码就能用。对非技术用户友好。
第二,100% 还原排版。HTML 格式导出会打包图片和 CSS 样式,打开后跟原文基本一致(项目官方宣称可 100% 还原,实际测试中大部分文章的排版还原度确实很高)。不是纯文本 dump,是完整的离线存档。
第三,数据维度全。不只是文章正文,还能导出阅读量、点赞数、转发量、评论内容——这些数据对内容研究者、竞品分析者极其有价值。
项目目前 10.5k stars,1.8k forks,有 3 个 QQ 交流群(1群已满),社区活跃度不错。MIT 协议,可自由商用。
核心功能一览
这个工具以网站形式提供,核心流程是:搜索公众号 → 同步文章列表 → 筛选下载 → 多格式导出。
支持的导出格式:
|
|
|
|---|---|
|
|
100% 还原排版
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
文章筛选条件: – 按作者过滤 – 标题关键词搜索 – 发布时间范围 – 是否原创 – 所属合集
其他功能: – 合集批量下载 – 单篇 URL 直接下载 – 图片/视频分享消息下载 – 本地 IndexedDB 缓存,避免重复下载 – 代理池并发下载,支持断点续传 – 开放 RESTful API,支持第三方集成
三步上手
第一步:扫码登录
访问 https://down.mptext.top,点击【登录】,用微信扫描页面二维码。
注意:必须选择公众号或服务号登录,不能用小程序登录,否则后续无法获取文章数据。
登录成功后,系统会生成一个 API 密钥(auth-key),有效期 4 天,过期后重新扫码即可。
第二步:添加公众号并同步文章列表
在【公众号管理】页面搜索目标公众号名称,点击【添加】,然后点击【同步】拉取全部历史文章。
系统会自动翻页,直到拉取完所有文章(微信接口每次最多返回 20 条)。同步后的文章列表会缓存在浏览器本地,下次打开不用重新拉取。
第三步:筛选文章并导出
进入【文章下载】页面,选择目标公众号,勾选需要的文章,点击【抓取】下载内容。
抓取完成后,点击【导出】选择格式。如果选 HTML,会得到一个 ZIP 文件,解压后用浏览器打开,排版、图片、样式跟原文基本一致。
进阶:抓取阅读量和评论数据
如果你需要文章的阅读量、点赞数、评论内容,需要额外配置 Credential。
Credential 是微信接口的认证参数(biz、uin、key、pass_ticket 等),每个公众号的 Credential 不同,有效期约 25 分钟。
项目提供了一个配套工具 wxdown-service 来自动抓取:
-
下载对应系统的 wxdown-service(Windows 直接运行 exe,macOS 需 Python 环境) -
启动后安装 mitmproxy CA 证书 -
将系统代理设置为 127.0.0.1:65000 -
在电脑端微信内置浏览器中打开目标公众号文章 -
工具自动拦截并提取 Credential,同步到网站
抓取成功后,网站上就能显示该公众号的阅读量、点赞数、评论等数据,导出时也会包含这些字段。
项目地址: https://github.com/wechat-article/wxdown-service
私有化部署:数据完全自主可控
如果你担心在线版的数据安全,或者需要大量下载,可以私有化部署:
Docker 部署(推荐):
docker run -d -p 3000:3000 wechat-article/wechat-article-exporter
Cloudflare Pages 部署:
Fork 仓库后连接到 Cloudflare Pages,自动构建部署。
Vercel 一键部署:
点击仓库 README 中的 Vercel 部署按钮即可。
本地开发:
git clone https://github.com/wechat-article/wechat-article-exporter.git
cd wechat-article-exporter
npm install
npm run dev
关于代理节点
微信文章有跨域和防盗链限制,下载时需要代理节点转发请求。在线版默认使用公共代理,但每个节点每天限 10 万次请求,大量下载时可能排队。
建议搭建私有代理节点,项目仓库里有详细教程。代理节点越多,并发下载速度越快,推荐配置 5 个以上节点。
局限与注意事项
这个工具不是万能的,有以下几个边界:
第一,你需要有一个公众号。扫码登录时必须用订阅号或服务号,没有的话需要先去微信公众平台注册一个。
第二,目标公众号需开启搜索。如果目标公众号关闭了「允许通过名称搜索」功能,可能搜索不到。
第三,阅读量抓取有门槛。需要额外配置 wxdown-service 和系统代理,对非技术用户有一定操作成本。
第四,公共代理有限速。大量下载建议私有化部署并搭建私有代理节点。
第五,版权归属原作者。通过本工具获取的文章内容,版权归文章原作者所有,请合理使用,勿用于商业侵权。
谁适合用这个工具
- 公众号运营者
:备份自己的历史文章,做内容复盘 - 内容研究者
:批量采集某个领域的公众号文章做分析 - 竞品分析师
:跟踪竞品公众号的发布节奏、阅读量变化 - 知识管理爱好者
:把优质公众号文章归档到本地或导入 Obsidian - 数据分析师
:导出 JSON/Excel 做阅读量、评论的情感分析
怎么开始用
最快的体验方式:直接访问 https://down.mptext.top,扫码登录,搜索一个你常看的公众号,试着同步并导出几篇文章。
如果你有自己的服务器,Docker 一键部署:
docker run -d -p 3000:3000 wechat-article/wechat-article-exporter
需要阅读量数据?下载 wxdown-service 配合抓取 Credential。
项目地址:https://github.com/wechat-article/wechat-article-exporter
MIT 协议,可自由商用和二次开发。10.5k stars,社区持续维护更新。
现在打开 https://down.mptext.top,选一个你收藏夹里的公众号,看看它有多少篇历史文章你还没读过。
夜雨聆风