批量下载任意公众号文章,这个开源工具能导出 HTML/Excel/Word 还带阅读量数据-夜雨聆风

批量下载任意公众号文章,这个开源工具能导出 HTML/Excel/Word 还带阅读量数据

你想备份某个公众号的全部历史文章，微信官方却不提供批量导出功能。手动一篇篇复制？不现实。

这个 GitHub 10.5k stars 的开源工具，三步就能导出任意公众号的全部文章，支持 HTML/Excel/Word 等六种格式，还能抓取阅读量和评论数据。

这不是爬虫脚本，是完整的内容资产备份方案

市面上有不少公众号文章下载工具，但大多数是命令行脚本，配置复杂、容易封号、排版丢失。这个项目的不同之处在于：

第一，开箱即用。不需要写代码、配环境，打开网站扫码就能用。对非技术用户友好。

第二，100% 还原排版。HTML 格式导出会打包图片和 CSS 样式，打开后跟原文基本一致（项目官方宣称可 100% 还原，实际测试中大部分文章的排版还原度确实很高）。不是纯文本 dump，是完整的离线存档。

第三，数据维度全。不只是文章正文，还能导出阅读量、点赞数、转发量、评论内容——这些数据对内容研究者、竞品分析者极其有价值。

项目目前 10.5k stars，1.8k forks，有 3 个 QQ 交流群（1群已满），社区活跃度不错。MIT 协议，可自由商用。

核心功能一览

这个工具以网站形式提供，核心流程是：搜索公众号 → 同步文章列表 → 筛选下载 → 多格式导出。

支持的导出格式：

格式	特点
HTML	100% 还原排版，打包图片和样式到 ZIP，打开跟原文一致
Excel	表格形式，含标题、作者、发布时间、链接等元数据
JSON	结构化数据，适合程序二次处理
Markdown	纯文本标记，适合导入 Obsidian/Notion
TXT	纯文本，仅保留文字内容
Word	适合离线阅读和打印

文章筛选条件： – 按作者过滤 – 标题关键词搜索 – 发布时间范围 – 是否原创 – 所属合集

其他功能： – 合集批量下载 – 单篇 URL 直接下载 – 图片/视频分享消息下载 – 本地 IndexedDB 缓存，避免重复下载 – 代理池并发下载，支持断点续传 – 开放 RESTful API，支持第三方集成

三步上手

第一步：扫码登录

访问 https://down.mptext.top，点击【登录】，用微信扫描页面二维码。

注意：必须选择公众号或服务号登录，不能用小程序登录，否则后续无法获取文章数据。

登录成功后，系统会生成一个 API 密钥（auth-key），有效期 4 天，过期后重新扫码即可。

第二步：添加公众号并同步文章列表

在【公众号管理】页面搜索目标公众号名称，点击【添加】，然后点击【同步】拉取全部历史文章。

系统会自动翻页，直到拉取完所有文章（微信接口每次最多返回 20 条）。同步后的文章列表会缓存在浏览器本地，下次打开不用重新拉取。

第三步：筛选文章并导出

进入【文章下载】页面，选择目标公众号，勾选需要的文章，点击【抓取】下载内容。

抓取完成后，点击【导出】选择格式。如果选 HTML，会得到一个 ZIP 文件，解压后用浏览器打开，排版、图片、样式跟原文基本一致。

进阶：抓取阅读量和评论数据

如果你需要文章的阅读量、点赞数、评论内容，需要额外配置 Credential。

Credential 是微信接口的认证参数（biz、uin、key、pass_ticket 等），每个公众号的 Credential 不同，有效期约 25 分钟。

项目提供了一个配套工具 wxdown-service 来自动抓取：

下载对应系统的 wxdown-service（Windows 直接运行 exe，macOS 需 Python 环境）
启动后安装 mitmproxy CA 证书
将系统代理设置为 127.0.0.1:65000
在电脑端微信内置浏览器中打开目标公众号文章
工具自动拦截并提取 Credential，同步到网站

抓取成功后，网站上就能显示该公众号的阅读量、点赞数、评论等数据，导出时也会包含这些字段。

项目地址： https://github.com/wechat-article/wxdown-service

私有化部署：数据完全自主可控

如果你担心在线版的数据安全，或者需要大量下载，可以私有化部署：

Docker 部署（推荐）：

docker run -d -p 3000:3000 wechat-article/wechat-article-exporter

Cloudflare Pages 部署：

Fork 仓库后连接到 Cloudflare Pages，自动构建部署。

Vercel 一键部署：

点击仓库 README 中的 Vercel 部署按钮即可。

本地开发：

git clone https://github.com/wechat-article/wechat-article-exporter.git
cd wechat-article-exporter
npm install
npm run dev

关于代理节点

微信文章有跨域和防盗链限制，下载时需要代理节点转发请求。在线版默认使用公共代理，但每个节点每天限 10 万次请求，大量下载时可能排队。

建议搭建私有代理节点，项目仓库里有详细教程。代理节点越多，并发下载速度越快，推荐配置 5 个以上节点。

局限与注意事项

这个工具不是万能的，有以下几个边界：

第一，你需要有一个公众号。扫码登录时必须用订阅号或服务号，没有的话需要先去微信公众平台注册一个。

第二，目标公众号需开启搜索。如果目标公众号关闭了「允许通过名称搜索」功能，可能搜索不到。

第三，阅读量抓取有门槛。需要额外配置 wxdown-service 和系统代理，对非技术用户有一定操作成本。

第四，公共代理有限速。大量下载建议私有化部署并搭建私有代理节点。

第五，版权归属原作者。通过本工具获取的文章内容，版权归文章原作者所有，请合理使用，勿用于商业侵权。

谁适合用这个工具

公众号运营者

：备份自己的历史文章，做内容复盘
内容研究者

：批量采集某个领域的公众号文章做分析
竞品分析师

：跟踪竞品公众号的发布节奏、阅读量变化
知识管理爱好者

：把优质公众号文章归档到本地或导入 Obsidian
数据分析师

：导出 JSON/Excel 做阅读量、评论的情感分析

怎么开始用

最快的体验方式：直接访问 https://down.mptext.top，扫码登录，搜索一个你常看的公众号，试着同步并导出几篇文章。

如果你有自己的服务器，Docker 一键部署：

docker run -d -p 3000:3000 wechat-article/wechat-article-exporter

需要阅读量数据？下载 wxdown-service 配合抓取 Credential。

项目地址：https://github.com/wechat-article/wechat-article-exporter

MIT 协议，可自由商用和二次开发。10.5k stars，社区持续维护更新。

现在打开 https://down.mptext.top，选一个你收藏夹里的公众号，看看它有多少篇历史文章你还没读过。