乐于分享
好东西不私藏

把网页和文档变成双人播客?这个开源 Twocast 有点实用

把网页和文档变成双人播客?这个开源 Twocast 有点实用

Twocast 是一个开源 AI 播客生成器,可以把主题、链接、文档、长文本和列表页变成双人播客。它有意思的地方不只是“自动生成声音”,而是会同时给出音频、大纲和脚本,让资料消化和内容复用都多一条路。

前段时间 NotebookLM 的“音频概览”火过一轮,很多人第一次意识到:把一份长文变成两个人聊天的音频,确实比硬读 PDF 轻松。
我今天看到的这个项目叫 Twocast,走的就是这个方向。
它的官方定位是AI Podcast Generator – Turn Any Content Into Engaging Podcasts。中文 README 里写得更直接:AI 播客生成器、双人播客生成器。
截至 2026 年 4 月 29 日,GitHub 页面显示这个仓库约1.2k stars123 forks。不算巨型项目,但方向很明确:把网页、文档、主题和列表页这类资料,变成一段可听的双人播客。
封面图

它到底解决什么

Twocast 不是传统播客剪辑软件。它更像一个“资料转播客工作台”。
你给它一个主题、一条链接、一个文档,或者一段长文本。它会先整理内容,再生成大纲和双人脚本,最后用 TTS 合成音频。
README 里列的能力包括:
  • 双人播客
  • 一键生成 3-5 分钟播客
  • 支持主题、链接、文档、列表页输入
  • 支持多语言
  • 可以下载音频
  • 播客内容包含音频、大纲、脚本
  • TTS 支持 Fish Audio、Minimax、Google Gemini
这几个点放在一起,意思很清楚:它不是只想把一段文字“念出来”,而是想把资料改造成更像对话的内容。
Twocast 官方界面截图

为什么“双人”有意义

单人朗读最大的问题,是信息密度一高就容易走神。
双人播客不一定更准确,但它有一个好处:可以把信息拆成提问、解释、追问和补充。听感上更接近“有人带你过一遍资料”,而不是冷冰冰地念稿。
这也是 Twocast 比普通 TTS 工具更值得看的地方。
如果它只做文字转语音,替代品很多。但它会输出大纲和脚本,用户可以在合成音频前检查结构和事实。对于技术内容、热点整理、论文摘要这类场景,这一步很重要。

输入来源做得比较实用

Twocast 支持的输入不只是一段文本。
主题输入适合临时生成一个科普小播客;链接输入适合把网页文章变成音频;文档输入能吃docpdftxt;列表页则适合 Hacker News、V2EX 这类每天刷新的信息源。
中文 README 里还专门写了,列表页播客会生成 5-9 分钟内容。这个功能很有意思,因为它更像“自动简报”:把一页热点先抓出来,再整理成一段可听的更新。
Twocast 处理链路

自托管门槛不算低

这项目不是那种下载后点一下就能跑起来的小工具。
README 的本地启动步骤里,需要先跑textract-rest-apiffmpeg-api两个依赖服务,再配置.env,准备 Postgres 数据库,执行npx drizzle-kit push,最后用 yarn 启动项目。
大致流程是这样:
cp .env.example .envnpx drizzle-kit pushyarn && yarn start
Docker 方式也有:
cp .env.docker .envdocker compose up
不过它还需要 TTS 和 LLM 相关 API Key。README 里提到 Fish Audio、Minimax、Google Gemini、OpenRouter 和 x.ai。也就是说,自托管可以更自由,但并不是完全零成本。

它适合谁

我觉得 Twocast 最适合三类人。
第一类是资料很多但没时间读的人。长文章、报告、论文、技术文档,先转成几分钟音频,通勤时听个大概。
第二类是内容创作者。Twocast 输出的不只是音频,还有大纲和脚本。你可以把它当作选题预处理工具,先看一版结构,再决定要不要继续写文章、做视频或者录播客。
第三类是愿意折腾自托管的开发者。它的技术栈是 Next.js、React、TypeScript、Postgres 这一套,依赖也比较完整。如果你想研究 AI 内容生成、队列处理、TTS 接入和文档解析,这个仓库有不少可看的地方。

Twocast 使用边界

也别把它想得太神

它的边界也很明显。
第一,生成出来的播客内容还是要人工检查。尤其是技术文章、新闻事件、财务医疗这类内容,AI 可能会讲得顺,但顺不等于准确。
第二,声音体验取决于你接的 TTS 服务。Fish Audio、Minimax、Gemini 都能做,但效果、费用和限制不一样。
第三,GitHub 页面显示项目目前没有发布 Releases,提交数量也不多。如果你准备拿它进生产流程,最好先按自己的环境跑一遍,不要直接假设它已经是成熟产品。

梦飞的判断

Twocast 真正有价值的地方,不是“它能自动生成一个像播客的音频”。
更准确地说,它把“读资料”这件事多开了一条通道:输入网页、文档或主题,输出音频、大纲和脚本。音频负责降低阅读压力,大纲和脚本负责让你还能回头检查。
如果你只是想听真人访谈,它肯定替代不了成熟播客。
但如果你的目标是把一堆资料先听一遍、过一遍、整理一遍,Twocast 这种工具就很适合放进信息处理流程里。
热点来晚了,但瓜更熟。梦飞帮你补错过的全网热事。
原文链接:https://github.com/panyanyany/Twocast