乐于分享
好东西不私藏

飞书设了"禁止下载/禁止复制"又怎样?这款开源插件,把你能看到的文档原汁原味存到本地(含图片)

飞书设了"禁止下载/禁止复制"又怎样?这款开源插件,把你能看到的文档原汁原味存到本地(含图片)

你肯定遇到过这种憋屈场景:

群里或知识库里收到一篇飞书长文——技术复盘、运营SOP、行业报告、离职交接文档——点开一看内容很好,但权限是”仅可浏览”:不能编辑、不能复制、官方导出入口直接隐藏。想存到 Obsidian 或者本地备份?截图几十页、手打、OCR再调格式,全是笨办法。

最近 GitHub 上一个社区开源项目 Cloud Document Converter 把这层窗户纸捅破了。它不是黑进飞书服务器,而是利用了一个极其朴素的道理:飞书要在你浏览器里把字渲染给你看,内容就已经在你的 DOM 里了。一个浏览器扩展只要读这份已渲染结构,就能把它还原成 Markdown,下载到你硬盘上。

你设的”禁止复制”是前端拦截,但渲染出来的文字,拦不住本地插件读。


一、用白话回答:它到底干了什么?为什么”禁止复制”拦不住它?

先把边界说死

你能做的事:你有查看权限,页面正常加载完了,插件帮你转成 .md 存本地。 你不能做的事:你没有查看权限、打不开页面,插件也没戏(它不绕身份认证)。

适用于个人备份、知识整理、合理引用。拿去盗版分发、商用倒卖、侵犯保密协议,那不行。

一句话总结:它对付的是”你能看但不能拿”的隐形墙,不是”你根本不该看”的权限墙。

原理本质

飞书的”禁止复制/禁止导出”主要靠两块:

  1. CSS + 事件拦截(user-select: none、禁掉右键菜单),让你不方便选。
  2. 不给你开官方”导出”入口,让你没法走正规通道拿 .docx 或 .pdf

但你的浏览器为了让你读,必须把真实文字、图片、表格结构渲染到页面里。Cloud Document Converter 做的事情就是:

content script 注入飞书页面
  → 遍历飞书专属的块级DOM结构
    → 提取:标题/段落/加粗斜体/代码块/表格/图片URL/列表层级
      → 映射为 Markdown AST(mdast)
        → 输出 .md 文本 / 或打包 .md + 图片进 zip

源码层面用的是 TypeScript + Plasmo(浏览器扩展框架),核心解析在 packages/lark/src/,走的是本地转换——内容不往任何第三方服务器跑,在你机器上就地消化。


二、它解决了哪三种”飞书最烦人的封锁”?

禁止复制 → 照样把文字拿出来

不用跟 user-select:none 较劲,不用改 CSS,不用 F12 里一段段 copy node。插件直接从结构化 DOM 读,出来的就是干净的 Markdown。

没有”导出”按钮 → 自己造一条下载通道

官方不给导出入口?没关系,.md 是你自己机器生成的文件,不碰飞书内部 API、不用申请编辑权限。

图片也能拿下

两个模式:

Download as Markdown:图片下载到本地,随 .md 一起打成 zip,引用改相对路径。适合长期保存、进 Obsidian、离线归档。推荐。 Copy as Markdown:图片用飞书返回的带签名临时 URL,但约2小时后失效。适合临时粘贴或你马上手动另存图片。

项目 README 写了这句警告:图片用复制模式生成的话,URL 只有两小时有效期,过期后图片资源就无法访问了。

所以如果你想真正存下来属于自己,永远选下载模式,别选复制模式。


三、实操:3步把”困在飞书里的文章”装进本地

Step 0|先确认文档加载完了

飞书是懒加载的——滚到最底部,等图片和代码块都出来,再操作。否则转出来的 .md 会缺段。

Step 1|装插件

两种方式:

  • Chrome / Edge 扩展商店搜 “Cloud Document Converter” 直接装。
  • 走开源路:clone 下来自己 pnpm install && turbo run build,然后 Chrome → 扩展 → 加载已解压。

开源地址:https://github.com/whale4113/cloud-document-converter

Step 2|打开目标飞书文档

在浏览器里正常打开那篇”仅可浏览”的飞书链接。你需要有查看权限,否则这一步就卡住了。

Step 3|点插件图标 → Download as Markdown

两种触发方式都行:

  • 点右上角扩展图标 → Download as Markdown。
  • 在页面右键 → Cloud Document Converter → 下载。

下载结果通常是:

你的文档标题.md
your-doc-title_images.zip   ← 图片打包在这里

解压后把图片文件夹和 .md 放一起,Obsidian、Typora、VSCode 直接开。


四、转出来质量怎么样?

标题、段落、加粗、斜体、删除线 —— 干净。代码块带语言标识,保留。表格是 GFM 格式,基本对齐。有序、无序列表、任务列表,层级保留。图片用下载模式可本地化。

思维导图、高级块可能变形或简化(Markdown 本身表达能力有限)。多维表格不属于”文档块”那套,通常不走这条通道。

总体来说:纯文字知识型文档(SOP、复盘、教程、规范、纪要)还原度极高;重度设计型页面别指望100%。


五、为什么说它不只是”下载工具”,而是Knowledge Worker的救生圈

真正痛的不是”今天抄一段”,而是你的知识资产被锁在别人平台里。

作者可以改权限、删文档,你离职了账号被回收,企业版到期、空间迁移。你唯一真正拥有的知识,是在你本地硬盘里、格式你控制、链接你能建的那份。

这条链路跑通以后:飞书只读 → 插件转 .md + 图片zip → Obsidian Vault → 双链链接 / 标签 / 全文搜索 / Git备份 → 知识终于属于你。

很多 Obsidian 用户看到这个插件会说——”早该有了。”


六、几点提醒

  • 这是第三方社区扩展,非飞书官方。用之前确认你能接受它的 MIT 开源协议和安全模型。
  • 只对你有权看的文档用。别拿它当绕过保密协议的作案工具——工具无罪,用法决定性质。
  • 飞书前端一升级,插件可能短暂抽风。GitHub Issues 里跟就行。
  • 图片优先走 Download 模式别走 Copy 模式,不然两周后你 .md 里一堆死图链。