乐于分享
好东西不私藏

开源|一款纯浏览器端运行的 PDF 全能工具箱,90 多种功能零上传、零付费、零隐私泄露

开源|一款纯浏览器端运行的 PDF 全能工具箱,90 多种功能零上传、零付费、零隐私泄露

日常工作中,PDF 文件处理可以说是避不开的刚需。合并几个扫描件、压缩一份合同、提取几页内容、转个格式发给客户,这些 cao 作看似基础,却总能让人抓狂。

市面上的 PDF 工具要么收费不菲,要么需要把文件上传到云端处理,数据安-全难以保障。有些在线工具甚至会在处理后的文件里偷偷加水印,或者对文件大小、页数层层设限。

那有没有一款既能满足所有 PDF 处理需求,又不用上传文件、完全免费的工具呢?

最近我在 GitHub 上发现了一款叫 PDFCraft 的开源项目,它把这些问题一次性处理了。

它到底处理了什么痛点

PDFCraft 的核心思路很直接:所有 cao 作都在浏览器本地完成,文件不出本机,隐私安-全。它基于 WebAssembly 技术,把原本需要服务器处理的重度计算搬到了前端,既保-证了速度,又杜绝了数据泄露的风险。

这个项目目前提供了超过 90 种专业工具,覆盖了从文件合并、格式转换、OCR 识别到加密解密、工作流编排等几乎所有 PDF 处理场景。更重要的是,它完全免费,没有功能限制,也没有套路。

现代化的技术选型

PDFCraft 的前端采用 Next.js 15 构建,使用 App Router 模式,配合 TypeScript 保-证代码质量。样式层面使用了 Tailwind CSS 4,界面简洁清爽,响应式设计做得相当到位。

在 PDF 渲染和交互方面,项目集成了 PDF.js 和 pdf-lib 这两个成熟库。PDF.js 负责文档的解析和展示,pdf-lib 则处理各种编辑 cao 作。状态管理使用了轻量级的 Zustand,避免了 Redux 的繁琐配置。

特别值得一提的是它的 可视化工作流编辑器。这是一个节点式的编排界面,你可以把多个 PDF  cao 作拖拽到画布上,像搭积木一样连接起来,形成自动化的处理流水线。比如你可以创建一个”合并多个文件、压缩体积、添加水印、加密保护”的完整流程,保存后批量处理同类任务。

后端逻辑:WebAssembly 的重度运用

虽然 PDFCraft 看起来是个纯前端项目,但它的”后端”能力是通过 WebAssembly 实现的。

这意味着你可以在浏览器里完成 OCR 文字识别、复杂格式转换、PDF 修复等原本只能在服务器端执行的 cao 作。WebAssembly 带来的性能表现接近原生应用,处理大文件也不会卡顿。

工作流的数据持久化和配置存储则依赖浏览器的本地存储能力,用户的自定义流程可以保存在本地,下次打开直接使用。

核心特点一览

PDFCraft 的设计哲学可以总结为几个关键词:隐私优先、功能丰富、体验流畅

隐私方面,所有计算都在本地完成,文件从不上传服务器,敏感合同、内部资料可以放心处理。

功能层面,90 多种工具被划分为五大类:组织管理(合并、拆分、提取、旋转等)、编辑批注(签名、水印、页眉页脚、表单填写)、格式转换(支持 Office、图片、电子书等 20 多种格式互转)、优化修复(压缩、线性化、损坏修复)、安-全保护(加密、解密、权限控制、元数据清理)。

体验上,界面没有多余元素,每个工具的 cao 作流程都很直观。多语言支持做得也很完善,中文用户完全无障碍使用。

部署方式:灵活且简单

如果你想本地运行,只需要 Node.js 18.17 以上环境,克隆仓库后安装依赖即可启动开发服务器。生产部署支持多种方式:Vercel、Netlify、GitHub Pages、Cloudflare Pages 都能一键部署,项目已经预置了所有平台的配置文件。

对于喜欢 Docker 的同学,提供了预构建镜像,一条命令就能跑起来。也可以基于源码自己构建,开发模式和生产模式都有对应的 Docker Compose 配置。

开源协议:AGPL-3.0 的注意事项

PDFCraft 采用 AGPL-3.0 协议开源。如果你修改了代码并在网络上提供服务,必须向用户开放修改后的源代码。

对于个人使用和内部部署来说,这个协议没有额外限制,可以自由使用、修改。但如果你想基于它做商业化的在线服务,就需要特别注意开源义务。建议在使用前仔细阅读协议条款,或者咨询专业的法务意见。

即刻体验一波

我在本地部署体验了一下几个高频场景。

合同合并与压缩:把七八份扫描件拖进去一键合并,压缩后体积减少了 60%,画质几乎没有损失。整个过程都在浏览器里完成,几兆的文件秒级处理。

OCR 识别:上传一份扫描版 PDF,系统能自动识别文字并生成可搜索、可复制的文档。识别准确度不错,排版也能保持原样。

工作流编排:创建了一个”图片转 PDF、添加页码、压缩体积”的自动化流程,以后处理发票、收据这类重复任务时直接套用,效率提升明显。

格式转换:试了下 Word 转 PDF 和反向转换,样式保持得相当完整,表格、图片的位置都没有错位。

适合谁用

如果你是经常处理 PDF 的办公族,PDFCraft 可以替代那些收费工具。如果你在意数据隐私,不想把敏感文件传到第三方服务器,它的本地处理模式就是为你设计的。技术团队也可以把它集成到内部系统中,作为文档处理的基础设施。

结语

PDFCraft 把 PDF 处理的复杂度降到了最低,同时把隐私保护做到了极致。在这个数据安-全越来越被重视的时代,一款不需要上传文件、功能又足够丰富的工具,确实值得放进收藏夹。

如果你也觉得实用,不妨部署一个试试。

源码获取请私回:PDFCraft

了解更多

#PDF 工具、#开源软件#WebAssembly#隐私保护#Next.js、#PDF 转换、#OCR#工作流自动化

本站文章均为手工撰写未经允许谢绝转载:夜雨聆风 » 开源|一款纯浏览器端运行的 PDF 全能工具箱,90 多种功能零上传、零付费、零隐私泄露

猜你喜欢

  • 暂无文章