老王的AI咖啡馆 · 老王
我帮朋友卸了 3 个 OCR 软件,她每年省了 294 块
前几天帮她看电脑,发现她装了三个"PDF 转 Word"的工具,每个都充了会员。
她说:"不充会员转出来都是乱码,只能认字不能排版。充了 98 块一年,才能用得好。"
我给她装了一个免费工具,把她电脑里那三个全卸了。
这个工具叫 Umi-OCR。开源、免费、离线运行。不上传任何数据到云端,也没有会员制、没有次数限制、没有"高级版"。
微信里长按图片,点"提取文字"。iPhone 相册里直接复制照片上的字。扫描仪把纸质文件变成 PDF。
这些底层都是 OCR。但系统自带的功能只能处理纯文本。遇到表格、排版复杂的 PDF、批量扫描件,就抓瞎了。
Umi-OCR 能干这些事:
批量处理。一次丢 50 张图片进去,自动全部识别,不用一张一张来。
保留排版。不只是把文字抠出来,还能尽量还原原来的段落、表格结构。
离线运行。这是最关键的一点。你的发票、合同、财务报表,不需要上传到任何人的服务器。本地跑,安全。
你可以理解为:那些收费软件买了一套很好的"眼睛"(PaddleOCR),然后在外面加了个收费的门禁。Umi-OCR 直接把这套眼睛借给你用,不收门票。
它开源,意味着任何人都能看它的代码、改进它。社区一直在更新,识别效果跟很多付费商业产品在一个水平线上。
截图识别:看到什么就要什么
场景:你在看一篇 PDF 论文,里面有一段数据想复制。但 PDF 是扫描版的,文字选不了,没法 Ctrl+C。
Umi-OCR 的做法:
- 按下快捷键(默认
Ctrl + Alt + O,可以改) - 鼠标框选你要的区域
- 识别结果自动复制到剪贴板
整个过程两秒。识别完你直接 Ctrl+V 粘贴到任何地方。
批量转文档:打印店帮你干的事
这就是开头我朋友需要的功能。
她手上有一堆纸质发票,要转成 Excel 做报销。打印店的方案是拍照后上传到某 OCR 平台,98 块包月。
用 Umi-OCR 的流程:
- 手机把发票全拍好,传到电脑
- Umi-OCR 里选"批量处理",指向那个文件夹
- 输出格式选 Excel
- 点开始,等它跑完
Umi-OCR 会识别图片里的表格线,尽量还原行列结构。
20 张纸质发票录入 Excel:
| 方式 | 时间 | 费用 |
|---|---|---|
| 手工敲键盘 | 约 40 分钟 | 0 |
| OCR 会员拍照转 | 约 10 分钟(含拍照+校对) | 98 块/年 |
| Umi-OCR 批量转 | 约 10 分钟(含拍照+校对) | 0 |
唯一的区别是,98 块买的是"省事"。但 Umi-OCR 能帮你省同样的事,还不用花钱。
手写体基本别指望。 Umi-OCR 对印刷体效果很好,识别率 95%+。但手写体只有 60-70%。手写笔记、签名、潦草的批注——这些不适合用 OCR,老老实实手录。
拍照角度很重要。 斜着拍会导致文字变形,识别率直线下降。拍的时候手机跟纸面尽量平行。如果实在拍歪了,Umi-OCR 内置了"图像矫正",能救一点,但不如拍正的效果好。
只有 Windows 版。 Mac 用户目前用不了。如果只需要截图识别,macOS 自带的"实况文本"够用。需要批量处理的话,可以考虑 PaddleOCR 的命令行版本,但需要一点技术基础。
| 你的场景 | 建议 |
|---|---|
| 偶尔提取一两句文字 | 手机自带功能就行 |
| 批量处理扫描件、发票 | Umi-OCR |
| 处理手写笔记 | 别用 OCR,手录更靠谱 |
| Mac 用户批量处理 | 等 Umi-OCR 出 Mac 版 |
Umi-OCR 不是万能的。但在它的舒适区里——印刷体、批量、Windows——它就是目前最好的免费方案。
怎么下:
1. GitHub 搜 hiroi-sora/Umi-OCR,Releases 页面直接下
2. 如果不会用 GitHub,直接百度/必应搜 Umi-OCR 下载,第一个结果就是官方渠道
3. 下下来是个 .exe,双击安装就行,不用登录、不用注册
你平时遇到最多的是哪种 OCR 需求?评论区说说,下期我针对性地测。
你平时遇到最多的是哪种 OCR 需求?
评论区说说,下期我针对性地测。
关注老王的AI咖啡馆,带你实操落地AI工具
© 2026 AI Café Media
*创作声明:本文内容由 AI 辅助生成,老王已进行人工审核与编辑。
夜雨聆风