截图、PDF、扫描件里的文字,终于不用一个个手打了

别人发来一张截图，里面明明有一大段文字。

你想复制，却发现它只是一张图片。

合同扫描件、通知截图、PDF 文件、照片里的资料，看起来都能读，但就是不能直接复制。

最后只能一边看，一边手动敲。

字少还好。

如果是一整页材料，或者几十张截图，那就真的很折磨。

Umi-OCR 界面展示

很多时候，我们不是缺资料，而是资料里的文字拿不出来。

今天这个软件叫 Umi-OCR，是一款免费、开源、离线的 OCR 文字识别软件。

它有中文界面，支持 Windows 和 Linux，可以识别截图、图片、PDF 里的文字。

官网显示，Umi-OCR 目前有 41K+ GitHub Stars，支持 100 多种语言，并且可以全程离线识别。

最烦人的，是明明看得见却复制不了

办公里经常会遇到这种情况。

别人微信发来一张截图，让你照着整理内容。

资料是扫描版 PDF，看起来像文档，实际上每一页都是图片。

一张通知、一份说明、一页合同，文字明明就在屏幕上，但鼠标怎么拖都选不中。

这种时候，手动输入其实很浪费时间。

尤其是遇到数字、编号、地址、条款、名单这些内容，手打不仅慢，还容易错。

Umi-OCR 解决的就是这个问题：把图片里的文字识别出来，变成可以复制、编辑、整理的文本。

截图里的文字，框一下就能识别

Umi-OCR 最常用的场景，就是截图识别。

看到屏幕上有一段不能复制的文字，可以直接用快捷键截图，然后识别。

识别出来的内容会出现在右侧记录里，可以复制，也可以继续编辑。

Umi-OCR 截图识别

这个功能很适合处理临时资料。

比如网页里不能复制的文字。

图片通知里的内容。

聊天截图里的地址、电话、编号。

软件界面里的报错信息。

不用再对着图片一个字一个字敲，直接识别出来再整理，会省心很多。

一堆图片要处理，也不用一张张来

如果只是偶尔识别一张截图，很多软件都能做。

但真正麻烦的是批量处理。

比如一整个文件夹里都是扫描图。

几十张资料图片要转文字。

一批截图要整理成文档。

这时候一张张打开、一张张识别，就很费时间。

Umi-OCR 支持批量 OCR，可以一次导入多张图片进行识别。

Umi-OCR 批量识别

识别结果可以保存成 txt、md、csv 等格式。

如果是整理资料、汇总文本、处理扫描图片，这个功能会比单张识别舒服很多。

扫描版 PDF，也能提取文字

PDF 最烦的一种情况，就是看起来像文档，实际上不能复制。

很多扫描版 PDF 都是这样。

每一页都是图片，文字只是“看得见”，并不是真的文本。

Umi-OCR 支持 PDF 识别，可以从扫描版 PDF 中提取文字。

也可以生成双层可搜索 PDF。

简单理解就是：原来的页面样子还保留着，但里面多了一层可以搜索、复制的文字。

Umi-OCR 文档识别

这个场景很实用。

比如资料归档、合同查找、说明书整理、扫描件检索。

以前想找某个关键词，只能一页页翻。

处理成可搜索 PDF 之后，直接搜索会方便很多。

有水印、页眉页脚，也能避开干扰

很多图片和扫描件里，不只有正文。

可能还有水印、Logo、页眉、页脚、编号。

如果全部识别进去，结果反而会乱。

Umi-OCR 的批量识别里有一个“忽略区域”功能，可以把不想识别的区域框出来。

比如每张图片右下角都有水印。

或者每页 PDF 顶部都有重复页眉。

可以先把这些区域排除掉，再进行批量识别。

这样导出的文字会干净一些，后面整理也少很多麻烦。

不用联网，对办公资料更安心

现在很多在线 OCR 网站也能识别文字。

但问题是，你要把图片或 PDF 上传上去。

普通内容可能无所谓。

但如果是合同、票据、证件、单位资料、内部文件，就不一定适合传到网页里处理。

Umi-OCR 的一个重要卖点，是完全离线。

官网写得很明确：所有处理都在本地电脑完成，数据不会上传。

对经常处理资料的人来说，这点很重要。

不是所有文件都适合交给在线工具。

能在自己电脑上完成识别，安全感会更强。

中文界面，上手门槛低很多

Umi-OCR 本身就是中文项目，中文界面和中文说明都比较完整。

这点对国内用户很友好。

很多国外工具功能不差，但界面全英文，下载也绕，普通用户很容易在第一步就放弃。

Umi-OCR 的使用方式就直接很多。

下载发布版，解压后打开 Umi-OCR.exe 就能用。

不需要注册账号，也不需要订阅。

官方还提供了蓝奏云、GitHub、SourceForge 等下载方式。

其中蓝奏云对国内用户更方便一些。

这几种场景会经常用到

别人发来截图，想复制里面的文字。

扫描版 PDF 不能搜索，也不能复制。

图片通知、资料照片，需要整理成文字。

一批扫描图片要批量识别。

合同、票据、说明书里想快速找关键词。

二维码或条形码需要从图片里读出来。

这些需求都不复杂，但很高频。

尤其是处理办公资料时，OCR 不是炫技功能，而是实实在在减少重复劳动。

有一点要提前说清楚

OCR 识别不是百分百准确。

图片越清晰，识别效果越好。

如果图片太糊、字体太小、光线太暗，或者排版特别复杂，识别结果就需要人工检查。

另外，Umi-OCR 目前主要支持 Windows 和 Linux。

官网说明支持 Windows 7 及以上版本，Linux 支持 x64 Debian 方向。

如果你用的是 macOS，就不一定适合。

普通用户建议优先下载官方发布版，不要随便从不明网站下载改包。

项目地址 / 官网地址

官网地址：

https://umi-ocr.com/zh-CN

项目地址：

https://github.com/hiroi-sora/Umi-OCR

国内推荐下载：

https://hiroi-sora.lanzoul.com/s/umi-ocr

最后说两句

Umi-OCR 最实用的地方，不是功能看起来多复杂。

而是它解决了一个特别常见的小麻烦：

图片、截图、扫描件里的文字，终于可以拿出来用了。

能复制，就能整理。

能搜索，就能归档。

能批量识别，就不用一张张手动敲。

如果你平时经常处理截图、PDF、扫描件、资料图片，可以把它收藏起来。

觉得这类实用软件推荐有用的话，顺手点个赞和在看。

免责声明

本号推荐的软件与资源均来源于网络公开项目，仅供学习交流和效率提升参考。使用前请自行判断软件安全性、适用性和相关合规要求。如涉及侵权或不当内容，请联系删除。