上周有个同事找我诉苦:领导发来一张截图,里面是密密麻麻的报价单,要求整理成 Excel 发给客户。
她对着屏幕一个数字一个数字地敲,敲了将近两个小时,眼睛都花了。
这种事你肯定也遇到过。扫描件、截图、拍照的纸质表格,数据就在那里,就是没法直接用。复制不了,导出不了,只能靠手。
其实有工具早就解决这个问题了,而且完全免费、开源、本地运行,数据不上传任何服务器。
它叫 TablePlus-OCR?不,更准确的名字是 Umi-OCR,一个被严重低估的国产开源项目。
01大多数人用 OCR 只用了 10% 的功能
提到图片识别文字,很多人第一反应是微信扫一扫,或者某个在线网站上传图片。
但这两种方式有个共同的硬伤:识别出来的是纯文本,表格结构全丢了。
原本整整齐齐的五列数据,识别完变成一行行混在一起的字符串,你还得重新手动对齐列,等于白干。
Umi-OCR 专门针对这个场景做了优化。它不只是识别文字,而是识别表格结构,直接输出带格式的 Excel 或 CSV 文件,行列关系完整保留。
02它到底能做什么?
场景一:截图表格直接变 Excel
把截图拖进软件,框选表格区域,点击识别,几秒钟后直接导出 .xlsx 文件。打开就是标准的行列结构,可以直接在 Excel 或 WPS 里编辑、筛选、做透视表。
对比用 Adobe Acrobat 或者在线 OCR 工具处理同一张图,Umi-OCR 的表格还原度明显更高,尤其是合并单元格和多级表头的情况。
场景二:批量处理一叠扫描件
财务、行政、采购岗位经常遇到这种情况:一次性收到几十张扫描的报销单或者入库单,每张里都有表格数据。
Umi-OCR 支持批量导入,把整个文件夹拖进去,设置好输出格式,一次性跑完,每张图对应生成一个结构化文件。
以前两个小时的活,现在可能十分钟就处理完了。
场景三:PDF 里的表格也能提取
很多 PDF 是扫描版,里面的表格根本无法复制。Umi-OCR 支持直接导入 PDF,逐页识别,表格数据同样可以完整导出。
这个功能在处理旧版合同、历史报告、政府公文时特别实用。
03一个让人意外的细节
很多人以为 OCR 工具必须联网调用 API,要么收费,要么有隐私风险。
Umi-OCR 完全离线运行。
它内置了 PaddleOCR 引擎,所有识别计算都在本地完成,不需要网络,不需要注册账号,数据不经过任何第三方服务器。
这对处理财务数据、合同内容、客户信息的人来说,是一个非常关键的特性。很多企业内网环境根本不允许数据外传,这类工具才是真正能落地的选择。
离线运行 + 表格结构识别 + 完全免费,这三点同时满足的工具,市面上真的不多。
04和常见工具比,差距在哪里?
| 工具 | 表格结构保留 | 离线运行 | 批量处理 | 费用 |
|---|---|---|---|---|
| 微信扫一扫 | 不支持 | 否 | 不支持 | 免费 |
| Adobe Acrobat | 部分支持 | 是 | 支持 | 付费 |
| 在线 OCR 网站 | 不稳定 | 否 | 有限制 | 部分收费 |
| Umi-OCR | 完整支持 | 是 | 支持 | 免费 |
Camtasia、ABBYY FineReader 这类专业工具在表格识别上确实更强,但动辄几百上千元的授权费,对个人用户和小团队来说门槛太高。
05怎么上手?
第一步:下载安装
在 GitHub 搜索 Umi-OCR,进入项目主页,在 Releases 页面下载最新版本的 .exe 安装包,Windows 系统直接安装即可。
项目地址:github.com/hiroi-sora/Umi-OCR
第二步:选择识别模式
打开软件后,左侧菜单选择「截图OCR」或「批量OCR」,根据你的场景选择对应模式。
第三步:设置输出格式
在设置里把输出格式改为「Excel」或「CSV」,这一步很多人忽略,默认是纯文本,表格结构不会保留。
第四步:框选或导入,开始识别
截图模式下,用快捷键截取表格区域;批量模式下,直接把图片或 PDF 文件夹拖入软件,点击开始。
整个流程熟悉之后,处理一张表格图片不超过 30 秒。
06哪些人最该收藏这篇文章?
- 财务、行政、采购岗,经常处理纸质单据或扫描件
- 做数据分析的,经常从报告截图里提取数据
- 学生党,需要整理教材或试卷里的表格内容
- 任何需要把"看得见但用不了"的数据变成可编辑格式的人
Umi-OCR 在 GitHub 上已经积累了超过 2 万 Star,但知道它的人依然不多。
很多人还在对着屏幕一个字一个字地敲,或者花钱买在线服务,其实这个问题早就有免费的解法了。
现在就去下载,处理完手头那张表格截图,你会明白为什么值得转发给同事。
夜雨聆风