图片表格秒变Excel

上周有个同事找我诉苦：领导发来一张截图，里面是密密麻麻的报价单，要求整理成 Excel 发给客户。

她对着屏幕一个数字一个数字地敲，敲了将近两个小时，眼睛都花了。

这种事你肯定也遇到过。扫描件、截图、拍照的纸质表格，数据就在那里，就是没法直接用。复制不了，导出不了，只能靠手。

其实有工具早就解决这个问题了，而且完全免费、开源、本地运行，数据不上传任何服务器。

它叫 TablePlus-OCR？不，更准确的名字是 Umi-OCR，一个被严重低估的国产开源项目。

01大多数人用 OCR 只用了 10% 的功能

提到图片识别文字，很多人第一反应是微信扫一扫，或者某个在线网站上传图片。

但这两种方式有个共同的硬伤：识别出来的是纯文本，表格结构全丢了。

原本整整齐齐的五列数据，识别完变成一行行混在一起的字符串，你还得重新手动对齐列，等于白干。

Umi-OCR 专门针对这个场景做了优化。它不只是识别文字，而是识别表格结构，直接输出带格式的 Excel 或 CSV 文件，行列关系完整保留。

场景一：截图表格直接变 Excel

把截图拖进软件，框选表格区域，点击识别，几秒钟后直接导出 .xlsx 文件。打开就是标准的行列结构，可以直接在 Excel 或 WPS 里编辑、筛选、做透视表。

对比用 Adobe Acrobat 或者在线 OCR 工具处理同一张图，Umi-OCR 的表格还原度明显更高，尤其是合并单元格和多级表头的情况。

场景二：批量处理一叠扫描件

财务、行政、采购岗位经常遇到这种情况：一次性收到几十张扫描的报销单或者入库单，每张里都有表格数据。

Umi-OCR 支持批量导入，把整个文件夹拖进去，设置好输出格式，一次性跑完，每张图对应生成一个结构化文件。

以前两个小时的活，现在可能十分钟就处理完了。

场景三：PDF 里的表格也能提取

很多 PDF 是扫描版，里面的表格根本无法复制。Umi-OCR 支持直接导入 PDF，逐页识别，表格数据同样可以完整导出。

这个功能在处理旧版合同、历史报告、政府公文时特别实用。

很多人以为 OCR 工具必须联网调用 API，要么收费，要么有隐私风险。

Umi-OCR 完全离线运行。

它内置了 PaddleOCR 引擎，所有识别计算都在本地完成，不需要网络，不需要注册账号，数据不经过任何第三方服务器。

这对处理财务数据、合同内容、客户信息的人来说，是一个非常关键的特性。很多企业内网环境根本不允许数据外传，这类工具才是真正能落地的选择。

离线运行 + 表格结构识别 + 完全免费，这三点同时满足的工具，市面上真的不多。

工具	表格结构保留	离线运行	批量处理	费用
微信扫一扫	不支持	否	不支持	免费
Adobe Acrobat	部分支持	是	支持	付费
在线 OCR 网站	不稳定	否	有限制	部分收费
Umi-OCR	完整支持	是	支持	免费

Camtasia、ABBYY FineReader 这类专业工具在表格识别上确实更强，但动辄几百上千元的授权费，对个人用户和小团队来说门槛太高。

第一步：下载安装

在 GitHub 搜索 Umi-OCR，进入项目主页，在 Releases 页面下载最新版本的 .exe 安装包，Windows 系统直接安装即可。

项目地址：github.com/hiroi-sora/Umi-OCR

第二步：选择识别模式

打开软件后，左侧菜单选择「截图OCR」或「批量OCR」，根据你的场景选择对应模式。

第三步：设置输出格式

在设置里把输出格式改为「Excel」或「CSV」，这一步很多人忽略，默认是纯文本，表格结构不会保留。

第四步：框选或导入，开始识别

截图模式下，用快捷键截取表格区域；批量模式下，直接把图片或 PDF 文件夹拖入软件，点击开始。

整个流程熟悉之后，处理一张表格图片不超过 30 秒。

Umi-OCR 在 GitHub 上已经积累了超过 2 万 Star，但知道它的人依然不多。

很多人还在对着屏幕一个字一个字地敲，或者花钱买在线服务，其实这个问题早就有免费的解法了。

现在就去下载，处理完手头那张表格截图，你会明白为什么值得转发给同事。