
我每周都要处理很多纸质文档。从扫描到录入,每次录入要花2小时,一周就是10小时。
后来我想:能不能用OCR自动提取文字?
我的方法很简单:
第一步:用扫描仪或手机把纸质文档扫描成PDF。
第二步:用OCR工具(如ABBYY FineReader、Adobe Acrobat Pro)打开PDF。
第三步:OCR工具会自动识别文字,导出为Word或Excel文件。
整个过程不超过10分钟。原来要花2小时录入,现在只要10分钟。
第一,文档要规范。不要有手写、污渍、折叠。文档不规范,OCR识别率就低。
第二,用高清晰度。扫描时至少300dpi,这样识别准确率更高。
第三,校对。OCR识别后,一定要校对一遍。特别是数字、日期、金额等关键信息。
第四,批量处理。做好一个OCR模板后,保存为模板。下次直接套用,不用再从头做。
用OCR做文档管理后,我每周节省8小时。一年就是400小时。这400小时可以用来做更重要的事情。
夜雨聆风