数电发票识别提取工具v1.0,支持 PDF/OFD/XML 三种格式,7 类票种一键转 Excel!

之前有小伙伴找我要发票识别提取的工具,本来觉得全量发票查询里有发票详细信息,没必要开发。
后面遇到了自己有火车票报销整理,看有多少报销金额时,发现还挺需要。
查了一下网上免费的离线提取工具,质量参差不齐,对较新的数电票提取支持一般。
同时考虑到以后是数电票的天下,拍照扫描的纸票越来越少,本次先开发数电票的专门识别提取工具。
支持税局下载PDF、OFD、XML格式,其中XML下载是以ZIP形式打包的,不需要解压,工具会自动解压提取。
涉及票种:
数电发票(二手车销售统一发票)
数电发票(航空运输电子客票行程单)
数电发票(机动车销售统一发票)
数电发票(普通发票)
数电发票(铁路电子客票)
数电发票(通行费发票)
数电发票(增值税专用发票)


食用指南

→准备发票源文件,下载并运行提取工具
→将需提取的发票放至某个文件夹中(支持所有子文件夹全部提取)
→点击工具输入对应的【浏览】按钮
→选择对应输入文件夹
→选择对应输出文件夹(没有选择则默认拆分到输入文件夹)




→点击【开始识别】按钮
→等待全部提取完成即可
→回到输出文件夹查看生成的“发票提取汇总.xlsx”表格即可
→可以看到发票的每行和合计行都单独提取出来了





注意事项

1.不支持图片版本的PDF,只支持文字版的PDF发票电子原件。
2.提取的时候尽可能考虑提取完整发票信息,但因发票版式复杂,肯定会有一些错漏提取的字段,阿白正在研究能不能训练出一个轻量的通用识别AI,提高提取准确率。
3.此工具免费,禁止其他人用于收费用途,提取结果仅供参考。


如何获取

关注“阿白AI财税”微信公众号,后台回复“20260215”。
20260215
通过网盘分享的文件链接: *** 提取码:***

V2.0升级计划
新增支持查看三种格式发票版本,继续提高各种字段提取精度等,敬请期待~
在使用过程中如果有其他修改建议、意见或需求,可以通过“阿白AI财税”微信公众号,获取阿白的联系方式。
夜雨聆风
