乐于分享
好东西不私藏

数电发票识别提取工具v1.0,支持 PDF/OFD/XML 三种格式,7 类票种一键转 Excel!

数电发票识别提取工具v1.0,支持 PDF/OFD/XML 三种格式,7 类票种一键转 Excel!

之前有小伙伴找我要发票识别提取的工具,本来觉得全量发票查询里有发票详细信息,没必要开发。

后面遇到了自己有火车票报销整理,看有多少报销金额时,发现还挺需要。

查了一下网上免费的离线提取工具,质量参差不齐,对较新的数电票提取支持一般。

同时考虑到以后是数电票的天下,拍照扫描的纸票越来越少,本次先开发数电票的专门识别提取工具。

支持税局下载PDF、OFD、XML格式,其中XML下载是以ZIP形式打包的,不需要解压,工具会自动解压提取。

涉及票种:

数电发票(二手车销售统一发票)

数电发票(航空运输电子客票行程单)

数电发票(机动车销售统一发票)

数电发票(普通发票)

数电发票(铁路电子客票)

数电发票(通行费发票)

数电发票(增值税专用发票)

食用指南

→准备发票源文件,下载并运行提取工具

→将需提取的发票放至某个文件夹中(支持所有子文件夹全部提取)

→点击工具输入对应的【浏览】按钮

→选择对应输入文件夹

→选择对应输出文件夹(没有选择则默认拆分到输入文件夹)

→点击【开始识别】按钮

→等待全部提取完成即可

→回到输出文件夹查看生成的“发票提取汇总.xlsx”表格即可

→可以看到发票的每行和合计行都单独提取出来了

注意事项

1.不支持图片版本的PDF,只支持文字版的PDF发票电子原件。

2.提取的时候尽可能考虑提取完整发票信息,但因发票版式复杂,肯定会有一些错漏提取的字段,阿白正在研究能不能训练出一个轻量的通用识别AI,提高提取准确率。

3.此工具免费,禁止其他人用于收费用途,提取结果仅供参考。

如何获取

关注“阿白AI财税”微信公众号,后台回复“20260215”。

20260215

通过网盘分享的文件链接: *** 提取码:*** 

V2.0升级计划

新增支持查看三种格式发票版本,继续提高各种字段提取精度等,敬请期待~

在使用过程中如果有其他修改建议、意见或需求,可以通过“阿白AI财税”微信公众号,获取阿白的联系方式。

本站文章均为手工撰写未经允许谢绝转载:夜雨聆风 » 数电发票识别提取工具v1.0,支持 PDF/OFD/XML 三种格式,7 类票种一键转 Excel!

评论 抢沙发

8 + 3 =
  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址
×
订阅图标按钮