Python批量读取PDF文件,清洗数据并按同列名拼接 已关注 关注 重播 分享 赞 视频详情 你是否有过这样的经历:要跑一个流水,银行间的数据格式千奇百怪,银行内的数据表头也时有变化?要跑一批结算单,每张单据成百上千页,而你手里有几百份数据需要汇总分析?PDF转表格的现成工具不少,但我们的需求不光要快速读取,还要逐层分析数据表头,将一致的表格合并起来,而无法找到表头或合并失败的也不能随意丢弃以确保数据完整性,那么这款脚本可能适合你。具体实现思路我们明天见!“把重复性的整理交给脚本,把思考性的判断留给自己”----我是内审拾光