福利

如果你懒得写小工具,公众号后台回复 “ 福利1 ” 获取小工具下载链接吧~
如果想再懒一点,就后台留言给我吧。

【1】准备好企查查专业版报告



【2】提示词

开发一款:纯离线可执行的PDF工商信息批量提取工具,软件名称固定为“企查查工商信息提取(公司类型)”。使用PyQt5做GUI页面,并要求能打包成EXE。【注:这句话不能删】
具体要求如下:
一、批量处理规则
1、仅处理目标文件夹内后缀为.pdf的文件,忽略子文件夹及其他格式文件;
2、若目标文件夹为空/无PDF文件,直接弹出异常提示,不执行后续操作;
3、按PDF文件数量实时更新处理进度(如“正在处理第X个,共Y个PDF”),逐个解析PDF,避免批量加载导致的卡顿。
二、PDF信息提取规则
1、提取范围:
精准匹配PDF中2.1工商信息章节内的所有表格数据,需先通过文本匹配精准定位该章节(含“2.1”+“统一社会信用代码”关键词,忽略标点/空格差异),未找到该章节的PDF直接跳过,不写入结果。
2、提取逻辑:
(1)表格表头识别:匹配到“企业名称、统一社会信用代码、法定代表人、注册资本、企业类型、成立日期、注册地址、经营范围、登记状态、登记机关”表头时,记录对应列索引,作为提取基准;如图1

(2)空值处理:表格单元格无内容/提取失败时,统一标记为【待确认】,严格按PDF原文摘录,不扩写、不脑补、不修改原文格式;
三、Word结果生成规则
1、保存路径:目标文件夹下生成“提取结果.doc”(覆盖同名文件,无需提示);
2、表格结构:每个PDF生成一个Word文档,仅包含1个表格,列名固定为:企业名称、统一社会信用代码、法定代表人、注册资本、企业类型、成立日期、经营期限、住所、经营范围、登记机关、登记状态;如图2

【注:这个表格针对的是公司类型的标的,合伙类型的信息摘录需要修改表格信息,你也可以按照你尽调报告的格式修改。合伙类型的小工具也放在福利下载链接里】
四、交互界面要求
实现极简一键操作,无冗余步骤,操作流程固定为:选择目标文件夹→点击“开始提取”按钮→自动生成结果文件,全程可视化操作,无需用户输入任何指令、修改任何参数。【注:如果你对小工具美观有要求,这里可以补充细节】

【3】展示结果

工具界面 ⬇️

开始跑 ⬇️

提取完成 ⬇️





叨叨两句

END
夜雨聆风