当前时间: 2026-04-01 23:21:26
更新时间: 2026-04-01
分类:软件教程
评论(0)
用AI做一个pdf转word的工具(不理想)
今天打算用AI来做一个将pdf转成word的工具,因为在工作中经常会遇到这样的问题,需要将pdf转成word文档之后再进行编辑,一直没有找到好的工具,用wps转的话需要会员,没有会员也就只能转前面几页,有之前几天的成功经验本以为今天也会顺利,结果完全不是那样。
用python写一段将pdf转为word、或者转为Excel表格的功能,功能界面整体分为三个区域,顶部为功能区,占从左到右全部区域,下面分为左右两个部分,左边与导入的pdf预览区,右边为转好后的word或者Excel的预览区,功能区包含导入pdf按钮、开始转换按钮、导出保存按钮和设置按钮;转换后的word保留原来pdf的样式,尽量百分百还原原来的排版。
等了十来分钟代码写好了,看AI这回复还以为妥了,然后按照ai提示的方式运行了代码结果就是:
-
pdf中是文字的情况,可以将文字读取出来,但是完全没有排版,只是单纯的提取了文字;
-
pdf如果是图片的情况,那种全是文字的截图的情况就完全没有没有效果了,完全识别不了;
于是我查了一下解决方案说是要用ocr识别内容,然后再次调整提示词:
用python写一段将pdf转为word、或者转为Excel表格的功能,功能界面整体分为三个区域,顶部为功能区,占从左到右全部区域,下面分为左右两个部分,左边与导入的pdf预览区,右边为转好后的word或者Excel的预览区,功能区包含导入pdf按钮、开始转换按钮、导出保存按钮和设置按钮;pdf内容可能是单纯的文字内容,也可能是包含图片,需要识别图片的内容展示,如果需要用到OCR识别,需要提供3种左右的OCR识别访问,如果OCR需要调用大模型,或者例如百度的OCR接口,可以预留调用需要的链接地址和其他参数,并说明参数怎么获取,我到对应的地方获取之后使用设置功能进行设置,转换过程最好有进度条方便我知道转换的进度,你也可以发挥自己的专业长处再确保上诉基本功能的情况下对功能进行优化或者添加一些其他必要的功能,让这款小软件更加的有用,写好之后给我提供可以下载代码的链接,我下载到本地运行使用
发送之后AI就开始写代码了,结果写到一半突然就变成这样了,试了几次都失败了。
经过多次任务暂停和失败,终于是经过半个多小时把代码写完了
运行发现这个版本也只是能够读取文字而已,配置了OCR也只是把pdf中图片的文字读取出来,还是没能还原成想要的word,只能当做提取文字的工具使用。
后续查找一下解决方案再看看能否做出一个免费的pdf转word的工具