乐于分享
好东西不私藏

利用AI将PDF文档转换为PPTX文档的逻辑

利用AI将PDF文档转换为PPTX文档的逻辑

我一直认为从事审计行业的工作者写程序是很容易的,原因很简单。因为他们的逻辑思维很严密,经常要在三张报表之间进行复杂的逻辑勾稽。

然而在实际工作中给我的印象并不是这样的,他们虽然在报表和附注之间业务逻辑很缜密,但是一跑到程序里面,就把本有的逻辑给弄丢了,为此我实在想不通这到底是为什么

我们在实际工作中,经常会接收到大量的PDF版本的PPT文件,所以有时候想把别人的PDF转成真正的PPTX文件。遇到这种情况怎么办呢?

目前我看到大量的视频和媒介都在介绍这种方法,经过我自己的实际测试,利用AI确实可以解决这个比较令人心烦的问题,但是并没有达到完美的程度,只能说可以用起来。

下面就来说一说PDFPPTX的逻辑:

测试PDF文件(为了说明方便,仅给出一页)

第一步:文字识别

说白了,就是把PDF中的文字识别出来,只不过识别出来的文字和原来文字的位置需要保持一致。

第二步:背景识别

也就是要去掉PDF中的文字,而是把背景图片识别出来,同样的道理,这个图片的位置也要与原文件保持一致。

第三步:合并文字和背景

将第一步和第二步分离出来的文字和背景进行重新组合。

基本逻辑就是这样的,先拆分,后合并。这和我们的“化整为零、化零为整”的思维是一样的。说白了,就是图文拆分,再图文合并。

好了,说一下实际操作。

利用javascript代码进行实际测试:

需要注意的是,这里我只分享操作的逻辑和方法,具体的代码不便于贴出。这是为了保留原创者的版权。

进行预览后得到下面的操作界面,然后按照提示即可轻松完成操作。

最终得到的PPTX效果如下:

总体还说得过去,但是我们发现字体、字体颜色和字体大小还是需要调整的。

今天的分享就到这儿啦,非常感谢您对“Python SQL审天下公众号的关注和点赞。如果您觉得我的公众号能给您带来一丝丝的收获,请多多转发给您的朋友圈,让更多的人看到并了解。也许您不经意间的点赞和转发,会给他人带来独特的体验和感受。

本站文章均为手工撰写未经允许谢绝转载:夜雨聆风 » 利用AI将PDF文档转换为PPTX文档的逻辑

评论 抢沙发

2 + 2 =
  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址
×
订阅图标按钮