PaddleOCR-VL 输出双层PDF
制作可搜索PDF在AI时代意义已经不大,我还是逆流地基于PaddleOCR-VL量化模型+RapidOCR搞了个C/S 分离的CLI和两个GUI,理论上GTX1650可以试试,8G独显随意用。这套东西将UMI-OCR缺的页面方向校正、混乱的BBox和PPOCR识别字库少的问题全都解决。有折腾能力的可以去我Gitee仓库里研究研究
其它金额
赞赏金额
¥
最低赞赏 ¥0
1
2
3
4
5
6
7
8
9
0
.
广东,13分钟前,
制作可搜索PDF在AI时代意义已经不大,我还是逆流地基于PaddleOCR-VL量化模型+RapidOCR搞了个C/S 分离的CLI和两个GUI,理论上GTX1650可以试试,8G独显随意用。这套东西将UMI-OCR缺的页面方向校正、混乱的BBox和PPOCR识别字库少的问题全都解决。有折腾能力的可以去我Gitee仓库里研究研究