起因:WPS越来越离谱
最近用WPS,发现各种功能开始收费。图片转文字收费,PDF转Word收费,字体用个好看的也收费,于是我一怒之下,自己手搓了一个AI图片识别工具。
关注公众号后回复“AI工具”扫码百度网盘自动下载
是个什么东西?
简单说就是一个集图片识别、文档提取、视频分析、图片生成于一体的AI桌面工具。界面采用三栏布局,左边是预览区支持拖拽上传,中间是识别结果和对话记录,右边是生成的图片展示。
核心功能全部免费
图片识别:支持上传或粘贴图片,一键识别文字,支持批量处理一次识别几十张,还能识别物体、场景并做完整分析。

文档提取:支持PDF、Word、Excel、TXT,连代码文件如.py、.java、.cpp、.js等都能识别,提取后可以直接对话分析。

视频分析:上传视频后每0.5秒抽一帧,AI自动分析动作、行为、场景变化,输出连贯的讲解式描述。

图片生成:接入智谱AI的CogView,输入描述直接生成图片,生成的图片可另存为、复制、双击放大。

多模型切换:支持通义千问、DeepSeek、豆包、智谱AI、Kimi,一个软件切换不同AI能力,API Key本地保存,切换模型自动换Key。
对话模式:上传图片或文档后可以连续提问,支持多行输入,Ctrl+Enter发送,结果自动复制到剪贴板。

技术实现
语言用的是Python,界面用tkinter,大模型API接入了通义千问、DeepSeek、智谱AI等,视频处理用OpenCV,文档解析用PyPDF2、python-docx、openpyxl。打包后体积约40MB,无需安装Python环境,直接双击运行,支持Windows 10和11。
为什么我要自己做?WPS会员一年199,一个字体还要单独收费。市面上AI工具要么网页版不方便,要么收费。自己做,想加什么功能加什么。这就是自己动手的意义:看不惯收费,就自己做一个更好的。
下载方式
公众号后台回复「AI工具」获取下载链接。
开发者:万频超控 | 公众号:ccc98ddd
夜雨聆风