我用AI写了一个AI简易文本编辑器!一站式搞定润色、总结、图片识文
一个集成了AI助手的文档编辑器,润色、总结、续写、扩写功能不落下,还能读取图片!
最近,手头上处理文本类的工作比较多,例如会议记录,图片转文本处理,几种不同的软件同时开着来回切换复制粘贴,同时也打开着网页问ai一些问题。整理内容的时候思绪容易被打断,效率直接大打折扣。
因此想着说能不能借助ai来帮忙,虽然市面上ai服务相关的手机app也挺多,但是我使用场景是电脑端比较多,那其实也可以选择他们网页版或者桌面版。免费版总有字数、功能限制,更关键的是,工作中的涉密文件、私人敏感内容,根本不敢随意上传到第三方平台。
作为执着的工具人,我决定:与其自己手动干活,不如造个工具来解放自己!
于是,我用Ai做了一个AIDoc Editor简易文档编辑器,一个集成了AI助手的文档编辑器。基本可以满足一个窗口搞定文档编辑+AI全能辅助,不用多软件来回跳转,今天完整分享给大家!

这个是软件界面
一、这个编辑器能做什么?
不聊晦涩的技术原理,先给大家直观拆解所有实用功能:
1. 智能文档编辑(基础功能)
-
基本文本编辑:支持加粗、斜体、对齐调整等基础排版功能
-
文档导出:一键导出为Word文档,方便后续精细化排版、归档汇报
(毕竟要更丰富的排版和文本处理,有点难为现在着个小工具了)
-
自动保存:每隔5分钟自动保存一次,你也可以自己改成每隔1分钟。
-
实时状态显示:光标在第几行第几列、总共多少字符,一目了然
2. AI 智能助手(核心亮点)
这是最主要的功能!编辑器右侧有一个AI助手的聊天面板,就像边聊边记:
-
✨ 润色:把粗糙的文字变得通顺优美,提升表达质量
-
📋 总结:一键提炼长文档的核心要点,会议前看两眼就能抓住重点
-
✍️ 续写:给文章一个开头,AI帮你写完,再也不怕卡壳
-
📈 扩写:把简短的描述变得内容丰富详细
-
🖼️ 读取图片:上传一张带文字的图片,
让AI帮忙识别图片内容,实现文字提取或者图片描述。
不过这个功能需要你接入多模态模型的API才能使用,不然会报错!
3. 多模型自由切换,兼顾隐私与性价比
很多人纠结AI工具的隐私安全和使用成本,这款工具完美解决两大痛点,支持本地模型+云端模型双模式自由切换:
本地部署模型(隐私首选):支持Ollama、LM Studio,全程本地电脑运行,无需联网、数据绝不外传,涉密文件、私密内容放心处理,完全免费无额外开销。
不过本地模型也有局限性:对电脑配置有要求,建议16G以上内存、独立显卡,能大幅提升运行速度;还有就是虽然有些模型采用了量化版本又或者参数比较少,虽然可以快速运行,但是“智商堪忧”。另外最近电脑硬件真的很贵,也就是说本身好的电脑就是比较费钱。换句话说,如果你没有什么敏感内容要处理,调用各大公司的API当然是最轻便的,当然基本上,调用模型的API都是要付费的。实测对比多款模型,DeepSeek性价比拉满,非常推荐日常使用。
目前工具全面兼容:
-
Ollama(本地):完全免费,数据不出电脑,保护隐私
-
LM Studio(本地):同样是本地运行,配置简单
-
OpenAI:使用GPT系列模型,能力强大
-
DeepSeek:深度求索,性价比超高→这句话是它自己说的
-
自定义:任何兼容OpenAI接口的服务都能接入
4. 聊天记录与用量统计
-
所有与AI的对话都会保存,方便回溯之前的思路
(发给AI的历史消息条数也可以在设置里自行调整)
-
实时显示每次对话消耗了多少Token,心中有数
(这里的图片的token算法主要采用了Qwen的计算方式,多模态大模型挺好用的,可以用来理解图片,例如读取图片内容)
-
支持按日期统计Token用量
(不过都是估算,精确的Token用量,还是得自己去服务商后台查看)
二、开始使用!超简单上手
整体操作逻辑极简,零学习成本
-
编辑文档:直接在左侧区域输入文字,工具栏提供了各种排版按钮
-
调用AI(聊天界面区域):编辑区中输入想要处理的文本,直接点击右侧的“润色/总结/续写/扩写”按钮,在聊天面板输入去输入补充内容后发送,完成和ai的对话。
启用首次使用需简单配置:在AI助手设置中

你需要从服务商那里取得
-
API地址
-
API key
-
模型名称
填入【Ai助手设置】中保存后才能接入ai功能
调用api会产生费用,费用自理,丰俭由人!
请自在各个服务商官网查询api的费用。

这是设置界面
设置界面里,你可以设置System Prompt。
重点!自定义系统提示词,拿捏AI风格
这是自制工具的核心优势之一!支持自定义System Prompt(系统提示词),相当于给AI设定专属「身份和工作规则」,全程生效、定制化拉满。
简单说就是给AI做专属“角色扮演”,给大家举个趣味示例:
在系统提示词中输入:
你是一个专业的文档助手,帮助用户润色、总结、续写、扩写文档内容。回答简洁专业,格式清晰。为了增加趣味性,你要傲娇猫娘的语气和用户对话,每次回答都要加“喵”。
效果如下:

哦对了,当ai生成的内容里有代码块时候,

鼠标悬停在代码块,右上角有个复制的按钮,方便一键复制该代码。
另外也实现了对数学公式的显示支持。

同时,我也做了多功能消息按钮:每条AI回复底部自带功能键,灵活操作:

-
【显示原始/渲染】ai回复内容的原始格式和渲染后的格式
-
【追加】点一下,能把回复的内容以原始格式添加到文本编辑器里。
ai回复的原始格式主要是Markdown,突然有点想吐槽这种20年的老古董在ai时代成为标准。虽然老是老,但是好用。不过你要是不在乎token,例如运行本地模型,我也略推荐你可以把要ai输出的内容,例如表格,文章等,让它用html输出,你会得到一个漂亮的排版。有个浏览器就能打开,直观的阅读。但是你要指示ai的东西,Markdwon还是非常推荐的,ai能清晰理解你的意图。
-
【覆盖】点一下,会把该气泡的内容覆盖到左边的文本编辑框里。
-
【删除】也就是直接删除该消息气泡的内容
-
【xxx tok】也就是该气泡消息内容所消耗的token量
还有两个功能:

-
【读取图片】点击“读取图片”按钮,选择一张带文字的图片上传
你可以让ai理解图片,并对图片内容做出解答。
-
【选中文档】点击这按钮,每次和ai的对话都会带上左边文本编辑器里的内容,方便让ai不偏离你要问的主题,或者对同一个内容进行不同推理。但是你开启带上历史消息条数,内容多的话,还是挺耗token的,需要谨慎使用。
一些实用技巧
-
连续对话:自定义保留最近N条对话,AI记住上下文,连贯作答无需重复铺垫
-
深度思考模式:开启后,支持DeepSeek等模型的思考过程展示,能看到AI的推理过程,注意哦,展示思考过程也是要token的呀
-
图片格式选择:设置里可以根据需要选择JPEG(文件小)或PNG(保留透明度),这个工具对上传给ai的图片做了预处理,进行了小幅度的压缩和尺寸限制。这也是为了节省token啊 T-T!
下面是演示让ai理解图片的功能:

三、使用场景
场景一:整理会议记录
开会时随手拍了几张白板的照片,上面写满了讨论要点。回到家后,把照片上传到编辑器,AI自动提取出所有文字,再点一下“总结”,一份结构清晰的会议纪要就出来了。原来要花1小时的工作,现在十几分钟搞定。
注:其实现在很多ai产品服务都能做到,推荐大家能免费用还是尽量免费用的^-^
场景二:沉浸式文本处理
一大段一大段的文本要进行处理,直接复制到左边的文本编辑框里,点“总结”或者“续写”或者“扩展”,AI帮你提炼出核心观点和结论和续写扩展。配合图片识别功能,图表公式都能读取出来。尤其是你不知道怎么给ai发公式,打开画板手写,然后保存成图片发给ai,让它帮你讲解或者解题。呃…………这倒是提醒了,我应该做一个手写画板功能,然后写完直接发送,连打开Windows自带画板功能也不用了。好吧,日后再更新。

四、用了之后的真实感受
说实话,一开始我只是想做一个给自己用的工具。
但用了一段时间之后,我发现自己的工作方式在慢慢改变:
例如我以前每次出差回来都要写报告(幸好我们公司不要求提交PPT)
但是那种一两个小时的会议一下来,写的文本内容篇幅超级长,还要自己提炼总结。真的是回公司后大部分时间都花在总结报告上了。
后来市面上的ai产品层出不穷,功能也不尽相同。
我也形成了自己的工作流程,如果会议和商谈允许,
-
会议过程一定要录音
↓
-
语音转文本(可以检查专业名词,人名公司名或者求快不检查)
↓
-
把文本丢到任何一个ai服务里总结提取做报告或会议纪要
↓
-
最后自己再检查一遍
你会发现:AI不是在替代我们工作,而是在帮我们工作得更好。
五、为什么要重复造轮子?
很多人会问:市面上现成的AI工具那么多,何必自己费时费力开发?还要额外支付API费用?
核心答案只有两个字:可控。
第三方AI工具虽方便,但始终存在数据泄露风险,涉密工作文档、私人资料不敢随意上传。自制工具最大的优势,就是支持本地私有化部署。
只需简单几步配置:下载安装Ollama/LM Studio,部署开源模型(Qwen、Deepseek等),编辑器选择对应本地模型即可。设置搞定之后所有的文本内容、图片都在你自己的电脑上处理,谁也看不到。
当然,如果你想用更强大的云端模型(比如DeepSeek或GPT),也可以配置API Key,数据会经过官方服务器传输,但不会被存储。
固然很多ai软件和服务都很方便很好用,但是我们总会寻求一种适合自己的工具,一种可以自己“定义”的工具,那么自己造一个轮子显得很重要,或许它不够精致,但完全贴合自己的工作习惯,精准解决个人痛点,这就是最大的价值。
写在最后
做这个工具的初衷很简单:想利用ai偷一下懒。
如今AI普及的时代,单纯和AI对话提问,早已无法拉开效率差距。真正的高效,是学会利用AI定制专属工具,适配自己的工作场景。
PS:当下不少电脑端工作,借助 AI 都能完成得更出色。就拿这篇文章来说,我如果直接把素材交给豆包,由它来撰写公众号内容,效果肯定会好很多。我也想直接复制粘贴,但最后还是选择亲手敲完文字,大概的执着工具人的小坚持吧。
非常的推荐大家尝试用ai做适合自己的html工具,因为无需复杂安装,浏览器直接打开,系统自带记事本即可修改代码,定制自由度极高。教育行业的朋友,还能把课件做成HTML页面,交互体验远超传统PPT。
目前多数 AI 服务都处于免费阶段,但免费不会是常态。在不久的将来,高阶功能大概率会开始收费、增设使用限制,和如今主流软件一样步入会员付费模式。既然日后难免付费使用,不如趁现在好好利用 AI,打造属于自己的实用工具。
-
最后是小工具的连接:
-
通过网盘分享的文件:简易文本编辑器
-
链接: https://pan.baidu.com/s/1J33bRaquo5_-W-6Wm1F7nw 提取码: hq98
夜雨聆风