一个软件干掉10个会员:AI抠图、人声分离、格式转换,这个300MB的开源工具全免费

昨天帮朋友处理一张证件照。
换背景,调尺寸,扣掉杂乱的发丝边缘。听起来很简单对吧?我打开remove.bg——要会员。打开Photoshop——导出发现文件太大,得压缩。打开TinyPNG——上传图片的那一刻犹豫了一下:这张照片里有朋友的脸,我确定要传到别人的服务器上吗?
最后我用了三个软件,花了二十分钟,处理了一张证件照。
你有没有过这种时刻?一个五分钟能搞定的活,因为工具分散、功能割裂、中间还要反复上传下载,硬生生拖成了半小时。
不是你效率低。是这个时代的工具太多了。
一个300MB的压缩包
GitHub上找了一圈,看到一个开源项目,叫MTools,开发者ID是HG-ha,一个人。没有公司,没有PR团队,没有融资新闻。项目在GitHub上当前版本是v0.0.8,最近一次更新是2026年1月。
我下载了。解压完300MB出头。
双击exe,弹出一个窗口。没有注册,没有登录,没有”升级到专业版解锁更多功能”的弹窗。

界面很简单,左边是功能分类——AI工具、图片工具、音视频工具、开发工具,右边是操作区域。干净利落,没有广告,没有弹窗。
我做了几件事。
AI抠图
上传了一张含人物的户外照片,点”开始处理”。七秒钟后,背景干净地被移除了,发丝边缘处理得比remove.bg的免费版更精细。
然后我试了证件照功能。自动换蓝底,自动裁剪到一寸尺寸。不用调参数,不用手动抠。

这个功能在remove.bg上要Pro会员才能用。在MTools上,免费。
区别是:remove.bg在云端处理,你的照片上传到别人的服务器。MTools在本地处理,模型下载到你自己的硬盘上,你的照片从不离开你的电脑。
音视频转文字
我扔了一段上周采访的录音进去,10分钟左右。
我电脑是RTX 3060显卡,用的CUDA版MTools。大约40秒,完整的文字稿出来了,连语气词和停顿都识别了,可以直接导出为SRT字幕文件。

40秒处理10分钟录音。我盯着满屏的文字稿愣了好几秒。
在飞书妙记上,同样的操作需要上传录音,等云端排队处理,通常要5到10分钟——取决于服务器忙不忙。飞书妙记的语音转文字功能在免费版里有时长限制,超出要买团队版。
图片压缩
一张5MB的PNG图片,用MTools内置的pngquant引擎压缩,出来1.1MB。画质肉眼无差别。

跟TinyPNG对比了一下,TinyPNG压完1.2MB。效果几乎一样。
区别还是那个:TinyPNG要上传,MTools在本地处理。而且TinyPNG有免费额度限制,超出要付费。MTools没有额度限制,没有付费,你有多少图压多少。
除此之外,MTools还塞了一堆功能进去:
- 格式转换
——JPG、PNG、WebP、GIF、BMP、TIFF等12种格式互转,支持批量处理 - 视频处理
——H.264/H.265编码,比特率自定义,速度调整不变音调 - 人声分离
——用的是UVR MDX-Net模型,效果接近专业级 - 视频插帧
——低帧率视频补帧到流畅 - 超分辨率放大
——720p修复到2K
这些功能,每一个单独拿出来,都是一款付费软件的主打功能。
MTools把它们全塞进了一个300MB的安装包里。


免费。开源。
测完这些功能,我做的第一件事不是发朋友圈安利,而是翻了一下自己的浏览器历史记录——过去一个月,我到底上传了多少文件到各种在线工具?
结果让我自己吃了一惊。
你的文件去哪了?
你用过的那些在线AI工具——AI抠图、AI降噪、AI超分、AI视频增强——你的文件上传到哪了?
答案通常是:上传到了服务商的云端服务器,处理完之后,文件可能在服务器上保留一段时间,也可能被用于模型训练。具体保留多久、会不会被用于训练,取决于你有没有仔细阅读那个谁都不会读的用户协议。
你可以现在打开手机,随便挑一个你常用的在线AI工具,翻翻它的用户协议——找到”数据处理”那一条,看看它写了什么。
我赌你没看过。因为我也没看过。
2023年4月,三星被爆出员工将公司敏感代码上传到ChatGPT,导致内部机密数据泄露。这件事在科技圈引发了不小的震动,但很快就被新的热点淹没了。
我不是说那些在线工具不安全。大部分正规服务商都有数据保护措施。但问题是:你的文件,真的需要上传到别人的服务器上吗?
对于一张风景照、一段公开的演讲录音,上传没什么大不了。但对于包含人脸的照片、含有商业机密的文档、涉及隐私的对话录音——本地处理是唯一正确的选择。
MTools的逻辑很简单:把AI模型下载到你的电脑上,用你自己的显卡跑。你的文件从不离开你的硬盘。没有网络连接也能用。
这就是”本地优先”。不是什么新技术,但在这个所有软件都想让你注册账号、上传数据、绑定支付方式的时代,它显得格外稀缺。
它不是万能的
说到这里,我需要做一件很多工具推荐文章不做的事:告诉你它哪里不行。
第一,你需要一块N卡。
MTools的AI功能依赖NVIDIA的CUDA加速。如果你用的是AMD显卡或者核显,AI功能的处理速度会大幅下降。普通版可以在CPU上运行,但体验和GPU加速版不在一个量级。

开发者提供了三个版本:普通版(127MB,适合无独显设备)、CUDA版(适合GTX 1060/3060等中端N卡)、CUDA_FULL版(适合RTX 3070及以上高端N卡)。如果你只是做格式转换和图片压缩,普通版就够用。
第二,模型文件要占空间。
首次使用AI功能时,MTools会自动下载对应的模型文件。这些模型加起来可能占用几个GB的硬盘空间。对于128GB SSD的轻薄本用户,需要留意一下。
第三,没有移动端。
目前MTools只有桌面端(Windows/Linux/Mac)。如果你主要在手机上处理内容,它帮不了你。
第四,它是个人开发者的作品。
更新频率可能不如商业软件稳定,遇到Bug不一定能立刻修复,功能也不一定比成熟软件完善。但它开源,代码在GitHub上公开可审计——这本身就是一个信任优势。
我之所以把这些局限性说清楚,是因为”免费工具推荐”这个领域已经充满了过度营销。一个只说好不说坏的工具推荐,跟那些”升级到Pro版解锁全部功能”的弹窗一样,都是在消费你的信任。
工具是用来解决问题的
回到开头那张证件照。
如果当时我就知道MTools,整个过程大概是这样的:打开软件,选”证件照制作”,上传照片,选蓝底一寸,点确定。两分钟。不注册,不上传,不花钱。
我不确定MTools会不会成为你日常的主力工具。如果你是专业设计师,Photoshop还是不可替代的;如果你是专业视频剪辑师,Premiere和DaVinci Resolve的功能深度远超一个工具箱。
但如果你跟我一样,做内容创作经常要处理图片、转格式、把录音变成文字,MTools解决的是另一个问题——
我到底需要多少工具?
过去几年,软件行业有一个趋势:把一个功能做成一个App,然后卖月费。图片压缩一个App,格式转换一个App,AI抠图一个App,PDF处理一个App。每个都收你一笔。
这个商业模式对开发者当然好——持续收入,用户黏性。但对用户呢?你为十几个功能,装了十几个软件,付了十几个会员,打开每个都要登录,处理文件都要上传,月底一看账单——好家伙。
MTools做的事情其实很简单:把这些功能集成到一起,放在本地跑,不收钱。
这不是什么颠覆性创新。这只是一种产品理念的回归——工具应该服务于人,而不是人服务于工具。
一个300MB的压缩包,解压即用。下载地址放下面了。觉得好用,去GitHub给开发者点个Star。在这个所有软件都在想方设法掏你钱包的年代,有人愿意花时间做一个免费工具,本身就值得尊敬。
GitHub官方下载:https://github.com/HG-ha/MTools/releases
国内镜像(下载更快):https://openlist.wer.plus/MTools
版本选择建议:
日常格式转换、压缩、裁剪 → 普通版(127MB) AI抠图、语音转文字 → CUDA版(需N卡,GTX 1060及以上) 专业视频处理、批量AI任务 → CUDA_FULL版(需RTX 3070及以上)
夜雨聆风