大家好,我是 So。
上周写了一篇豆包输入法的深度调研,后台收到最多的一个问题是:
"豆包之外还有别的吗?我用 Mac 多,桌面端有没有更猛的方案?"
这个问题我自己也纠结过很久。过去半年我陆陆续续试了一圈,国内的有豆包、微信、讯飞、通义、飞书;海外的有 Wispr Flow、Superwhisper、Typeless、MacWhisper、Spokenly;极客圈还有 whisper.cpp、蛐蛐 QuQu 这些开源方案。
试到第八款的时候我意识到一件事:这不是"哪款最好"的问题,而是"你属于哪一类用户"的问题。
所以这篇文章我想做三件事:
- 1. 给一个能落地的选型框架——三轴选型法
- 2. 把市面上 12 款主流方案按"国内派 / 海外派 / 极客派 / 系统派"分类整理
- 3. 按 5 类人群给出具体的工具组合推荐,看完照抄就行
文末还会送一个"语音输入三件套"的工具箱清单。
一、为什么 2026 年值得切到语音输入
先说一个反常识的数据。
Wispr Flow 官方做过一次内部测试:成熟用户使用语音输入的速度,是键盘党的 4 倍。Typeless 的用户报告里这个数字是 3-5 倍,豆包官方给出的"错误率比传统输入法低 20%-50%"也指向同一个结论。
更关键的是这背后的两个变量都变了:
变量 1:识别准确率跨过了"可用线"。 2023 年的语音输入还会让你每说三句话停下来改两个错字,到 2026 年中英混说、方言、专业术语、口头禅过滤,全都能搞定。准确率从"将就着用"变成了"基本不用改"。
变量 2:AI 进入了"二次加工"环节。 过去的语音输入只负责"听对",现在的 AI 语音输入会自动帮你去口水词、加标点、改语气、甚至把口语整理成结构化要点。一段"嗯那个我觉得这个事情吧应该这样做"出来直接是"我建议这样处理:……"。
这两件事叠加起来,意味着一个新的工作流正在成型:
用嘴说出原始想法 → AI 当场清洗成可用文本 → 喂给下一个 AI 干活。
键盘党不会消失,但只用键盘的人,正在被这个新工作流甩开身位。
二、三轴选型法:90 秒选出适合你的工具
把 12 款工具铺开之后我发现,所有选型问题都能拆成三个轴。回答这三个问题,答案基本就出来了。
轴 1:你主要在哪台设备上用?
- • 手机为主 → 看输入法类(豆包、微信、讯飞)
- • Mac 为主 → 看桌面听写类(Wispr Flow、Superwhisper、Typeless)
- • 全平台跨端 → Wispr Flow 是目前唯一三端通吃且体验一致的方案
- • Windows 为主 → 选择更少,Wispr Flow / 讯飞输入法 PC 版 / Typeless
轴 2:你拿语音输入来干嘛?
- • 日常聊天 / 发消息 → 输入法类够用,免费
- • 写长文 / 公众号 / 周报 → 需要 AI 清洗能力,Wispr Flow / Typeless / 豆包
- • 转写会议 / 长录音 → MacWhisper / 飞书妙记 / 通义听悟 / 讯飞听见
- • 配合 AI 编程或对话 → Wispr Flow / Superwhisper(全局快捷键最快)
轴 3:你的数据放哪里你能接受?
- • 云端无所谓 → 几乎所有商业产品都可以
- • 必须本地 → Superwhisper / Typeless(本地模式)/ whisper.cpp / 蛐蛐
- • 企业合规 → 飞书妙记(私有部署)/ 讯飞政企版
三个问题答完,下一步就是去对应象限里挑工具。下面我把 12 款方案铺开。
三、12 款主流方案速查表
我把它们分成四派,每派给一个"一句话定位",方便你快速跳过不相关的部分。
派系 1:国内大厂派(中文体验天花板)
| 工具 | 定位 | 平台 | 价格 | 核心优势 |
|---|---|---|---|---|
| 豆包输入法 | 字节系 All in AI+语音 | iOS/Android/Mac | 免费 | 中英混说 + 方言 + 古文 |
| 微信输入法 | 隐私优先的系统级输入 | 全平台 | 免费 | 跨端词库同步 + 隐私 |
| 讯飞输入法 | 老牌语音转写之王 | 全平台 | 免费/订阅 | 长语音稳定性 + 行业词库 |
| 通义听悟 | 长录音 AI 总结神器 | Web/小程序/插件 | 每天 10h 免费 | 总结 + 章节 + 字幕 |
| 飞书妙记 | 企业会议纪要标配 | Web/App | 飞书套件 | 区分发言人 + 待办提取 |
国内派的甜区:中文母语者、移动场景、不想付费。豆包是这一波 AI 输入法里综合体验最好的,详细评测见上一篇文章。
国内派的天花板:到桌面深度协作就跟不上了。微信输入法 Mac 版还行,但和海外几款的"全局快捷键 + AI 自动清洗"工作流比,还差一截。
派系 2:海外明星派(桌面工作流之神)
| 工具 | 定位 | 平台 | 价格 | 核心优势 |
|---|---|---|---|---|
| Wispr Flow | 体验最丝滑的全平台方案 | Mac/Win/iOS | $15/月 或免费版 2000 词/周 | 一键全局 + AI 自动 polish |
| Superwhisper | Mac 用户的本地隐私首选 | Mac | $8.49/月 或 $249 终身 | 本地 Whisper + 深度可定制 |
| Typeless | 中文体验最好的桌面方案 | Mac/Win/iOS | $12/月(年付) | 实时编辑 + 自动去口水词 |
| MacWhisper | 文件转写的瑞士军刀 | Mac | €59 终身买断 | 录音文件批量转写 |
| Spokenly | AquaVoice 的免费平替 | Mac/iPhone | 部分免费 | 本地 + 云端混合架构 |
海外派的甜区:Mac 桌面、知识工作者、深度依赖 AI 工作流。这一派的工具普遍内置"按一个键 → 说话 → 文字直接进光标"的极致流程,配合 Cursor、ChatGPT 用爽到怀疑人生。
海外派的天花板:贵,以及中文支持参差。Wispr Flow 中文够用但带口音的还会翻车;Typeless 中文优化最好,但桌面端订阅 $12/月对国内用户偏贵。
一个常被忽略的点:Wispr Flow 的免费版对中文用户实质上是"无限量"。它按英文字数计费,但中文一长段会被它误判成几个英文 token,2000 词的免费额度几乎用不完。亲测过去三个月没花一分钱。
派系 3:开源极客派(本地隐私 + 零订阅)
| 工具 | 定位 | 平台 | 价格 | 核心优势 |
|---|---|---|---|---|
| whisper.cpp | OpenAI Whisper 的 C++ 实现 | 全平台 | 免费开源 | Apple Neural Engine 加速 |
| 蛐蛐 QuQu | 阿里 FunASR + LLM 的开源 IME | Mac/Win | 免费开源 | 中文优化 + 本地 LLM 润色 |
极客派的甜区:程序员、隐私洁癖、想自己折腾的人。准确率不比商业产品差,但要愿意花一个下午配环境。蛐蛐基于阿里 FunASR Paraformer,中文表现比 Whisper 本身还稳。
极客派的天花板:开箱即用程度低,UI 普遍粗糙,更新节奏跟不上商业产品。
派系 4:系统自带派(你可能忘了它存在)
- • iOS Dictation / macOS 听写:Apple 自带,免费,开箱即用。准确率追上来了,但缺 AI 二次加工,纯转录。
- • Android 系统输入法:Pixel 上的 Recorder 也能用,但中文不优化。
系统派的甜区:临时凑合用、不愿意装第三方、对隐私极度敏感(数据本机处理)。
四、按人群推荐:5 类用户的工具组合
光列表还不够,我给 5 类典型用户各配一套"工具组合"。
1. 内容创作者 / 公众号作者(我自己)
主力:Wispr Flow + 备用:豆包输入法 + 兜底:通义听悟
- • 写长文用 Wispr Flow,按住
Ctrl+Win在 Cursor 里口述初稿,AI 自动去口水词加标点 - • 通勤路上想到选题用豆包输入法,刷到飞书文档里
- • 采访录音用通义听悟转写 + 自动总结,每天 10 小时免费额度够用
月成本:Wispr Flow $15,其他免费。
2. 程序员 / AI 重度使用者
主力:Wispr Flow 或 Superwhisper + 备用:Typeless + 兜底:whisper.cpp
- • 给 Cursor / Claude Code 喂 prompt 用语音最快,全局快捷键打开就说
- • 不想付订阅的程序员可以本地起一个 Superwhisper + Whisper Large V3 模型,效果接近 Wispr Flow
- • 极客玩法:whisper.cpp + 自写脚本 + Karabiner 全局快捷键,零订阅
月成本:$8.49(Superwhisper)或 0(开源方案)。
3. 销售 / 律师 / 一线业务
主力:豆包输入法 + 备用:讯飞输入法 + 兜底:飞书妙记
- • 移动场景为主,豆包语音准确率和方言支持最好
- • 客户会议用飞书妙记录音转写,自动提待办
- • 讯飞输入法做长语音备份,它的长段语音断句最稳
月成本:全免费(除非买讯飞畅享包)。
4. 隐私敏感型用户 / 企业合规
主力:Superwhisper(本地模式)+ 备用:whisper.cpp + 兜底:系统自带听写
- • 所有语音数据本机处理,不上云
- • Superwhisper 支持 BYOK,你也可以自己跑 Whisper 模型
- • 微信、银行类敏感场景切回系统自带听写
月成本:$8.49(Superwhisper 一次性 $249 终身更划算)或 0。
5. 学生 / 价格敏感用户
主力:豆包输入法 + 备用:Wispr Flow 免费版 + 兜底:通义听悟
- • 豆包免费、中文好、有 AI 补全
- • Wispr Flow 免费版对中文用户实质无限量(前面说过的 token 计费 bug)
- • 通义听悟每天 10 小时免费转写额度
月成本:0 元。
五、工具箱:每个人都该配的"语音输入三件套"
不管你属于哪一类,我推荐都按"主力 + 备用 + 兜底"的结构来配:
主力(每天都用的那个)
选一个:豆包输入法 / Wispr Flow / Typeless / Superwhisper
判断标准:你最常用的设备是什么。手机为主选豆包,Mac 为主选海外那三个。
备用(主力坏了顶上来)
选一个和主力不同派系的产品。
判断标准:主力是云端那备用就上本地,主力是 Mac 桌面那备用就装个手机输入法。两条腿走路。
兜底(处理特殊场景)
至少配一个会议转写工具:飞书妙记 / 通义听悟 / MacWhisper 三选一。
判断标准:哪个生态你用得最熟。飞书用户选妙记,阿里系选通义,全平台无依赖选 MacWhisper(一次性买断)。
六、避坑清单:选型时容易翻车的 7 个点
- 1. 看免费额度别看月限:Wispr Flow 按英文 token 算中文,"2000 词/周"对中文用户几乎是无限
- 2. 本地方案要看模型大小:Whisper Large 准确率高但要 3GB 内存常驻,Base 模型够日常但容易翻车
- 3. 方言用户优先豆包:粤语、川话、陕西话这些豆包识别明显比讯飞快半个版本
- 4. 会议转写别用输入法:输入法类(豆包/微信)做长录音转写都会断,老老实实用专门工具
- 5. 隐私敏感场景断网测试:所谓"本地模式",先关网络试一遍,云端依赖立马露馅
- 6. 企业合规看部署方式:通义听悟/讯飞听见有私有化版本,飞书妙记可以走企业租户
- 7. 订阅前先用免费版一周:Wispr Flow 和 Typeless 都有免费试用,至少测两天再付钱
七、最后说一句
我去年这时候还在键盘上一个字一个字敲文章,现在 80% 的初稿是说出来的,包括这篇。
切换的成本比想象中低。第一周会觉得"说出来好奇怪",第二周开始感觉"哎其实有点爽",第三周回头看键盘党会想:怎么还有人愿意一个字一个字敲。
如果你还没开始用 AI 语音输入,挑一个免费的(豆包或 Wispr Flow 免费版),今天就装上。这是 2026 年我能想到的、ROI 最高的一次工作流升级。
下一篇我打算写一下"语音 + Cursor + Claude Code"的具体工作流,包括我用语音怎么写出这篇文章的全过程。感兴趣的话评论区留言告诉我。
📌 工具速查链接
- • 豆包输入法:https://www.doubao.com/ime
- • Wispr Flow:https://wisprflow.ai
- • Superwhisper:https://superwhisper.com
- • Typeless:https://www.typeless.ai
- • MacWhisper:https://goodsnooze.gumroad.com/l/macwhisper
- • 通义听悟:https://tingwu.aliyun.com
- • 飞书妙记:https://www.feishu.cn/product/minutes
- • 蛐蛐 QuQu(开源):https://github.com/yan5xu/ququ
如果这篇帮你省了选型时间,点个"在看",让算法多推荐给一个同类。
夜雨聆风