千问PC端正式上线AI语音输入功能
阿里千问在 2026年5月7日 正式在PC端上线了全新的AI语音输入功能。这次更新不仅仅是简单的“语音转文字”,而是深度集成了 Qwen 3.6 的大模型能力,所以看起来更像是一个“语音 AI 助理”。
以下是该输入法核心更新功能的详细整理:
1、整合大模型的“智能修剪”
传统的语音输入法往往会保留大量的语气词,而千问语音输入法新增了自动化整理能力:
-
去语气词与口语纠错: 自动识别并剔除说话过程中的“呃”、“那个”、“然后”等语气词。
-
智能断句与标点:根据语境和语气,精准添加标点符号,甚至能根据说话逻辑进行段落排版。
-
格式化整理: 它可以将杂乱的口语表达直接转化为逻辑清晰的文案、纪要或正式邮件格式。
2、基于上下文的“代写与回复”
这是该输入法最受关注的功能,特别是在社交和办公场景:
-
自动生成回复: 在钉钉、微信或邮件中,它可以读取当前的聊天背景,当用户语音说“帮我拒绝这个会议”时,它会自动生成一段得体、礼貌的文字回复。
-
跨应用唤起:通过快捷键,用户可以在任何桌面应用(如 Word、Excel、浏览器)中直接调用语音输入,实现“所说即所得”。
3、“一言即达”的指令系统
用户可以直接对着输入法下达功能性指令,而不仅仅是录入文字:
-
创作指令: “帮我写一段关于 AI 趋势的周报大纲。”
-
翻译指令: “把这段话翻译成地道的英文。”
4、底层技术升级:Qwen3-TTS 与 ASR-Flash
其背后的技术支撑也同步进行了更新:
-
超低延迟: 采用全新的Qwen3-ASR-Flash-Realtime引擎,端到端延迟显著降低,支持大规模长语音的实时转写。
-
多语种与方言支持: 除了标准的普通话和英语,新增了对国内7大方言(如粤语、四川话、闽南语等)的深度优化,以及 30 多种全球主要语种的识别。
5、免费策略
目前该功能已在千问PC 客户端全面开放,所有用户均可免费使用。

夜雨聆风