近日,阿里上线了自己的语音输入法产品:千问输入法。

或者也叫做CosyVoice 输入法。

这款产品,出自阿里通义实验室,主打 AI 时代的语音输入。
底层大模型,是阿里千问大模型的 CosyVoice 大模型技术。
产品口号:说得随意,写得漂亮。
Cosy,舒适的。Voice,声音。舒适的声音。
腾讯,有微信输入法。
字节,有豆包输入法。
现在,阿里的千问输入法,也来了。
大厂激战输入法,拉开帷幕。
目前,千问输入法macOS 版、Android 版已上线,iOS 版和 Windows 版还需等待。

接下来,体验下千问输入法。
下载后,登录账号,支持淘宝登录。

按照流程,配置下各项设置,就可以使用了。






任何页面启动后,即可输入。显示下面动态声波图标,表示正在输入。

该产品支持智能转录,能自动过滤「嗯、啊、那个」等口水词。

能把你语音输入的内容,结构化呈现,整理成列表或大纲,非常清晰。

还能智能的自我更正,比如能识别口语中的「不对不对」「改成」「我意思是」等修改词。
然后完成自动修正。

也能理解用户意图。 比如,写邮件、写会议邀请、写 vlog 脚本等。
告诉 CosyVoice 你想要什么格式,它直接给你完成稿,称谓、问候、签名一应俱全。
确实有点智能。

还能将文本,多样化呈现。比如,数字转为小写,呈现计算公式。

支持多种方言,能听懂上海话、广东话、四川话等。
也支持多种语言,中、英、日、韩等,都能搞定

你也能添加热词Skill,记在你的特殊词汇,越用越聪明。

体验下来,豆包输入法、微信语音输入法常有的功能,基本都有。

比较有特点的是,所有输入法,都记录在历史记录中。
你原始的语音输入文件,能下载下来。

还有剪贴板功能,自动帮你帮你把语音转成的文字,添加到剪贴板。

还能帮你进行字数统计,帮你了解使用情况。

该产品,离线也能用,没网的时候照样能转文字,有网了再同步。
但是比较遗憾的,千问输入法,语音转录时,不支持流式输出,而是一段话说完话后整体转录后输出。
而微信输入法、豆包输入法都是可以的。

流式输出的体验,是很好的。
预估后面, 千问输入法也能补齐这个功能。
为何大厂都喜欢推自己的输入法呢?
两个原因,
一个是,AI 时代,所有的产品值得重新做一遍。
AI 时代的输入法,主要方式不是打字,而是语音。
因为语音输入效率,是打字输入的 3-5 倍。
这让大家在输入法这个赛道,又站到了同一起跑线上。
另一个是,输入法是 AI 时代的底层入口。
你和所有 AI 智能体的沟通协作,都依赖你的输入。
输入越频繁、越多、越准确,大模型就越懂你,越能解决你的问题。
而输入法,就是这个底层接入口。
这非常重要。
在 AI 时代,有 2 个以前非常古典互联网产品,AI 公司都在重塑。
一个是输入法,负责内容输入。
一个浏览器,负责内容查看。
这都是为大模型提供上下文信息、提供背景信息的最基础载体。
所以你会看到,每个大厂,都在推输入法,主打语音智能识别。
各个大模型公司,都在桌面 Agent 里内置浏览器。
目的是,用户输入、输出、消费信息,都在自己产品内。
为大模型提供有效个性信息,让大模型更懂你。
现在开始,你也可以放在键盘,开口就好。
这是这个时代的有效表达。
夜雨聆风