一、引言
前不久,龙虾的爆红让大家看到了一件事:个人设备是 AI 的大市场。
用户非常愿意在自己的设备上,运行 AI 完成各种任务。
这表明 AI 的个人电脑客户端有着广阔前景,绝不仅仅是提示词收发工具,而是一种通用工具。
各大厂商都看到了这一点,不约而同加强了电脑客户端,朝着通用工具的方向发展,比如 Anthropic 的 Claude Cowork 和 Computer Use、OpenAI 的 Codex 的功能都在扩展。
国内也不例外,千问最近就为自己的电脑版扩展了功能,上线语音输入法,大大加强了本地的智能办公。
我这几天一直在试用这个新版本,觉得新增的功能很不错,值得好好介绍一下。
二、千问电脑版
我是从官网下载客户端[1],只有最新版才有新功能,如果以前安装过,需要更新一下。
安装后打开,就是下面的样子。
页面可以切换模型(下图),都是千问自家的模型,免费使用。
这些模型就不多说了,网上有很多评测,我们主要看它的新功能。
体验之前,你需要到“设置”菜单里面确认一下,“千问语音输入法”有没有打开。
智能语音就是这次千问更新的重头戏,也就是把电脑的语音功能跟 AI 结合起来。
三、全局唤起
这次更新后,就可以用快捷键全局唤起千问。
什么是全局唤起?就是不管当前是什么环境,处于哪个窗口,只要用快捷键,就可以把千问唤出。
这样就能随时快速调用 AI,大大方便了日常使用。
默认的快捷键是右侧的 Alt 键(Windows 系统)或者右侧的 Command 键(Mac 系统),用几次就记住了。
四、智能语音输入
按住快捷键,唤起的是智能语音输入。
这个功能就是通过电脑的麦克风,让 AI 模型处理接受到的语音。
这时,屏幕下方会出现一个提示符(下图)。
按着快捷键,千问就会一直识别输入的语音。松开按键,输入就停止了。
如果光标处在输入框内,识别出来的文字就会插入光标处。
经过我的测试,它的识别准确度非常高。上图就是中英混合语音的识别结果,可以看到没有错字,基本不用二次修改。你完全可以把它当做英文语音转文本的工具,非常方便。
此外,AI 模型还会对文本进行处理,自动去除语气词,修正口误,优化表达,结构化地呈现。
五、语音指令
5.1 提问
双击快捷键,可以直接向千问提问,屏幕下方会出现不一样的提示符。
跟上一节的语音输入相比,多了一行提示文字,让你直接提问。
说完问题后,再按一下快捷键,输入就会生效。它会打开一个小窗(下图),回答你的问题。
你也可以在小窗直接输入查资料,或者继续追问。
除了语音提问,它也支持划词提问,直接双击,让它解释,结果很快就出来了。
5.2 语音指令
双击快捷键,不只是提问,还能向 AI 发出语音指令。
什么样的指令都可以,让千问查资料、翻译、记便签、做 PPT、整理表格……效率至少提升好几倍。
这时最好先打开“设置”菜单的“识别屏幕”选项,允许它识别屏幕(下图)。
这个选项会把屏幕画面作为上下文,一起输入模型,提高回答的针对性。
下面是我测试的几个常见场景。
5.2.1 文案润色
在 Word(或其他办公软件)里面选择一段文字,可以让 AI 进行润色、翻译、总结等操作。
举例来说,选中一段很啰嗦的文字,发出语音指令“对选中文字进行润色”。
下面就是润色的结果。
5.2.2 撰写邮件
发出语音指令,它可以替你写邮件。
上面就是 AI 根据对方来信,自动生成的邮件回复。你也可以给出内容要点,提出写作要求(比如希望写得更商务、更简练),让千问把内容扩展成一封完整的邮件。
5.2.3 记便签
发出语音指令,还可以把信息摘录成便签。
举例来说,打开一个电商页面。
然后双击快捷键,说“帮我记商品价格”(指令格式是“帮我记xxx”),就会出触发便签功能,将指定的内容记入便签。
千问会打开一个便签小窗(下图),里面就是自动提取的相关内容,方便进一步处理。
5.2.4 PPT 和表格
你还可以通过语音指令,让千问生成 PPT。
点击生成的文件,会打开内置的 PPT 编辑器,可以预览和手动编辑。
Excel 表格文件也可以生成。
六、总结
试用以后,我的感觉是,千问选择了一个很巧妙的方向:为个人电脑加入一个语音模型,从而以很小的开发成本,进化为支持全局语音的电脑桌面 AI 助手。
表面上,这次只是方便用户动嘴,但其实是它从客户端开始转变为本地通用工具。
如果你的电脑办公学习需要 AI 辅助,可以试试这次的千问电脑版,零门槛、易上手、而且免费。本地安装后确实比使用网页版[2]更方便,下载可以点击“阅读原文”。
(完)
References
[1] 千问客户端: https://www.qianwen.com/download?ch=tongyi_redirect [2] 千问网页版: https://www.qianwen.com/
夜雨聆风