WPS 笔记,将常驻我的手机
WPS 笔记,将常驻我的手机
录音、照片、OCR、灵感和 Agent,被放进同一个轻盈的记录空间。
上周五,6月5日,我去北京参加了 WPS 的 AI Next。
上午场一上来,就发布了一个我很喜欢的新东西:WPS 笔记。
先说结论:它已经常驻我的手机和电脑端。

终于,终于有个产品能把现场记录、照片、录音、灵感,全都串起来,让人干人事儿了。
先聊一个我每次听分享都会遇到的尴尬场面
人坐在台下,电脑开着录音。
台上的 PPT 翻得那个快,就怕你看懂似的。
你好不容易拍完照片,回头还得订正语音转文字里的错字。那堆字已经滚过去不知道多少行了。
更崩溃的是回家以后:
录音躺在 A 里等着导出,照片堆在手机相册里等着快传,零散的灵感记在 B 里…
等我真要写点东西的时候,得在三四个 App 之间来回倒腾。
倒着倒着,就没劲儿了。
你明明记了那么多,可它们躺在那儿,再也没被打开过。
一顿忙活,给知识当了把搬运工。
除了没进脑子,都挺好。
我是个十年的老 Office 用户。
去年我直接把主力办公软件换成了 WPS,还开了大会员。
真的,挺适合中国宝宝体质的~
WPS 月活 6 亿,是个国民级工具,注册个账号谁都有。
这次它在北京办 AI Next,上午场的主角就是 WPS 笔记。
3 月开启万人内测,4000+ 用户共创
我对它的期待,是带着双重身份来的。
一方面,我经常参加各种分享会,遇到好的灵感和碰撞,都需要现场记录。
另一方面,我也是个写公众号的创作者,天天跟素材打交道。
所以我更看重的是:它能不能让我记完以后,真的用得上。
录音:别再让我多装一个 App 了
我对一个录音工具,其实就三个朴素要求。
第一,别让我再下一个新 App。
我手机里录音的、转写的工具已经够多了。我想要的是在已经有的东西里把活干好,而不是再装一个。
第二,能实时编辑。
它转写的时候,我就能改错字,而不是等它吐完一大段流水账,我再回头一个个找。
第三,录完能和其他类型的文档一起整理成摘要。
而且这个摘要还能让我接着改,跟别的图片素材、文字内容和录音拼在一起,最后凑成一份完整的会议回顾。
听起来不难吧?
可你真去市面上找,会发现没几个能三条全占。
全模态高效录入:语音、图片、文字、网页全格式支持
拍照:照片里的信息,其实特别值钱
先说拍照。
分享现场的照片,不只是留个纪念。
我可能想学人家 PPT 的排版,想抠下来图里的那段文字,想要里面的图、表,甚至想把整页结构拆出来复用。
这就特别考验 OCR 能力。
图片处理:OCR、梯形校正、划词生图、AI 重绘
我在现场直接开试。
会场右上角有一面背景墙,上面有一串公式。
我顺手拿手机拍下来,扔进 WPS 笔记,点了“内容提取”。
会场背景墙上的公式,我现场拍的
它不光把公式认出来了,连公式旁边那几个英文单词都一个不落地识别了出来,而且公式还能继续编辑,后面要改符号、改文字、改排版,都不用从头再抄一遍。
对老师、理科内容创作者、经常处理公式材料的人来说,这才是他们要的。
公式编辑器带显示LaTex源码
OCR 这关,过了。
我又把这些内容选中,点了一下“划词生图”。
什么提示词都不用写。
坦白说,我没指望能生成什么东西,就是纯试试。
提取出来的公式连旁边的英文都认全了,选中后划词生图
结果它直接给我生成了一张只有公式的图。
不明意义的字儿没有出现,公式内容也全对。
没给任何提示词,直接生成的纯公式图
你可能觉得这没什么。
但对一个老师来说,这个事儿可不简单。
现场用 WPS 笔记随手拍一张照片,给学生用的那张公式图,就已经生成好了。
这事儿放在以前,想都不敢想。
不光要 OCR,还得把识别出来的内容重新做成一张图。
整个环节错一点,都不能用。
现在呢?
手机上点两下,成了。
不只是老师。
但凡你做理科内容、开会要抠图表、工作里要把“镜头里的东西”变成“能用的东西”,都会需要这一下。
可以哦,WPS 笔记有点东西。
边听边修:这个细节很戳我
还有一个我筛选录音工具的硬性指标:边听边修。
咱得承认,听分享的时候,不是每一秒都 100% 在状态。
经常是听到某一句,突然发现:
“诶,这儿它转错了。”
我就想马上改。
可如果工具不让我当场改,等回家再回头找,你放一百个心,你绝对懒得弄了。
边听边修,就是让我在听的当下,顺手把错字捋顺。
甚至还能把发言人改成指定的人。
而且 WPS 笔记还会告诉你:它改了哪儿,从什么改到了什么。
我知道,通义听悟也有类似能力。
但把刚才说的图片 OCR、录音转写、文字整理放在一块儿做的,几乎没有。
单拎出来,每个功能都有人做。
可“录音 + 拍照 + 文字”能在一个地方拌匀了端上来,才是我想要的。
录音过程中 AI 边听边修,结合上下文把“公司”修正成“公式”
录音处理:实时转写、区分发言人、AI 边听边修
WPS灵犀:用 Agent 把录音、图片、文字一起兜住
WPS 笔记还集成了 WPS 原生办公 Agent「灵犀」,把整件事兜住了。
录音、文字、图片都在同一个空间下,我寻思测试一下能力上限,干个大的。
用灵犀 Agent 整理当前笔记
它还内置了高频场景下的 Skill,点击即用。
我直接写了个提示词:
结合录音、图片和文字,做一个时间轴上的简短汇总,大概多少分钟拍的图,对应上,/整理当前笔记
要完成这个任务,它必须同时处理三件事:
-
音频里的时间轴; -
图片里的 OCR 内容; -
文字信息的整理和归纳。
结果如下。完美不完美吧~
灵犀 Agent 根据录音、图片和文字整理出的时间轴摘要
还有一个细节:它有自己的记忆系统。
灵犀能记住你的工作方式,也能慢慢适配你的写作风格。后面再处理类似内容时,你就不用每次从头交代一遍。
对创作者来说,这个很关键。
因为我们真正需要的不是一个每次都重新认识你的工具,而是一个越用越顺手、越用越知道你想怎么表达的助手。
内置 AI 助手能记住你的工作方式、适配写作风格,越用越顺手
多级标签:它终于不逼我先想分类了
接下来这个,是我个人最喜欢的:多级标签。
WPS 笔记是铁了心不做文件夹。
它的逻辑是:文件夹是给人看的,可给 AI 看,根本不需要文件夹,直接按内容分类就行。
我把笔记往里一扔,它自己读懂内容,自动给我打好标签、定好层级。
比如我当天我现场记录的这篇笔记,它直接归成了“工作流和工具的 AI 笔记工具”。
左边标签栏点一下就能用。
我不用先想这条该放哪个文件夹。
结构是它自己长出来的。
WPS 笔记自动生成多级标签
而且它的检索是多模态的。
只要你搜的关键词,出现在文字里,或者出现在某张图片里的文字上,它都能给你捞出来。
这个能力,咱们在手机原生相册里可能见过。
但把你乱七八糟的笔记全堆在一起,还能这么搜的,WPS 笔记就能办到。
搜“蓝色”,所有带蓝色元素的图片都被捞了出来
MCP 接入:这才是对我杀伤力最大的点
但要说对我杀伤力最大的一个点,是 MCP 接入。
它支持别的 AI Agent 直接调用笔记里的内容。
对我这种天天泡在 Claude 和 Codex 里干活的人,简直是福音。
WPS 笔记支持 MCP 接入
我给你描一下我理想中的一天:
白天我在现场,录音、视频、照片、文字,全都丢进一篇 WPS 笔记里,让它先把这场分享整理利索。
晚上回家,我直接让自己的公众号写作 Skill 去读这篇笔记,当天的感想就能开写。
搁以前可不是这样。
以前我得让 Claude 自己吭哧吭哧把一堆工具拉起来,去解析、去重新搭。
AI 在那儿当个边解析边搬砖的实习生。
而现在,WPS 已经用固定的工作流和 Agent,把“记录—整理—打标”这段脏活累活替我干完了。
我拿到的是一份已经收拾干净的东西,直接拿去做文风改写、做创作。
它不香吗?
最关键的是,我有地儿查了。
标签做得好,我想找哪条,直接就能找着。
我相信这才是 WPS 笔记最大的价值:
把一天的线索串起来,把字面上“不是人该干的活儿”,真不让人干。
我现场问了一个难题
在问答环节,我也问了个难题。
像我这种手里攒了成百上千篇内容的人,全靠 AI 自动对每篇文章打标签、建分类,会不会标签过度分类,数量直接爆炸?
刘聪老师的回答非常实在:
标签真打多了、打乱了,可以让灵犀重新做二次打标。
相似的标签,比如“开源模型测试”和“开源模型项目”,还能让它帮你合并。
合并前,它还会再问你一句要不要。
WPS 笔记负责人也介绍到,标签的层级和长度其实是有上限的:最多 10 级,总长不超过 200 字。
也就是说,它不是放任你无限堆标签,是有兜底的。
真的挺好。
有能落地的解法就好,相信 WPS 的产品规划和品味。
问答环节关于多级标签和二次打标的说明
最后说说我的态度
聊到这儿,你大概能感觉到我的态度了。
WPS 笔记打动我的,是它把一件事彻底打通了:
从收藏即遗忘,到记下来就能用。
在 AI 时代,能记的工具不稀缺。
能让你记完还用得上的,才稀缺。
我的录音、我的照片、我墙上拍下来的那串公式、我那半截灵感,它们终于不再是各回各家的沉默素材,而是被串成了一条能流动起来的线。
Obsidian 我还会继续研究,它有它的好。
但对大多数像我这样懒得搭体系、又想把东西用起来的人,WPS 笔记可能就是那个更现实的解。
因为它真的,把所有东西都串起来了。
对了,这才只是上午场。
下午 WPS 还发了一个更让我想介绍给大家的工具——AI PPT。

那个我单独开一篇细聊~
今天就先到这儿。
愿我们记下的每一笔,都能等到被用上的那天。
而且,它已经支持全量下载了。
你现在就可以试试~
我是刘旭。
WPS 笔记,真的值。
WPS 笔记下载入口
WPS 笔记,真的值。
夜雨聆风