乐于分享
好东西不私藏

WPS 已死,ChatGPT 永生(AnyGen 也行)

WPS 已死,ChatGPT 永生(AnyGen 也行)

这话有点标题党了,只不过在体验后,十分兴奋地想将自己的感悟分享给大家。更准确说,不是 docx、ppt 立马会消失,而是我们真的没必要再把大量时间耗在 WPS/Office 这种 GUI 软件里做【机械排版】了。文件格式不会死,但“人亲自进去点来点去”这种生产方式,已经该退场了(这不等同于说 GUI 不好、不值得)。

以前我一碰到排版就头大,都干出创伤来了,现在终于有一种“生产力解放了”的实感。我们确实该准备挪动屁股、解放脑袋了。别被旧的工具形态绑架。马车能做的事,汽车也能做,而且做得更好。现在“汽车”已经开到面前了。

总之我的感受就是:终于可以慢慢脱离 WPS 这个狗皮膏药了。(攥紧拳头)

排过版的人都明白,这种痛苦非常具体

不是什么抽象的“低效”:

正文宋体四号,英文 Times New Roman;
行距怎么调;
段前段后多少;
Enter 和 Shift+Enter 对“分行”有什么区别;
脚注尾注怎么设置,到底放左下还是正下;
打印出来会不会跑版。
你做的根本不是表达 / 思考,很多时候就是在跟软件较劲。

我为什么感触这么深?因为我以前接过排版的单子,客户对 docx 文档的格式要求特多(因为最后要打印出来)。于是被迫在 WPS 里点来点去,做完后脑子都是麻的。

我就是不擅长这种机械式操作(即便有格式刷,也还是难受)。那种感觉就是,把机械活包给了我,这跟两百年前在珍妮机上弹棉花的工人没区别😶‍🌫️。手一直在动,但人好像逐渐没了什么思考和创造。

这次真正让我震惊的,不是 AI 会写内容

这个大家早就知道了;而是 ChatGPT 现在连格式也能一并包下来。你可以描述得很具体:正文什么字体字号,英文单独用什么,标题怎么处理,页面怎么排,怎么设置表格……它都能直接给你出成品。

你不用自己先写完内容,再单独找个软件进去排版。内容和格式,二者可以在同一个聊天里推进:哪里不对直接说;哪里要改,它继续改。很多时候,甚至根本不需要打开 WPS。这个体验一出来,我对 docx 这类文件的看法就变了。AI 眼里,它也不是一坨像 PDF 的“死”东西,而是可以被拆解 / 改 / 重写。

虽然我对底层技术的理解可能有偏差,但至少从体验上看,这些文件格式没那么神。它们更像交付壳子,而不是非得让人亲手进去劳作的地儿。以前得学按钮 / 菜单在哪、这个功能藏在哪个二级面板里;

现在我们更该学的,是怎么把内容做好,把需求说清楚,怎么给约束,怎么盯最后结果。这不是一回事,前者更像熟练工,后者更像判断力虽然说在圈内已经被人说烂了)。

有人可能以为 AI 只是帮你“先写一版”,但它正在把一整段原来靠人手工完成的工作流吞掉。内容+格式是一层,后面的修改、预览、导出、分享又是另外的一层。越来越多产品会先反过来,或者说直抵效果:给谁看,达到什么效果,什么风格,重点放哪。这个变化比“WPS 里加个 AI 按钮”大得多。

真正被替代的,不是一两个功能点,而是“我自己进去点半天”这个动作本身。

所以我觉得,真没必要再把学习 WPS/Office 那套【机械操作】,当成什么值得长期投入的能力

除非以后长期吃这碗饭,而且吃的就是这碗“反复在旧格式里修修补补”的饭,不然它的复利非常差。这也是为什么“在这这些生态里加AI功能”,在我看来有点像屎上雕花(当然,如果是强硬需求的话,那可能也确实是雪中送炭😕)。

点来点去的意义何在?能力没有太强的可迁移性,也没什么复利。

当然,这里要纠偏一下:不是说 WPS 的设计开发者有错,也不是说今天还在用这套东西的人有错,我自己现在不也还在用吗。

老工具,本来就是为上一代的条件服务的:没有这么强的 AI,没有这么自然的对话式交互,没有这么顺滑的云端生成,当然只能靠人亲手去调。问题不在于它“坏”,而在于现在已经有了更高效的方式,我们还把自己绑在旧动作里,就有点没必要。


同样的事情发生在 PPT 上

以前我就觉得 PPT 这种格式很重,里面绑了太多东西。因为我们要的明明只是“把一组内容清楚展示出来”,结果却被迫进入一个很厚+重的文件和软件体系。

现在我在用 Zara姐 和 Claude Code 搞出来的 slides skill,后来又去体验了 AnyGen(字节跳动推出的 AI 办公/生产力 Agent) 上更完整的那套流程,我更确定了:人真正要的不是某个 .pptx / HTML 本身,而是一个闭环。

这个闭环是:

1把需求说清楚,先给一个 plan / list,帮你把思路理顺;
2然后先给你一个小的可视化预览,让你先选风格(而不是一上来就赌一整份成品);
3确认方向后,再生成完整的 slides(幻灯片)。

左边你继续跟 AI 聊,右边你直接看预览、改字、调内容。最后你可以全屏展示,可以下载,也可以直接把链接拿出去分享。部分用户不想为了做个演示,先去折腾本地、命令行、文件夹。浏览器里直接搞定,才是“最懒”的体验。

AnyGen 官网现在也把这条线写得很直白:1 page. Every edit. 0 switching.Structured questions guide your ideas step by stepBuilds with you, not for you。(同时又在强调 editable AI slides、PPTX export/import/editing、template reuse、native charts)[4]

本地跑 skill 很有价值,但它更像 Power User 干的事,不像最终给普通人用的体验。最终大概率还是会落回到 Web 上,在一个人人都熟悉的聊天框里,把生成、预览、修改、展示、分享这些事一次做完。按 F11 全屏,展示效果并不比传统 PPT 差。上下切换时该有的过渡动画也有,分享反而更方便。

而且这种网页化 slides 的一个好处是,它本来就更轻。如果想自主些,HTML 下载下来,在浏览器里打开。说白了,浏览器就可以当播放器,HTML 也完全可以是载体。

GPT跟我说的是:HTML 很像先出现的新交互,PPTX 更像还得兼容很久的旧交付。PPT 也不会消失,但不继续当主要创作界面。换句话说,创作和交付界面开始分离了。以前,得直接在交付格式里创作;以后更可能是在 AI 对话框、网页预览、结构化编辑里创作,再导出去。

总之就是更轻松了,更底层、更复杂的部分被抽象了、被AI外包了🥵😉。

这些文件会继续存在,但

doc、ppt、pdf 当然会继续存在,因为打印、交付、协作、单位模板、老师领导客户的接收习惯都还在。但我越来越觉得,它们会慢慢退到“导出格式”“交换格式”这一层,而不再是主要的创作空间。被淘汰的不是 PPT 本身,而是你亲自一点点排它的过程。

就像你今天写东西,未必要直接在最终发布界面里一字一句敲(用过公众号后台的,应该都知道挺烂的);你可以先在更顺手的地方生成、修改、组织,最后再导出去。PPT 也一样,它更像结果,不像过程。

这背后真正变的不是文件,是人的分工。以前机器不够聪明,所以人要替机器,补上那部分机械劳动;现在机器终于开始能把这些机械劳动吞掉了,人应该把注意力拿回来,放到【更该由人做的事上】:判断信息是不是成立,结构是不是清楚,表达有没有打到点上,最终呈现是不是符合场景。

不是不检查(尤其是要打印 / 交付 / 对外发的,最后那一眼还是自己盯)。但至少你不用再亲自去干那些【本来就不该由你干的活】了。


很多今天还只存在于 AI coding agent 里的 skill,明天很可能就会被做成按钮

最后,顺带说:本人之前就想着把 Zara姐 这个很火的 frontied-slides skills 包装成一个平台,后来发现 AnyGen 大平台已经把这条路走通了,于是就写了一份 end.md 给自己做复盘。

这个经历对我的启发是:很多今天还只存在于 AI coding agent 里的 skill,明天很可能就会被做成普通用户在聊天框里随手点一下就能用的按钮。以前只有 Power User 能享受的东西,会被也应该被产品化、平民化。

重要的是看清楚用户到底要什么,然后看谁把那段工作流做得最丝滑,而非守着意识形态本身。而用户要的可能不是“全世界最新模型”这几个字(虽说有些用户追求的就是这个),不是文件后缀名,也不是软件里有多少个按钮。

他们要的是,最后能不能把事做完:卖点不是模型名,而是完成度,Result as a service。

@WPS,地址; @AnyGen @ChatGPT,打钱!🥵(不对,好的产品果然是用户自传播的
(完)

参考资料

GPT 和我找的技术背景补充:

AI 就是在“看懂 docx 这堆字符”,至少拿 ChatGPT 来说,不是黑灯瞎火的走。它会先把 Word、PPT 的文字抽出来,再结合上下文和检索去处理;有时候则会直接进入安全的代码执行环境,写 / 跑 Python、调用库去处理和生成文件。所以这不是玄,不只是“会生成”这么简单,它确实已经能在文件层面动手了。

OpenAI 官方自己写的是,file uploads 能力建立在 Advanced Data Analysis 之上;数据分析时 ChatGPT 会进安全代码执行环境写/跑 Python,而且这套环境支持 file manipulation and generation;但对 Word/PPT 这类文本文档,官方又单列成 text extraction + search 这一类,说明文件类型的背后机制并不完全一样。

1Zara Zhang,frontend-slides GitHub README:skill 的定位、visual previews、PPT 转 web、浏览器打开、分享与导出;repo 当前约 15.4k stars。链接:https://github.com/zarazhangrui/frontend-slides
2Zara / AnyGen 公开帖:Frontend Slides 已进入 AnyGen,HTML slides 可编辑、可分享、可导出 PDF。链接:https://x.com/zarazhangrui/status/2042339116894032157?utm_source=chatgpt.com
3AnyGen 官方更新档案:2025-07 强调多轮协作与精确编辑;2025-09 上线 Slides;2025-12 One-Stop PPT Creation;2025-12 PPTX Import & Editing;2026-01 Template Reuse;2026-02 Two Styles;2026-03 OpenAPI 支持 .pptx / .docx / .pdf 输出。链接:https://docs.anygen.io/updates/archive
4AnyGen 官网:1 page. Every edit. 0 switching.Builds with you, not for you.Structured questions guide your ideas step by step.Other AIs guess. Ours verifies.。链接:https://anygen.io/
5OpenAI《File Uploads FAQ》:文件上传能力建立在 Advanced Data Analysis 之上,可处理 Word、PPT、PDF 等文本型文档。链接:https://help.openai.com/en/articles/8555545-file-uploads-faq
6OpenAI《Data analysis with ChatGPT》:ChatGPT 可进入安全代码执行环境写/跑 Python,并支持 file manipulation and generation。链接:https://help.openai.com/en/articles/8437071-data-analysis-with-chatgpt
7OpenAI《Optimizing File Uploads in ChatGPT Enterprise》:对 docx/pptx/pdfs 这类文本文档,常见机制是文本抽取 + 搜索;不同文件类型会触发不同处理路径。链接:https://help.openai.com/en/articles/10029836-optimizing-file-uploads-in-chatgpt-enterprise
8OpenAI《What types of files are supported?》:ChatGPT 支持 DOCX、PPTX、PDF、TXT、XLSX 等常见文件类型。链接:https://help.openai.com/en/articles/8983675-what-types-of-files-are-supported