一周之内,AI Agent 同时进驻 Office 四件套、Chrome 浏览器和 Mac 桌面。不做产品发布汇总,这篇文章从工作流重构的视角,分析你的日常工作哪些环节会先被接管。
昨天早上我打开电脑,习惯性地扫了一眼几个官方博客。然后我愣了几秒。
不是被某个功能震撼到。是被发布时间扎堆惊到了。
Claude 全面入驻 Excel、PowerPoint、Word 和 Outlook,GA 了。OpenAI 的 Codex 装了个 Chrome 插件,能在浏览器里后台干活。Perplexity 把 Computer Use 做进了 Mac 原生应用。
三家竞品,同一天发布,同一个方向。Agent 不再只待在终端和 IDE 里写代码了。它要进你每天都在用的工具了。
这不是 demo,不是内测,是正式产品。
24 小时,三个 Agent 同时发布,不是巧合
先快速过一遍发生了什么。不是为了写产品公告。是为了让你感受这 24 小时的密度。
首先是 Claude for Office 四件套。Excel、PowerPoint、Word 正式上线,Outlook 开放公测。跟普通 Office 插件最大的不同:Claude 在四个应用之间共享对话上下文。
什么意思?你在 Outlook 里让它分类邮件并起草回复。然后切到 Excel 调了一组数据。PowerPoint 里的图表和 Word 里的文档,自动同步更新。不是手动导出导入,是它自己帮你做了。
同一天,OpenAI 宣布 Codex 可以在 Chrome 里直接运行。装个插件就行。
它能操作 Chrome 里的任何网页和应用。它能在后台跨标签页并行工作,不影响你正常浏览。它不会接管你的浏览器控制权——你干你的,它在后台默默做事。
同一天,Perplexity 的 Personal Computer 上线 Mac 原生应用。能跨本地文件、桌面程序、网页和安全服务器执行任务。不需要折腾环境——下载 Mac 客户端,直接就能用。
这三个发布的时间间隔不到 12 小时。一家可能是巧合,三家就是信号。

不是功能罗列——Agent 在你的一天里到底干了什么
好了,发布新闻看完了。假设你是一个典型的互联网从业者。Agent 进了你的工具之后,你的一天会变成什么样?
上午 9 点,你打开 Outlook。 昨晚的 30 封未读邮件已经被 Claude 分类好了。客户问进度的归一堆,内部通知归一堆,CC 你的归一堆。它还帮客户那封起草了回复草稿。你不用从头写——扫一眼,改两句话,点发送。
上午 10 点半,你在 Excel 里调运营数据。 调完一组数,切到 PPT 准备下午的周会。发现图表已经更新了。不是你拷的,是 Claude 检测到 Excel 数据变了,自动同步的。Word 里的周报草稿也同步更新了数据引用。
下午 2 点,你有个调研任务。 让 Codex 在 Chrome 里打开 5 个竞品网站。提取定价信息和功能列表。对比成一个表格。Codex 在后台开了 5 个标签页,默默抓数据。不打扰你干别的。10 分钟后给你一个整理好的表格。你可以继续写周报,不需要来回切标签。
这不是科幻。这是这周刚上线的东西。Claude 的官方公告和 OpenAI 的推文都可以自己翻。我想说的是另一个问题。
为什么是现在?不是技术突破,是产品化临界点
说实话,这些能力不是这周突然变出来的。Claude 的跨文件上下文,至少存在半年了。Codex 的工具调用同理。Perplexity 的 Computer Use 也是。
那为什么集中在这周扎堆发?因为产品化条件同时到位了。
跨应用上下文保持,这是技术基础。Agent 有用的前提不是「能在某一个 App 里帮你」。而是「能在多个 App 之间记住你在干什么」。Claude 这次在 Office 四件套之间保持连续对话上下文,就是这个能力的落地。你不需要告诉它「我刚在 Excel 改了 B 列」——它自己知道。
但光有技术不够。更关键的是部署通道和企业付费意愿同时成熟了。Claude 这次不走第三方插件的老路。直接走微软管理中心统一部署。企业管理员可以批量安装和配置,还能用 OpenTelemetry 做全流程监控。Codex 走 Chrome 插件商店,Perplexity 走 Mac 客户端。都不是「先搭 Docker 再配环境变量」的路子——点安装就能用。
而企业愿不愿意为这个买单?GitHub 本周发了篇文章,讲他们怎么优化 Agentic Workflow 的 Token 消耗。不是写出来秀的。是他们已经在生产环境大规模跑 Agent,跑出成本后才开始优化。每个 PR 上运行的智能体工作流会累积高昂 API 成本。团队监测后构建专门智能体来优化这些环节。
企业愿意为 Agent 买单,而且已经开始优化成本结构了。这不是「未来趋势」,这是「已经在记账了」。

工作流被改写后,你的角色变成什么
前面讲的都是「Agent 能做什么」。但更有意思的问题是:Agent 做了这些之后,你做什么?
我的判断是,你的角色会发生三个变化。
第一,工作节奏从串行变并行。 以前你得一件一件来——先回邮件,再改数据,再做 PPT。现在 Agent 在后台并行处理多个任务。你变成了「指挥官」:发指令、检查结果、修正方向。
这意味着你的决策密度会大幅提高。以前一天做 5 个决策,以后可能一小时就要做 5 个。
技能树也在跟着变。以前你的竞争力是「我 Excel 透视表玩得溜」「我 PPT 做得快」。以后这些操作层技能被 Agent 替你做了。真正拉开差距的是你能不能精准描述需求。能不能快速判断 Agent 产出质量。知不知道什么时候该自己上,而不是让 Agent 瞎搞。
GitHub 本周发的 Agent PR 审查指南就是个很好的例子。AI 代理生成的 Pull Request 越来越多,审查它们不再只是看代码风格。要特别关注逻辑错误、安全漏洞、技术债务。这些是 Agent 容易遗漏,但人一眼能看出问题的地方。会审查 Agent 产出的人,比会用 Agent 的人更稀缺。
还有一个变化更隐蔽:错误模式也变了。 Agent 以前最多在终端里写错代码,你跑一下报错就发现了。现在 Agent 可以操作文件、改 Excel 数据、发邮件草稿。它的错误不是终端里的红色报错了。而是「不知不觉间改了你的数据」。或者「草稿里混入了不该有的内容」。
这是从「显性错误」到「隐性错误」的转变。你不能再靠「跑一下看报不报错」来发现问题。需要建立新的检查习惯。

现在开始做的三件事
说了这么多,给点能用的建议。根据你现在的状态,选一条开始。
如果你是企业管理者: Claude for Office 支持微软管理中心统一部署。先在 5-10 人的小团队里试点。关键不是让所有人马上用上。是在试点期搞清楚两个问题。第一个:哪些工作流马上见效(邮件分类、数据同步大概率是)。第二个:哪些工作流 Agent 反而添乱(需要你亲自判断的决策型任务)。
如果你是一线从业者: 别等公司推。装一个 Claude for Office 或者 Codex Chrome 插件。从你最烦的那个重复性任务开始试。 不是从零学新工具,是拿它解决一个已有的痛点。试三次。第一次指令可能不够精准。第二次调一下 prompt。第三次大概就找到感觉了。
如果你是观望者,在想「要不要入场」: 判断标准很简单。同事开始用 Agent 处理重复性任务了,而你还在手动做。你的产出速度就是别人的一半。那时候再入场,不是学工具的问题,是追差距的问题。
你日常工作里,有没有哪个环节已经在被 Agent 悄悄接管了,而你还没意识到?
参考来源
• Claude Blog: Collaborate with Claude across Excel, PowerPoint, Word and Outlook — claude.com/blog/collaborate-with-claude-across-excel-powerpoint-word-and-outlook • OpenAI X: Codex now works directly in Chrome on macOS and Windows — x.com/OpenAI • Perplexity X: Personal Computer now available in new Mac app — x.com/perplexity_ai • GitHub Blog: Agent pull requests are everywhere — github.blog/ai-and-ml/generative-ai/agent-pull-requests-are-everywhere-heres-how-to-review-them • GitHub Blog: Improving token efficiency in GitHub Agentic Workflows — github.blog/ai-and-ml/github-copilot/improving-token-efficiency-in-github-agentic-workflows
夜雨聆风