从手机发任务,电脑自动干活——Claude这次更新有多狠?

上周，一条新闻刷爆了科技圈：Anthropic发布Claude Computer Use功能。

什么意思呢？简单说——你从手机上给Claude发个任务，它就能在你家里的电脑上自动执行。

举个例子：开会迟到了，你在路上用手机告诉Claude"把pitch deck导出PDF附到会议邀请"，几分钟后，Claude就完成了。打开应用、浏览文件、导出PDF、发送邮件，全程自动化。

听起来像科幻片？但这就是刚刚发布的新功能。

01｜Claude Computer Use 到底是什么？

这次Anthropic发布的是"Claude Cowork"功能，核心就是Computer Use——让AI直接操控你的电脑。

以前的AI助手，只能"说话"。你问它问题，它给你答案。你想让它帮你干活？没门，它只能告诉你"怎么做"，然后你自己动手。

但Computer Use Agent不一样。它能"行动"——你给它一个任务，它会去看屏幕、操作键盘鼠标、完成工作。

核心能力有三点：

第一，看懂屏幕。它能识别屏幕上的界面元素——按钮在哪、输入框在哪、菜单在哪，就像真人看电脑一样。

第二，操作界面。它能点击、输入、滚动、拖拽，模拟人类的键盘鼠标操作。

第三，智能决策。遇到界面变化能自动适应。按钮从左边挪到右边？它一看就知道，不需要重新编程。

这种"观察-决策-行动-反馈"的循环，就是Computer Use Agent的核心模式。

02｜和传统AI助手有什么本质区别？

说实话，刚开始听到这个功能的时候，我有点困惑。

这不就是RPA（机器人流程自动化）吗？以前那些自动化脚本也能操作电脑啊。

但深入了解后，我发现差别大了。

传统RPA是"脚本"：你得把每一步都写得清清楚楚。点击坐标(100,200)，等待2秒，输入文字"XXX"...一旦界面改了，脚本就崩了。

Computer Use Agent是"智能体"：你只需要告诉它"要做什么"，它会自己决定"怎么做"。按钮挪位置了？它看一眼就找到了，不需要人工干预。

打个比方：

RPA就像教一个机器人做饭——你得告诉它"拿起锅、放左边灶台、开火、倒油、等30秒、放菜..."

Computer Use Agent就像让一个真人做饭——你只需要说"帮我做个番茄炒蛋"，它自己知道怎么弄。

这个差距，是质的飞跃。

03｜实测能干什么？三大场景演示

根据Anthropic的演示和B站UP主的实测，目前能做的事情还挺多的。

场景一：办公自动化

最直观的例子就是开会迟到。你在路上用手机发任务，Claude在家里的电脑上帮你：

• 打开PPT文件

• 导出为PDF

• 打开邮件客户端

• 创建会议邀请

• 附上PDF文件

• 发送

整个过程，你只需要一句话，Claude自己完成。

场景二：数据分析

有个B站UP主实测了小红书数据分析：

• Claude自动打开小红书后台

• 扫描最近10条视频数据

• 识别哪些是爆款

• 生成Excel表格

• 写深度分析报告

全程零干预，Claude自己浏览网页、提取数据、整理输出。

场景三：跨应用协作

最厉害的是跨应用联动。比如分析股票：

• Claude调用浏览器搜索特斯拉股价信息

• 从多个网站收集数据

• 打开Word写分析报告

• 自动排版、插入数据图表

• 保存文件

以前这种任务得人工操作好几个软件，现在一句话搞定。

当然，Anthropic自己也说："功能还在早期阶段，会犯错"。实测中也有翻车的案例，比如操作卡住、找不到按钮、点错位置。但整体来看，成功率已经相当可观了。

04｜如何使用？完整指南

想体验这个功能，需要满足几个条件，我来详细说说。

首先，四大核心条件缺一不可：

条件	要求
订阅计划	Claude Pro（$20/月）或 Max（$100-200/月），免费版不可用
操作系统	仅限 macOS（Windows/Linux 暂不支持）
客户端	最新版 Claude Cowork 桌面 App 或 Claude Code CLI
系统权限	必须授予屏幕录制 + 辅助功能权限

然后，两种启用方式：

方式一：通过 Claude Cowork 桌面 App（推荐）

1. 订阅 Claude Pro/Max 并登录桌面 App

2. 进入 Settings → Cowork，打开 Computer Use 开关

3. 按系统提示授权：屏幕录制（让Claude"看见"屏幕）、辅助功能（让Claude控制鼠标键盘）

4. 发起任务，首次操作新应用时会弹出授权，点击 Turn on 即可

方式二：通过 Claude Code CLI

1. 安装并登录 Claude Code CLI

2. 输入命令 /mcp 启用 MCP 服务

3. 按提示授予屏幕录制与辅助功能权限

4. 发送指令，自动触发 Computer Use

进阶玩法：手机远程控制（Dispatch）

这个功能很酷——你在外面，手机发任务，家里的 Mac 自动执行：

1. Mac 端 Claude Cowork 保持运行并登录

2. 手机安装 Claude App，登录同一账号

3. 点击桌面端右上角配对图标，用手机扫码绑定

4. 在手机端发送指令，Claude 会在 Mac 上执行并回传结果

安全要点：

• 每个新应用需单独授权

• 可在设置中添加黑名单应用（如网银、密码管理器）

• 随时按 Esc 键停止操作

• 终端窗口不被截图

• 同一时间仅一个会话可控制屏幕

• Computer Use 消耗大量 tokens，额度消耗较快

常见问题：

• Windows 可用吗？暂不支持，官方计划后续更新

• 免费版能用吗？不能，必须 Pro/Max 订阅

• 权限被拒绝？前往 macOS 系统设置 → 隐私与安全性，手动为 Claude 开启权限

05｜和竞品对比：Operator、OpenClaw

Computer Use Agent现在是热门赛道，各家都在布局。

Claude Computer Use（Anthropic）

• 定位：桌面全控制，能操作你电脑上的所有应用

• 特点：通过Claude桌面版启用，本地运行

• 优势：权限大，能访问本地文件、操作桌面软件

• 劣势：目前主要面向Pro订阅用户

OpenAI Operator

• 定位：浏览器自动化，专注网页操作

• 特点：基于CUA模型，强化学习训练

• 优势：网页场景深耕，体验流畅

• 劣势：只能操作浏览器，不能动本地应用

OpenClaw

• 定位：开源方案，本地AI Agent框架

• 特点：GitHub爆火，28万Stars超越React

• 优势：完全开源，可自定义，连接多种AI模型

• 劣势：需要技术能力，部署门槛高

还有Google的Mariner（浏览器自动化）、微软的Copilot Studio（企业级）、智谱的GLM-PC（跨平台）...

赛道很拥挤，但每家的定位不太一样。Claude的优势在于桌面控制——能操作你电脑上的所有东西，不只是浏览器。

06｜AI Agent趋势：这件事意味着什么？

2026年，AI Agent彻底爆发了。

从ChatGPT到Claude Computer Use，从Operator到OpenClaw，AI正在经历一个关键转变：

从"对话助手"进化为"行动主体"。

以前的AI，你问它问题，它给你答案。你想让它帮你干活？没门。

现在的AI Agent，你给它一个目标，它自己规划、执行、反馈、调整。就像一个真正的助理，能独立完成任务。

Nvidia CEO Jensen Huang公开说："OpenClaw是下一个ChatGPT"。这句话分量很重——当年ChatGPT改变了我们和AI的对话方式，现在AI Agent要改变AI帮我们做事的方式。

长远来看，Computer Use Agent可能改变我们和软件的交互方式：

以前，我们学软件操作：点这个按钮、拖这个滑块、填这个表单...

未来，我们只需要描述目标："帮我做个PPT"、"整理这些数据"、"发个邮件给XXX"

软件界面变成了AI的操作对象，我们不需要知道怎么操作，只需要知道要什么结果。

这是交互方式的范式转移。

结尾｜总结+思考

Claude Computer Use还在早期，Anthropic自己也承认"会犯错"。

但方向很清晰：AI不再只是聊天的助手，而是能行动的伙伴。

2026年，AI Agent元年。OpenClaw爆火、Operator发布、Claude Computer Use上线...巨头们都在往这个方向冲。

对于我们普通人来说，有两件事值得关注：

第一，体验一下。如果你有Claude Pro订阅，Cowork功能已经上线了。打开桌面版，试试让它帮你做点简单任务。

第二，思考一下。如果你的工作中有大量重复性操作——填表、导文件、整理数据——AI Agent可能很快就能帮你省掉这些时间。

技术还在迭代，但趋势已经很明显了。

AI不只是用来聊天的，它开始帮你干活了。