不需要API,AI自己就能操作软件了
5月26日,微软发布了 Copilot Studio 2026年5月更新,其中最重磅的消息是:Computer-Using Agents(计算机操控智能体)正式进入 GA(General Availability)阶段。
简单来说,这些 AI 智能体可以像一个真人用户一样操作你的电脑——打开应用程序、点击按钮、填写表单、从屏幕上读取数据、在多个软件之间来回切换。
关键在于:它不需要任何 API 接口。
传统的企业自动化(RPA、iPaaS 等)有一个致命前提:目标软件必须提供 API 或至少有结构化的数据接口。而现实中,绝大多数企业内部运行着几十甚至上百个关键系统,大量是十几年前部署的老系统,根本没有 API,也没有厂商愿意为你开发一个。
微软这次的做法是:绕过 API 这道门槛,让 AI 直接"看"屏幕,"理解"界面,然后"动手"操作。
这不是 Demo,是正式上线
这里需要特别强调:Computer-Using Agents 不是预览版,不是实验室产品,而是 GA 正式发布。也就是说,企业客户从今天起就可以在生产环境中使用这项能力。
此前,Anthropic 的 Claude 也展示过"电脑操控"的能力(Computer Use),OpenAI 也有类似的 Operator 功能,但它们基本还停留在开发者预览阶段。微软这次直接把它推到了企业级可用的状态,结合 Azure 的安全合规框架一起上线,这对企业用户来说是一个质的跳跃。
同期发布的三项关键升级
除了 Computer-Using Agents,微软在这次更新中还推出了三项重要能力:
1. 全新工作流设计器
Copilot Studio 的工作流画布被重新设计,现在支持:
- • 条件分支:根据不同场景执行不同路径
- • 并行执行:多条任务线同时推进
- • 调试控制台:逐步追踪智能体的每一个操作
这意味着构建复杂的 AI 工作流不再是"连连看"式的简单拼接,而是真正的流程编排。
2. Work IQ 集成
智能体现在可以原生读取微软 Viva Work IQ 的信号数据,将员工效能分析融入决策逻辑。举个例子:一个智能体可以根据团队的工作负荷自动调整任务分配。
3. 实时语音交互
智能体支持实时语音通话,响应延迟低于 500 毫秒。这让 AI 客服和 IT 帮助台场景正式落地——之前的语音交互因为延迟太高,在实际使用中完全不可接受。
为什么这件事意义重大?
打通了"最后一公里"
企业数字化转型喊了这么多年,最大的瓶颈从来不是那些已经上云的新系统,而是那些"碰不了、改不动、但每天都在用"的老系统。一个典型的大企业里,可能有 10 到 50 个关键内部系统根本不支持外部集成。
Computer-Using Agents 的出现,相当于在所有这些系统之间架起了一座桥——不需要厂商配合,不需要开发新接口,AI 自己就能跨系统操作。
RPA 行业迎来"诺基亚时刻"?
传统的 RPA(机器人流程自动化)靠的是预设规则:定义好"点哪里、填什么、下一步做什么"。一旦界面布局变了,脚本就挂了。
Computer-Using Agents 则是基于视觉理解和语义推理,它不是在执行脚本,而是在"看懂"屏幕后做出判断。这就像从记住一条固定路线,变成了真正学会了看地图。
UiPath、Automation Anywhere 这些 RPA 巨头需要认真审视一下自己的护城河了。
微软的战略意图很清晰
微软在2026年的布局非常清楚:Azure 要做所有 AI 智能体的安全治理层。
注意几个关键动作:
- • Azure AI Foundry 同时上线了 Anthropic 的 Claude 模型
- • Copilot 正在从"对话助手"变成"智能体平台"
- • Computer-Using Agents 让 Copilot 能操控几乎所有软件
换句话说,微软不再只是 OpenAI 的分销商。它要做的是一个"模型无关"的企业智能体平台——不管你用 GPT、Claude 还是 Gemini,都在微软的安全和合规框架里运行。
还有什么值得关注?
6月2日至3日,微软 Build 2026 大会即将在旧金山举行。根据已有信息,预计会有以下重磅发布:
- • GitHub Copilot 多智能体编排:代码审查、测试、文档、安全扫描由不同专用智能体并行处理
- • AI Foundry for Windows SDK:将 ONNX Runtime 和 DirectML 打包为统一本地 AI 开发接口
- • Agent 365:企业智能体的统一管理平台,重点解决审计和合规
写在最后
AI 会不会"操作电脑"这个问题,现在有了明确的答案:会,而且已经到了企业级可用的阶段。
这不仅仅是一个功能更新。当 AI 可以像人一样操作任何软件的时候,企业中大量"人作为系统间粘合剂"的角色——数据录入员、系统操作员、流程专员——都将面临根本性的变化。
但机会同样存在:理解这些工具的人,将成为新一代"AI 工作流架构师"。
微软 Build 大会下周开幕。这场 AI 智能体的军备竞赛,才刚刚进入白热化阶段。
夜雨聆风