
“它比RPA更智能” “它能像人一样操作电脑” “它能理解页面,不用那么依赖元素定位”
对非结构化界面的适应能力
对变化场景的泛化能力
对“半规则、半判断”任务的处理能力
OpenClaw真正改变的,不是“RPA还能不能做”,而是“自动化边界被往外推了一大圈”。
一、为什么传统RPA总在“某些场景”里特别难做?
页面元素定位不稳定 页面结构经常微调 弹窗状态不固定
RPA擅长的是“规则清晰的确定性执行”,不擅长“感知驱动的动态决策”。
二、RPA最难补的第一个短板:对“非结构化界面”的适应能力
标准系统 稳定DOM结构 可访问元素清晰
老旧系统,前端结构混乱 图片化界面 自定义控件无法稳定抓取 多层嵌套、动态刷新、局部重绘
增加更多兜底分支 做图像识别辅助 加大量等待、重试、状态校验 甚至为某些页面单独定制处理
按钮位置改了 文案改了 图标换了
看页面 理解当前状态 识别界面语义 基于上下文判断下一步动作:
“页面上哪个区域看起来是我要找的按钮?”
“当前这个弹窗是在提示成功、警告,还是需要确认?”
三、RPA最难补的第二个短板:对“变化场景”的泛化能力
它通常依赖你提前把路径定义清楚。
第一步登录 第二步进入菜单A 第三步打开页面B
有时会出现二次确认 有时会多一个提示框 有时菜单入口略有变化
为了覆盖变化,不断加分支;为了兜住分支,不断加规则。
判断条件越来越深 维护者越来越不敢动 一个小改动牵一发动全身
“先判断当前页面处于什么状态,再决定最合理的下一步动作”
看见提示框就处理提示框 没有提示框就继续主流程 菜单入口位置变了,但仍能理解它是目标入口
它能在规则之外,拥有一定的场景适应力。
四、RPA最难补的第三个短板:“半规则、半判断”任务处理能力
能自动化 不能自动化
看页面提示语,决定是重试、确认还是跳过 判断当前订单状态属于哪一类,再走不同分支 根据邮件内容提取关键信息后再执行后续操作
规则树越来越复杂 异常分类越来越多
“理论上能做,商业上不划算。”
把过去“必须写死的判断逻辑”,变成“基于上下文的轻量决策”。
在可控范围内做有限判断 在边界清晰的场景里提升处理覆盖率 在不确定时能回退、转人工、触发兜底流程
它让大量过去“不值得自动化”的灰区流程,开始进入ROI可成立的区间。
五、为什么说OpenClaw是在“扩边界”,而不是“换底座”?
新的出来了,旧的就没用了 更智能的来了,规则自动化就过时了
底层稳定能力保留,感知与决策能力增强。
原来能稳定做的,继续稳定做 原来很难做的,开始变得能做 原来维护成本高的,开始下降
把自动化从“只能做确定性流程”,推进到“能处理更多现实世界中的轻变化、弱结构、半判断任务”。
六、真正会被改变的,不是“RPA项目”,而是“RPA交付方式”
RPA项目的设计方式、实施方式、维护方式。
核心流程编排仍然是RPA 标准动作执行仍然是RPA 批量任务调度仍然是RPA 但在“感知难点”处,嵌入OpenClaw能力 在“判断难点”处,引入AI辅助决策 在“异常灰区”处,做智能分流或人工回退:
既懂企业流程治理,又懂RPA工程化,还懂如何在关键节点合理引入AI能力的人。
未来不是“RPA顾问消失”,而是“传统RPA顾问必须升级”。
它最重要的价值,不是让自动化看起来更酷,而是让更多原本难以自动化、维护成本过高、ROI不成立的流程,开始变得可落地。
非结构化界面的适应能力 变化场景的泛化能力 半规则、半判断任务的处理能力
RPA决定自动化能不能稳,OpenClaw决定自动化能不能更广。
夜雨聆风
