AIOps 探索:哇!OpenClaw 接入 Playwright CLI 后,我让 AI 自动登录网站、截图、采集信息-夜雨聆风

AIOps 探索:哇!OpenClaw 接入 Playwright CLI 后,我让 AI 自动登录网站、截图、采集信息

研究 AIOps 已有数月，目前手里有不少可落地的方案了，接下来会把这些方案全部整理到我的公众号里。欢迎大家关注，可以把你遇到的场景在评论区留言。我会在能力范围内给你提供思路和建议。

前段时间我一直在折腾 OpenClaw 的各种能力，这不，手又有点痒了。我就在想，既然 OpenClaw 已经能调工具、能接 skill、还能驱动浏览器，那能不能把“网页自动化”这件事也真正接进来？

还真可以。

这次我接入的是 Playwright CLI。接完之后，我直接让 AI 去打开网页、自动登录网站、截图页面、采集页面里的关键信息，甚至还能一路操作到公众号后台草稿箱。整个过程跑下来，我最大的感受就一句话：这套组合太适合做浏览器自动化执行层了。

今天这篇文章，我就带大家来看下这个实战过程。

一、为什么这个方向值得做？

很多运维、测试、运营同学，平时都会遇到一类特别碎、但又不得不做的工作。

比如：

登录后台查看系统状态
进入某个页面截图留档
采集页面上的关键信息
重复点击固定按钮完成流程
把网页里的内容整理到文档、消息或者知识库里

这些动作单看都不难，但特别耗时间，而且重复率很高。

以前面对这些事，大家通常有几种办法。

第一种，人工自己点。

优点是简单，缺点也很明显，就是慢，而且一旦重复次数多了，人会很烦。

第二种，自己写 Selenium 或 Playwright 脚本。

这当然可行，但很多时候门槛并不低。你要先想流程，再找元素，再调脚本，还要处理页面变化、登录态、异常情况。

第三种，借助 RPA 平台去编排。

也不是不行，但在一些临时场景里，又显得有点重。

而 OpenClaw + Playwright CLI 这一套，刚好卡在一个非常舒服的位置：既保留了浏览器自动化能力，又保留了 AI 的自然语言理解和流程协作能力。

说白了，就是你不用每次都从零手搓一套脚本，也不用先上一个特别重的平台，而是可以先让 AI 帮你把事做起来。

二、这次用到的技术组合

我这次用到的组合其实很简单：

OpenClaw
Playwright CLI
本地浏览器环境
针对网页自动化整理好的 skill

整体思路是这样的。

先在本地安装 Playwright CLI，然后把它的常用命令和工作流沉淀成 skill，再让 OpenClaw 知道：什么场景该调用它、该怎么调用、调用之后怎样判断页面状态、怎样继续下一步。

这样一来，我直接对 AI 说一句自然语言，它就能把这句话拆成一串浏览器动作去执行。

这和传统“先写好完整脚本再运行”的思路不太一样，它更像是一种“先让 AI 帮你跑通，再逐步沉淀成可复用能力”的路线。

三、Playwright CLI 为什么适合做这件事？

这次跑完之后，我觉得 Playwright CLI 之所以适合和 OpenClaw 搭配，至少有三个原因。

1. 它足够轻，但能力又不弱

很多工具的问题在于，要么太轻，只能做点简单动作；要么太重，刚上手就要搭一整套工程。

Playwright CLI 刚好不是这样。

它的好处是，装好之后，你在命令行里就能直接做这些动作：

打开网页
点击元素
输入内容
切换标签页
做页面快照
截图
查看控制台输出
执行一段浏览器代码

也就是说，它不是一个“浏览器截图小工具”，而是一整套可以被命令行调度的浏览器自动化执行层。

2. 它特别适合被 Agent 调用

我觉得这个点非常关键。

Agent 最怕什么？

最怕一次调用做太多事，失败了还不知道卡在哪。

而 Playwright CLI 的命令天然比较原子化，比如 open、click、type、fill、snapshot、tab-list、tab-select 等等。

这种结构非常适合 AI 一步一步执行。

AI 每做完一步，都可以看看结果，再决定下一步怎么走。比起一口气生成几百行浏览器脚本，我觉得这种方式要稳很多。

3. 它允许“人机协作式自动化”

这是我这次最有感触的一点。

很多网页自动化方案，一遇到登录、验证码、风控、弹窗，就容易卡死。

但 Playwright CLI 配合 OpenClaw 的方式，并不是强行追求“完全无人值守”。它更像是一种人机协作：

登录你可以手动来
后面的重复动作 AI 来
页面异常时 AI 会停下来提示你接管
处理完之后再继续执行

这种模式我觉得特别适合真实业务场景，因为它没那么理想化，但反而更能落地。

四、我这次做了哪些真实测试？

为了确认这套方案不是“只能演示”，我这次专门做了几个比较真实的测试。

1. 让 AI 自动查天气

我先让它做最简单的网页搜索场景：

打开百度
搜索南京今天天气怎么样
再搜索杭州今天天气怎么样
从结果页里提取天气信息

这个场景虽然简单，但已经足够说明一个问题：AI 不只是“会聊天”，它已经可以替你去操作网页并读结果了。

它完成的是一整条链路：

自然语言指令 → 浏览器动作 → 页面结果提取。

我觉得这就是浏览器自动化真正开始变得“可用”的起点。

2. 打开 Grok 并识别安全验证

后面我又让它尝试打开 Grok。

结果页面遇到了 Cloudflare 安全验证。

但这个过程反而让我觉得它更靠谱。

因为它没有乱点，也没有装作成功，而是明确告诉我：页面已经打开，但现在卡在安全验证，需要人工接管。

这说明它不是在死板执行命令，而是已经开始具备一点流程判断能力了。

这个能力在真实自动化里特别重要，因为网页世界不是静止不变的。页面会变，状态会变，风控会触发，AI 不能只会“照本宣科”。

3. 直接接入公众号后台写草稿

这个场景是我最喜欢的一段。

我让它：

打开微信公众号后台
等我手动登录
找到新建文章入口
输入文章标题和正文
保存为草稿

最后它真的把文章写进了草稿箱。

一开始我们是直接往公众号后台里输入正文，后面发现排版效果一般，还踩到了一个坑：微信公众号后台并不原生支持 Markdown 原文，直接把 ## 这种写法写进去，只会原样显示。

再后来，我们又继续摸索出一条更好的路线：

先把文章 Markdown 源文送进在线转换器，点击 Copy Rich Text，再回到公众号后台粘贴富文本内容。

这一版的效果就好很多，标题块、段落、编号结构都正常了。

这一点我觉得非常有意思，因为它说明：

真正可用的自动化，不一定是“一步到位”的，而是不断调通每一层之后，慢慢把流程沉淀下来。

五、它到底能落地到哪些场景？

很多人看到这里，可能会觉得这只是个“写文章”的玩法。

其实不是。

我觉得它能落地的场景比想象中多得多。

1. 运维场景

比如：

登录监控平台查看状态
打开告警页面截图
采集当前面板里的关键指标
进入后台确认某个服务页面是否正常

这些都特别适合浏览器自动化。

2. 测试场景

比如：

自动打开网页验证某个页面是否正常显示
自动截图留档
自动检查某些关键元素是否存在
自动模拟一段固定点击流程

这类轻量级任务，根本没必要每次都单独写大脚本。

3. 运营场景

比如：

登录公众号后台写草稿
打开网页采集素材
对活动页面截图
采集竞品页面信息
把结果整理后再输出给人确认

这类工作特别适合“AI 辅助 + 浏览器自动化”的模式。

六、我对这套方案的几个看法

这次折腾完之后，我最大的感受有三个。

1. 它不是替代脚本，而是降低脚本门槛

很多人一看到 AI 自动化，就会问：以后是不是都不用写脚本了？

我的看法不是这样。

脚本当然依然重要，但以前很多“值不值得写脚本”的灰色地带，现在可以先交给 AI 去跑通。

也就是说：

简单任务，直接自然语言驱动
稍复杂任务，沉淀成 skill
更复杂、需要稳定复用的，再继续脚本化

这个路径比一上来就手写一整套东西，要顺很多。

2. 半自动协作，可能比全自动更现实

很多自动化项目最大的问题，就是太想一步到位。

但真实世界里，登录、验证码、风控、页面变化这些问题，是客观存在的。

所以我现在反而更认同一种更现实的思路：

关键步骤由人接管
重复步骤交给 AI
遇到异常时及时暂停
恢复后再继续执行

这种方式听起来没那么酷，但是真的更能落地。

3. skill 才是长期价值所在

如果这次只停留在“装了一个 Playwright CLI”，那价值其实有限。

最有价值的是，我们把一次次成功的流程沉淀成了 skill。

这样下次再做类似任务时，AI 不是临场猜，而是走你已经验证过的路径。

这才是可复用、可积累、可持续演进的关键。

七、最关键的步骤是什么？

如果你也想复现这条路，我觉得最关键的一步不是安装工具，而是：

把成功流程沉淀下来。

因为真正值钱的，不是某一次点成功了，而是你把它变成了下一次还能继续调用的能力。

一旦这个思路跑通，后面很多事情都会越来越顺：

查页面
截图
采集信息
走后台流程
写公众号草稿
做网页协作式自动化

这些都能慢慢变成你自己的 AI 自动化资产。

八、总结

这次把 OpenClaw 和 Playwright CLI 接起来之后，我最大的感受就是：AI 助手终于开始真正“动手”了。

它不再只是给建议、写文字、讲思路，而是已经能在浏览器里帮你执行一整段真实操作。

虽然现在还不是那种完全无人值守的终极形态，但对很多日常工作来说，它已经足够实用了。

尤其是对于运维、测试、运营这些高重复动作特别多的岗位，我觉得这个方向非常值得继续深挖。

后面我也会继续把更多可落地的 OpenClaw 实战整理出来，比如浏览器自动化更多玩法、飞书文档自动化、公众号后台自动化、以及和 MCP 能力的进一步结合。

希望大家能看明白这个思路。

最后介绍下我的公众号：研究 AIOps 已有数月，目前手里有不少可落地的方案了，接下来会把这些方案全部整理到我的公众号里。如果你觉得这篇文章有帮助，欢迎关注，分享给更多运维伙伴。