1. 碰壁:AI想操控浏览器,却没有“手”
平时探索AI智能体与自动化流程搭建,近期测试了一款自主行动型AI智能体,想摸清它电脑端网页自动化的能力边界。
也是内置无头浏览器可以访问一般网页,但对于有网页访问限制的网页,例如雪某球,红某书,就会受限,我要求它只能操控我Windows主机的Chrome浏览器,AI说需要下官方的extension插件,但是官网的插件链接失效。电光火石之间我萌生了一个大胆想法:让AI自主编写插件,给自己补齐操作能力。

2. 反转:AI自我造工具,上演AI套娃
我直接下达指令:自主开发适配Chrome的浏览器插件,实现全程网页操控。
没想到AI全程独立完成开发,自动生成插件配置、后台脚本与页面交互代码,无需人工写一行代码。
插件安装即可使用,完美兼容Chrome浏览器。AI靠自研工具打通网页操控通道,这场AI自我赋能的套娃实验,效果远超预期。
3. 终极挑战:勇闯雪某球与红某书

有了趁手的兵器,当然要去最高难度的副本里试一试。
我把目标锁定在了反爬虫机制极其严格的雪某球和红某书。大家都知道,这类平台的风控系统对机器行为极其敏感,常规的自动化脚本进去,往往活不过几秒钟就会被封 IP 或弹出无限验证码。
第一次尝试, 凭借新插件成功登录,但很快因为操作太“机械”被系统盯上了。于是我再次提出要求:“你的行为太像机器人了,需要加入伪装策略。”
接着,惊艳的操作来了。它的控制逻辑中,迅速给自己开发并叠加了两个新能力:
伪随机点击: 不再是生硬的绝对坐标跳转,而是模拟人类手指的滑动、犹豫和非线性点击。
拟人化访问路径: 自动搜索、随机停留、页面上下滚动,完全模拟一个真实用户的“闲逛”状态。
4. 感悟:三生万物,未来软件会自生触手功能不断扩张
这次简单的探索,带给我极大的震撼。

过去我们做流程自动化(RPA),核心是“人写规则,机器执行”,一旦目标网页改版,脚本就全部作废。
但基于现在的智能体框架,未来的工作流已经变成了“人给目标,AI 自己造工具,自己摸索规则,自己绕过障碍”。
从手搓 Chrome 插件到突破反爬虫防线, 展现出了一种近乎“生物本能”的进化能力。AI 正在从一个被动的回答者,变成一个主动的探索者。
夜雨聆风