
2026年5月19日 · AI工具手册系列 Day 56
【AI工具手册Day56】Browser Use插件深度实战
让AI自动帮你抢票、查数据、填表格
你的邻居老王
AI工具手册系列作者 · 每天帮你踩一个坑
先问个问题:你有没有遇到过这种情况——
🎫 抢票页面一开放就卡死,刷新回来票没了
📊 老板让你每天查10个竞品的价格,手动点开网页复制粘贴,半小时没了
📝 报名系统要填20个字段,每年重复填同样的信息
如果这些让AI来干呢?不是写爬虫(太复杂),是说一句话,Agent自己打开浏览器、点按钮、填表单、抓数据。
插件介绍
Browser Use 是什么?一句话说清楚
Browser Use 是 Hermes 上最火的浏览器自动化插件,GitHub Stars 12,000+。它的核心能力就一句话:
"让AI像真人一样操作浏览器"
具体来说,它能:
✅
自动打开网页、点击按钮、填写表单、下拉滚动
✅
抓取网页上的文字、价格、表格、图片
✅
支持多标签页切换、iframe嵌套页面、文件上传
✅
内置反检测机制,不会被网站识别为机器人
💡 老王点评:它不等于爬虫。爬虫要写代码,这个你说人话就行
场景一
自动查数据:竞品价格监控
背景:老王有个做电商的朋友,每天要查5个竞品在京东、淘宝的价格变化。以前手动查,现在交给Agent。
你给Agent的指令(自然语言):
"打开京东搜索'蓝牙耳机',抓取前10个商品的名称和价格,保存到表格。然后打开淘宝做同样的事,最后对比两个平台的价格差异。"
Browser Use 会怎么做:
打开京东首页
自动输入网址,等待页面加载完成
在搜索框输入"蓝牙耳机"
定位搜索框 → 输入关键词 → 点击搜索按钮
抓取前10个商品信息
识别商品列表区域 → 提取名称和价格 → 自动翻页如果需要
重复操作淘宝 → 生成对比表
打开新标签页访问淘宝 → 同样抓取 → 生成Excel或Markdown表格
耗时:人工操作约25分钟,Agent自动执行约3分钟
准确率:连续运行30天,只有2天因页面改版需要调整指令
场景二
自动填表:批量报名/信息录入
背景:每年各种考试报名、活动报名,同样的个人信息要填N遍。老王用Browser Use做了一套"自动填表模板"。
你给Agent的指令:
"打开XXX考试报名系统,按以下信息填写:姓名张三,身份证号1101011990...,手机号138...,学历本科,工作单位XXX。填完后勾选同意协议,点击提交。"
进阶玩法:配合 Hermes 的变量系统,把个人信息存为变量,换网站只需要改网址:
模板化指令示例:
"打开 {{报名网址}},填写姓名{{姓名}}、身份证{{身份证}}、手机{{手机}},勾选同意协议并提交。"
⚠️
安全提醒:涉及身份证号、银行卡等敏感信息的网站,建议开启 Browser Use 的"人工确认模式"——Agent填到敏感字段时暂停,等你确认后再继续。
场景三
自动抢票:演唱会/火车票秒杀
先说结论:Browser Use 可以辅助抢票,但不能保证100%抢到。它的价值在于减少你的操作时间和避免手滑点错。
它能帮你做什么:
🔄
提前5分钟自动刷新页面,倒计时结束时自动进入抢票页
🎯
自动选择你预设的日期、场次、价位(避免手滑选错)
⚡
自动勾选观演人、同意协议,点击提交订单——整个过程<2秒
⚠️ 重要提示:抢票成功与否取决于服务器响应速度和票源,Browser Use只能优化你的操作流程。建议配合官方App多开抢票,不要把希望全押在自动化上。
快速上手
安装到运行,5分钟搞定
安装插件
在 Hermes 对话中输入:/install browser-use
或手动 clone 到 ~/.hermes/plugins/browser-use
安装浏览器驱动
Browser Use 依赖 Playwright 或 Selenium。首次使用时会自动检测并提示安装,按提示运行:playwright install chromium
写第一条指令测试
比如:"打开百度,搜索'今天的天气',把结果告诉我"
看到Agent真的打开了浏览器并开始操作,说明安装成功
进阶:开启"可视化模式"
在指令前加 @browser-use --visible,Agent操作时会弹出一个真实浏览器窗口,你能实时看到它点了哪里。调试阶段建议开启,稳定运行后可以关掉。
避坑指南
新手最容易踩的5个坑
页面加载慢,Agent就报错
解决:在指令里加"等待页面完全加载后再操作",或在配置里把默认超时从5秒改成15秒
弹窗验证码挡住Agent
解决:遇到验证码时Agent会自动暂停并提示你。你也可以用第三方打码服务(如2Captcha)接入,但成本较高
网站改版,指令失效
解决:不要写死XPath或CSS选择器,用自然语言描述元素(如"搜索框""第一个蓝色按钮")。Browser Use的AI定位比固定选择器更抗改版
同时开太多标签页,内存爆炸
解决:在指令结尾加"关闭所有标签页",或在配置里设置 max_tabs=3
某些网站检测自动化工具,直接封号
解决:Browser Use内置了反检测,但敏感网站(如银行、12306)仍可能检测。不要在关键账号上冒险测试
💬 老王说
Browser Use 是我装的第一个 Hermes 插件,也是使用频率最高的一个。
它的价值不是替代你,是把你的时间从重复操作里解放出来。查数据、填表格、做调研——这些不需要创造力的活,就该交给Agent。
但我也要泼点冷水:它不是万能的。遇到复杂JS交互、多层iframe嵌套、或者网站故意做反爬,它也会卡壳。这时候别硬刚,换个思路,也许API接口更靠谱。
最后给个建议:从最简单的场景开始。别一上来就搞抢票,先让它帮你查个快递、搜个价格。用熟了再挑战高难度。
✅ 今天的行动清单
1️⃣
在 Hermes 中输入 /install browser-use 安装插件
2️⃣
运行一条简单指令测试:"打开百度,搜索'Browser Use',告诉我第一个结果是什么"
3️⃣
想一个你每周重复做的网页操作,写成指令让Agent试一次
4️⃣
把常用的个人信息存为 Hermes 变量,方便自动填表时调用
5️⃣
开启可视化模式观察Agent操作,确认无误后再关后台运行
关注「有用AI」
有用才会用,会用才有用
每天一篇,帮你踩完所有坑

扫码关注公众号 · 回复「浏览器」领取指令模板
有用AI — 有用才会用,会用才有用
AI领域连续创业者、落地实战派
亲手打造AI产品,服务数百家中大型名企
夜雨聆风