我发现了一个让AI替你操控浏览器的神器,5分钟安装,小白也能用!
01 一个让我”破防”的深夜
凌晨1点,我还在手动填表。
做跨境电商的朋友应该懂——每天要在十几个平台上填写产品信息:标题、描述、价格、库存……一个平台30分钟,十个平台就是5小时。
手指都麻了,眼睛也花了。
那天晚上我跟朋友吐槽:”要是有个AI能帮我自动填表就好了。”
朋友发来一个链接:”你是说这个吗?”
我点开一看——
browser-use。
输入一句话,AI自动操控你的浏览器,帮你填表、搜索、下单、爬数据。
我试了一下,然后失眠了。
不是熬夜试的,是激动得睡不着。
02 为什么这个项目让所有程序员疯狂?
在说browser-use是什么之前,先说说它解决了什么问题。
你是不是也有过这些时刻?
-
• 想批量查询竞品价格,要一个个手动搜,搜到眼睛酸 -
• 每天要在Excel里填几十条数据,全是重复操作,手指得了腱鞘炎 -
• 想抓取某个网站的数据做分析,但一爬就被封IP -
• 需要批量注册账号,但每个都要手动填写信息
这些事情有一个共同点:规则明确,但重复性极高。
程序员可以用脚本自动化。但问题是:
-
1. 写脚本需要编程基础 -
2. 网站改版了,脚本就废了 -
3. 有些网站有反爬机制,脚本根本跑不通
browser-use的核心思路是:让AI来操控浏览器。
你不需要写代码,你只需要告诉AI你想做什么。
AI会像真人一样打开浏览器、点击按钮、填写表单、读取数据。
它不是爬虫,它是你的”AI浏览器助手”。
03 项目介绍:browser-use是什么?
browser-use是GitHub上最近爆火的开源项目,目前星标数已超过82,000。
它的核心能力是:让大语言模型(LLM)自动操控Chrome浏览器,完成各种任务。
举几个例子:
场景1:批量填表
你输入:"帮我填这个表单,姓名张三,年龄30,职业程序员"AI自动打开表单页面,自动填写每个字段,提交
场景2:竞品调研
你输入:"打开Google,搜索'最好的跑步鞋',把前10个结果的产品名、价格、评分整理成一个表格"AI自动完成搜索、逐个点击、读取数据、整理成表格
场景3:自动化测试
你输入:"打开这个页面,点击'登录'按钮,输入账号test@test.com和密码123456,验证登录是否成功"AI自动执行完整测试流程
场景4:数据抓取
你输入:"打开这个电商网站,抓取所有商品的名字、价格、销量"AI自动翻页、自动抓取、自动整理
背后的原理并不复杂:
-
1. AI通过视觉模型”看到”网页内容 -
2. AI分析网页结构,识别按钮、输入框、链接 -
3. AI决定下一步操作(点击、输入、滚动) -
4. 执行操作,循环直到任务完成
简单说:browser-use = Chrome浏览器 + AI大脑 + 自动化执行
04 安装教程:5分钟搞定(Windows用户)
好消息:browser-use支持Windows,安装一点都不难。
前置要求:
-
• Python 3.11 或更高版本 -
• Google Chrome浏览器(最新版) -
• 一个能够调用的大模型API(可选,用免费的也行)
第一步:安装Python
如果你的电脑没有Python,去官网下载:https://www.python.org/downloads/
Windows用户下载后运行安装包,记得勾选 “Add Python to PATH”。
安装完成后,按Win+R,输入cmd,打开命令行,输入:
python --version
看到版本号就说明安装成功了。
第二步:创建虚拟环境(建议但可选)
打开命令行,运行:
cd Desktopmkdir browser-usecd browser-usepython -m venv venv
第三步:激活虚拟环境
venv\Scripts\activate
看到命令行前面出现(venv)就说明激活成功。
第四步:安装browser-use
pip install browser-use
这个命令会自动安装所有依赖,包括Playwright(浏览器自动化框架)。
第五步:安装浏览器驱动
playwright install chromium
这会下载Chrome的驱动,不用担心,browser-use会自动调用Chrome。
第六步:编写第一个脚本
在文件夹里新建一个文件,叫 demo.py,内容如下:
from browser_use import Agentfrom langchain_openai import ChatOpenAI# 初始化模型(用免费的DuckDuckGo的LLM)llm = ChatOpenAI(model="gpt-4o")# 初始化Agentagent = Agent(llm=llm, task="打开百度,搜索'AI浏览器自动化',把前5个结果保存下来")# 运行agent.run()
第七步:运行
python demo.py
你会看到Chrome自动打开,自动导航到百度,自动搜索,自动保存结果。
全程不需要你动一根手指。
05 使用技巧:让AI更准确地帮你干活
browser-use不是万能的,想要效果好,有几个小技巧:
技巧1:任务描述要具体
❌ 模糊的指令:”帮我查一下这个产品价格”
✅ 具体的指令:”打开https://example.com/product,读取产品名称、价格、库存数量,用表格形式输出”
技巧2:分步骤执行复杂任务
❌ 一步到位:”帮我完成电商后台所有商品的库存更新”
✅ 分步执行:
-
• 第一步:打开后台,截图给我确认 -
• 第二步:读取Excel里的商品编码和库存数据 -
• 第三步:逐个更新,并截图确认
技巧3:处理弹窗和验证码
browser-use对弹窗和验证码的处理能力有限。遇到验证码,建议用手机接收,或者找不需要验证码的页面。
06 适用人群:谁用谁香
跨境电商从业者:批量填写商品信息、竞品调研、价格监控
数据分析师:批量抓取公开数据、竞品数据监控
程序员:自动化测试、网页截图、批量操作
运营人员:批量注册账号、批量发布内容、批量数据采集
普通用户:抢票、抢号、自动填表
07 写在最后
browser-use让我意识到一件事:
AI最大的价值,不是替代人类思考,而是替代人类重复。
那些每天浪费在重复操作上的时间,本可以用来学习、创作、陪伴家人。
browser-use把这件事向前推进了一大步。
它让”自动化”不再是程序员的专利,让每一个普通人都能用AI操控浏览器。
学会了,你就是那个”用AI偷懒的人”。
而不是”被AI替代的人”。
有收获的点个赞!
有问题评论区问,看到都会回。
#browser-use #AI工具 #GitHub #自动化 #Python #副业 #效率提升 #程序员
夜雨聆风