乐于分享
好东西不私藏

我发现了一个让AI替你操控浏览器的神器,5分钟安装,小白也能用!

我发现了一个让AI替你操控浏览器的神器,5分钟安装,小白也能用!

01 一个让我”破防”的深夜

凌晨1点,我还在手动填表。

做跨境电商的朋友应该懂——每天要在十几个平台上填写产品信息:标题、描述、价格、库存……一个平台30分钟,十个平台就是5小时。

手指都麻了,眼睛也花了。

那天晚上我跟朋友吐槽:”要是有个AI能帮我自动填表就好了。”

朋友发来一个链接:”你是说这个吗?”

我点开一看——

browser-use。

输入一句话,AI自动操控你的浏览器,帮你填表、搜索、下单、爬数据。

我试了一下,然后失眠了。

不是熬夜试的,是激动得睡不着。


02 为什么这个项目让所有程序员疯狂?

在说browser-use是什么之前,先说说它解决了什么问题。

你是不是也有过这些时刻?

  • • 想批量查询竞品价格,要一个个手动搜,搜到眼睛酸
  • • 每天要在Excel里填几十条数据,全是重复操作,手指得了腱鞘炎
  • • 想抓取某个网站的数据做分析,但一爬就被封IP
  • • 需要批量注册账号,但每个都要手动填写信息

这些事情有一个共同点:规则明确,但重复性极高。

程序员可以用脚本自动化。但问题是:

  1. 1. 写脚本需要编程基础
  2. 2. 网站改版了,脚本就废了
  3. 3. 有些网站有反爬机制,脚本根本跑不通

browser-use的核心思路是:让AI来操控浏览器。

你不需要写代码,你只需要告诉AI你想做什么。

AI会像真人一样打开浏览器、点击按钮、填写表单、读取数据。

它不是爬虫,它是你的”AI浏览器助手”。


03 项目介绍:browser-use是什么?

browser-use是GitHub上最近爆火的开源项目,目前星标数已超过82,000。

它的核心能力是:让大语言模型(LLM)自动操控Chrome浏览器,完成各种任务。

举几个例子:

场景1:批量填表

你输入:"帮我填这个表单,姓名张三,年龄30,职业程序员"AI自动打开表单页面,自动填写每个字段,提交

场景2:竞品调研

你输入:"打开Google,搜索'最好的跑步鞋',把前10个结果的产品名、价格、评分整理成一个表格"AI自动完成搜索、逐个点击、读取数据、整理成表格

场景3:自动化测试

你输入:"打开这个页面,点击'登录'按钮,输入账号test@test.com和密码123456,验证登录是否成功"AI自动执行完整测试流程

场景4:数据抓取

你输入:"打开这个电商网站,抓取所有商品的名字、价格、销量"AI自动翻页、自动抓取、自动整理

背后的原理并不复杂:

  1. 1. AI通过视觉模型”看到”网页内容
  2. 2. AI分析网页结构,识别按钮、输入框、链接
  3. 3. AI决定下一步操作(点击、输入、滚动)
  4. 4. 执行操作,循环直到任务完成

简单说:browser-use = Chrome浏览器 + AI大脑 + 自动化执行


04 安装教程:5分钟搞定(Windows用户)

好消息:browser-use支持Windows,安装一点都不难。

前置要求:

  • • Python 3.11 或更高版本
  • • Google Chrome浏览器(最新版)
  • • 一个能够调用的大模型API(可选,用免费的也行)

第一步:安装Python

如果你的电脑没有Python,去官网下载:https://www.python.org/downloads/

Windows用户下载后运行安装包,记得勾选 “Add Python to PATH”

安装完成后,按Win+R,输入cmd,打开命令行,输入:

python --version

看到版本号就说明安装成功了。

第二步:创建虚拟环境(建议但可选)

打开命令行,运行:

cd Desktopmkdir browser-usecd browser-usepython -m venv venv

第三步:激活虚拟环境

venv\Scripts\activate

看到命令行前面出现(venv)就说明激活成功。

第四步:安装browser-use

pip install browser-use

这个命令会自动安装所有依赖,包括Playwright(浏览器自动化框架)。

第五步:安装浏览器驱动

playwright install chromium

这会下载Chrome的驱动,不用担心,browser-use会自动调用Chrome。

第六步:编写第一个脚本

在文件夹里新建一个文件,叫 demo.py,内容如下:

from browser_use import Agentfrom langchain_openai import ChatOpenAI# 初始化模型(用免费的DuckDuckGo的LLM)llm = ChatOpenAI(model="gpt-4o")# 初始化Agentagent = Agent(llm=llm, task="打开百度,搜索'AI浏览器自动化',把前5个结果保存下来")# 运行agent.run()

第七步:运行

python demo.py

你会看到Chrome自动打开,自动导航到百度,自动搜索,自动保存结果。

全程不需要你动一根手指。


05 使用技巧:让AI更准确地帮你干活

browser-use不是万能的,想要效果好,有几个小技巧:

技巧1:任务描述要具体

❌ 模糊的指令:”帮我查一下这个产品价格”

✅ 具体的指令:”打开https://example.com/product,读取产品名称、价格、库存数量,用表格形式输出”

技巧2:分步骤执行复杂任务

❌ 一步到位:”帮我完成电商后台所有商品的库存更新”

✅ 分步执行:

  • • 第一步:打开后台,截图给我确认
  • • 第二步:读取Excel里的商品编码和库存数据
  • • 第三步:逐个更新,并截图确认

技巧3:处理弹窗和验证码

browser-use对弹窗和验证码的处理能力有限。遇到验证码,建议用手机接收,或者找不需要验证码的页面。


06 适用人群:谁用谁香

跨境电商从业者:批量填写商品信息、竞品调研、价格监控

数据分析师:批量抓取公开数据、竞品数据监控

程序员:自动化测试、网页截图、批量操作

运营人员:批量注册账号、批量发布内容、批量数据采集

普通用户:抢票、抢号、自动填表


07 写在最后

browser-use让我意识到一件事:

AI最大的价值,不是替代人类思考,而是替代人类重复。

那些每天浪费在重复操作上的时间,本可以用来学习、创作、陪伴家人。

browser-use把这件事向前推进了一大步。

它让”自动化”不再是程序员的专利,让每一个普通人都能用AI操控浏览器。

学会了,你就是那个”用AI偷懒的人”。

而不是”被AI替代的人”。


有收获的点个赞!

有问题评论区问,看到都会回。


#browser-use #AI工具 #GitHub #自动化 #Python #副业 #效率提升 #程序员

本站文章均为手工撰写未经允许谢绝转载:夜雨聆风 » 我发现了一个让AI替你操控浏览器的神器,5分钟安装,小白也能用!

猜你喜欢

  • 暂无文章