探索一次,复用永远!这个 AI Skill 能把任何网站变成自动化工具
不再写爬虫代码!让 AI 自动探索网站 API,一键生成可复用的自动化 Skill。
一句话介绍
browser-act-skill-forge 是一个"网站能力锻造器"——你告诉它要从哪个网站获取什么数据或完成什么操作,它自动探索网站的 API 端点和交互逻辑,然后生成一个可复用的 Skill 包(SKILL.md + Python 脚本)。
核心卖点:探索一次,后续零成本复用。
它能干什么?
想象这些场景:
"帮我把微博上某个话题的所有热门帖子都抓取下来" "每天自动从某电商平台抓取竞品价格" "自动把下载好的视频上传到微信公众号素材库" "监控某个论坛,有新帖子时自动提取内容"
以前,你需要:
手动分析网站的网络请求 找到 API 端点和参数 写爬虫代码 处理反爬、验证码、分页 每次网站改版都要重新来一遍
现在,只需要用自然语言告诉 browser-act-skill-forge 你要什么,它全包了。
工作流程:四步搞定一切
第一步:需求分析
你用自然语言描述意图,比如:
"帮我从知乎抓取关于 AI 的热门问答,每个问题要包含标题、回答数、点赞数"
Skill 会解析你的核心目标、目标网站、输出要求,然后生成执行计划跟你确认。
第二步:自动探索
这是最厉害的部分。browser-act-skill-forge 会:
优先找 API:自动发现网站背后的内部 API 端点,比 DOM 抓取快 10 倍 DOM 兜底:如果没找到 API,自动fallback到 DOM 操作 记录完整调用方式:endpoint + 参数,或选择器 + 交互步骤 收集枚举参数:把所有有意义的参数值都记录下来
整个过程完全自动化,不需要你写一行代码。
第三步:生成 Skill
探索完成后,自动生成:
output/{skill-name}/
├── SKILL.md ← 使用文档
└── scripts/
└── {feature}.py ← 封装好的 Python 脚本
每个 Python 脚本都把探索到的 JS 逻辑封装成可调用函数,支持命令行参数。
第四步:自动测试 + 安装
生成的 Skill 会经过自动测试验证,确认能正常工作后自动安装。后续再调用,直接执行,无需重新探索。
能达到的效果
效果一:省钱
browser-act-skill-forge 在探索过程中会自动剥离 90% 的无效 HTML——广告、追踪代码、框架噪音全砍掉,只把有意义的内容喂给 LLM。
这意味着:
Token 消耗大幅降低 Agent 拿到的信息更干净、更准确 同样的任务,成本可能只有原来的 1/10
效果二:避坑经验自动沉淀
网站五花八门,交互千变万化。AI 第一次探索时可能会踩坑:
误点了某个按钮 没注意到某个复选框需要勾选 某个操作有隐藏的前置条件
browser-act-skill-forge 会把踩过的坑沉淀下来,下次直接走最优路径。
作者的实际案例:用它自动上传视频到微信公众号素材库。第一次探索时 AI 误点了"公众平台视频上传服务规则"链接;但学会后,后续每次都能正确勾选"原创"复选框,精准完成操作。
效果三:大规模批量处理
一旦 Skill 生成并验证通过,就可以批量执行:
抓取几十到几千条记录 多关键词并行搜索 跨分页自动翻页 去重处理
从"一次性的脚本"升级为"可重复调用的能力"。
技术亮点:为什么它比传统爬虫强?
1. API 优先策略
传统爬虫直接从 DOM 解析数据,慢且脆弱。browser-act-skill-forge 优先发现网站内部的 API 端点——这些 API 通常返回结构化 JSON 数据,速度快、可靠性高。
2. 智能探索算法
不是盲目试错,而是有策略地枚举替代方案 确定性失败一次确认即放弃,不浪费时间 探索上限 100 步,避免无限循环
3. 严格的验证机制
生成的每个脚本都要经过三重验证:
Python 脚本能否正确输出 JS 字符串 浏览器执行结果是否与探索阶段一致 模拟错误场景是否能正常返回错误信息
4. 合规设计
所有数据本地存储,不上传外部 通过用户已登录的浏览器访问,不绕过权限控制 等价于"替用户复制粘贴",只是自动化了这个过程
行业意义
browser-act-skill-forge 代表了一个重要的行业趋势:AI 驱动的"零代码自动化"正在成为现实。
对数据采集行业
传统数据采集需要专业的爬虫工程师,处理反爬、逆向工程、IP 池管理等复杂问题。browser-act-skill-forge 让非技术人员也能通过自然语言描述完成数据采集任务。
对 RPA(机器人流程自动化)行业
UiPath、Automation Anywhere 等传统 RPA 工具需要录制操作、编写流程。browser-act-skill-forge 让 AI 自动探索并生成可复用的自动化流程,门槛从"会配置"降低到"会说话"。
对 AI Agent 生态
Skill-forge 机制解决了一个关键问题:AI 的经验如何沉淀?
每次探索都生成标准化的 Skill 包,这些 Skill 可以:
在不同 Agent 之间共享 作为可复用组件组合使用 持续迭代优化
这意味着 AI 不再是"每次都从零开始",而是有记忆、有积累的智能体。
与 browser-act CLI 的关系
browser-act-skill-forge 是建立在 browser-act CLI 之上的"上层建筑":
browser-act CLI = 实时浏览器控制,适合一次性任务 browser-act-skill-forge = 可复用能力封装,适合批量、定期、大规模任务
两者配合使用,覆盖了从"临时操作"到"长期自动化"的全场景。
开源信息
GitHub: github.com/browser-act/skills 包含: browser-act + browser-act-skill-forge 两个 Skill 版本: browser-act 2.0.2 / skill-forge 1.0.6 安装: 通过 Hermes Agent 的 hermes skills install一键安装
觉得这个工具能帮到你?点个*在看,让更多朋友看到!*
夜雨聆风