探索一次,复用永远!这个AI Skill能把任何网站变成自动化工具

探索一次，复用永远！这个 AI Skill 能把任何网站变成自动化工具

不再写爬虫代码！让 AI 自动探索网站 API，一键生成可复用的自动化 Skill。

一句话介绍

browser-act-skill-forge 是一个"网站能力锻造器"——你告诉它要从哪个网站获取什么数据或完成什么操作，它自动探索网站的 API 端点和交互逻辑，然后生成一个可复用的 Skill 包（SKILL.md + Python 脚本）。

核心卖点：探索一次，后续零成本复用。

它能干什么？

想象这些场景：

"帮我把微博上某个话题的所有热门帖子都抓取下来"
"每天自动从某电商平台抓取竞品价格"
"自动把下载好的视频上传到微信公众号素材库"
"监控某个论坛，有新帖子时自动提取内容"

以前，你需要：

手动分析网站的网络请求
找到 API 端点和参数
写爬虫代码
处理反爬、验证码、分页
每次网站改版都要重新来一遍

现在，只需要用自然语言告诉 browser-act-skill-forge 你要什么，它全包了。

工作流程：四步搞定一切

第一步：需求分析

你用自然语言描述意图，比如：

"帮我从知乎抓取关于 AI 的热门问答，每个问题要包含标题、回答数、点赞数"

Skill 会解析你的核心目标、目标网站、输出要求，然后生成执行计划跟你确认。

第二步：自动探索

这是最厉害的部分。browser-act-skill-forge 会：

优先找 API：自动发现网站背后的内部 API 端点，比 DOM 抓取快 10 倍
DOM 兜底：如果没找到 API，自动fallback到 DOM 操作
记录完整调用方式：endpoint + 参数，或选择器 + 交互步骤
收集枚举参数：把所有有意义的参数值都记录下来

整个过程完全自动化，不需要你写一行代码。

第三步：生成 Skill

探索完成后，自动生成：

output/{skill-name}/
├── SKILL.md          ← 使用文档
└── scripts/
    └── {feature}.py  ← 封装好的 Python 脚本

每个 Python 脚本都把探索到的 JS 逻辑封装成可调用函数，支持命令行参数。

第四步：自动测试 + 安装

生成的 Skill 会经过自动测试验证，确认能正常工作后自动安装。后续再调用，直接执行，无需重新探索。

能达到的效果

效果一：省钱

browser-act-skill-forge 在探索过程中会自动剥离 90% 的无效 HTML——广告、追踪代码、框架噪音全砍掉，只把有意义的内容喂给 LLM。

这意味着：

Token 消耗大幅降低
Agent 拿到的信息更干净、更准确
同样的任务，成本可能只有原来的 1/10

效果二：避坑经验自动沉淀

网站五花八门，交互千变万化。AI 第一次探索时可能会踩坑：

误点了某个按钮
没注意到某个复选框需要勾选
某个操作有隐藏的前置条件

browser-act-skill-forge 会把踩过的坑沉淀下来，下次直接走最优路径。

作者的实际案例：用它自动上传视频到微信公众号素材库。第一次探索时 AI 误点了"公众平台视频上传服务规则"链接；但学会后，后续每次都能正确勾选"原创"复选框，精准完成操作。

效果三：大规模批量处理

一旦 Skill 生成并验证通过，就可以批量执行：

抓取几十到几千条记录
多关键词并行搜索
跨分页自动翻页
去重处理

从"一次性的脚本"升级为"可重复调用的能力"。

技术亮点：为什么它比传统爬虫强？

1. API 优先策略

传统爬虫直接从 DOM 解析数据，慢且脆弱。browser-act-skill-forge 优先发现网站内部的 API 端点——这些 API 通常返回结构化 JSON 数据，速度快、可靠性高。

2. 智能探索算法

不是盲目试错，而是有策略地枚举替代方案
确定性失败一次确认即放弃，不浪费时间
探索上限 100 步，避免无限循环

3. 严格的验证机制

生成的每个脚本都要经过三重验证：

Python 脚本能否正确输出 JS 字符串
浏览器执行结果是否与探索阶段一致
模拟错误场景是否能正常返回错误信息

4. 合规设计

所有数据本地存储，不上传外部
通过用户已登录的浏览器访问，不绕过权限控制
等价于"替用户复制粘贴"，只是自动化了这个过程

行业意义

browser-act-skill-forge 代表了一个重要的行业趋势：AI 驱动的"零代码自动化"正在成为现实。

对数据采集行业

传统数据采集需要专业的爬虫工程师，处理反爬、逆向工程、IP 池管理等复杂问题。browser-act-skill-forge 让非技术人员也能通过自然语言描述完成数据采集任务。

对 RPA（机器人流程自动化）行业

UiPath、Automation Anywhere 等传统 RPA 工具需要录制操作、编写流程。browser-act-skill-forge 让 AI 自动探索并生成可复用的自动化流程，门槛从"会配置"降低到"会说话"。

对 AI Agent 生态

Skill-forge 机制解决了一个关键问题：AI 的经验如何沉淀？

每次探索都生成标准化的 Skill 包，这些 Skill 可以：

在不同 Agent 之间共享
作为可复用组件组合使用
持续迭代优化

这意味着 AI 不再是"每次都从零开始"，而是有记忆、有积累的智能体。

与 browser-act CLI 的关系

browser-act-skill-forge 是建立在 browser-act CLI 之上的"上层建筑"：

browser-act CLI = 实时浏览器控制，适合一次性任务
browser-act-skill-forge = 可复用能力封装，适合批量、定期、大规模任务

两者配合使用，覆盖了从"临时操作"到"长期自动化"的全场景。

开源信息

GitHub: github.com/browser-act/skills
包含: browser-act + browser-act-skill-forge 两个 Skill
版本: browser-act 2.0.2 / skill-forge 1.0.6
安装: 通过 Hermes Agent 的 hermes skills install 一键安装

觉得这个工具能帮到你？点个*在看，让更多朋友看到！*