最近在GitHub上冲浪,挖到一个有意思的项目——camofox-browser。
说出来你可能不信,现在大多数AI agent的上网能力,其实比想象中弱很多。不是AI不聪明,是网站太"聪明"了。打开一个页面,先问你是不是机器人,验证码弹窗伺候,IP直接封禁。AI再强,上不了网也是白搭。
这个项目就是来解决这个问题的。
它是什么
camofox-browser是一个防检测浏览器服务器,基于修改过的Firefox内核开发,专门给AI agent使用。
普通自动化浏览器用的是标准Chromium或Firefox内核,网站很容易通过浏览器指纹识别出来:Canvas渲染特征、WebGL签名、字体列表、屏幕分辨率……一个不对劲,直接判定是机器人。
camofox的做法是:从底层替换掉那些会被识别的特征,让浏览器看起来更像真实用户在操作。
项目把浏览器封装成REST API服务,AI agent可以通过HTTP请求直接控制浏览器行为——打开页面、点击按钮、填表单、截图。全套操作,跟真人用浏览器没什么区别。
为什么这事值得关注
AI agent想"上网",目前主流方案有几条路:
第一条:直接调网页爬虫API。 门槛低,但能力也弱。遇到需要登录、验证码、动态加载的页面,直接歇菜。
第二条:用Playwright/Selenium这类自动化工具。 能力全了,但太容易被检测。目标网站一个反爬策略更新,之前能跑的功能全部挂掉。
第三条:买商业反检测浏览器。 贵,不开源,数据还得经过第三方,隐私和稳定性都是问题。
camofox走的是第四条路:开源 + 底层防检测 + REST API。 免费,代码透明,本身就是为AI agent设计的,接口天然适合集成。
核心特性拆解
底层指纹伪装
这是核心技术。普通浏览器的指纹特征是固定的,网站一检测一个准。camofox做了两件事:
一是修改了Firefox的底层渲染逻辑,Canvas、WebGL、字体等指纹变得随机化和多样化;二是支持指纹随机化配置,每次启动可以生成不同的浏览器指纹,让网站无法通过特征比对判断是不是机器人。
REST API设计
项目把浏览器控制接口做成了标准HTTP API。发请求就能操作浏览器,不需要在本地运行浏览器实例,AI agent在服务器上也能远程控制。
典型的使用流程:
POST /session → 创建浏览器会话
POST /session/navigate → 打开指定URL
POST /session/screenshot → 获取当前页面截图
POST /session/click → 点击页面元素
POST /session/eval → 执行JavaScript
DELETE /session → 关闭会话
接口跟Playwright/Selenium的设计思路接近,但更轻量,也更适合AI agent调用。

内置人机验证绕过
这是亮点。reCAPTCHA、hCaptcha这些主流验证码,系统内置了绕过逻辑。不需要额外买打码服务,AI agent可以直接完成验证流程。
实际效果因网站而异,但在很多主流网站上已经验证过可用。
实际能做什么
举几个场景:
市场调研机器人——自动抓取竞品官网、价格信息、用户评论,不需要买代理IP,不需要担心被封。
社交媒体管理agent——自动发布内容、回复评论、爬取数据,以为自己是个真实用户在操作。
金融数据采集——有些金融数据网站有严格的反爬机制,camofox可以绕过这些限制。
AI搜索增强——让AI agent直接访问网页获取实时信息,而不是只靠搜索引擎返回的摘要。
限制在哪
说清楚才能用好。
性能比纯HTTP爬虫慢——毕竟跑的是完整浏览器,资源消耗不小,不适合大规模并发。
维护成本高——网站反爬策略在不断升级,指纹伪装需要持续更新,项目能不能跟上这个节奏是未知数。
法律边界——绕过反爬措施可能涉及法律风险,使用时需要评估目标网站的服务条款。
值不值得试
如果你正在做AI agent相关的开发,需要让agent真正"上网"而不是只能调API,这个项目值得看看。
开源地址:github.com/jo-inc/camofox-browser
免费,代码透明,接口设计也合理。最重要的是思路对:让AI agent用真实用户的方式上网,而不是用机器人的方式被挡在门外。
生产环境用之前,建议先测一下具体目标网站的兼容性。反爬这件事,没有银弹。
有在研究AI agent或者自动化相关方向的朋友,欢迎交流。下一期聊聊我在实际项目里用过哪些工具,各有什么坑。
夜雨聆风