现在的 AI 助手,嘴上说得天花乱坠,真让它干活的时候——卡住了。
让它帮你订个会议室,它说”没问题”,然后开始报错。点个外卖,它分析了一通菜名,最后来一句”我无法直接操作外卖软件”。这种”嘴强王者”的情况,在 AI Agent 时代尤其普遍。大模型很强,但它的工具箱是死的,你没教过的操作,它就是不会。
最近我看到个项目,有点不一样。它叫 Browser Harness,来自 browser-use(就是那个做了 browser-use 开源库的工作室)。4月17日才开源,短短一周多拿了快六千星。核心功能一句话:让大模型在干活的过程中,自己把缺失的能力写出来。
它是怎么工作的?
传统的 AI Agent 框架是什么思路?先想好 agent 需要哪些工具,然后提前把函数写好,agent 调用就行了。比如要上传文件?好,预先写个 upload_file() 函数。要截屏?写个 screenshot()。这套逻辑没问题,但有个致命缺陷:你永远写不完所有可能的操作。
Browser Harness 的思路反过来了。它不预设完整工具箱,而是给 agent 一个基础的薄薄框架,里面只有最基础的 CDP(Chrome DevTools Protocol)连接。然后——
遇到缺失的功能?自己写。
它有个 helpers.py,大概 200 行,装着初始的工具函数。当 agent 在执行任务时说”我要上传文件”而 upload_file() 不存在时,它不会报错退出。它会:停下来,让 agent 自己编辑 helpers.py,把缺失的函数补上,然后继续跑。
这就像什么?给你一台没有工具的工作台,告诉你材料和图纸全有,遇到缺什么工具自己造。造完了,继续干活。

实际体验是什么样的?
官方的 Setup Prompt 很有意思——让你把它接进 Claude Code 或 Codex,然后让它帮你完成第一个任务。安装好之后,它会打开 GitHub 页面,问你:”要不要帮我点个 star?”(演示用,如果你是登录状态的话)。就这么简单的一个 demo,但说明了这套东西的逻辑:agent 不只是执行指令,它在执行过程中会感知到自己缺了什么,然后动手补上。
它还提供了 free remote browsers,可以不接本地 Chrome,直接用云端的,而且有免费 tier。这对于想快速体验或者跑 sub-agent 的同学来说挺友好,不需要配环境。
代码本身也不大,拢共 592 行 Python,主要就四个文件:
run.py— 跑任务的入口 helpers.py— 工具函数(agent 会改它) admin.py+ daemon.py— CDP 连接和守护进程domain-skills/— 各种网站的操作技能包(GitHub、LinkedIn、Amazon 等)
让我想到一个问题
这种”自愈”机制确实很酷,但我想到了一个可能的问题:当 agent 自己写的代码出了 bug 怎么办?它是直接运行自己写的 upload_file() 的,如果逻辑有问题,整个任务就崩了。更重要的是,agent 自己生成并执行的代码,在安全层面几乎是盲区——没有 sandbox,没有审计,谁知道它会写出什么来。
不过话说回来,这可能也是 AI Agent 发展的必经之路。早期的框架像 Playwright MCP、LangChain、AutoGPT,都在努力”给 agent 更多的工具”。Browser Harness 反其道而行:给 agent 最少的东西,让它自己成长。这种”少即是多”的哲学,有点像 Unix 的设计理念。
它的 README 里提到了一篇博客文章叫 “Bitter Lesson”(苦涩的教训),说 AI 领域的进步往往不是因为人类教了机器更多知识,而是因为机器学会了利用更多的计算资源 self-improve。Browser Harness 这个项目,大概就是把这个思路落在了”让 AI 自己写工具”这个具体动作上。
你用过类似的 AI Agent 工具吗?有没有遇到 agent”想干但不会干”的情况?欢迎留言聊聊。

↓ 点击阅读原文,查看相关链接 ↓
夜雨聆风