AI Agent 遇到不会做的事,居然自己写代码补上了?

现在的 AI 助手，嘴上说得天花乱坠，真让它干活的时候——卡住了。

让它帮你订个会议室，它说”没问题”，然后开始报错。点个外卖，它分析了一通菜名，最后来一句”我无法直接操作外卖软件”。这种”嘴强王者”的情况，在 AI Agent 时代尤其普遍。大模型很强，但它的工具箱是死的，你没教过的操作，它就是不会。

最近我看到个项目，有点不一样。它叫 Browser Harness，来自 browser-use（就是那个做了 browser-use 开源库的工作室）。4月17日才开源，短短一周多拿了快六千星。核心功能一句话：让大模型在干活的过程中，自己把缺失的能力写出来。

它是怎么工作的？

传统的 AI Agent 框架是什么思路？先想好 agent 需要哪些工具，然后提前把函数写好，agent 调用就行了。比如要上传文件？好，预先写个 upload_file() 函数。要截屏？写个 screenshot()。这套逻辑没问题，但有个致命缺陷：你永远写不完所有可能的操作。

Browser Harness 的思路反过来了。它不预设完整工具箱，而是给 agent 一个基础的薄薄框架，里面只有最基础的 CDP（Chrome DevTools Protocol）连接。然后——

遇到缺失的功能？自己写。

它有个 helpers.py，大概 200 行，装着初始的工具函数。当 agent 在执行任务时说”我要上传文件”而 upload_file() 不存在时，它不会报错退出。它会：停下来，让 agent 自己编辑 helpers.py，把缺失的函数补上，然后继续跑。

这就像什么？给你一台没有工具的工作台，告诉你材料和图纸全有，遇到缺什么工具自己造。造完了，继续干活。

实际体验是什么样的？

官方的 Setup Prompt 很有意思——让你把它接进 Claude Code 或 Codex，然后让它帮你完成第一个任务。安装好之后，它会打开 GitHub 页面，问你：”要不要帮我点个 star？”（演示用，如果你是登录状态的话）。就这么简单的一个 demo，但说明了这套东西的逻辑：agent 不只是执行指令，它在执行过程中会感知到自己缺了什么，然后动手补上。

它还提供了 free remote browsers，可以不接本地 Chrome，直接用云端的，而且有免费 tier。这对于想快速体验或者跑 sub-agent 的同学来说挺友好，不需要配环境。

代码本身也不大，拢共 592 行 Python，主要就四个文件：

run.py
— 跑任务的入口
helpers.py
— 工具函数（agent 会改它）
admin.py
+ daemon.py — CDP 连接和守护进程
domain-skills/
— 各种网站的操作技能包（GitHub、LinkedIn、Amazon 等）

让我想到一个问题

这种”自愈”机制确实很酷，但我想到了一个可能的问题：当 agent 自己写的代码出了 bug 怎么办？它是直接运行自己写的 upload_file() 的，如果逻辑有问题，整个任务就崩了。更重要的是，agent 自己生成并执行的代码，在安全层面几乎是盲区——没有 sandbox，没有审计，谁知道它会写出什么来。

不过话说回来，这可能也是 AI Agent 发展的必经之路。早期的框架像 Playwright MCP、LangChain、AutoGPT，都在努力”给 agent 更多的工具”。Browser Harness 反其道而行：给 agent 最少的东西，让它自己成长。这种”少即是多”的哲学，有点像 Unix 的设计理念。

它的 README 里提到了一篇博客文章叫 “Bitter Lesson”（苦涩的教训），说 AI 领域的进步往往不是因为人类教了机器更多知识，而是因为机器学会了利用更多的计算资源 self-improve。Browser Harness 这个项目，大概就是把这个思路落在了”让 AI 自己写工具”这个具体动作上。

你用过类似的 AI Agent 工具吗？有没有遇到 agent”想干但不会干”的情况？欢迎留言聊聊。

↓ 点击阅读原文，查看相关链接 ↓