这两天看 AI 开发者圈,我有个很强的感觉:大家对“更聪明的模型”当然还感兴趣,但真正开始花力气解决的,是 Agent 进入真实工作后的混乱。
混乱在哪?上下文乱、权限乱、会话乱、成本乱、证据乱。
先看几个最近冒出来的项目。
OpenViking 把自己定位成给 AI Agent 用的 context database。它想统一管理 Agent 需要的上下文,比如记忆、资源和 skills,并且用类似文件系统的方式组织。LeanCTX 的说法更直接:控制 AI 能看到什么,压缩它发给模型的内容,记住它学到的东西,还记录节省了多少 token。agentcookie 解决的是另一个非常现实的问题:你的 Agent 跑在另一台 Mac 上,但它需要你日常机器里的登录状态和 CLI token,于是它用 Tailscale 在两台 Mac 之间同步这些会话状态。
这些项目看上去不一样,但都在补同一层东西:模型之外的工作现场。
以前我们讨论 AI 工具,经常问“它用的是哪个模型”。现在这个问题当然还有用,但已经不够了。一个 Agent 真正开始干活时,它要知道读哪些文件、记住哪些事实、能不能碰生产环境、能不能复用登录态、每一步有没有记录、失败后怎么回滚。缺了这些,再强的模型也像一个记性很好但桌面乱成一团的实习生。
Anthropic 近期关于 Claude Code 的研究也有个值得咂摸的点。他们分析了大量 Claude Code 会话,结论之一是:人类更多决定“做什么”,Claude 更多决定“怎么做”;而用户带来的领域理解越强,Claude 每条指令能做的工作越多。翻译成人话就是,AI 没有把人的理解变得不重要,反而把“你能不能清楚定义工作现场”变得更重要。
OpenAI 最近的 Codex Security Plugin quickstart,也是在往这个方向走。它不是告诉你“模型更会写代码了”,而是提醒你在编码 Agent 流程里加安全检查。另一边,The Register 报道过 Codex 日志实现导致 SSD 写入异常的问题,虽然这是具体实现层面的坑,但提醒很朴素:Agent 跑起来以后,成本不只发生在 API 账单里,还可能发生在磁盘、日志、网络、权限和维护时间里。
再看 GitHub Copilot。GitHub 最近把 Free 和 Student 计划里的模型选择改成自动模型选择。这个变化不一定人人喜欢,但它说明一个产品方向:普通用户不会一直手动挑模型,系统会越来越多地替你决定“这一步该用谁”。当模型选择被产品隐藏后,用户真正能控制的,反而是任务拆分、上下文准备、验收标准和工具权限。
所以我倾向于把接下来的 AI 工作方式分成三层。
第一层是模型,负责生成和推理。这个层大家最熟,也最容易被新品发布牵着走。
第二层是工具,负责把模型接到浏览器、代码库、表格、邮件、自动化平台。Browser Use、Stagehand、agent-browser、Activepieces 都在这一层。
第三层是秩序,负责上下文、权限、记忆、审计、成本和回滚。OpenViking、LeanCTX、agentcookie、Codex 的安全插件都在往这一层靠。
对普通 AI 工作者来说,最有价值的启发不是马上部署这些项目,而是把自己的工作流也按这三层整理一遍。
想一想:我每次让 AI 做事,输入是不是可复用?它读到的资料有没有边界?它写入任何地方之前,我有没有确认点?它做完以后,我能不能看懂改了什么?失败了能不能撤回?这些问题听很繁琐,但比“换一个最新模型”更能提高稳定性。
反正我现在越来越不相信那种一句话全自动完成复杂工作的演示。不是说做不到,而是成本和风险通常被藏起来了。更靠谱的做法是让 Agent 在一个有秩序的工作现场里做小步动作:先读,再计划,再改,再测试,再让人确认。慢一点,但能用得久。
如果你已经每天用 AI 工作,下一步不是追每个新模型,而是给自己的 AI 工作台补秩序。整理常用上下文,拆出低风险工具,给写操作加确认,把每次结果留下证据。模型会继续变强,但会管理工作现场的人,才会真正吃到红利。
好了,以上仅代表我的观点。如果对你有帮助,顺手点个赞吧。这里是能能产品实验室,我还会继续分享。
参考链接:
OpenViking GitHub:https://github.com/volcengine/OpenViking
LeanCTX GitHub:https://github.com/yvgude/lean-ctx
agentcookie GitHub:https://github.com/mvanhorn/agentcookie
OpenAI Developers:Codex Security Plugin Quickstart:https://developers.openai.com/codex/security/plugin
夜雨聆风