乐于分享
好东西不私藏

别再给AI安排工位了——为什么Agent应该嵌入软件,而不是当同事

别再给AI安排工位了——为什么Agent应该嵌入软件,而不是当同事

2025年,AI Agent管理软件成了科技圈最火的风口。从OpenClaw、ZeroClaw到Hermes、AutoGPT,各类Agent编排平台层出不穷。

但这些平台有一个共同的底层假设:Agent是”数字同事”,需要像人一样协作。

Feldera工程主管Gerd Zellweger最近写了一篇文章,直接挑战了这个假设。他的核心观点是:把Agent设计成”人类同事”,是当前AI应用最大的架构误区。

一、”AI同事”的五种症状

Zellweger列出了当前Agent的典型行为模式,相信每个用过ChatGPT、Claude的人都感同身受:

  1. 过度解释 — Agent有强烈的”表达欲”,动辄生成大段文字来解释自己的操作
  2. 信息轰炸 — 甩给你一面文字墙,需要你自己去筛选关键信息
  3. 轮流发言 — 对话式交互本质上是”人-人协作”的映射,要求用户不断回复
  4. 假装理解 — Agent会追问、澄清,但更常见的是”以为懂了实际做偏”
  5. 需要监督 — 你得盯着它,不然它可能跑偏

这五种行为的共同结果:高认知负荷。

用户不是在用AI提效,而是在管理AI。本来想让人工智能帮你干活,结果你成了AI的”监督员”。

二、”宁静技术”:一个被遗忘的理想

Zellweger引述了计算机科学先驱Mark Weiser 1991年的经典论文《21世纪的计算机》。Weiser在那篇文章中描绘了一种截然不同的计算范式:

最深刻的技术是那些消失的技术。它们融入日常生活的肌理,直到与生活不可区分。

Weiser设想的计算有四个特征:

  • 淡入背景,不抢注意力
  • 不需要持续交互就能增强生活
  • 最小化对注意力的索取
  • 平静、可靠、可预测

对比当下Agent的行为——主动汇报、反复确认、生成文字墙——显然,当前的AI Agent是”宁静技术”的反面。

三、解法不是更聪明的Prompt,而是更聪明的软件

这是文章最有洞察的一点。

很多人以为,Agent不好用是因为prompt不够好,模型不够强。但Zellweger指出,真正的问题不在Agent,而在软件。

解决方案不是更聪明的prompt,而是让软件去”迎接”Agent。理想情况下,这种改变发生在现有软件内部,而不是一堆外部Agent运行器的动物园里。

翻译成大白话:与其让Agent在外部拼命”适应”你的系统,不如在系统内部给Agent留好接口。

当软件给Agent提供了正确的交互界面,Agent就不再需要频繁”说话”——它变得安静(ambient),在后台运行,只在需要时才发出信号。这正是Weiser”宁静技术”的愿景,只不过对象从人变成了机器。

四、三大”Agent友好”设计模式

Zellweger总结了三个已经在业界验证过的Agent设计模式:

模式一:CLI接口

好的命令行界面让Agent的交互变得高效且省token。

为什么CLI比GUI更适合Agent?因为CLI是结构化的、确定性的。一个kubectl get pods返回的结果,远比一个网页仪表盘更容易让Agent解析。Agent不需要”看”页面、理解布局,它只需要解析文本输出。

模式二:声明式配置(Specs)

声明式配置的核心思想是:描述”我要什么”,而不是”怎么做”。

Kubernetes的YAML文件是典型例子。你告诉系统”我需要3个nginx副本”,而不是写脚本一步步去创建。对Agent来说,生成一个声明式配置比执行一系列命令要简单得多、安全得多——因为系统会自动处理”怎么做”的部分。

模式三:Reconciliation循环

这是Kubernetes的核心理念:持续收敛。

你声明期望状态,系统不断检测实际状态与期望状态的差异,自动修正偏差。Agent不需要”盯着”系统——系统自己会收敛。如果出了问题,系统会发出事件通知Agent,而不是Agent去轮询。

三种模式组合起来,形成了一个完整的Agent友好架构:CLI提供入口、Specs描述意图、Reconciliation保证收敛。 Agent的工作从”全程监工”变成了”异常响应”。

五、被忽视的第四种模式:变更数据捕获(CDC)

Zellweger提出了一个更深层的洞察:Agent与数据库的交互方式,是当前最被忽视的优化空间。

当前大多数系统给Agent提供的是表格、仪表盘、CSV导出。Agent不得不反复查询、做diff、猜测什么变了。

但数据库可以做得更好。

变更数据捕获(CDC)让系统主动推送精确的变更事件:插入、更新、删除,每一条都关联到具体记录。

Zellweger用反欺诈场景做了一个对比:

传统模式(快照查询):

  • Agent定期扫描大量交易表
  • 需要运行复杂查询找可疑交易
  • 随数据量增长越来越慢、越来越贵

CDC模式(事件推送):

  • 数据库主动推送:”交易T123新增:账户A向B转账$9,800″
  • “账户A标记为高风险”
  • “交易T123状态更新为待审核”

Agent只需要响应这些事件,不需要反复查询、不需要算diff。它收到的是精确的、及时的信息。

更关键的是,Agent和CDC形成了优雅的分工:Agent负责理解新信息、调整逻辑;数据库负责持续执行逻辑、精确推送变更。一个思考,一个执行,各司其职。

六、商业启示:从”AI同事平台”到”Agent内嵌架构”

这篇文章对企业的启示是深远的:

当前主流是买一个”AI同事”平台,让Agent像员工一样在系统外面操作你的各种工具。这很酷,但认知负荷极高,实际效率提升有限。

更好的路线是在现有系统中嵌入Agent接口——给Agent留好CLI、声明式API、事件流。Agent在后台静默运行,只在异常时才打扰人类。

这条路线的商业潜力可能更大:

  • 不需要改变用户习惯 — 用户感知不到Agent的存在,只是系统”更好用了”
  • 实施成本更低 — 在现有系统上加接口,比换一套全新的Agent平台便宜
  • 可靠性更高 — Agent在受控的接口内运行,出错概率远低于自由操作

正如Zellweger所说:“与其买一个AI同事平台,不如在现有系统中嵌入Agent接口。”

结语

Mark Weiser在1991年预言:最深刻的技术会消失在日常之中。34年后,AI Agent行业正在重新学习这个教训——最好的Agent,是你感觉不到它在工作的Agent。

从”AI同事”到”嵌入软件”,这不只是技术架构的选择,更是产品设计哲学的转变。下一个真正改变世界的Agent产品,可能不会让你在聊天窗口里跟它对话——它会在你完全没注意到的时候,把事情做完了。


本文基于Feldera工程主管Gerd Zellweger的文章《Agents Aren’t Coworkers, Embed Them in Your Software》[1]深度改写,补充了商业分析和中文语境解读。

引用链接

[1]《Agents Aren’t Coworkers, Embed Them in Your Software》: https://www.feldera.com/blog/ai-agents-arent-coworkers-embed-them-in-your-software