为什么AI越强,你越需要亲手设计工作流?
这两天看了Anthropic的一篇文章,《Building effective agents》,有些事情,突然想明白了。

我原来用Agent,就是想让它完全自主地帮我干活,我什么也不用管。
但Anthropic说,等等,你可能想错了。
比起全自主的Agent,你可能更需要Workflow。
全自主Agent只会让你既浪费时间,又浪费token,还拿不到想要的结果。
Anthropic就是开发Claude Code的公司,
这篇文章是他们在与客户合作、以及亲自构建Agent过程中总结的经验。
本来是写给Agent开发者看的,但我发现这里面也藏着我们普通人用好Agent的4个技巧。
能提升你使用Claude Code或WorkBuddy的稳定性,节约你的token,以及加快任务的执行速度。
在讲这四个技巧之前,你需要先了解两个概念。
一个叫「LLM Workflow」,一个叫「全自主Agent」。
LLM Workflow是说,你会把任务拆成几步,甚至固化下来,每一步都是确定的,人类来编排这个流程,LLM只在需要的步骤介入。
全自主Agent是说,你只是提要求,让LLM自己决定下一步做什么,自己选工具,自己判断要不要继续,没有任何预先编排的流程,每次Agent都从零开始完成任务。
Anthropic把这两种都归类为「智能体系统」。
所以不用觉得用Workflow听着很low。
LLM Workflow的好处很明显,可预测,你知道它会做什么。好调试,出了问题你知道是哪一步出的。成本低,因为每一步都是必要的,没有浪费。
全自主Agent的好处也很明显,灵活,能处理你没想到的情况。能扩展,同样的Agent可以处理各种不同的任务。
但全自主Agent的问题是,你不知道它会做什么。它可能走弯路,可能调用一堆没用的工具,可能陷入长长长的循环。成本会高很多,延迟也会长很多。
Anthropic说,能用「LLM Workflow」,就别依赖「全自主Agent」。
还给出了LLM Workflow的几种应用模式。
我就是从中梳理出了这4个技巧。
1. 提示链 (Prompt Chaining)

相比仅用一个提示词处理复杂任务,如果把一个任务拆成一连串按顺序执行的步骤,后一个步骤依赖前一个步骤的输出结果,每个步骤用针对性的提示词,效果会更好。
别小看这种模式,这个东西用好了真的很有效。
假设你经常浏览X上的推文,有一天你看到一篇帖子里有一个英文视频,没有中文字幕,你又很想看,怎么办?
如果你把推文的网址丢给Claude Code或是WorkBuddy,然后说「帮我生成中文字幕」,你大概率得不到想要的结果,Agent会运行很长时间,然后告诉你失败了。
如果你知道「提示链技巧」,就会把这个任务拆解成这3个步骤,第一步下载视频,第二步生成视频字幕文件,第三步把字幕文件翻译成中文。
每一步完成后,再跟Claude Code说下一步做什么,这样大概率你能得到想要的结果。
然后你可以让Agent把你们的对话过程做成一个skill,把这3个步骤固化到skill的代码脚本里,这样下次你只要调用这个skill就能快速得到一个视频的中文字幕了。
这个Skill我已经做好了,需要可以留言,我会分享出来,不需要任何API Key直接用。

如果你会用coze、n8n、dify这样的工作流平台,搭建一个固定工作流,也很好用。
2. 路由 (Routing)

根据输入的类型,把任务分流到不同的处理路径。
假设你正苦恼大模型的token消耗速度太快,可以创建多个Agent,为这些Agent分别设置不同的大模型,比如简单场景用便宜的模型,复杂场景用贵的模型。
在Claude Code里做这件事很简单,用 /agents 命令就可以创建不同的Agent。

3. 并行 (Parallelization)

多个LLM同时跑,然后汇总结果。
假设你要分析一个代码库,但Agent分析起来太慢了,可以这么和Claude Code说,「帮我用5个子Agent分析探索这个代码库。」Agent干活的速度将提升5倍。
这也是Claude Code之父Boris Cherny

公开的他们团队内部使用Claude Code的10个技巧之一。

4. 评估优化 (Evaluator-Optimizer)

一个LLM生成结果,另一个LLM评估并给出反馈,循环迭代。
假设你担心Agent帮你润色的文稿携带敏感词,又不想每次都要自己去核一遍,可以在你的文章润色SKILL.md里加入一个评估步骤,提前放入敏感词,以及你不喜欢的措辞,Agent就会自动循环评估,直到优化所有问题。

上面的每一个技巧,都能全然提升你的Agent使用效率。
这也是为什么同样使用Claude Code,或WorkBuddy,有的人用的飞起,有的人觉得不好用。
如果这4种技巧你还是都不会用,你就只能依赖「全自主Agent」。
比如你只能直接和Agent说「给这个视频生成中文字幕」。
Agent接到任务,会自己规划,自己选工具,自己执行,自己判断做完了没有,遇到问题自己想办法解决,没有任何人为提前设置的workflow。
这会消耗你巨量的token和时间成本。
而且就目前的情况来看,你大概率无法拿到结果。
如果Agent碰巧真的完成了任务,那一定请记得在Agent完成任务后,让Agent为这次任务的执行过程创建一个skill,把一些步骤固化到skill,甚至是skill的脚本代码里,从而下次可以稳定复用。
Anthropic开源的这个创建skill的skill,

可以先安装,从而让Claude Code或WorkBuddy能创建质量更高的Skill,安装方法很简单,直接跟Claude Code或WorkBuddy说,
「帮我安装这个Skill
https://github.com/anthropics/skills/tree/main/skills/skill-creator 」
Claude Code、WorkBuddy这些Agent工作台,确实很大提升了人们的工作效率。
很多人随手就能执行一个很复杂的任务,看着很厉害。
但关键问题是,复杂任务大概率会出错,而且你会为Agent修复错误,付出大量的时间和token。
尤其那些容错率很低的场景,我们更需要的是一个能稳定解决100%问题的workflow,而不是每次从零开始的全自主Agent。
而梳理出Workflow,需要你付出自己对问题的专业理解和判断,这是你多年修炼出来的品味。
我在Anthropic的这篇文章里,看到了一种克制,在面对AI的快速试错能力,仍然保持人类思考的克制。
这才是人类用AI的最佳模式。
不要期望发一句指令,就能坐享其成,那只会让你失去价值。
你得躬身入局,付出你独特的思考和品味。
这些,将成为你在AI时代的,核心竞争力。
看到这里的你,一定很用心~
如果喜欢这篇内容,随手点个赞、在看、转发吧,想第一时间收到我的更新,也可以给我星标⭐,不错过每一次推送。谢谢你的陪伴,我们下次再见。
作者:再凝秋水互动交流,请联系邮箱:fennenqiushui@qq.com
夜雨聆风