乐于分享
好东西不私藏

为什么AI越强,你越需要亲手设计工作流?

为什么AI越强,你越需要亲手设计工作流?

这两天看了Anthropic的一篇文章,《Building effective agents》,有些事情,突然想明白了。

我原来用Agent,就是想让它完全自主地帮我干活,我什么也不用管。

但Anthropic说,等等,你可能想错了。

比起全自主的Agent,你可能更需要Workflow。

全自主Agent只会让你既浪费时间,又浪费token,还拿不到想要的结果。

Anthropic就是开发Claude Code的公司,

这篇文章是他们在与客户合作、以及亲自构建Agent过程中总结的经验。

本来是写给Agent开发者看的,但我发现这里面也藏着我们普通人用好Agent的4个技巧。

能提升你使用Claude Code或WorkBuddy的稳定性,节约你的token,以及加快任务的执行速度。

在讲这四个技巧之前,你需要先了解两个概念。

一个叫「LLM Workflow」,一个叫「全自主Agent」。

LLM Workflow是说,你会把任务拆成几步,甚至固化下来,每一步都是确定的,人类来编排这个流程,LLM只在需要的步骤介入。

全自主Agent是说,你只是提要求,让LLM自己决定下一步做什么,自己选工具,自己判断要不要继续,没有任何预先编排的流程,每次Agent都从零开始完成任务。

Anthropic把这两种都归类为「智能体系统」。

所以不用觉得用Workflow听着很low。

LLM Workflow的好处很明显,可预测,你知道它会做什么。好调试,出了问题你知道是哪一步出的。成本低,因为每一步都是必要的,没有浪费。

全自主Agent的好处也很明显,灵活,能处理你没想到的情况。能扩展,同样的Agent可以处理各种不同的任务。

但全自主Agent的问题是,你不知道它会做什么。它可能走弯路,可能调用一堆没用的工具,可能陷入长长长的循环。成本会高很多,延迟也会长很多。


Anthropic说,能用「LLM Workflow」,就别依赖「全自主Agent」。

还给出了LLM Workflow的几种应用模式。

我就是从中梳理出了这4个技巧。

1. 提示链 (Prompt Chaining)

相比仅用一个提示词处理复杂任务,如果把一个任务拆成一连串按顺序执行的步骤,后一个步骤依赖前一个步骤的输出结果,每个步骤用针对性的提示词,效果会更好。

别小看这种模式,这个东西用好了真的很有效。

假设你经常浏览X上的推文,有一天你看到一篇帖子里有一个英文视频,没有中文字幕,你又很想看,怎么办?

如果你把推文的网址丢给Claude Code或是WorkBuddy,然后说「帮我生成中文字幕」,你大概率得不到想要的结果,Agent会运行很长时间,然后告诉你失败了。

如果你知道「提示链技巧」,就会把这个任务拆解成这3个步骤,第一步下载视频,第二步生成视频字幕文件,第三步把字幕文件翻译成中文。

每一步完成后,再跟Claude Code说下一步做什么,这样大概率你能得到想要的结果。

然后你可以让Agent把你们的对话过程做成一个skill,把这3个步骤固化到skill的代码脚本里,这样下次你只要调用这个skill就能快速得到一个视频的中文字幕了。

已关注

关注

重播 分享

这个Skill我已经做好了,需要可以留言,我会分享出来,不需要任何API Key直接用。

如果你会用coze、n8n、dify这样的工作流平台,搭建一个固定工作流,也很好用。

2. 路由 (Routing)

根据输入的类型,把任务分流到不同的处理路径。

假设你正苦恼大模型的token消耗速度太快,可以创建多个Agent,为这些Agent分别设置不同的大模型,比如简单场景用便宜的模型,复杂场景用贵的模型。

在Claude Code里做这件事很简单,用 /agents 命令就可以创建不同的Agent。

3. 并行 (Parallelization)

多个LLM同时跑,然后汇总结果。

假设你要分析一个代码库,但Agent分析起来太慢了,可以这么和Claude Code说,「帮我用5个子Agent分析探索这个代码库。」Agent干活的速度将提升5倍。

这也是Claude Code之父Boris Cherny

公开的他们团队内部使用Claude Code的10个技巧之一。

4. 评估优化 (Evaluator-Optimizer)

一个LLM生成结果,另一个LLM评估并给出反馈,循环迭代。

假设你担心Agent帮你润色的文稿携带敏感词,又不想每次都要自己去核一遍,可以在你的文章润色SKILL.md里加入一个评估步骤,提前放入敏感词,以及你不喜欢的措辞,Agent就会自动循环评估,直到优化所有问题。


上面的每一个技巧,都能全然提升你的Agent使用效率。

这也是为什么同样使用Claude Code,或WorkBuddy,有的人用的飞起,有的人觉得不好用。


如果这4种技巧你还是都不会用,你就只能依赖「全自主Agent」。

比如你只能直接和Agent说「给这个视频生成中文字幕」。

Agent接到任务,会自己规划,自己选工具,自己执行,自己判断做完了没有,遇到问题自己想办法解决,没有任何人为提前设置的workflow。

这会消耗你巨量的token和时间成本。

而且就目前的情况来看,你大概率无法拿到结果。

如果Agent碰巧真的完成了任务,那一定请记得在Agent完成任务后,让Agent为这次任务的执行过程创建一个skill,把一些步骤固化到skill,甚至是skill的脚本代码里,从而下次可以稳定复用。

Anthropic开源的这个创建skill的skill,

可以先安装,从而让Claude Code或WorkBuddy能创建质量更高的Skill,安装方法很简单,直接跟Claude Code或WorkBuddy说,

「帮我安装这个Skill

https://github.com/anthropics/skills/tree/main/skills/skill-creator 」


Claude Code、WorkBuddy这些Agent工作台,确实很大提升了人们的工作效率。

很多人随手就能执行一个很复杂的任务,看着很厉害。

但关键问题是,复杂任务大概率会出错,而且你会为Agent修复错误,付出大量的时间和token。

尤其那些容错率很低的场景,我们更需要的是一个能稳定解决100%问题的workflow,而不是每次从零开始的全自主Agent。

而梳理出Workflow,需要你付出自己对问题的专业理解和判断,这是你多年修炼出来的品味。

我在Anthropic的这篇文章里,看到了一种克制,在面对AI的快速试错能力,仍然保持人类思考的克制。

这才是人类用AI的最佳模式。

不要期望发一句指令,就能坐享其成,那只会让你失去价值。

你得躬身入局,付出你独特的思考和品味。

这些,将成为你在AI时代的,核心竞争力。


看到这里的你,一定很用心~

如果喜欢这篇内容,随手点个赞、在看、转发吧,想第一时间收到我的更新,也可以给我星标⭐,不错过每一次推送。谢谢你的陪伴,我们下次再见。

作者:再凝秋水互动交流,请联系邮箱:fennenqiushui@qq.com