为什么AI越强,你越需要亲手设计工作流?-夜雨聆风

为什么AI越强,你越需要亲手设计工作流?

这两天看了Anthropic的一篇文章，《Building effective agents》，有些事情，突然想明白了。

我原来用Agent，就是想让它完全自主地帮我干活，我什么也不用管。

但Anthropic说，等等，你可能想错了。

比起全自主的Agent，你可能更需要Workflow。

全自主Agent只会让你既浪费时间，又浪费token，还拿不到想要的结果。

Anthropic就是开发Claude Code的公司，

这篇文章是他们在与客户合作、以及亲自构建Agent过程中总结的经验。

本来是写给Agent开发者看的，但我发现这里面也藏着我们普通人用好Agent的4个技巧。

能提升你使用Claude Code或WorkBuddy的稳定性，节约你的token，以及加快任务的执行速度。

在讲这四个技巧之前，你需要先了解两个概念。

一个叫「LLM Workflow」，一个叫「全自主Agent」。

LLM Workflow是说，你会把任务拆成几步，甚至固化下来，每一步都是确定的，人类来编排这个流程，LLM只在需要的步骤介入。

全自主Agent是说，你只是提要求，让LLM自己决定下一步做什么，自己选工具，自己判断要不要继续，没有任何预先编排的流程，每次Agent都从零开始完成任务。

Anthropic把这两种都归类为「智能体系统」。

所以不用觉得用Workflow听着很low。

LLM Workflow的好处很明显，可预测，你知道它会做什么。好调试，出了问题你知道是哪一步出的。成本低，因为每一步都是必要的，没有浪费。

全自主Agent的好处也很明显，灵活，能处理你没想到的情况。能扩展，同样的Agent可以处理各种不同的任务。

但全自主Agent的问题是，你不知道它会做什么。它可能走弯路，可能调用一堆没用的工具，可能陷入长长长的循环。成本会高很多，延迟也会长很多。

Anthropic说，能用「LLM Workflow」，就别依赖「全自主Agent」。

还给出了LLM Workflow的几种应用模式。

我就是从中梳理出了这4个技巧。

1. 提示链 (Prompt Chaining)

相比仅用一个提示词处理复杂任务，如果把一个任务拆成一连串按顺序执行的步骤，后一个步骤依赖前一个步骤的输出结果，每个步骤用针对性的提示词，效果会更好。

别小看这种模式，这个东西用好了真的很有效。

假设你经常浏览X上的推文，有一天你看到一篇帖子里有一个英文视频，没有中文字幕，你又很想看，怎么办？

如果你把推文的网址丢给Claude Code或是WorkBuddy，然后说「帮我生成中文字幕」，你大概率得不到想要的结果，Agent会运行很长时间，然后告诉你失败了。

如果你知道「提示链技巧」，就会把这个任务拆解成这3个步骤，第一步下载视频，第二步生成视频字幕文件，第三步把字幕文件翻译成中文。

每一步完成后，再跟Claude Code说下一步做什么，这样大概率你能得到想要的结果。

然后你可以让Agent把你们的对话过程做成一个skill，把这3个步骤固化到skill的代码脚本里，这样下次你只要调用这个skill就能快速得到一个视频的中文字幕了。

已关注

关注

重播分享赞

视频详情

这个Skill我已经做好了，需要可以留言，我会分享出来，不需要任何API Key直接用。

如果你会用coze、n8n、dify这样的工作流平台，搭建一个固定工作流，也很好用。

2. 路由 (Routing)

根据输入的类型，把任务分流到不同的处理路径。

假设你正苦恼大模型的token消耗速度太快，可以创建多个Agent，为这些Agent分别设置不同的大模型，比如简单场景用便宜的模型，复杂场景用贵的模型。

在Claude Code里做这件事很简单，用 /agents 命令就可以创建不同的Agent。

3. 并行 (Parallelization)

多个LLM同时跑，然后汇总结果。

假设你要分析一个代码库，但Agent分析起来太慢了，可以这么和Claude Code说，「帮我用5个子Agent分析探索这个代码库。」Agent干活的速度将提升5倍。

这也是Claude Code之父Boris Cherny

公开的他们团队内部使用Claude Code的10个技巧之一。

4. 评估优化 (Evaluator-Optimizer)

一个LLM生成结果，另一个LLM评估并给出反馈，循环迭代。

假设你担心Agent帮你润色的文稿携带敏感词，又不想每次都要自己去核一遍，可以在你的文章润色SKILL.md里加入一个评估步骤，提前放入敏感词，以及你不喜欢的措辞，Agent就会自动循环评估，直到优化所有问题。

上面的每一个技巧，都能全然提升你的Agent使用效率。

这也是为什么同样使用Claude Code，或WorkBuddy，有的人用的飞起，有的人觉得不好用。

如果这4种技巧你还是都不会用，你就只能依赖「全自主Agent」。

比如你只能直接和Agent说「给这个视频生成中文字幕」。

Agent接到任务，会自己规划，自己选工具，自己执行，自己判断做完了没有，遇到问题自己想办法解决，没有任何人为提前设置的workflow。

这会消耗你巨量的token和时间成本。

而且就目前的情况来看，你大概率无法拿到结果。

如果Agent碰巧真的完成了任务，那一定请记得在Agent完成任务后，让Agent为这次任务的执行过程创建一个skill，把一些步骤固化到skill，甚至是skill的脚本代码里，从而下次可以稳定复用。

Anthropic开源的这个创建skill的skill，

可以先安装，从而让Claude Code或WorkBuddy能创建质量更高的Skill，安装方法很简单，直接跟Claude Code或WorkBuddy说，

「帮我安装这个Skill

https://github.com/anthropics/skills/tree/main/skills/skill-creator 」

Claude Code、WorkBuddy这些Agent工作台，确实很大提升了人们的工作效率。

很多人随手就能执行一个很复杂的任务，看着很厉害。

但关键问题是，复杂任务大概率会出错，而且你会为Agent修复错误，付出大量的时间和token。

尤其那些容错率很低的场景，我们更需要的是一个能稳定解决100%问题的workflow，而不是每次从零开始的全自主Agent。

而梳理出Workflow，需要你付出自己对问题的专业理解和判断，这是你多年修炼出来的品味。

我在Anthropic的这篇文章里，看到了一种克制，在面对AI的快速试错能力，仍然保持人类思考的克制。

这才是人类用AI的最佳模式。

不要期望发一句指令，就能坐享其成，那只会让你失去价值。

你得躬身入局，付出你独特的思考和品味。

这些，将成为你在AI时代的，核心竞争力。

看到这里的你，一定很用心～

如果喜欢这篇内容，随手点个赞、在看、转发吧，想第一时间收到我的更新，也可以给我星标⭐，不错过每一次推送。谢谢你的陪伴，我们下次再见。

作者：再凝秋水互动交流，请联系邮箱：fennenqiushui@qq.com