跟大侠学 AI | (实战为王)21 种智能体编排工具,助力 AI 管理
这是大侠发布的《侠游》专栏文章
2026 年第 97 期、总第 474 期
本文共 4700+ 字,阅读需要 7 分钟
随时获取全球行业最新洞察与前沿资讯!
本期是大侠为你不定期带来的全新的 “跟大侠学 AI” 系列文章。本期大侠为你带来的 “跟大侠学 AI” 文章是:
21 种智能体编排工具,助力 AI 管理(21 agent orchestration tools for managing your AI fleet)(点赞并转发本期文章即可获赠行业最新数智化转型报告1份,限前10名)大侠编辑 :) + CIO.com 官网
希望充分发挥 AI 智能体潜力的企业需要一个平台,用于构建、管理和监控 AI 智能体,以使其在目标明确的工作流程中运行。在这个快速发展的领域,各种选择层出不穷。那些为大型人工智能供应商制作电视广告的夸大其词者,把 AI 智能体描绘得好像能满足我们所有要求,甚至更多。它们会预测我们的需求,处理数据,美化一切,甚至还能倒垃圾。好吧,最后一点就留给你自己去做了。 想象在吊床上工作的生活很容易。但要实现这个梦想,唉,却需要付出努力和技术。没错,那些专门构建智能体团队的公司,可以说是在用自己的产品,并将智能体的超能力融入到他们的产品中。但这并不意味着,只要在阳台上一边吃着剥好的葡萄,一边说几句简单的指令,就能轻松搭建出智能体的工作流程。这时,智能体编排工具就派上了用场。许多公司正在构建用于管理智能体团队的复杂工具。您只需提出您的设想,他们的工具就能处理将数据管道连接到正确的模型,然后再连接回存储输出数据的表等繁琐工作。如果需求激增,他们还会帮您轻松扩展规模。以下概述了目前可用于协调 AI 智能体的平台。其中一些是无需编写代码的工具,旨在帮助非开发人员通过简单的文字描述创建复杂的应用程序。另一些则是混合解决方案,可以帮助开发人员更快地完成工作。这些工具只需少量文字描述和几行巧妙的人工编写代码,即可完成原本需要一周才能完成的工作。每个平台都能够创建算法和工作流程,将任务分解成多个部分,然后将这些部分输入到大型模型集合中,最后收集结果。如果需要创建循环并在过程中调整进度,它们通常也能做到,兼顾战术和战略层面。当它们运作良好时(这种情况很常见),其结果会出人意料地强大且令人振奋。智能体团队制定计划,将其分解成各个部分,然后逐一攻克。他们整理数据并协调流程,以处理复杂的多步骤项目。如果系统出现故障,那就得由人来收拾残局。许多系统特意在特定节点征求用户意见,从而将人纳入其中。无论系统看起来多么出色,我们任何人都不应该期望它完美无缺。最好将它们视为重要且必要的实验平台。而最好的实验方法就是让它们运行起来。以下是 21 个工具的字母顺序列表,这些工具可以启动一组智能体,并在它们协同工作或独立完成分配的任务时对其进行维护。Salesforce 的 Agentforce 平台旨在为其业务支持软件添加人工智能层。智能体程序使用特殊的智能体脚本在 Builder 中构建。业务逻辑与业务逻辑分离,并通过传统计算按顺序执行,以避免大型语言模型(LLM)可能出现的幻觉和完全捏造的情况。LLM 增加了自然对话层,并在必要时添加语音合成功能。它们的主要用途是利用其传统市场领域来支持销售流程。任何严重依赖 AWS Lambda 等核心服务的团队都可以依靠 AgentCore 来处理维护网站正常运行的繁琐事务。智能体和智能体组的设计初衷是首先与 AWS 集成。虽然可以使用粘合代码来集成其他云平台,但该公司将该平台设计为支持其通用基础设施,并采用严格的按需付费的无服务器模式。该产品充分利用了 AWS 云中内置的各种无服务器选项,同时还维护着自身的状态。一系列仪表板使用户能够跟踪和调试智能体操作。BigPanda公司使用 AI 作为 “告警智能(alert intelligence)” 的缩写。他们的系统监控软件会收集有关过载、故障和瓶颈的详细信息。然后,AI 通过规范化、添加上下文信息以及构建历史记录来理解这些警报。最终,海量警报会被提炼成几个更容易理解的、可操作的事件。 CrewAI平台支持构建和部署智能体,这些智能体可以根据需要以集群或团队的形式协同工作。该平台支持智能体的信息收集,并通过跟踪、日志和指标来记录所有行为,从而实现调试。CrewStudio 用于构建智能体,可以使用 Python 或一些 Vibe 代码。然后,它们被部署到 CrewAI AMP,AMP 会监控它们的运行进度并标记任何异常或迟缓的行为。托管版本提供免费和付费两种套餐。开源版本也已发布。Devin.AI 的这款工具旨在打造一位能够胜任各个层级工作的自主软件工程师。它会仔细分析 Jira、Slack、Teams 和 Linear 等集成系统中的任务单,构建任务列表,并制定开发计划。计划获批后,Devin 会根据需要重构代码、编写测试用例,并检查新代码是否通过测试。一些客户部署它是为了清理积压的 bug。另一些客户则将 Devin 集成到 CI/CD 流水线中,用于处理维护测试集或文档等特定任务。Dynatrace的人工智能(Davis AI)被称为 “因果智能体(causation agent)”,因为该公司希望强调其在解析和解释软件堆栈故障原因方面的作用。它接收性能下降或故障报告,并生成报告来确定根本原因,以便进行修复。该人工智能可以深入代码和网络拓扑,从而得出更明智的结论。之后,Davis CoPilot 可以帮助开发人员和 DevOps 团队执行修复。Griptape 的可视化节点构建器可组建智能体团队来管理数据管道。其云平台负责所有基于 Griptape 框架构建的应用程序的部署和扩展。其中一项名为 “关闭提示词(off prompt)” 的功能,指的是其框架能够高效处理大量数据块,仅将最相关的部分作为提示传递给 LLM。数据存储在数据库中,LLM 可根据需要进行查询,从而显著节省计算成本。此外,其模块化的 Python 框架也以 Apache 2.0 许可证发布。DevOps 团队会对 Kubiya 感兴趣,因为它首要的功能是与标准云环境集成,并处理许多常规任务,例如部署新实例或重新配置云架构。它与 Slack 等工具集成,因此团队可以将其视为另一位团队成员,它可以创建计划、分析计划,并在需要时主动部署。Kubiya 的重点在于提供一支能够确定性地执行任务的智能体团队——也就是说,当计划准备就绪时,平台不会在执行过程中引入任何随机性。如果您的工作流程被构建成一个包含循环和反馈的复杂图,那么 LangGraph 是一个不错的选择。该工具旨在让不同的智能体和模型能够独立工作,并确保 LangGraph 机制能够处理推动工作流程完成的繁重任务。如果需要重复执行任务,则可以使用循环图。其他工具,例如 LangSmith 和 LangChain,都依赖于 LangGraph 来进行任务级的状态协调。LlamaIndex 最初是一个向量搜索工具,但现在已发展成为直接支持托管智能体(hosting agents)的工具。智能体可以通过与索引协同工作,迭代处理存储的数据。该工具主要使用 Python 或 TypeScript 编写,并包含强大的调试支持,有助于引导用户参与到整个流程中。LogicMonitor 的 AI 智能体 Edwin 可与各种企业监控工具集成,从而关联并控制任何问题。这种智能体式方法使其能够轮询故障点并制定潜在解决方案。用户可以用自然语言与 Edwin 对话,这一功能有效地将人类的决策能力与 Edwin 广泛的情报收集能力相结合。其目标是制定一套方案,以修复企业架构中的任何异常情况。12. Microsoft AutoGen 和 Semantic Kernel(语义内核)微软发布了 AutoGen 框架,旨在鼓励用户构建自己的 LLM 智能体团队。这些智能体可以使用 Python、.Net 或其他几种流行的编程语言编写,并依赖该框架进行异步消息传递。系统会跟踪数据流,以实现可观测性和调试。预先编写的扩展程序可以处理许多常见场景,例如支持 MCP 服务器。语义内核是另一个类似的项目,它支持各种模型和不同的语言,例如 C#、.Net 和 Java。类似的插件生态系统提供了 MCP 服务器、向量数据库和 OpenAPI 选项。N8n 团队喜欢这样描述他们的工具:想写代码的时候就写,不想写的时候就让 AI 来处理。可视化工作流编辑器让您可以将多个智能体串联起来,并根据需要与它们进行沟通。该工具既可以利用商业模型,也可以与本地部署的自托管模型配合使用。在 PagerDuty 云端,智能体程序发出的坏消息更容易让人接受。它们不再只是简单地宣布问题,而是负责制定解决方案并跟进执行,直至问题彻底解决。这些智能体程序专注于理解故障事件与所需解决方案之间的关联。它们与 700 多个基础设施工具建立了连接,涵盖了从代码仓库到云服务提供商等各种资源。智能体团队可以使用 Prefect 的状态机同步其行为。这款基于 Python 的工具最初旨在协调数据科学工作流程,后来扩展到允许单个智能体接管任务。希望提供 MCP 网关的开发人员可以使用 FastMCP 和 MCP Horizon 来处理访问控制等繁琐事务。依赖 Pydantic 数据验证和清洗功能的 Python 开发者现在也可以将 Pydantic AI 集成到他们的项目中。这种类型安全的方法可以为 AI 开发流程增添更多结构性和鲁棒性。该框架与所有主流的 MCP 或 Agent2Agent 规范兼容,因此可以实现基于事件的通信来协调各个智能体。通用遥测数据收集平台 Logfire 确保任何进行调试的人员或 AI 都能获得充足的数据。Relevance AI 的模板可以帮助任何想要在系统中构建 AI 智能体工作流程的用户快速上手。这些模板主要面向市场营销、客户支持和销售部门。例如,他们的潜在客户研究员可以从各种集成中提取信息,以便销售人员在每次会议前都能充分了解潜在客户的数据。您可以从模板开始,然后经过多次调试迭代,直到最终可以部署为止。ServiceNow 最初的主要功能是支持客户服务部门。如今,该平台的 AI 智能体层可以自动执行企业内部以及客户服务部门的一些最常见任务。它旨在为网络治理、人力资源和 IT 管理等诸多任务提供统一的响应机制。ServiceNow 提供一系列工具,包括 AI Agent Studio 和 AI Control Tower,旨在培养一系列智能体,这些智能体的功能远不止于提供更强大的聊天机器人。它们能够在需要时快速响应。Strands Agent 框架支持多种集群架构,并可使用 Python 或 TypeScript 进行开发。默认示例依赖于 AWS 工具(例如 Bedrock),深受云工程师的青睐,他们利用智能体功能和 LLM 来管理跨云实例的信息流。许多示例展示了如何构建工具来处理以云为中心的任务,例如合成多个数据源或仅用几行代码构建具有循环结构的重复性作业。该工具支持所有主流云平台,包括 AWS、Azure 和 GCP。部分工具和 API采用 Apache 许可证发布。对于需要长时间运行的分布式工作流的团队, Temporal 是一个具备故障安全编排和持久状态的系统。协调多个智能体的 AI 应用可以与管道中的其他数据处理程序协同工作。Temporal 会在每个步骤捕获状态,确保失败的提示或错误的进程不会导致整个流程崩溃。当部分组件发生故障时,Temporal 会自动重启。开发人员在迭代开发各种智能体解决方案时,会使用 Vellum 来支持整个开发周期。Vellum 是一款专为跟踪 AI 智能体行为而优化的集成开发环境 (IDE)。它能够收集来自各种提示和答案的数据,帮助用户追踪解决方案的运行状况。扩展的回归测试和版本控制功能确保团队能够在不引入错误的情况下跟踪开发进度。彼得·韦纳(Peter Wayner),特约撰稿人Peter Wayner 是 InfoWorld 的特约撰稿人。他撰写了大量关于编程语言(包括 Java、JavaScript、SQL、WebAssembly 和实验性语言)、数据库(SQL 和 NoSQL)、云计算、云原生计算、人工智能、开源软件、提示工程、编程习惯(包括好的和坏的)以及其他众多软件开发人员感兴趣的主题的文章。Peter 也曾为《纽约时报》和《连线》等主流媒体撰稿,并著有 20 多本书,主要内容涉及技术。- 他关于模仿函数的研究 —— 一种伪装技术,用于对数据进行编码,使其具有其他信息的统计特征(隐写术的一个例子)——是他著作《消失的密码学》的基础。
- Peter 的著作《自由开放》探讨了开源运动的文化、法律、政治和技术根源。
- 他的著作《透明数据库》提供了一些实用的数据加密技术,使数据既难以理解又可用于做出重要决策。其中包括一些最早的同态加密技术。
- 在《数字现金》一书中,彼得阐述了如何利用区块链等技术建立高效的数字经济。
- 而在《网络游戏监管》一书中,彼得则从哲学和数学的角度,为构建一个强大、安全且杜绝作弊的虚拟世界奠定了基础。
好了!本期内容就是这些!如您认为文章有益,欢迎点赞、赞赏或转发,赠人玫瑰,手有余香,下期见!侠游专栏:专业视角、大众语言、解读江湖中的科技动态