一、架构模式层:三大范式
1.1 三种核心架构对比
| 工作原理 | |||
| 控制流 | |||
| 容错能力 | |||
| Token效率 | |||
| 最大优势 | |||
| 最大劣势 | |||
| 最佳步数 |
1.2 场景匹配
1.3 生产环境真相
混合架构才是主流:
外层: Multi-Agent 编排器├── 研究 Agent → 内嵌 ReAct(探索性信息收集)├── 编码 Agent → 内嵌 Plan-and-Execute(结构化代码修改)└── 审核 Agent → 内嵌 ReAct(动态验证与反馈)核心结论:架构设计对Agent可靠性的影响远大于底层模型选择。
二、框架层:八大主流方案
2.1 框架全景矩阵
| LangGraph | |||||
| CrewAI | |||||
| AutoGen | |||||
| Claude Agent SDK | |||||
| OpenAI Agents SDK | |||||
| Google ADK | |||||
| Smolagents | |||||
| Pydantic AI |
2.2 八大框架详细对比
1. LangGraph(LangChain)
架构: 图状态机,节点=函数,边=条件转换
最佳场景: 复杂工作流、含分支/重试/人工审批的工业级应用
致命缺点: 简单场景过重;图调试难度高;依赖LangChain重抽象
2. CrewAI
架构: 角色链,自然语言定义角色自动编排
最佳场景: 快速原型、内容生成、研究团队、QA流程
致命缺点: 角色扮演带来额外LLM开销;低延迟场景不适用
3. AutoGen(Microsoft)
架构: 多代理对话(GroupChat辩论/共识)
最佳场景: 需代理辩论、人类中途介入、Azure生态
致命缺点: Token成本极高;低延迟场景完全不适用
4. Claude Agent SDK(Anthropic)
架构: Hooks(生命周期拦截)+ Subagents(子代理委托)
最佳场景: 编程代理、研究代理、深度操作系统访问
致命缺点: 换模型需重写工具Schema;绑定Claude生态
5. OpenAI Agents SDK
架构: Agentic Loop(Agents + Handoffs + Guardrails + Tracing)
最佳场景: 轻量多代理协调、客服路由、工单分诊、流水线工作流
致命缺点: 无内置持久化;交接仅支持线性/分支链
6. Google ADK
架构: 分层代理树(Hierarchical Agent Trees)
最佳场景: 企业多语言代理、Google Cloud深度用户、跨厂商代理发现
致命缺点: 重度依赖Google Cloud;社区生态小于LangChain/CrewAI
7. Smolagents(Hugging Face)
架构: 极简设计(核心~1000行),代码生成范式
最佳场景: 极简框架偏好者、本地开源模型、快速验证原型
致命缺点: 无内置持久化;复杂多Agent不适用;代码执行攻击面大
8. Pydantic AI
架构: 纯单代理,类型驱动
最佳场景: 高可靠性结构化数据提取、表单处理、分类任务
致命缺点: 无多Agent编排;不适合复杂工作流
三、协议层:MCP vs A2A
3.1 协议分工
| MCP | |||
| A2A | |||
| ACP |
3.2 框架协议支持
四、成本分析
4.1 多Agent模式Token成本
4.2 成本警示
多Agent协作会显著增加Token消耗。生产环境必须:
按业务匹配模式,不盲目追求多Agent 增加异常处理、日志记录、安全校验 采用自动化评估(Evals)替代人工抽查
五、最优方案选择
5.1 没有银弹,只有场景匹配
| 快速原型/内容生成 | ||
| 复杂工业流程 | ||
| 编程/OS深度访问 | ||
| 轻量客服/流水线 | ||
| 企业多语言/跨厂商 | ||
| 本地模型/极简 | ||
| 类型安全/数据提取 | ||
| 辩论/人类介入/Azure |
5.2 我的推荐:分层选型策略
┌─────────────────────────────────────────┐│ 战略层:选协议 ││ MCP(工具集成) + A2A(代理通信) │├─────────────────────────────────────────┤│ 架构层:选模式 ││ 外层Multi-Agent + 内层Plan-and-Execute ││ + 探索性子任务ReAct │├─────────────────────────────────────────┤│ 框架层:选工具 ││ 生产环境: LangGraph(复杂)或 ││ CrewAI(快速) ││ 生态绑定: Claude SDK 或 OpenAI SDK │├─────────────────────────────────────────┤│ 模型层:选LLM ││ Claude(推理强)或 GPT-4o(均衡) │└─────────────────────────────────────────┘5.3 终极结论
如果只能选一个框架:
关键洞察:
框架只负责意图路由,底层执行基础设施(沙箱、代码搜索、Fast Apply、上下文压缩)才是生产可用性的关键瓶颈 混合架构是必然趋势:外层编排+内层按需嵌套 协议标准化正在进行:MCP解决垂直集成,A2A解决水平集成 成本意识必须前置:多Agent模式Token成本可达单Agent的10-20倍 不要追求"最先进":匹配任务特性比技术先进性重要10倍
六、实施建议
6.1 起步路径
第1周: 用原生SDK手写ReAct,理解模式本质第2-3周: 引入框架处理持久化/分支/Human-in-the-loop第4周+: 根据业务复杂度升级到Multi-Agent混合架构6.2 防坑清单
6.3 评估指标
生产环境必须监控:
任务完成率(核心指标) 平均Token消耗/任务(成本指标) 死循环概率(可靠性指标) 平均执行时间(延迟指标) 人工介入率(自动化程度指标)
夜雨聆风