乐于分享
好东西不私藏

吴恩达《Agentic AI》核心要点全详解Ⅰ

吴恩达《Agentic AI》核心要点全详解Ⅰ

说明:本文基于吴恩达在DeepLearning.AI开设的《Agentic AI》课程完整整理,覆盖全部核心知识点、设计模式、架构、工程实践与伦理安全。

一、Agentic AI 基础认知

1.1 什么是Agentic AI

Agentic AI(代理式人工智能/AI智能体)是以大语言模型(LLM)为核心,具备自主感知、目标拆解、规划执行、工具调用、自我反思、多智能体协作能力的AI系统。
它的核心跃迁是:从被动问答→ 主动完成复杂任务。

1.2 AI Agent 的核心特征

1.自主性:无需人工逐轮指令,可独立决策、推进任务
2.目标导向:围绕最终目标持续推进,不偏离核心需求
3.规划能力:自动将复杂目标拆解为可执行的子任务
4.工具使用:可自主调用搜索、API、数据库、代码等外部工具
5.反思修正:能自我检查错误、漏洞,迭代优化输出结果
6.记忆能力:具备短期上下文记忆和长期经验记忆,保持任务连贯性
7.社会性:多个智能体可实现分工、通信、协作,完成复杂团队任务

1.3 Agentic AI 与传统LLM的区别

传统LLM:单次问答、无行动能力、无反思机制、仅输出文本,无法主动完成任务;
Agentic AI:多轮闭环执行、可调用工具执行动作、可自我修正优化、可多智能体协作,核心是“完成任务”而非“回答问题”。

1.4 AI 自主性分级(L1–L5,课程核心框架)

  1. L1(辅助级):仅支持提示增强,需人工给出逐一步骤指令,无自主能力(基础LLM水平)
  2. L2(部分自主级):可完成简单任务规划、调用单一工具,执行结果需人工审核
  3. L3(条件自主级):可完成复杂任务拆解、调用多种工具、自我反思优化,仅在异常场景下需人工介入
  4. L4(高度自主级):全流程自主执行任务、动态适应环境变化、自动处理常见异常,极少需要人工干预
  5. L5(完全自主级):可应对开放环境、未知场景,完全独立决策、自我进化,无需人工参与(终极目标,目前未实现)

1.5 适合Agentic AI的任务(筛选标准)

✅ 适合场景:
  • 多步骤、复杂且需要外部信息/工具支撑的任务(如行业研报撰写、行程规划)
  • 需要高精度、多轮修正的任务(如代码开发、法律文书、财务报表)
  • 需要长期记忆、保持上下文连贯的任务(如项目管理、客户跟进)
  • 需要多角色分工、团队协作的任务(如软件开发、内容生产)
❌ 不适合场景:
  • 极简单、单步即可完成的任务(直接使用基础LLM效率更高)
  • 高度模糊、无明确目标、纯创意发散的任务(如无方向的艺术创作)
  • 安全风险极高、需100%人工把控的任务(如重大医疗决策、核心金融风控)

二、四大核心设计模式(课程灵魂,全展开)

2.1 Reflection(反思模式)——AI的“自我批评”能力

核心思想
让AI先生成初始结果,再扮演“审查者/评论家”角色,自我检查错误、逻辑漏洞、质量问题,然后迭代优化,直到达标。这是提升AI输出质量最有效的单一机制。
三层实现逻辑(从基础到高级)
1.基础反思(单轮自查):生成结果→ 自我提问“存在哪些问题?” → 一次性修正 → 输出最终结果;示例:生成SQL语句后,自查语法错误、逻辑漏洞,直接修正。
2.迭代反思(多轮优化):生成结果→ 评估质量 → 修正问题 → 再次评估 → 反复迭代(直到满足预设质量阈值);关键:需提前设定明确的质量标准(如准确率、完整性、格式合规性)。
3.双模型反思(高级实战):拆分两个角色——生成器模型负责输出初稿,评论家模型专门审查、挑错、提出具体优化建议;优势:避免“自己看不出自己问题”的局限,大幅提升输出质量。
典型应用场景
代码纠错、法律合同审查、学术论文校对、数据可视化优化、隐私信息脱敏、文案润色。

2.2 Tool Use(工具使用模式)——给AI接上“手和脚”

核心思想
突破LLM“只能输出文本”的限制,让AI自主判断“是否需要工具”“调用哪个工具”“如何处理工具返回结果”,实现与现实世界的交互,延伸AI的能力边界。
工具分类(课程完整清单)
  1. 信息获取类工具:搜索引擎(Google/Bing)、数据库查询(SQL)、第三方API(天气、股票、地图、CRM等)、知识库。
  2. 执行动作类工具:代码执行(Python/JS)、文件操作(读写、创建、编辑、下载)、系统操作(发送邮件、创建日历、控制设备)。
  3. 专业类工具:数据分析工具(Pandas/Matplotlib)、设计工具(Figma API)、开发工具(Git、Docker、API测试)。
工具使用的标准流程
1. 感知需求:AI判断当前任务是否需要外部信息/能力支撑;
2. 选择工具:从工具库中匹配最合适的工具;
3. 生成参数:自动构造工具调用所需的参数(如搜索关键词、SQL语句、API请求参数);
4. 执行调用:发起工具调用请求,获取返回结果;
5. 整合结果:将工具返回的原始数据,转化为自然语言或可直接使用的格式;
6. 异常处理:若工具调用失败、超时或返回错误,自动重试或切换替代工具。
关键技术
1. Function Calling(函数调用):LLM输出结构化JSON,明确指定工具名和参数,系统解析后执行调用(OpenAI、Anthropic等模型原生支持);
2. MCP(Model Context Protocol):课程重点推荐的统一工具调用协议,实现跨模型、跨平台标准化,大幅降低工具集成成本。

2.3 Planning(规划模式)——AI的“大脑中枢”

核心思想
让AI将一个模糊、高层级的复杂目标,自动拆解为有序、可执行、有依赖关系的子任务序列,并能动态调整任务顺序、处理执行异常、跟踪推进进度,相当于AI的“项目管理系统”。
两大核心规划范式(课程重点对比)
1.Plan-and-Execute(先规划后执行,静态规划):流程为“全盘规划 → 按序执行 → 全程不修改计划”;适合结构化、确定性高、环境变化少的任务(如固定流程的报表生成、标准化作业);优势:效率高、可控性强;劣势:环境变化时无法适应,易导致任务失败。
2.ReAct(Reason + Act,边推理边执行,动态规划):流程为“思考 → 行动 → 观察结果 → 再思考 → 再行动”(循环迭代);适合非结构化、动态、不确定、需实时反馈的任务(如市场调研、故障排查、复杂问题解决);优势:灵活、适应变化、容错性强;课程强调:这是工业界最实用、最主流的规划范式。
规划的核心能力
  • 目标分解:将大目标拆分为最小可执行单元(如“撰写行业研报”拆分为“定框架→搜数据→写摘要→写分析→绘图表→校对”);
  • 依赖管理:识别子任务之间的先后顺序(如“先搜索数据,再撰写分析内容”);
  • 进度跟踪:实时记录已完成、进行中、待执行的任务,掌握整体进度;
  • 异常重规划:当某一子任务执行失败时,自动重新生成新的执行方案(如搜索无结果→更换关键词→切换搜索工具);
  • 资源调度:优先调用高效、低成本的工具和资源(如先使用本地计算,再发起网络请求)。

2.4 Multi-Agent(多智能体协作模式)——AI的“团队作战”

核心思想
不追求打造一个“全能通才AI”,而是构建多个“专精专才AI”,为每个智能体设定明确角色和分工,让它们通过通信、协作、整合结果,共同完成单个智能体无法完成的复杂任务——模拟人类公司/团队的工作模式,整体能力远超单个智能体。
四种经典协作模式(课程全解)
1.主从模式(Master-Worker):架构为1个主控智能体(Planner)+ N个执行智能体(Worker);流程:主控智能体拆解任务→分配给各个执行智能体→收集执行结果→整合输出最终成果;适合任务明确、需集中管控的场景(如数据处理流水线)。
2.流水线模式(Sequential):多个智能体按固定顺序接力执行任务(如A→B→C→D);示例:研究智能体→写作智能体→校对智能体→排版智能体;适合流程固定、步骤清晰的标准化任务。
3.并行协作模式(Concurrent):多个智能体同时执行不同的子任务,最后汇总所有结果;示例:同时调研“市场规模”“竞品分析”“技术趋势”,再合并生成完整报告;优势:执行速度快、效率高。
4.辩论/评审模式(Debate/Critique):多个智能体持不同观点,互相辩论、挑错、补充,最终形成最优结果;优势:显著提升结果的准确性、全面性和逻辑性,课程重点推荐用于高价值决策场景。
多智能体的核心机制
  • 角色定义:为每个智能体设定明确的身份和职责(如规划者、研究者、写手、程序员、校对员);
  • 通信协议:制定标准化的消息格式,实现智能体之间的记忆共享、进度同步、结果传递;
  • 冲突解决:当多个智能体意见不一致时,通过投票、辩论或交由主控智能体决策,化解冲突;
  • 结果整合:对多个智能体的输出进行统一格式、去重、补全、润色,形成最终交付物。
课程实战案例:4-Agent客户服务系统
1. Planner(规划智能体):解析用户问题,拆解为可执行的子任务;
2. Researcher(调研智能体):查询企业知识库、搜索相关解决方案;
3. Executor(执行智能体):生成回复内容、操作订单系统处理用户需求;
4. Reflector(反思智能体):审查回复质量、合规性和准确性,修正错误;四大智能体协同,输出高质量、高准确率的客户服务结果。

待续~

感谢阅读。
如果你觉得有用,欢迎点赞+推荐+分享~
更多干货内容,关注我的公众号【军师杂谈】。
下期更有趣~