吴恩达《Agentic AI》课程解读 · 第一篇来源:DeepLearning.AI 课程
一、一个简单的对比
想象你在写一篇文章。有两种方式:
方式 A(非智能体):你给 AI 一个提示词,让它一口气写完,中间不能回头改。就像一个人从第一个字写到最后一个字,不能按退格键。
方式 B(智能体):你先让 AI 写大纲 → 决定是否需要查资料 → 搜索资料 → 写初稿 → 自己审阅修改 → 最终定稿。
方式 A 就是零样本(Zero-shot)工作流,方式 B 就是Agentic AI 工作流。
看起来方式 B 更慢、更复杂。但真实世界的任务,几乎都需要迭代和修正。吴恩达在课程中给了一个让人印象深刻的数据:
在 HumanEval 编程基准测试中,GPT-3.5 直接生成代码的正确率约 48%,GPT-4 约 67%。
但把 GPT-3.5 放进 Agentic 工作流(写完代码→自我反思→修改),它的表现能超越单次使用的 GPT-4!
同一个模型,换一种工作方式,性能就能跨越式提升。 这就是 Agentic AI 的核心价值。
二、到底什么是 Agentic AI?
课程给出了一个精简的定义:
Agentic AI 工作流:基于大语言模型(LLM)的应用程序,通过执行多个步骤来完成一个复杂任务。
换成大白话:把一个复杂任务拆成多个小步骤,指挥多个 LLM 分工完成每一步,最后拼出一个高质量的结果。
有一个很形象的比喻:AI 厨房天团
你想做一道西红柿炒鸡蛋,不再是找一个厨师全包,而是: 🥬 一个模型负责准备食材(提取和整理信息) 🍳 一个模型负责核心烹饪(推理和生成) 🍽️ 一个模型负责精致摆盘(格式化和润色) 👨🍳 如果味道不对,还有个模型复盘问题、打回重做你只动嘴不动手,靠多个大模型分工协作,一步步把复杂任务搞定。
三、非智能体 vs 智能体:一个代码对比
用 Python 伪代码来直观感受两者的区别:
非智能体工作流(一步到位)
defnon_agentic_write_essay(topic):"""零样本方式:一次性生成全文""" prompt = f"请写一篇关于{topic}的深度文章" essay = llm.generate(prompt) # 一步完成return essay# 问题:内容表面化,缺乏深度,前后风格可能不一致智能体工作流(多步迭代)
defagentic_write_essay(topic):"""Agentic 方式:分步执行,迭代优化"""# 步骤1:先生成大纲 outline = llm.generate(f"请为{topic}写一个详细的文章大纲")# 步骤2:根据大纲搜索资料 search_queries = llm.generate(f"根据大纲{outline},生成3个搜索关键词") research_materials = []for query in search_queries: result = web_search(query) # 调用搜索工具 research_materials.append(result)# 步骤3:写初稿 draft = llm.generate(f""" 大纲:{outline} 参考资料:{research_materials} 请撰写关于{topic}的初稿 """)# 步骤4:自我反思 + 修改 feedback = llm.generate(f"请审阅以下文章,指出需要改进的地方:\n{draft}") final = llm.generate(f""" 初稿:{draft} 修改意见:{feedback} 请根据意见修改并输出最终版本 """)return final💡 关键区别:Agentic 工作流把一个大任务拆成了 4 个可控的小步骤,每一步都可以单独优化、单独评估、甚至可以换不同的模型来执行。
四、自主性光谱:从"听话助手"到"自主实习生"
吴恩达特意用了 Agentic(形容词) 而不是 Agent(名词),因为自主性不是非黑即白的,它是一个光谱。
低自主性(Less Autonomous)
用户:"写一篇关于黑洞的论文" ↓LLM 生成搜索关键词 ← 预设步骤 ↓系统执行网页搜索 ← 硬编码调用 ↓LLM 整合内容成文章 ← 预设步骤所有步骤都是开发者预先硬编码的。AI 只负责"写",其他事都得你来操心。像一个听话但不会动脑的助手。
高自主性(More Autonomous)
用户:"写一篇关于黑洞的论文" ↓LLM 自己决定:先搜索 arXiv + news 找最新研究 ← 自主决策 ↓LLM 判断:选5个最好的来源 ← 自主筛选 ↓LLM 写初稿 → 自己反思 → 主动修改 ← 自主优化 ↓输出高质量论文!像一个聪明又有责任心的实习生——它自己知道该查什么、怎么筛选、怎么写、怎么改。
代码视角:两种方式的差异
# 低自主性:步骤被硬编码deflow_autonomy_write(topic): keywords = llm.generate_keywords(topic) # 固定步骤1 results = web_search(keywords) # 固定步骤2return llm.summarize(topic, results) # 固定步骤3# 高自主性:LLM 自己决定做什么defhigh_autonomy_write(topic): tools = [web_search, arxiv_search, news_search, web_fetch, pdf_parser] response = llm.chat( prompt=f"写一篇关于{topic}的论文。你可以使用任何工具,自己规划步骤。", tools=tools, max_turns=10# 允许模型自行调用工具最多10轮 )return response🎯 精髓:Agentic AI 不是"能干活",而是"会自己想怎么干、用什么工具、干完还能自己检查改错"。
五、Agentic AI 的三大核心优势
1. 性能飞跃 📈
前面 HumanEval 的数据已经说明了一切。Agentic 工作流带来的性能提升,超过单纯升级模型版本(比如从 GPT-3.5 升到 GPT-4)。
2. 并行加速 ⚡
人类做研究是顺序的:搜 → 看 → 再搜 → 再看。AI 可以同时开 3 个线程搜不同关键词,再同时抓取 9 个网页,最后汇总。步骤更多,但总时间更短。
import asyncio# 注意:LLM API 调用本质上是 HTTP 请求,需要用异步 HTTP 客户端# (如 httpx.AsyncClient) 配合 async def 函数才能实现真正的并行asyncdefparallel_research(topic):"""并行搜索示例 —— 前提是各函数为 async def"""# 同时生成3个不同角度的搜索词 queries = await asyncio.gather( llm.generate_query_async(topic, angle="基础概念"), llm.generate_query_async(topic, angle="最新进展"), llm.generate_query_async(topic, angle="实际应用"), )# 并行执行3个搜索 search_results = await asyncio.gather( web_search_async(queries[0]), web_search_async(queries[1]), web_search_async(queries[2]), )# 并行抓取所有搜索结果中的网页 all_urls = [url for result in search_results for url in result.urls] pages = await asyncio.gather(*[fetch_page_async(url) for url in all_urls])return llm.synthesize(topic, pages)3. 模块化设计 🧩
工作流的每个环节都可以独立替换:
搜索引擎?从 Google 换成 Bing,一行代码 写作模型?从 GPT 换成 Claude,只改一个参数 某个步骤效果不好?单独优化这一步骤即可
# 模块化:每个组件都可以独立替换classAgenticWorkflow:def__init__(self, search_engine, writer_model, reviewer_model): self.search = search_engine # 可替换:Google / Bing / Serper self.writer = writer_model # 可替换:GPT-4 / Claude / DeepSeek self.reviewer = reviewer_model # 可替换:不同模型的反思defrun(self, task): outline = self.writer.generate_outline(task) research = self.search.lookup(outline.keywords) draft = self.writer.write_draft(outline, research) feedback = self.reviewer.review(draft) final = self.writer.revise(draft, feedback)return final六、Agentic AI 能做什么?四个真实场景
场景一:发票处理 📄
PDF 发票 → 转文本 → LLM 提取关键字段 → 写入数据库从 PDF 中自动提取开票方、金额、到期日,录入系统。传统人工流程完全自动化。
场景二:客服邮件回复 📧
客户投诉邮件 → 提取关键信息 → 查询订单数据库 → 起草回复 → 人工审核 → 发送每步都可控,关键环节保留人工审核,效率和准确性兼得。
场景三:通用客服代理 🎧
处理各种未知问题——查库存、退货、换货。Agent 需要动态规划调用哪些 API、按什么顺序、如何根据结果决定下一步。
场景四:视觉计算机使用 🖥️
让 AI 像人一样操作浏览器:打开网页、填表单、点按钮。遇到错误还能自己换网站。虽然还不够稳定,但潜力巨大。
七、什么任务适合 Agentic AI?
核心原则:Agentic AI 是把人类工作流程自动化的新范式——不是取代人,而是把人从重复性、规则性强的任务中解放出来。
八、四种核心设计模式(预告)
课程介绍了构建 Agentic AI 的四种设计模式,后续章节会逐一深入:
反思(Reflection):让 AI 自我检查、自我改进 工具使用(Tool Use):赋予 AI 调用外部工具的能力 规划(Planning):让 AI 自主决定任务步骤 多智能体协作(Multi-agent):多个 AI 分工合作
📌 本篇要点回顾
Agentic AI = 多步骤 + 迭代 + 分工协作的 AI 工作流 核心价值:同样模型 + Agentic 工作流 → 性能大幅超越单次使用 三大优势:性能好、速度快(并行)、模块化(可替换) 自主性是光谱,不是二选一
夜雨聆风