什么是 Agentic AI?

吴恩达《Agentic AI》课程解读 · 第一篇来源：DeepLearning.AI 课程

一、一个简单的对比

想象你在写一篇文章。有两种方式：

方式 A（非智能体）：你给 AI 一个提示词，让它一口气写完，中间不能回头改。就像一个人从第一个字写到最后一个字，不能按退格键。

方式 B（智能体）：你先让 AI 写大纲 → 决定是否需要查资料 → 搜索资料 → 写初稿 → 自己审阅修改 → 最终定稿。

方式 A 就是零样本（Zero-shot）工作流，方式 B 就是Agentic AI 工作流。

看起来方式 B 更慢、更复杂。但真实世界的任务，几乎都需要迭代和修正。吴恩达在课程中给了一个让人印象深刻的数据：

在 HumanEval 编程基准测试中，GPT-3.5 直接生成代码的正确率约 48%，GPT-4 约 67%。

但把 GPT-3.5 放进 Agentic 工作流（写完代码→自我反思→修改），它的表现能超越单次使用的 GPT-4！

同一个模型，换一种工作方式，性能就能跨越式提升。 这就是 Agentic AI 的核心价值。

二、到底什么是 Agentic AI？

课程给出了一个精简的定义：

Agentic AI 工作流：基于大语言模型（LLM）的应用程序，通过执行多个步骤来完成一个复杂任务。

换成大白话：把一个复杂任务拆成多个小步骤，指挥多个 LLM 分工完成每一步，最后拼出一个高质量的结果。

有一个很形象的比喻：AI 厨房天团

你想做一道西红柿炒鸡蛋，不再是找一个厨师全包，而是：  🥬 一个模型负责准备食材（提取和整理信息）  🍳 一个模型负责核心烹饪（推理和生成）  🍽️ 一个模型负责精致摆盘（格式化和润色）  👨‍🍳 如果味道不对，还有个模型复盘问题、打回重做

你只动嘴不动手，靠多个大模型分工协作，一步步把复杂任务搞定。

三、非智能体 vs 智能体：一个代码对比

用 Python 伪代码来直观感受两者的区别：

非智能体工作流（一步到位）

defnon_agentic_write_essay(topic):"""零样本方式：一次性生成全文"""    prompt = f"请写一篇关于{topic}的深度文章"    essay = llm.generate(prompt)  # 一步完成return essay# 问题：内容表面化，缺乏深度，前后风格可能不一致

智能体工作流（多步迭代）

defagentic_write_essay(topic):"""Agentic 方式：分步执行，迭代优化"""# 步骤1：先生成大纲    outline = llm.generate(f"请为{topic}写一个详细的文章大纲")# 步骤2：根据大纲搜索资料    search_queries = llm.generate(f"根据大纲{outline}，生成3个搜索关键词")    research_materials = []for query in search_queries:        result = web_search(query)  # 调用搜索工具        research_materials.append(result)# 步骤3：写初稿    draft = llm.generate(f"""    大纲：{outline}    参考资料：{research_materials}    请撰写关于{topic}的初稿    """)# 步骤4：自我反思 + 修改    feedback = llm.generate(f"请审阅以下文章，指出需要改进的地方：\n{draft}")    final = llm.generate(f"""    初稿：{draft}    修改意见：{feedback}    请根据意见修改并输出最终版本    """)return final

💡 关键区别：Agentic 工作流把一个大任务拆成了 4 个可控的小步骤，每一步都可以单独优化、单独评估、甚至可以换不同的模型来执行。

四、自主性光谱：从"听话助手"到"自主实习生"

吴恩达特意用了 Agentic（形容词） 而不是 Agent（名词），因为自主性不是非黑即白的，它是一个光谱。

低自主性（Less Autonomous）

用户："写一篇关于黑洞的论文" ↓LLM 生成搜索关键词      ← 预设步骤 ↓系统执行网页搜索         ← 硬编码调用 ↓LLM 整合内容成文章       ← 预设步骤

所有步骤都是开发者预先硬编码的。AI 只负责"写"，其他事都得你来操心。像一个听话但不会动脑的助手。

高自主性（More Autonomous）

用户："写一篇关于黑洞的论文" ↓LLM 自己决定：先搜索 arXiv + news 找最新研究  ← 自主决策 ↓LLM 判断：选5个最好的来源                    ← 自主筛选 ↓LLM 写初稿 → 自己反思 → 主动修改             ← 自主优化 ↓输出高质量论文！

像一个聪明又有责任心的实习生——它自己知道该查什么、怎么筛选、怎么写、怎么改。

代码视角：两种方式的差异

# 低自主性：步骤被硬编码deflow_autonomy_write(topic):    keywords = llm.generate_keywords(topic)       # 固定步骤1    results = web_search(keywords)                 # 固定步骤2return llm.summarize(topic, results)           # 固定步骤3# 高自主性：LLM 自己决定做什么defhigh_autonomy_write(topic):    tools = [web_search, arxiv_search, news_search, web_fetch, pdf_parser]    response = llm.chat(        prompt=f"写一篇关于{topic}的论文。你可以使用任何工具，自己规划步骤。",        tools=tools,        max_turns=10# 允许模型自行调用工具最多10轮    )return response

🎯 精髓：Agentic AI 不是"能干活"，而是"会自己想怎么干、用什么工具、干完还能自己检查改错"。

五、Agentic AI 的三大核心优势

1. 性能飞跃 📈

前面 HumanEval 的数据已经说明了一切。Agentic 工作流带来的性能提升，超过单纯升级模型版本（比如从 GPT-3.5 升到 GPT-4）。

2. 并行加速 ⚡

人类做研究是顺序的：搜 → 看 → 再搜 → 再看。AI 可以同时开 3 个线程搜不同关键词，再同时抓取 9 个网页，最后汇总。步骤更多，但总时间更短。

import asyncio# 注意：LLM API 调用本质上是 HTTP 请求，需要用异步 HTTP 客户端# (如 httpx.AsyncClient) 配合 async def 函数才能实现真正的并行asyncdefparallel_research(topic):"""并行搜索示例 —— 前提是各函数为 async def"""# 同时生成3个不同角度的搜索词    queries = await asyncio.gather(        llm.generate_query_async(topic, angle="基础概念"),        llm.generate_query_async(topic, angle="最新进展"),        llm.generate_query_async(topic, angle="实际应用"),    )# 并行执行3个搜索    search_results = await asyncio.gather(        web_search_async(queries[0]),        web_search_async(queries[1]),        web_search_async(queries[2]),    )# 并行抓取所有搜索结果中的网页    all_urls = [url for result in search_results for url in result.urls]    pages = await asyncio.gather(*[fetch_page_async(url) for url in all_urls])return llm.synthesize(topic, pages)

3. 模块化设计 🧩

工作流的每个环节都可以独立替换：

搜索引擎？从 Google 换成 Bing，一行代码
写作模型？从 GPT 换成 Claude，只改一个参数
某个步骤效果不好？单独优化这一步骤即可

# 模块化：每个组件都可以独立替换classAgenticWorkflow:def__init__(self, search_engine, writer_model, reviewer_model):        self.search = search_engine    # 可替换：Google / Bing / Serper        self.writer = writer_model     # 可替换：GPT-4 / Claude / DeepSeek        self.reviewer = reviewer_model # 可替换：不同模型的反思defrun(self, task):        outline = self.writer.generate_outline(task)        research = self.search.lookup(outline.keywords)        draft = self.writer.write_draft(outline, research)        feedback = self.reviewer.review(draft)        final = self.writer.revise(draft, feedback)return final

六、Agentic AI 能做什么？四个真实场景

场景一：发票处理 📄

PDF 发票 → 转文本 → LLM 提取关键字段 → 写入数据库

从 PDF 中自动提取开票方、金额、到期日，录入系统。传统人工流程完全自动化。

场景二：客服邮件回复 📧

客户投诉邮件 → 提取关键信息 → 查询订单数据库 → 起草回复 → 人工审核 → 发送

每步都可控，关键环节保留人工审核，效率和准确性兼得。

场景三：通用客服代理 🎧

处理各种未知问题——查库存、退货、换货。Agent 需要动态规划调用哪些 API、按什么顺序、如何根据结果决定下一步。

场景四：视觉计算机使用 🖥️

让 AI 像人一样操作浏览器：打开网页、填表单、点按钮。遇到错误还能自己换网站。虽然还不够稳定，但潜力巨大。

七、什么任务适合 Agentic AI？

容易实现 ✅	较难实现 ⚠️
步骤清晰明确	步骤在执行前未知
有标准操作流程	需要边做边规划
纯文本输入输出	多模态（图像、声音）

核心原则：Agentic AI 是把人类工作流程自动化的新范式——不是取代人，而是把人从重复性、规则性强的任务中解放出来。

八、四种核心设计模式（预告）

课程介绍了构建 Agentic AI 的四种设计模式，后续章节会逐一深入：

反思（Reflection）：让 AI 自我检查、自我改进
工具使用（Tool Use）：赋予 AI 调用外部工具的能力
规划（Planning）：让 AI 自主决定任务步骤
多智能体协作（Multi-agent）：多个 AI 分工合作

📌 本篇要点回顾
Agentic AI = 多步骤 + 迭代 + 分工协作的 AI 工作流
核心价值：同样模型 + Agentic 工作流 → 性能大幅超越单次使用
三大优势：性能好、速度快（并行）、模块化（可替换）
自主性是光谱，不是二选一