AI Agent 到底是什么?—— 一篇普通人也能看懂的科普

周末长文001

如果给 AI 行业选一个当下的年度词汇，Agent 当之无愧。OpenAI、Anthropic、Google、微软、字节、阿里……所有人都在押注同一件事——让 AI 不再只是「聊天」，而是真正「帮你干活」。

一、别被名词吓到：Agent 到底是什么？

用最简单的话说：

聊天 AI：一问一答，被动应答。没有工具，出错即止。
AI Agent：接收目标，自主分步落地。自动调用搜索、文件、浏览器。出错自己重试纠正。

打个比喻：

聊天机器人 = 图书管理员。你问「《三体》在哪」，它说「3楼A区第4排」。
AI Agent = 私人助理。你说「帮我把下周去上海的出差安排好」。它自己查航班、比价格、订票、加日历、发邮件给酒店——你只在付款确认时看一眼。

Anthropic 在《Building Effective Agents》里给了一个经典定义：**Agent 是 AI 自己动态决定每一步怎么做。

二、解剖 Agent：一个公式讲清楚内部构造

ICLR 2025 之后，Hugging Face 工程师 Sergio Paniego 和 Aritra Roy Gosthipaty 发布了一篇术语手册，用一个经典框架把 Agent 的底层结构讲透了：

Agent = Model（模型）+ Scaffold（脚手架）+ Harness（驾驭者）

🧠 Model（模型层）—— 「大脑」

就是那个「裸」的大语言模型。它很「纯粹」：文本进，文本出。没有记忆，不会循环，不会主动做任何事。只能「表达」意图——比如「我应该去搜一下最近的新闻」，但真正去搜的那个人不是它。

打个比方：Model 是一个超级聪明但全身瘫痪的天才——能告诉你该做什么，自己动不了。

🏗️ Scaffold（脚手架/上下文层）—— 「眼睛和记忆」

Scaffold 是 Model「看到」的一切：系统提示词、工具描述、对话历史、检索到的知识。Scaffold 塑造了 Model 眼里的世界，决定了它的边界。

这就是为什么行业内现在强调「上下文工程」而不只是「提示词工程」——决定 Agent 表现的，往往不是那句话写得多漂亮，而是它在关键时刻能「看到」哪些信息。

同一个底层模型，配上不同的 Scaffold 和 Harness，就是完全不同的产品。同样是 Claude，Claude.ai 聊天界面 和 Claude Code 的体验天差地别：Model 没变，变的是执行系统。

⚙️ Harness（驾驭者/执行层）—— 「手脚和神经」

这是真正让 Model 跑起来的东西。它的工作：

调用模型，拿到 Model 的「意图」
Model 说「搜索」→ Harness 真的去执行
判断什么时候完成、什么时候该问人、什么时候换思路

Harness 才是 Agent 和聊天机器人的本质区别。 聊天机器人只会回答，Agent 能循环、执行、自我纠正。

一个类比帮你记住

想象你在开餐厅：

角色	对应	做什么
Model	主厨的大脑	决定「这道菜该怎么做」
Scaffold	菜谱、库存单、忌口表	主厨「看到」的所有信息
Harness	厨房、炉灶、帮厨	真正把菜做出来的执行系统

Model 只会说「应该煎3分钟」，点火、翻面、装盘全是 Harness 干的。

在Agent中，三种工具使用的金字塔：Tool → Skill → Sub-agent

层级	是什么	例子
Tool（工具）	原子操作	调用 API、读写文件
Skill（技能）	完整方案	「排查 Bug 的完整流程」
Sub-agent（子智能体）	独立代理人	有自己的 Model，能独立推理

Skill 可以跨 Agent 移植——你写好的「数据分析 Skill」能同时给客服 Agent 和销售 Agent 用。而 Sub-agent 最强大：能像独立员工一样被派出去干活，干完回来汇报。

三、拆开黑箱：Agent 到底怎么干活？

假设你给 Agent 一个任务：「研究最近 AI Agent 行业动态，写一篇科普文章」。

它的内部运作：

理解意图 → 制定计划 → 调用工具 → 观察结果 → 自我修正 → 循环直到完成

具体拆开：

理解意图：把「写科普」拆成子任务——搜新闻→找权威文章→整理框架→撰写→润色
制定计划：搜索用搜索引擎、抓文章用 web fetch、写作直接输出
调用工具：打开网站、抓取内容、提取关键信息
观察反馈：搜到的够不够？不够换关键词再搜
自我修正：某个链接打不开？换来源。某段写得不好？重写
交付结果：整合所有素材，输出完整文章

这和传统程序最大的不同：传统程序走预设路线，一条路不通就报错停下。Agent 走不通会自己找别的路——这是质的飞跃。

四、六种 Agent 设计模式（行业必修课）

💡 Anthropic 与几十个团队合作后发现：最成功的 Agent 系统，用的都是简单可组合的模式，而非复杂框架。**

模式	通俗解释	生活案例
提示链	流水线，A 产出喂 B	写公众号：先生成大纲 → 检查覆盖度 → 按大纲逐段成文
路由	先分类再分派	客服：自动判断「退款」「使用」「投诉」，分别转对应组
并行化	多线同时开工	买机票：同时查携程、飞猪、官网，汇总最低价
编排-工人	工头动态派活	开发新功能：自动拆成前端、后端、数据库，分别派给专业 Agent
评估-优化	一个写一个审	翻译小说：翻译出初稿 → 审校标注不自然 → 针对性修改 → 再审
自主 Agent	完全自治	竞品调研：自行搜索、整理、写成报告，只在发现矛盾时确认一次

五、Agent 现在到底能做什么？不能做什么？

先看一组最新数据：Anthropic 联合 Material 调研了 500+ 美国技术决策者，发现 57% 的企业已在生产环境部署多步骤 Agent，81% 计划 2026 年上更复杂的场景，80% 已看到可衡量的经济回报。 2026 Q1 全球 AI 风投冲到 2555 亿美元，超过 2025 全年总和。Agent 不是未来式，是进行时。

✅ 确定性疆域：已经是主场

规则清晰、对错可量化的领域，Agent 的表现相当可靠：

编程：多文件修改、自动调试、生成测试——Claude Code 已是程序员标配
信息搜集：自动搜索、对比、汇总、写报告
网页操作：填表、下单、订票、比价
客服分流：自动识别问题类型，分派处理流程

⚠️ 过渡地带：能做但容易翻车

PPT 与排版：能生成内容和基础布局，精细视觉设计仍需人工
多 Agent 协作：两个还行，三个以上容易出现调度混乱
翻译：日常文本不错，文学翻译的语感、双关、文化梗经常翻车

❌ 非确定性疆域：Agent 的真正盲区

1. 隐性知识与物理直觉

AI 能写出完美的汽车维修教程，但真放到车底下面对一台发动不了的引擎，它连「传感器坏还是线路老化」这种修车师傅一眼能判断的事都做不到。这不是逻辑推理题——这是几千次亲手摸过发动机后形成的肌肉直觉。

2. 世界模型缺失

当前 Agent 没有对物理世界的真正理解。它知道「苹果会掉下来」是因为在文本里读过，不是因为它懂万有引力。这导致它会建议你「暴风雨天开窗通风」。

3. 深度决策

Agent 能筛简历但做不了终面决定。因为真正的决策需要理解「没说出来的上下文」——候选人的微表情、公司政治中的隐性风险。这些信息不在 Agent 的窗口里。

4. 超长链路自治

连续跨天的自主任务，缺少分段校验时，Agent 会逐步偏离目标。就像实习生被派去做一个月调研，中间没人检查，月底交来的可能完全是另一个方向。

立马上手

试一个 Agent：如果你还没用过，Claude Code（编程）或 ChatGPT Deep Research（搜索）是最直观的体验入口
记一个公式：Agent = Model + Scaffold + Harness，下次看任何 Agent 产品，拆开这三维就懂了它强在哪弱在哪
用一条原则：复杂度匹配任务。简单问题用单次 LLM，多步骤加链，需要自主决策才上 Agent

一句话总结：Agent 的本质 = 大模型的思考能力 + 信息环境的约束 + 自动化执行引擎。它是 AI 从「问答工具」走向「自主办事」的新形态。边界虽然存在，但它在快速移动——把确定的事交给它，把需要判断和直觉的事留给自己。

关注「AI上手报告」，每周3分钟，看懂AI大瓜 + 拿到能直接用的实操Prompt。只写亲测能用的。

如果觉得有收获，点个「在看」转发给也在关心AI的朋友 👇