读完这篇,跟 AI 从业者聊天不再一脸懵。
你有没有过这样的经历——
打开一篇 AI 文章,第一段就碰到「LLM」「RAG」「Token」「Agent」……每个字母都认识,连起来像天书。关掉页面,默默叹气:我是不是被时代抛弃了?
别急,你不是一个人。
今天这篇推文,我们用生活化的比喻,把 AI 领域最核心的 13 个术语一次讲清楚。不需要技术背景,10 分钟读完,你就能:
•✅ 看懂 80% 的 AI 新闻和产品介绍•✅ 跟技术同事/朋友聊天不再插不上话•✅ 理解为什么 ChatGPT 有时候会「胡说八道」
先搞清楚最关键的一个:LLM(大语言模型)
在理解所有术语之前,先记住这一个。
🍳 一句话类比:LLM 就像一个读过全世界所有书、但被关在房间里的人。
他知识渊博,能回答问题、写文章、翻译、编程——但他看不到外面的世界,不知道今天几号,也没法帮你做任何实际操作(发邮件、查数据库、订机票)。
ChatGPT、Claude、文心一言、通义千问,都是 LLM。
关键局限:知识有截止日期、没有实时信息、不能执行外部操作、可能会「编造」事实(这叫幻觉)。
💡 理解了 LLM 的局限,下面所有概念就好懂了——它们大多是为了突破 LLM 的局限而诞生的。
一、Token(词元)—— AI 怎么「吃」文字的?
🍳 类比:如果把 AI 读的文字比作一顿饭,Token 就是被切碎的食物块。AI 不会一口吞下整段话,而是切成小块小块地吃。
•一个中文字 ≈ 1-2 个 Token•一个英文单词 ≈ 1-3 个 Token•"我喜欢AI" ≈ 5 个 Token
为什么要关心?
•💰 计费按 Token 算:用 API 是花真金白银的•📏 上下文窗口有限:AI 一次能「记住」的内容有上限(比如 200K Token ≈ 一本中等厚度的书)•🚀 Token 越多,生成越慢
补充概念:Context Window(上下文窗口) = AI 的「短期记忆容量」。这就是为什么和 AI 聊太久,它会「忘记」之前说的内容。
二、Prompt(提示词)—— 怎么跟 AI 说话?
🍳 类比:Prompt 就是你跟 AI 说话的方式。就像一个超级聪明但不太懂人情世故的实习生——说得越清楚,它做得越好。
同一个 AI,Prompt 写得好坏,结果天差地别。
Prompt Engineering(提示词工程)
🍳 类比:就像是学会了怎么「管理」这个超级实习生——知道说什么、怎么说、用什么顺序说,才能让它交出最好的活。
常用技巧:
•角色设定:「你是一个有 10 年经验的银行风控专家……」•给示例(Few-shot):先给 AI 看几个例子,再让它做•思维链:让 AI 「一步一步思考,不要直接给答案」•结构化输出:要求 AI 以 JSON 或表格格式回复
三、RAG(检索增强生成)—— 给 AI 查资料的能力
🍳 类比:LLM 是博学但被困在房间里的人。RAG 就是在回答每个问题前,先往房间里塞一堆相关资料,这样它就能回答「超出记忆」的问题了。
简单公式:RAG = 查资料 + 回答问题
流程是这样的:
1.你问:「公司今年的年假政策是什么?」2.系统去知识库检索公司政策文档3.把文档 + 你的问题一起发给 AI4.AI 基于文档生成准确答案 ✅
这就解决了 LLM「不知道实时信息」和「编造内容」的问题。企业内部知识库、智能客服、合同审查背后基本都是 RAG。
RAG 的三个关键小伙伴
Embedding(向量化):把文字变成一串数字。意思相近的文字,数字也相近。「猫」和「小猫」的数字很近,「猫」和「汽车」的数字很远。用它来做「按意思搜索」,而不是「按关键词搜索」。
Vector Database(向量数据库):专门存这些「数字坐标」的仓库。输入一个坐标,它能瞬间找出最接近的 N 个——就像「查找附近的人」。
Knowledge Base(知识库):存放原始资料的地方,比如 PDF、Word、网页等。
四、Tool Calling(工具调用)—— AI 能「动手」了
🍳 类比:LLM 被困在房间里,但手里有一部电话。Tool Calling 就是告诉它:「你可以打电话叫外卖、查天气、订机票,按这个格式说你要什么就行」。
AI 从此不再是「嘴炮」,能把想法变成行动。
举个例子:
1.你:「帮我查一下明天北京的天气」2.AI 意识到需要查天气 → 输出指令:{工具: "查天气", 城市: "北京"}3.系统执行这个指令,拿到真实天气数据4.AI 回复:「明天北京晴,20-30°C」
五、MCP(模型上下文协议)—— AI 界的 USB-C
🍳 类比:你的手机上有微信、支付宝、滴滴,每个 App 接口都不一样。如果每连一个新 App 都得找人写代码,效率极低。MCP 就是 AI 界的 USB-C 接口——制定了一个通用标准,符合标准就能即插即用。
•以前:每接入一个新工具(Gmail、Slack、GitHub……),都得写一套定制代码•现在(MCP):工具开发者实现 MCP 协议,AI 就能直接调用
它是 AI 从「聊天机器人」走向「AI 操作系统」的关键基础设施。
🔗 MCP vs Tool Calling:Tool Calling 是 AI 调用某个函数的能力,MCP 是统一管理所有工具的标准协议。一个讲「能不能」,一个讲「怎么管」。
六、Context Engineering(上下文工程)—— 不止写好一句话
🍳 类比:Prompt Engineering 是「这一句话怎么说更好」。Context Engineering 是「整个对话的剧本怎么写」——给 AI 什么背景、什么时候喂什么资料、怎么管理记忆。
一句话对比:
•Prompt Engineering = 写好一句话(战术)•Context Engineering = 设计整个信息流(战略)
它关注:记忆管理(记住什么、忘掉什么)、知识注入(什么时候查资料)、角色控制(AI 的人设和边界)、工具编排(什么时候用哪个工具)。
七、Skill(技能)—— AI 的「任务模板包」
🍳 类比:Skill 就像一个「任务技能包」——打包了完成某项任务需要的所有东西:标准流程、Prompt 模板、工具配置。需要时打开就用,不需要重新教 AI。
举例:
•/code-review → 审查代码•/translate → 翻译文档•/write-report → 根据数据生成报告
从「每次都重新教 AI」→「一次定义,重复调用」,效率质变。
🔗 Skill vs Agent:Skill = 固定流程的任务模板(像 SOP),Agent = 能自主决策的智能体(像员工)。
八、Agent(智能体)—— 能自己干活的 AI
🍳 类比:如果普通 LLM 是一个坐等提问的「军师」,Agent 就是一个能自己思考、自己拿主意、自己去行动的「独立员工」。
你交代目标(比如「帮我订一张去北京的机票」),它自己去计划步骤、调用工具、处理意外、达成目标。
Agent 的工作循环:ReAct
💭 思考:「用户要订机票,我先查航班」↓🎬 行动:调用搜索航班工具↓👁 观察:拿到航班列表↓💭 再思考:「有 8:00 和 10:00 两班,用户偏好早班」↓🎬 再行动:调用订票工具↓✅ 任务完成!
Agent 的四大核心能力:
1.🧭 规划:把大任务拆成小步骤2.🧰 用工具:调用 API、查数据库、发邮件3.🔄 反思纠错:结果不对,换个方法再试4.💾 记忆:记住做过什么,不重复劳动
九、Computer Use(计算机操作)—— AI 直接操作电脑
🍳 类比:Tool Calling 是有 API 的时候打电话下单。Computer Use 是 API 不好用或根本没有的时候,AI 直接坐到电脑前,像人一样看屏幕、移动鼠标、点击按钮、敲键盘。
典型场景:浏览器网页没有API,无法通过tool calling操作页面。
⚠️ Tool Calling = 通过菜单点菜(高效、规范) Computer Use = 自己进厨房做(通用、但慢)
十、Vibe Coding(氛围编程)—— 说话就能写代码
🍳 类比:传统编程是你亲自搬砖盖房子。Vibe Coding 是你用自然语言描述想要什么,AI 帮你写代码。你关注「要做什么」而不是「怎么做」。
像是从「程序员」变成了「产品经理 + 审阅者」。
适合:快速原型、非程序员做小工具、探索性项目。复杂生产系统仍需要传统编程功底。
十一、Harness Engineering(约束工程)—— 给 AI 套上缰绳
🍳 类比:Agent 像一匹千里马,跑得飞快。但如果你不给它套上缰绳、装上护栏,它可能冲下悬崖。Harness Engineering 就是给 AI 设计缰绳和护栏——让它既强大又可控。
核心控制维度:
•🔐 权限控制:不允许删除生产数据库•🛠 工具白名单:只能用读权限的 API•📦 执行沙箱:AI 代码在隔离环境跑•📋 日志追踪:记录 AI 每一步干了什么•👤 人工审批:转账 > 1000 元需人确认•💰 成本控制:单次任务不超过 $5
这是 AI 从「实验品」走向「生产环境」的关键工程实践。
十二、Workflow(工作流)—— AI 的自动化流水线
🍳 类比:如果每个 Skill 是「专用工具」,Workflow 就是工厂流水线。把多个 Skill、Agent、工具串联起来,按流程自动完成任务。
举个例子:
收到客户邮件→ Agent A 判断意图(投诉 / 咨询 / 订单)→ 投诉:提取信息 → 查知识库 → 生成回复草稿 → 人工审核→ 咨询:RAG 检索 → 自动回复→ 订单:查订单系统 → 生成状态回复 → 自动回复
十三、Workspace Agent(数据员工)—— 你的数字同事
🍳 类比:如果普通 Agent 是「远程外包员工」,Workspace Agent 就是坐在你旁边的数字同事——能看到你的文件、理解你的项目背景、在你的工作环境中直接帮你干活。
比如 Claude Code 可以直接读取你的项目文件、运行命令、编辑代码。Cursor 和 Copilot 可以跨文件理解你的项目上下文。
核心特点:有项目级上下文感知能力,不是「通用 AI」,而是「懂你的 AI」。
📋 速查表:更多高频术语一网打尽
模型相关
| Fine-tuning(微调) | |
| Hallucination(幻觉) | |
| Temperature(温度) | |
| Parameters(参数) |
技术相关
| Chain of Thought | |
| Zero-shot / Few-shot | |
| Guardrails(护栏) |
常用工具
| LangChain | |
| Dify / Coze | |
| Hugging Face | |
| Ollama |
💬 写在最后
AI 领域术语更新极快,这篇文档只是一个起点。但好消息是,核心概念就那么几个,理解之后,新术语大多能举一反三。
如果你想进一步学习,一个非常实用的建议:
遇到不懂的 AI 术语,直接打开 ChatGPT 或 Claude,输入: 「用最通俗的类比解释 XXX」
这是最快的学习方式。毕竟,最好的 AI 老师,就是你手机里那个 AI。
📅 更新日期:2026 年 6 月 13 日
🔗 这份术语表会持续更新。如果觉得有用,欢迎收藏 + 转发给身边同样被 AI 术语困扰的朋友。
关注我们,获取更多 AI 通俗科普内容 🙌
互动话题:你被哪个 AI 术语折磨过?或者你有哪些更好的类比?评论区聊聊 👇
夜雨聆风