AI必知必会通用名词解释

👨‍💼老板：小刘，最近老听人说什么大模型、提示词、Agent……一堆词听得我头大。今天正好有空，你挨个给我讲明白，行不？

👩‍💻小刘：没问题老板，咱就拿咱们公司举例子，保证您一听就懂。

01 大模型

👨‍💼老板：先说说，到底什么是大模型？

👩‍💻小刘：您可以把它当成一个读过全世界所有书、但从来没上过一天班的大学生。天文地理、物理化学它都懂，但该怎么在咱们公司干活，它完全不知道，得靠我们教。

02 Token

👨‍💼老板：那它读书是怎么读的？一个字一个字看？

👩‍💻小刘：没准。英文里大概一个单词是1-2个Token，中文里一个字可能就占1-2个Token。比如“我喜欢AI”，可能会被切成“我/喜欢/AI”三个Token。后面要讲的“上下文窗口”能装多少东西，不是按字数算的，是按Token数算的。最新的模型，一个窗口能装下整本《三体》还绰绰有余。

03 提示词

👨‍💼老板：提示词是什么？

👩‍💻小刘：您就把AI想象成一个特别听话、但脑袋一根筋的机器人服务员。

您对它说：

“给我来杯喝的。”

它可能给您端来一杯滚烫的白开水，因为它不知道您想喝什么。

但如果您说：

“给我来一杯冰美式，不加糖，用大杯装。”

它马上就能给您想要的。

提示词，就是您对AI下达的那句具体指令。说得越模糊，结果越随机；说得越具体、越有画面感，它就越懂您，给的东西就越准。

👨‍💼老板：哦，就是别让它猜，直接给它列清楚“是什么、什么要求、要什么结果”。

👩‍💻小刘：对，就是这个意思。提示词，就是您给这个一根筋机器人的行动说明书。

04 提示词工程

👨‍💼老板：我上次就说了这么一句，它写得干巴巴的，是不是我话说得不对？

👩‍💻小刘：对。想让AI干得漂亮，得讲究下指令的技巧，这个技巧就叫提示词工程。给您看个对比。

❌随口的提示词：

“帮我写个招销售的JD。”

✅用了提示工程的提示词：

“你是有10年经验的SaaS行业HR总监。现在为济南分公司招聘一名大客户销售经理，硬性要求是有3年以上软件行业经验、参与过十万级用户项目开发。请按以下结构输出：

一句话吸引语

岗位职责（5条，突出开拓新客户）

任职要求（分‘必须项’和‘加分项’）

我们能提供什么（列出3条独特福利）

格式用Markdown，语气要专业又不失温度。”

👨‍💼老板：我明白了，就像给下属派任务，交代得越清楚，他干得越到位。

05 上下文

👨‍💼老板：那为什么我问他“济南天气”，接着问“后天呢”，他也能知道我问的是济南？

👩‍💻小刘：因为他在跟您这一轮对话里，能“看到”前面说过的话。这些前面说过的话，就构成了上下文。他知道“后天呢”是在接着“济南”往下问。

06 上下文窗口

👨‍💼老板：可为什么有时候聊了快一小时，再问“后天呢”，他就开始胡说，好像根本不记得聊过天气？

👩‍💻小刘：那是因为上下文窗口满了。上下文窗口就是他一次能记住的聊天记录的最大Token数，就像一块小黑板。写满了新内容，就必须擦掉旧内容。当“济南”被擦掉以后，您再问“后天呢”，他自然就不知道您说的是哪个城市了。

就像一个服务员手里只有一个巴掌大的便签纸。你开始点单：“一碗牛肉面，多放辣，不要香菜，再来盘拍黄瓜……”他全记在便签纸上。但纸就这么大，当你继续加菜：“再加一份酱牛肉，切薄点，哦对隔壁的啤酒也来一瓶……”写到“酱牛肉”时纸满了。他只能把最开头的“牛肉面”整条划掉，才能把“啤酒”写上去。等你突然回头问：“哎刚才那碗面，我不要辣了。”他低头一看便签纸上早就没有“牛肉面”三个字，一脸懵：“什么面？您点过面吗？”便签纸的大小，就是上下文窗口。一旦前面的内容被擦掉，他就当你从来没说过，彻底遗忘。

07 压缩记忆

👨‍💼老板：那黑板这么容易满，不是很耽误事吗？

👩‍💻小刘：所以有一种补救办法，叫压缩记忆。当聊天记录快把窗口撑爆的时候，AI会自动把前面啰嗦的一大段对话，总结成几条简短的要点，然后用这个“摘要”替换掉原来的全文，省出空间来继续聊。就像秘书把两小时的会议录音，整理成三条会议纪要递给您，核心信息还在，纸省了。

👨‍💼老板：我懂了，就是把长长的对话，当场提炼成关键词，用关键词代表整件事。

👩‍💻小刘：完全正确。压缩记忆干的就这件事——聊天记录快把窗口撑爆时，AI会自动把前面啰嗦的话总结成几条极其简短的要点，然后用这个“摘要”替代完整的对话历史。腾出了空间，核心信息又没丢。

08 Memory（记忆）

👨‍💼老板：上下文只能记住这一轮，那我想让它永久记住我喜欢喝冰美式，怎么办？

👩‍💻小刘：这靠的是Memory（记忆）。您只要说一句“记一下，我喝美式，冰的，不加糖”，系统就会把这条信息存进您专属的长期档案里。三天后，您在新电脑上打开，说一句“老样子”，它会先去档案里翻出“冰美式无糖”，再下单。上下文管的是“这一轮”，记忆管的是“跨轮”。

09 幻觉

👨‍💼老板：我听说AI有时候会一本正经地胡说八道，这叫什么？

👩‍💻小刘：这叫幻觉。AI的本质上是在做“猜词接龙”，它没有真假判断能力。您问它“咱们公司去年去年净利润是多少”，他没查有咱们公司的财报信息，但又不好意思说不知道，于是凭着读过的无数上市公司财报，自己编了一个看起来很合理的数字：“66万”还说得一脸自信。这就是幻觉。它本质是个“猜词接龙”机器，没有求真欲，只会拼凑它认为最像的答案。

10 嵌入

👨‍💼老板：那要怎么治这种瞎编的毛病？

👩‍💻小刘：要治这个，得先让AI有能力去“翻”咱们公司的内部资料。但在翻之前，得先让机器能“理解”文字的意思，这一步靠嵌入。嵌入就是把一句话变成一串很长的数字，比如[0.13, -0.55, 0.78...]。这串数字就是这句话的“语义坐标”。意思越近的话，坐标距离就越近。比如“老板”和“CEO”的坐标很近，但它俩跟“打印机”的坐标就非常远。把意思变成坐标的过程，就叫嵌入。

11 向量数据库

👨‍💼老板：有了坐标，然后放哪儿？

👩‍💻小刘：放在向量数据库里。咱们事先把公司的制度、财报、产品手册切成一个个小段，每段都算出一个语义坐标，存进这个库。这个数据库就像一个按“意思”来检索的超级档案柜，您搜“营收”，它能把写有“销售收入”的段落也找出来，而不只是匹配关键词。这个按“意思距离”检索的数据库，就是向量数据库。

12 RAG（检索增强生成）

👨‍💼老板：东西存好了，那具体怎么让他不瞎编？

👩‍💻小刘：靠RAG（检索增强生成）。当您问“去年净利润”，系统会先做三件事：

系统先把你的问题转成坐标，去向量数据库里找到最相关的几段原文（比如审计报告截图里的段落）。

把这些原文和你的问题一起“打包”，对AI说：“请只基于以下资料回答，不准瞎编，如果资料里没有就说不知道。”

AI读完资料，回答：“根据审计报告，是8765万元。”

这样一来，它就相当于被关在资料室里开卷考试，只能根据证据说话，不准凭印象答题，彻底根治幻觉。

13 Agent（智能体）

👨‍💼老板：前面这些都是在“聊天”，但我想让它直接帮我订机票、写进日历，能行吗？

👩‍💻小刘：能，这就得用上Agent（智能体）。Agent不只会说，还有“手”和“脚”。它接到一个任务后，会自己规划步骤，然后一步步去执行，执行完还会检查结果。它是一个“思考→行动→观察”不断循环的数字员工。

它会自己规划：先查航班→再订票→再写日程→再发消息。每一步做完都检查结果，出错了就调整。

Agent是能自主规划并执行多步任务的AI。

14 工具调用

👨‍💼老板：它怎么“动手”？总不能真去点鼠标吧？

👩‍💻小刘：它靠的是工具调用。Agent虽然自己没有眼睛和手，但可以“借用”外部工具，比如你让Agent订票，Agent去查航班，就是向“航班查询工具”发出请求，借它的能力来完成自己做不到的事。这个“借”的动作，就叫工具调用。

15 函数调用

👨‍💼老板：那它请求工具的时候，是怎么说的？也像跟咱们聊天一样随便吗？

👩‍💻小刘：不是，那样容易出错。它用的是严格的函数调用。比如您说“帮我查5月28号济南飞广州的航班”，Agent不会直接说大白话去搜，而是生成一段结构严整的指令：

{  "tool": "search_flights",  "parameters": {  "from": "济南",  "to": "广州",  "date": "2026-05-28"  }}

咱们的程序看到这段标准指令，就能万无一失地执行真实查询。函数调用就是把模糊的自然语言，变成机器一定能执行对的标准命令。

16 SKILL（技能）

👨‍💼老板：每次做复杂任务，都要从零开始组合工具，太麻烦了。

👩‍💻小刘：所以有了SKILL（技能）。比如果你每周都要做“竞品分析”，每次都得一步步教Agent：去A网站搜新闻→提取产品动态→套用PPT模板→发邮件。太累。于是你把这一整套流程打包，起了个名字叫“竞品周报技能”。以后只需说：“用竞品周报技能，分析一下A公司本周动向。”Agent就会自动按技能里的流水线一口气做完。SKILL就是把一套复杂的操作流程，封装成了随叫随用的自动化生产线。

17 MCP（模型上下文协议）

👨‍💼老板：公司用着飞书，又用着企业微信，还有各种数据库，每个都接一遍，开发不得累死？

👩‍💻小刘：这个问题，现在有MCP（模型上下文协议）来解决了。您可以把它想成是AI世界的TYPE-C接口。以前，每连一种新工具，都得专门写一套适配代码，就像给每种设备配不同形状的充电线。后来，行业定了一套万能插座标准，叫MCP。只要工具方支持MCP，Agent就像拿着一个万能转接头，即插即用，无需额外开发。现在只要大家都支持MCP这个标准协议，AI就能像即插即用的U盘一样，随时接通任何MCP服务，不用再做重复开发。

18 微调

👨‍💼老板：这个大学生是个通才，但我想让他一开口就有咱们公司法务的味道，能行吗？

👩‍💻小刘：能，用微调。在通用大模型的基础上，拿咱们公司过往的合同、法律文书再专门训练它一小轮。微调之后，不需要您在提示词里强调“你是个法务专家”，它天生就用专业的视角看问题了。这相当于大学生入职后的岗前培训。这种在通用大模型基础上，用特定领域数据再训练一轮的过程，就叫微调。

19 温度

👨‍💼老板：有时候我想要它规规矩矩，有时候又想要它脑洞大开，能调吗？👩‍💻小刘：能，有一个旋钮叫温度，一般是从0到2之间的一个数。调到0，它就像个严谨的老学究，每次回答几乎一模一样，适合算账、写公文。调到0.8以上，它就开启脑洞模式，适合起广告词、想创意。不过调到太高，它说话就可能开始疯疯癫癫了。

20 思维链

👨‍💼老板：上次我让它算一道有点绕的数学题，它直接给了个错误答案。

👩‍💻小刘：下次您在问题后面加一句“让我们一步一步思考”，这招就叫思维链。你问他：“小明有5个苹果，吃了2个，又买了3个，给朋友一半，还剩几个？”他直接报“1个”，却可能算错。你赶紧补一句：“别急，让我们一步一步思考。”他于是老实了，开始在草稿纸上写：5-2=3，3+3=6，6的一半是3，最后剩3。这个逼他先展示推理过程、再给结论的提示技巧，就叫思维链。相当于老师要求“把你的草稿纸交出来”。

21 对齐 & RLHF

👨‍💼老板：那我怎么保证它不给客户说出格的话？

👩‍💻小刘：这背后是一套家教流程，叫对齐。

主流的一种做法是RLHF（基于人类反馈的强化学习）。先让人给AI的各种回答打分，训练出一个“品味判断模型”，再用这个模型去微调AI，让它只输出符合人类价值观和规范的回答。相当于给它请了家教，教它什么该说，什么不该说。

22 多模态

👨‍💼老板：现在我看有些AI能识别图片了，这又是怎么回事？

👩‍💻小刘：这叫多模态。以前的AI只能处理文本，叫单模态。

现在能同时理解文字、图片、声音甚至视频，就叫多模态。比如拍一张产品破损的照片传给它，它能直接看出哪里坏了，并用文字描述出来。相当于给这个大学生配上了眼睛和耳朵。这种能同时处理文字、图片、声音、视频等多种信息的能力，就叫多模态。

23 量化

👨‍💼老板：这模型跑起来那么贵，有没有省钱的办法？

👩‍💻小刘：有，叫量化。

就是把模型参数里的高精度小数，比如32位的小数，压缩成8位甚至4位的整数。这一压，模型体积能直接缩小到原来的四分之一，在普通电脑甚至手机上就能跑，而且回答质量下降很少。相当于把超高清视频压成高清，看着还行，但省了一大笔带宽和硬件钱。

24 基座模型

👨‍💼老板：刚训出来、没经过任何调教的那个，又叫什么？

👩‍💻小刘：那就是基座模型。它是个生坯子，只会最原始的猜词接龙。我们平时用的ChatGPT之类的，是经过了指令微调和对齐的成品。基座模型是原材料，成品是可上岗的员工。

👨‍💼老板（长出一口气）：这下所有词全通透了。

👩‍💻小刘：老板，您今天问的这些问题串起来，本身就是一堂完美的AI入门课。