AI必知必会 通用名词解释👨💼老板:小刘,最近老听人说什么大模型、提示词、Agent……一堆词听得我头大。今天正好有空,你挨个给我讲明白,行不?👩💻小刘:没问题老板,咱就拿咱们公司举例子,保证您一听就懂。
01 大模型
👩💻小刘:您可以把它当成一个读过全世界所有书、但从来没上过一天班的大学生。天文地理、物理化学它都懂,但该怎么在咱们公司干活,它完全不知道,得靠我们教。
02 Token
👩💻小刘:没准。英文里大概一个单词是1-2个Token,中文里一个字可能就占1-2个Token。比如“我喜欢AI”,可能会被切成“我/喜欢/AI”三个Token。后面要讲的“上下文窗口”能装多少东西,不是按字数算的,是按Token数算的。最新的模型,一个窗口能装下整本《三体》还绰绰有余。
03 提示词
👩💻小刘:您就把AI想象成一个特别听话、但脑袋一根筋的机器人服务员。您对它说:
“给我来杯喝的。”
它可能给您端来一杯滚烫的白开水,因为它不知道您想喝什么。
但如果您说:
“给我来一杯冰美式,不加糖,用大杯装。”
它马上就能给您想要的。
提示词,就是您对AI下达的那句具体指令。说得越模糊,结果越随机;说得越具体、越有画面感,它就越懂您,给的东西就越准。👨💼老板:哦,就是别让它猜,直接给它列清楚“是什么、什么要求、要什么结果”。👩💻小刘:对,就是这个意思。提示词,就是您给这个一根筋机器人的行动说明书。
04 提示词工程
👨💼老板:我上次就说了这么一句,它写得干巴巴的,是不是我话说得不对?👩💻小刘:对。想让AI干得漂亮,得讲究下指令的技巧,这个技巧就叫提示词工程。给您看个对比。“帮我写个招销售的JD。”
“你是有10年经验的SaaS行业HR总监。现在为济南分公司招聘一名大客户销售经理,硬性要求是有3年以上软件行业经验、参与过十万级用户项目开发。请按以下结构输出:
一句话吸引语
岗位职责(5条,突出开拓新客户)
任职要求(分‘必须项’和‘加分项’)
我们能提供什么(列出3条独特福利)
格式用Markdown,语气要专业又不失温度。”
👨💼老板:我明白了,就像给下属派任务,交代得越清楚,他干得越到位。
05 上下文
👨💼老板:那为什么我问他“济南天气”,接着问“后天呢”,他也能知道我问的是济南?👩💻小刘:因为他在跟您这一轮对话里,能“看到”前面说过的话。这些前面说过的话,就构成了上下文。他知道“后天呢”是在接着“济南”往下问。
06 上下文窗口
👨💼老板:可为什么有时候聊了快一小时,再问“后天呢”,他就开始胡说,好像根本不记得聊过天气?👩💻小刘:那是因为上下文窗口满了。上下文窗口就是他一次能记住的聊天记录的最大Token数,就像一块小黑板。写满了新内容,就必须擦掉旧内容。当“济南”被擦掉以后,您再问“后天呢”,他自然就不知道您说的是哪个城市了。就像一个服务员手里只有一个巴掌大的便签纸。你开始点单:“一碗牛肉面,多放辣,不要香菜,再来盘拍黄瓜……”他全记在便签纸上。但纸就这么大,当你继续加菜:“再加一份酱牛肉,切薄点,哦对隔壁的啤酒也来一瓶……”写到“酱牛肉”时纸满了。他只能把最开头的“牛肉面”整条划掉,才能把“啤酒”写上去。等你突然回头问:“哎刚才那碗面,我不要辣了。”他低头一看便签纸上早就没有“牛肉面”三个字,一脸懵:“什么面?您点过面吗?”便签纸的大小,就是上下文窗口。一旦前面的内容被擦掉,他就当你从来没说过,彻底遗忘。
07 压缩记忆
👩💻小刘:所以有一种补救办法,叫压缩记忆。当聊天记录快把窗口撑爆的时候,AI会自动把前面啰嗦的一大段对话,总结成几条简短的要点,然后用这个“摘要”替换掉原来的全文,省出空间来继续聊。就像秘书把两小时的会议录音,整理成三条会议纪要递给您,核心信息还在,纸省了。👨💼老板:我懂了,就是把长长的对话,当场提炼成关键词,用关键词代表整件事。👩💻小刘:完全正确。压缩记忆干的就这件事——聊天记录快把窗口撑爆时,AI会自动把前面啰嗦的话总结成几条极其简短的要点,然后用这个“摘要”替代完整的对话历史。腾出了空间,核心信息又没丢。
08 Memory(记忆)
👨💼老板:上下文只能记住这一轮,那我想让它永久记住我喜欢喝冰美式,怎么办?👩💻小刘:这靠的是Memory(记忆)。您只要说一句“记一下,我喝美式,冰的,不加糖”,系统就会把这条信息存进您专属的长期档案里。三天后,您在新电脑上打开,说一句“老样子”,它会先去档案里翻出“冰美式无糖”,再下单。上下文管的是“这一轮”,记忆管的是“跨轮”。
09 幻觉
👨💼老板:我听说AI有时候会一本正经地胡说八道,这叫什么?👩💻小刘:这叫幻觉。AI的本质上是在做“猜词接龙”,它没有真假判断能力。您问它“咱们公司去年去年净利润是多少”,他没查有咱们公司的财报信息,但又不好意思说不知道,于是凭着读过的无数上市公司财报,自己编了一个看起来很合理的数字:“66万”还说得一脸自信。这就是幻觉。它本质是个“猜词接龙”机器,没有求真欲,只会拼凑它认为最像的答案。
10 嵌入
👩💻小刘:要治这个,得先让AI有能力去“翻”咱们公司的内部资料。但在翻之前,得先让机器能“理解”文字的意思,这一步靠嵌入。嵌入就是把一句话变成一串很长的数字,比如[0.13, -0.55, 0.78...]。这串数字就是这句话的“语义坐标”。意思越近的话,坐标距离就越近。比如“老板”和“CEO”的坐标很近,但它俩跟“打印机”的坐标就非常远。把意思变成坐标的过程,就叫嵌入。
11 向量数据库
👩💻小刘:放在向量数据库里。咱们事先把公司的制度、财报、产品手册切成一个个小段,每段都算出一个语义坐标,存进这个库。这个数据库就像一个按“意思”来检索的超级档案柜,您搜“营收”,它能把写有“销售收入”的段落也找出来,而不只是匹配关键词。这个按“意思距离”检索的数据库,就是向量数据库。
12 RAG(检索增强生成)
👩💻小刘:靠RAG(检索增强生成)。当您问“去年净利润”,系统会先做三件事:系统先把你的问题转成坐标,去向量数据库里找到最相关的几段原文(比如审计报告截图里的段落)。
把这些原文和你的问题一起“打包”,对AI说:“请只基于以下资料回答,不准瞎编,如果资料里没有就说不知道。”
AI读完资料,回答:“根据审计报告,是8765万元。”
这样一来,它就相当于被关在资料室里开卷考试,只能根据证据说话,不准凭印象答题,彻底根治幻觉。
13 Agent(智能体)
👨💼老板:前面这些都是在“聊天”,但我想让它直接帮我订机票、写进日历,能行吗?👩💻小刘:能,这就得用上Agent(智能体)。Agent不只会说,还有“手”和“脚”。它接到一个任务后,会自己规划步骤,然后一步步去执行,执行完还会检查结果。它是一个“思考→行动→观察”不断循环的数字员工。它会自己规划:先查航班→再订票→再写日程→再发消息。每一步做完都检查结果,出错了就调整。
Agent是能自主规划并执行多步任务的AI。
14 工具调用
👩💻小刘:它靠的是工具调用。Agent虽然自己没有眼睛和手,但可以“借用”外部工具,比如你让Agent订票,Agent去查航班,就是向“航班查询工具”发出请求,借它的能力来完成自己做不到的事。这个“借”的动作,就叫工具调用。
15 函数调用
👨💼老板:那它请求工具的时候,是怎么说的?也像跟咱们聊天一样随便吗?👩💻小刘:不是,那样容易出错。它用的是严格的函数调用。比如您说“帮我查5月28号济南飞广州的航班”,Agent不会直接说大白话去搜,而是生成一段结构严整的指令:{ "tool": "search_flights", "parameters": { "from": "济南", "to": "广州", "date": "2026-05-28" }}
咱们的程序看到这段标准指令,就能万无一失地执行真实查询。函数调用就是把模糊的自然语言,变成机器一定能执行对的标准命令。
16 SKILL(技能)
👨💼老板:每次做复杂任务,都要从零开始组合工具,太麻烦了。👩💻小刘:所以有了SKILL(技能)。比如果你每周都要做“竞品分析”,每次都得一步步教Agent:去A网站搜新闻→提取产品动态→套用PPT模板→发邮件。太累。于是你把这一整套流程打包,起了个名字叫“竞品周报技能”。以后只需说:“用竞品周报技能,分析一下A公司本周动向。”Agent就会自动按技能里的流水线一口气做完。SKILL就是把一套复杂的操作流程,封装成了随叫随用的自动化生产线。
17 MCP(模型上下文协议)
👨💼老板:公司用着飞书,又用着企业微信,还有各种数据库,每个都接一遍,开发不得累死?👩💻小刘:这个问题,现在有MCP(模型上下文协议)来解决了。您可以把它想成是AI世界的TYPE-C接口。以前,每连一种新工具,都得专门写一套适配代码,就像给每种设备配不同形状的充电线。后来,行业定了一套万能插座标准,叫MCP。只要工具方支持MCP,Agent就像拿着一个万能转接头,即插即用,无需额外开发。现在只要大家都支持MCP这个标准协议,AI就能像即插即用的U盘一样,随时接通任何MCP服务,不用再做重复开发。
18 微调
👨💼老板:这个大学生是个通才,但我想让他一开口就有咱们公司法务的味道,能行吗?👩💻小刘:能,用微调。在通用大模型的基础上,拿咱们公司过往的合同、法律文书再专门训练它一小轮。微调之后,不需要您在提示词里强调“你是个法务专家”,它天生就用专业的视角看问题了。这相当于大学生入职后的岗前培训。这种在通用大模型基础上,用特定领域数据再训练一轮的过程,就叫微调。
19 温度
👨💼老板:有时候我想要它规规矩矩,有时候又想要它脑洞大开,能调吗?👩💻小刘:能,有一个旋钮叫温度,一般是从0到2之间的一个数。调到0,它就像个严谨的老学究,每次回答几乎一模一样,适合算账、写公文。调到0.8以上,它就开启脑洞模式,适合起广告词、想创意。不过调到太高,它说话就可能开始疯疯癫癫了。
20 思维链
👨💼老板:上次我让它算一道有点绕的数学题,它直接给了个错误答案。👩💻小刘:下次您在问题后面加一句“让我们一步一步思考”,这招就叫思维链。你问他:“小明有5个苹果,吃了2个,又买了3个,给朋友一半,还剩几个?”他直接报“1个”,却可能算错。你赶紧补一句:“别急,让我们一步一步思考。”他于是老实了,开始在草稿纸上写:5-2=3,3+3=6,6的一半是3,最后剩3。这个逼他先展示推理过程、再给结论的提示技巧,就叫思维链。相当于老师要求“把你的草稿纸交出来”。
21 对齐 & RLHF
主流的一种做法是RLHF(基于人类反馈的强化学习)。先让人给AI的各种回答打分,训练出一个“品味判断模型”,再用这个模型去微调AI,让它只输出符合人类价值观和规范的回答。相当于给它请了家教,教它什么该说,什么不该说。
22 多模态
👨💼老板:现在我看有些AI能识别图片了,这又是怎么回事?👩💻小刘:这叫多模态。以前的AI只能处理文本,叫单模态。现在能同时理解文字、图片、声音甚至视频,就叫多模态。比如拍一张产品破损的照片传给它,它能直接看出哪里坏了,并用文字描述出来。相当于给这个大学生配上了眼睛和耳朵。这种能同时处理文字、图片、声音、视频等多种信息的能力,就叫多模态。
23 量化
👨💼老板:这模型跑起来那么贵,有没有省钱的办法?就是把模型参数里的高精度小数,比如32位的小数,压缩成8位甚至4位的整数。这一压,模型体积能直接缩小到原来的四分之一,在普通电脑甚至手机上就能跑,而且回答质量下降很少。相当于把超高清视频压成高清,看着还行,但省了一大笔带宽和硬件钱。
24 基座模型
👨💼老板:刚训出来、没经过任何调教的那个,又叫什么?👩💻小刘:那就是基座模型。它是个生坯子,只会最原始的猜词接龙。我们平时用的ChatGPT之类的,是经过了指令微调和对齐的成品。基座模型是原材料,成品是可上岗的员工。
👩💻小刘:老板,您今天问的这些问题串起来,本身就是一堂完美的AI入门课。