开会时同事说"让Agent调个MCP接口做个RAG",你点了点头,脑子里全是问号。
没事,你不是一个人。这篇文章把AI圈最常用的术语,用人话讲清楚。看完你就是那个在会议上能接话的人。
LLM — AI的"大脑"
全称 Large Language Model,中文叫大语言模型,常简称为"大模型"。
你可以把它理解成一个读了互联网上几乎所有文章的超级程序。读得够多,所以能聊天、写文章、写代码。
像一个博学但没上过网的实习生——什么都知道,但不一定是最新的。
ChatGPT、DeepSeek、豆包、文心一言、通义千问……你常听到的名字,本质上都是LLM。国内目前主流的有DeepSeek(深度求索)、文心一言(百度)、通义千问(阿里)、Kimi(月之暗面)、GLM(智谱)、混元(腾讯),各有擅长——有的推理强,有的中文好,有的便宜,选哪个看场景。
几个配套词:
Token— AI的"按字计费"单位。大约1个中文字 ≈ 1.3个Token。你发一句"帮我写封邮件",它回五百字,消耗的就是Token。
上下文窗口(Context Window)— AI一次性记住的信息量上限,相当于它的"短期记忆容量"。128K Token约等于一本《三体》,1M Token可以吞下一整套《三体》三部曲。
幻觉— LLM最大的毛病:不会说"不知道",而是编一个听起来合理的答案。一本正经地胡说八道,就叫幻觉。小技巧:有些问题用你已知的信息先试探它,再让它展开。
Prompt — 跟AI说话
Prompt(提示词)就是你对AI下的指令。"帮我写一封道歉邮件",这就是一个Prompt。Prompt写得好不好,直接决定AI回答的质量。
围绕这个还诞生了一门学问——Prompt Engineering(提示词工程),专门研究怎么把话说得让AI更好地执行。
几种常见技巧:
Few-shot— 先给AI举几个例子,让它照着模仿。比如给三封优秀的营销邮件,让它写第四封。
Zero-shot— 什么例子都不给,直接让它自己想。"翻译这段话",没了。
CoT(思维链)— 让AI一步步推理。先列步骤再给答案,不要直接蒙。就像数学考试写出推导过程,出错概率低很多。
System Prompt(系统提示词)— 对话开头设置的"全局规则"。"你是一名专利律师,语气严谨专业",相当于给AI发一本工作手册。
RAG — 让AI先"查资料"再回答
LLM有一个天然缺陷:它的知识在训练时就定死了,不知道最新发生的事,更不知道你公司的内部文件。
RAG(检索增强生成)就是解决这个问题的。原理很简单:AI回答问题之前,先去查一查资料,找到相关内容再作答。
把闭卷考试变成了开卷考试。
这个"资料库"叫知识库——公司手册、产品文档、个人笔记全部传进去,AI就能基于这些内容回答问题。支撑它的底层技术是向量数据库,把文字变成一组数字坐标(这个过程叫Embedding),意思相近的内容存得近,检索时找"距离最近"的就对了。
Fine-tuning — 给AI"加小灶"
通用大模型什么都会一点,但专业领域不够强。让它写专利交底书,文风偏差;让它分析基因序列,一知半解。
Fine-tuning(微调)——在通用模型基础上,用一批专业数据"加小灶"培训。相当于大学生入职后接受的岗位专项培训。
几种微调方式:
SFT(有监督微调)— 最直接:你提供一批"问题+标准答案",AI按答案学。
LoRA— 省钱省力的方法。不需要重训整个模型,只给AI"挂载"一小块补丁就能学会新技能,成本大幅降低。
RLHF(人类反馈强化学习)— 人类给AI的回答打分,好的奖励,差的扣分。ChatGPT对话这么自然,RLHF功不可没。
Agent + MCP — AI学会"自己动手"
前面说的LLM,本质上还只是一个能说话的大脑——你问它答,仅此而已。
AI Agent(智能体)不一样——它能自己干活。你给它一个目标,它自己规划步骤、调用工具、检查结果。
让它"做一份竞品分析报告",它会自己:搜索竞品信息 → 整理数据 → 对比分析 → 写成报告 → 排版输出。全程不用你盯着。
Agent的核心能力:
Tool Use(工具调用)— 用外部工具:搜索网页、运行代码、操作Excel。没有工具就是嘴强王者。
Planning(规划)— 把大任务拆成步骤,自己排顺序。
Memory(记忆)— 记住你说过的话,不用每次都重新介绍背景。
Reflection(反思)— 做完自己检查,发现不对就修正,不是交差了事。
Multi-Agent(多智能体)— 多个Agent组队,各有分工。有人查资料、有人写报告、有人审核,效率更高。
Agent要用工具,工具有成百上千种,怎么统一对接?MCP(模型上下文协议)就是干这个的。它是一个标准协议,相当于"万能插头"——AI可以插上飞书、数据库、浏览器、邮件,即插即用,不用为每个工具单独写对接代码。
LLM是大脑,Agent是学会自己动手的大脑,MCP是它连接世界的插头。
几个常见词,顺便一说
AIGC— AI生成内容(文章、图片、视频、音乐、代码),LLM产出的所有东西都算AIGC。
Copilot(副驾驶)— 在旁边帮你但不替你决定的AI。补全代码、润色邮件,你是驾驶员,它只是副驾。
多模态— AI不只能处理文字,还能看图、听声音、看视频,像人类同时用眼睛和耳朵。
流式输出— AI边想边蹦字,一个字一个字往外冒,不用等全想完才显示,体验更流畅。
最后,用一句话串起来:
LLM 是大脑,Prompt 是你下的命令,RAG 是给它翻的参考书,MCP 是它连接世界的插头,Agent 是学会自己干活的它,AIGC 是它干出来的成果。
夜雨聆风