文科生也可以懂的AI术语入门
当我们谈论AI时,别被那些看起来高大上的名词吓到。
开篇:为什么文科生也该懂点AI术语?
你有没有过这样的经历——朋友聊起AI时,你只能默默点头,心里却在想:“他们在说什么?”或者看到科技新闻里满屏的“Transformer”“Token”“微调”,感觉像在读天书?
其实,这些术语没那么可怕。它们就像是我们理解这个时代的“暗语”——不需要你写代码、不需要你懂数学,只需要你愿意伸把手,去触摸一下这个正在改变我们生活的工具。
更重要的是,懂得一些AI术语,能帮你更好地参与对话、做出判断,甚至保护自己。毕竟,AI正在渗透到教育、工作、创作的方方面面——你不需要成为工程师,但你需要成为一个“明白人”。
这篇文章就是为你准备的。我们不追求高深,只追求“懂了”。每个术语,我会用一两句话说清楚,再给你一个生活中的小例子。放心,都是你熟悉的生活场景。
准备好了吗?让我们开始吧。
第一章:几个最基本的概念
什么是AI?
一句话解释:让计算机像人一样思考和做事的技术。
小例子:你教一个小孩子认识猫,不是告诉他“有尖耳朵、胡须、长尾巴的是猫”,而是给他看很多猫的照片——看多了,他自然就认识了。AI也是这么“学会”的:我们不直接写死答案,而是给它足够多的例子,让它自己总结规律。这就像让机器找到了“作弊”的方法——不是我们教它每一道题怎么做,而是它自己从海量例子中发现了秘密。
什么是机器学习?
一句话解释:不直接写死答案,而是让机器自己从数据中发现规律的方法。
小例子:传统编程像是“手把手教”——你写一个公式,输入数字,它算出结果。比如算工资:基本工资+加班费=总工资。机器学习则像是“潜移默化”——你让一个AI下棋,不是告诉它每一步该怎么走,而是给它看几十万盘棋局,它自己慢慢就学会怎么赢了。AlphaGo就是这种方法教出来的“棋王”。
什么是深度学习?
一句话解释:机器学习的一种高级方法,用“多层神经网络”来处理复杂问题。
小例子:想象你看一幅画——你不是一眼就读懂全部,而是先看轮廓,再看细节,最后理解含义。深度学习就是这样工作的:它一层一层地提取信息,从简单的边缘、颜色,到复杂的形状、关系,最后“看清”整幅画。人的眼睛和大脑是这样工作的,深度学习也在模仿这个过程。
什么是神经网络?
一句话解释:模仿人脑结构设计的计算模型,由很多“节点”连接组成。
小例子:想象一个大型公司的组织架构——基层员工向组长汇报,组长向经理汇报,经理向总监汇报……信息一层层传递,最终做出决策。神经网络就是这样一个层层传递信息的系统,每个“节点”就像一个员工,负责处理一小部分信息,然后传给下一个。
什么是算法?
一句话解释:解决问题的一系列步骤指令,就像食谱一样。
小例子:做红烧肉的食谱就是算法——第一步焯水,第二步炒糖色,第三步加调料,第四步小火炖……你照着做,就能做出红烧肉。算法也是一样的:告诉计算机先做什么、再做什么、最后做什么,它就能完成任务。
第二章:聊聊大语言模型
什么是LLM?
一句话解释:经过海量文本训练,能够理解和生成人类语言的AI系统。
小例子:LLM就像一个读了全世界所有图书馆书籍的人。你问他历史,他能聊两句;你问他地理,他也能接上;你让他写诗,他还能来几句。虽然不一定每句话都完全准确,但什么问题都能聊一聊。这就是为什么ChatGPT看起来好像“什么都懂”。
什么是Prompt(提示词)?
一句话解释:你给AI下达的指令或问题,相当于“对AI说话”。
小例子:这就像你给下属布置任务。你说“把这份报告整理一下”,他可能整理得面目全非;但如果说“把这份报告整理成三页纸的摘要,重点放在数据分析和结论上”,他就知道该怎么做了。对AI说话也是同样道理——说清楚了,结果就好;说模糊了,它就可能“自由发挥”。
什么是Token?
一句话解释:AI处理文本时的最小单位,可能是单词、汉字或子词。
小例子:你读书时,眼睛一次能扫过三到五个词——而不是一个字一个字地读。AI也是这样的,它不是逐个字处理,而是一“口”一“口”地吞咽文本。每“口”就是 一个Token。AI计算费用时,就是按Token数量算的。
什么是Embedding(嵌入向量)?
一句话解释:把文字转换成AI能理解的“数字密码”的方式。
小例子:我们看到“猫”这个字,会想到一种毛茸茸的动物。但AI不懂文字,它只能懂数字。Embedding就像是给每个词发一张“数字身份证”——比如把“猫”翻译成(0.8, 0.3, -0.5)这样的坐标。而且神奇的是,意思相近的词,在数学上也会离得近——比如“猫”和“狗”的坐标就比“猫”和“汽车”更接近。
什么是Hallucination(幻觉)?
一句话解释:AI一本正经地胡说八道,看起来像真的其实是编的。
小例子:就像一个很会讲故事的人。你问他“秦始皇活了多少岁”,他可能说得头头是道,但某些细节——比如“我上次在一本书里看到……”——可能是他现编的。AI很擅长“编故事”,所以重要的事情一定要自己核实,不能全信。
什么是Temperature(温度参数)?
一句话解释:控制AI输出“保守”还是“创意”的参数。
小例子:温度=0的时候,AI就像一个保守的老人,只说最有把握的话,翻来覆去就那几句;温度=1的时候,像一个正常人,偶尔会说点新鲜的;温度=2的时候,就像喝多了酒,开始胡言乱语、语无伦次。日常使用,一般设置在0.7左右比较合适。
什么是Context Window(上下文窗口)?
一句话解释:AI一次能“记住”多少内容,超过了就会“忘记”前面的。
小例子:就像短期记忆。你和一个朋友聊天,前十分钟说的内容你还记得;但如果聊了俩小时,前面说过啥可能就忘了。AI也是这样——聊太长了,它就会“失忆”,忘记最早的话题。所以长对话有时要分段,或者把重要信息重新告诉它。
第三章:几个关键技术概念
什么是Transformer?
一句话解释:当前主流的AI模型核心技术架构,让机器理解词与词之间的关系。
小例子:读这句话时——“他把书放在了桌子上,因为它太重了”——你,知道“它”指的是书,而不是桌子。因为你理解每个词和其他词的关系。Transformer就是让AI具备这种能力的技术:它不只是读懂每个词,还能理解词与词之间的联系。
什么是Attention Mechanism(注意力机制)?
一句话解释:让AI学会“抓重点”的技术,知道该重点关注什么。
小例子:你读这段话时,会不自觉地重点看关键词——“文科生”“AI术语”“入门”,而自动忽略“的”“了”“在”这些辅助词。注意力机制就是这个原理:让AI学会把“注意力”放在重要的词上,忽略不重要的。
什么是Fine-tuning(微调)?
一句话解释:在已经训练好的模型基础上,用特定数据进一步训练。
小例子:就像一个大学生,已经学了很多基础知识——语文、数学、英语都过了及格线。现在让他专门去学法律——他不需要从幼儿园开始重新学,而是在已有基础上深入。微调就是这样:先有一个“什么都会一点”的基础模型,再用特定数据让它在某个领域更专业。
什么是RAG(检索增强生成)?
一句话解释:让AI先查资料再回答问题,减少胡说八道的技术。
小例子:这就像考试时允许查教科书。不是凭记忆硬背,而是真的去找到答案再回答。RAG就是给AI配了一个“资料库”,让它先搜索相关资料,找到正确答案再输出——这样就不容易“编故事”了。
什么是Pre-training(预训练)?
一句话解释:用海量数据训练出一个“基础大脑”的过程。
小例子:就像小孩从出生到上学前的积累。虽然没有专门参加过考试,但在这期间,他学会了说话、走路、认识事物,有了基本的理解和表达能力。预训练就是给AI打基础的过程,让它“长大成人”,具备基本的“智能”。
什么是Model Training(模型训练)?
一句话解释:用数据“教会”AI模型的过程。
小例子:就像训练小狗。你喊“坐下”,它做了,就给零食奖励;它做错了,就批评一下。反复多次,它就学会了。模型训练也是这个道理——给AI看正确答案,给它奖励;看错了,给它惩罚。慢慢 它就学会了。
什么是Inference(推理)?
一句话解释:训练好的模型“上班工作”,给出预测结果。
小例子:就像老师教完学生后,学生去考试做题目。训练是学习阶段,推理是应用阶段——学完了,该上场了。模型训练需要大量计算资源,但推理相对简单,你的手机也能跑。
什么是GPU?
一句话解释:AI训练必需的“超级计算器”,擅长并行计算。
小例子:就像用挖掘机代替铲子挖土——效率完全不一样。训练AI需要算海量数据,一般的CPU太慢了,GPU就像为AI准备的“挖掘机”,能同时处理很多计算任务。所以现在GPU成了AI时代的“硬通货”。
第四章:AI有哪些应用?
什么是Agent(智能体)?
一句话解释:能自主规划、执行任务的AI系统,不只是回答问题。
小例子:就像一个靠谱的助理。你说“帮我整理一下本周的热点新闻”,他不会只回复你一句“好的”,而是会自己查资料、做分析、整理成文档、然后发给你。整个过程你不用盯着,他自己就完成了。Agent就是这种“会干活”的AI。
什么是Copilot(副驾驶)?
一句话解释:在特定场景下辅助人类工作的AI工具。
小例子:就像副驾驶帮你看导航、提醒你注意事项。真正的驾驶还是你来做,但有人帮忙盯着,会轻松很多。Microsoft Copilot就是在你写文档、做表格时,在旁边帮你提供建议的“副驾驶”。
什么是Prompt Engineering(提示工程)?
一句话解释:如何更好地和AI说话的技术活儿。
小例子:问问题也是技术。问得好,获得好答案;问得模糊,得到模糊的回复。比如你想让AI帮你写一封求职邮件,你如果说“帮我写一封邮件”,它可能写得四不像;但如果说“帮我写一封针对产品经理岗位的求职邮件,要突出我的数据分析能力和项目管理经验,控制在500字以内”,它就能写得有模有样。
什么是AI Copilot?
一句话解释:在各软件中集成的AI辅助功能,如Word、Excel里的AI。
小例子:就像有个隐形的助手帮你干活。你写邮件时,它帮你润色;你做表格时,它帮你生成公式;你做PPT时,它帮你生成内容。你感觉不到它的存在,但它确实让工作变简单了。
什么是Multimodal(多模态)?
一句话解释:能同时处理文字、图片、声音等多种形式信息的AI。
小例子:人不仅能看书,还能看图、听声音、闻味道。多模态AI也能“眼观六路、耳听八方”——你给它一张照片,它能描述照片里有什么;你给它一段录音,它能写出文字稿。你跟它说话,它还能帮你画图。
什么是Token Limit?
一句话解释:AI单次对话能处理的最大信息量。
小例子:就像打电话有时长限制。说太久就会被切断,或者需要重新打。AI对话也是这样,一次不能聊太长,超过了上限它就“记不住”了。现在主流AI的上下文窗口在几万到上百万Token不等。
什么是API?
一句话解释:让不同软件能互相“对话”的技术通道。
小例子:就像餐厅的服务窗口。顾客(其他软件)点餐(发请求),厨房(AI服务)做好端出来(返回结果)。你不需要走进厨房,只需要通过窗口点单就行。API就是软件世界里的“窗口”。
什么是System Prompt?
一句话解释:设定AI身份和行为规范的“总指令”。
小例子:就像公司给新员工发的员工手册——告诉它是什么角色、该怎么做事。你告诉AI“你是一个专业的法律顾问,回答问题要严谨”,它就会表现得像一个专业顾问。System Prompt就是给AI定下的“规矩”。
第五章:那些你可能听过的模型
GPT是什么?
一句话解释:Generative Pre-trained Transformer,生成式预训练Transformer,OpenAI开发的模型系列。
小例子:就像汽车品牌。GPT是“特斯拉”这个系列的名字,后面跟着的数字——GPT-3、GPT-4——就像是model S、model 3一样,代表不同版本。
ChatGPT是什么?
一句话解释:OpenAI推出的对话AI产品,让AI能像人一样聊天。
小例子:就像智能客服。但比普通客服懂得多得多——你问什么,它都能接上话。虽然偶尔会“胡扯”,但整体体验很像在和一个知识渊博的朋友聊天。
Claude、Gemini、Llama是什么?
一句话解释:不同公司开发的AI模型名字。
小例子:就像手机品牌——有iPhone、三星、小米一样。Claude是Anthropic公司的,Gemini是Google的,Llama是Meta的开源模型。每个都有自己的特点和擅长领域。
什么是Base Model(基础模型)?
一句话解释:未经微调的“毛坯”模型,有能力但不够专业。
小例子:就像刚毕业的大学生,找工作时“有基础知识但没有专业技能”。基础模型什么都懂一点,但不够精。微调就是让这个大学生去专门学一门手艺,变成专业人才。
什么是Instruction Tuning(指令微调)?
一句话解释:用“问答对”数据让模型学会“听指令”。
小例子:就像训练宠物听命令。问“坐下”,它就坐下;问“握手”,它就伸手。指令微调就是让AI学会准确地响应人类的各种指令。
第六章:评估与安全
什么是Benchmark?
一句话解释:用来衡量AI性能的标准化考试。
小例子:就像高考——用统一的题目比较各学校的教学质量。AI领域也有各种benchmark,比如让所有AI做同一套数学题,看谁得分高。
什么是Alignment(对齐)?
一句话解释:让AI的输出符合人类价值观和期望。
小例子:就像教育小孩。不仅仅是聪明就够了,还要有礼貌、遵纪守法、知道什么该做什么不该做。对齐就是让AI不仅仅“能干活”,还要“干正确的活”。
什么是Bias(偏见)?
一句话解释:AI在训练数据中学到的错误倾向。
小例子:就像如果只让小孩看一种类型的书,他可能觉得世界就是这样——比如只给他看王子拯救公主的故事,他可能认为世界就是这样。AI也可能“一叶障目”,从片面的数据中学到偏颇的观点。
什么是Safety(安全)?
一句话解释:确保AI不输出有害内容的保护机制。
小例子:就像给AI装上“道德刹车”。虽然它有能力,但知道什么不能说、什么不能做。比如你问它“如何制造炸弹”,负责任的AI会拒绝回答。
第七章:OpenClaw相关概念
本章介绍OpenClaw这一AI协作框架的核心概念。OpenClaw就像一个“AI团队管理系统”——它能让多个AI Agent协同工作,通过不同的通道(Channel)与用户对话,并利用各种工具(Tool)完成任务。
什么是Agent?
一句话解释:OpenClaw中的核心执行单元,能自主理解指令、调用工具、完成任务的AI实体。
小例子:就像公司里的“员工”——有明确职责,能独立完成任务,也可以和其他Agent协同工作。一个负责搜索,一个负责写作,一个负责发布——各司其职又相互配合。
什么是Session?
一句话解释:一次完整的对话上下文,包含多轮交互的历史记录。
小例子:就像一次“电话粥”——从接通到挂断之间的所有对话内容都被记录下来。即使聊了一小时后再问一句“你刚才说的那个”,Agent也能理解你在问什么。
什么是Channel?
一句话解释:AI与用户通信的渠道,如飞书、Telegram、微信等。
小例子:就像“接线员”——负责把用户的消息传给AI,再把AI的回复传回给用户。你在飞书上发消息,和在微信上发消息,用的是不同的Channel,但背后的Agent可能是同一个。
什么是Workspace?
一句话解释:每个Agent专属的文件存储和运行环境目录。
小例子:就像每个员工的“独立办公室”——有自己的文件柜和办公桌,互不干扰。Agent A处理的文件不会乱跑到Agent B的桌面上。
什么是Runtime?
一句话解释:OpenClaw Gateway启动后的运行状态,负责处理所有请求和任务。
小例子:就像公司的“营业时间”——门打开后,能接待客户、处理事务。Gateway启动后,OpenClaw就进入了Runtime状态,随时待命。
什么是Skill?
一句话解释:预定义的工具使用规范,告诉Agent如何调用特定工具完成任务。
小例子:就像“操作手册”——教会员工怎么用打印机、怎么发邮件。Skill定义了Agent“做什么”和“怎么做”的规则。
什么是Tool?
一句话解释:Agent可以调用的外部功能,如浏览器、文件读写、发送消息等。
小例子:就像“瑞士军刀”——Agent的工具箱里有各种功能:能读文件、能上网搜索、能发消息。遇到不同任务,就用不同的工具。
什么是Memory?
一句话解释:Agent存储和检索历史信息的能力,包括短期记忆(会话内)和长期记忆(跨会话)。
小例子:就像人的“记忆系统”——有瞬时记忆(当前对话里你说过什么)和长期记忆(记住你的名字和偏好)。下次再聊时,Agent还记得你上次聊过什么。
什么是Plugin?
一句话解释:扩展OpenClaw功能的模块,可以包含自定义工具和技能。
小例子:就像手机App——给手机添加新功能的扩展程序。一个新的Plugin可能给OpenClaw增加“支持微信消息”或“连接新数据库”的能力。
什么是Subagent?
一句话解释:由主Agent派生的独立Agent,用于处理特定子任务。
小例子:就像部门经理把任务交给专员去做——主Agent分配任务,说“你去查资料”,子Agent就去执行,完成后汇报结果。
什么是Gateway?
一句话解释:OpenClaw的核心服务进程,负责协调Agent、Channel和工具之间的通信。
小例子:就像公司的“前台+调度中心”——接收所有外部请求,理解要做什么,然后分发给合适的Agent处理。
什么是Node?
一句话解释:连接到Gateway的远程设备,可以是Mac、Windows或Linux机器。
小例子:就像“分公司”——不在总部但能执行任务、获取资源的远程工作站。你可能在家里的Mac上部署一个Node,在公司的Windows上部署另一个。
什么是Sandbox?
一句话解释:隔离的安全执行环境,用于运行不可信的代码或工具。
小例子:就像“防爆箱”——即使里面东西爆炸,也不会伤到外面的人。运行来路不明的代码时,先放到Sandbox里,确保安全。
什么是Channel Provider?
一句话解释:为特定平台(如飞书、Telegram)提供消息收发能力的插件。
小例子:就像“快递公司”——负责把消息送到不同的“目的地”。飞书Provider负责飞书上的消息,微信Provider负责微信上的消息。
什么是openclaw.json?
一句话解释:OpenClaw的主配置文件,定义Agent行为、技能、通道等设置。
小例子:就像公司的“规章制度”——告诉系统该怎么运行、启用哪些功能、哪些Agent负责什么任务。
什么是SKILL.md?
一句话解释:定义一个Skill的元数据和使用说明的Markdown文件。
小例子:就像技能的“身份证”——写明这个技能叫什么名字、做什么事情、怎么使用它。一个好的SKILL.md能让Agent准确理解何时该用这个技能。
什么是ClawHub?
一句话解释:OpenClaw官方维护的公共技能库,可以安装共享的Skills。
小例子:就像“应用商店”——可以下载安装各种现成的技能包。想要让你的Agent支持天气查询?去ClawHub下一个Weather Skill就行。
什么是Skill Precedence?
一句话解释:当多个位置存在同名Skill时的加载优先级规则。
小例子:就像“就近原则”——工作台上的文件优先于柜子里的,柜子里的优先于仓库里的。本地定义的Skill会覆盖从ClawHub下载的同名Skill。
什么是Message?
一句话解释:用户与Agent之间传递的内容单元,可以是文本、图片、文件等。
小例子:就像“信件”——通信的基本单位,可以有不同格式和附件。你发的每一条消息,在OpenClaw里都是一个Message对象。
什么是Exec?
一句话解释:在主机上执行Shell命令的工具,支持后台运行和TTY交互。
小例子:就像“终端”——可以在系统层面执行任何命令行操作。Agent需要运行Python脚本、调用git命令,或者查询数据库时,都靠Exec。
结尾:术语不是障碍,思维才是
恭喜你,读到了这里。
你可能发现,这些所谓的“术语”,其实并没有那么可怕。它们只是一些描述复杂现象的“简称”。就像我们日常聊天时会说“内卷”“躺平”一样——AI领域也有自己的“黑话”。
重要的是,你愿不愿意伸出手,去触摸一下这些新东西。
作为一个文科生,你有自己的优势:你懂得人、懂得社会、懂得文化、懂得美学。这些东西,AI暂时还学不太会。而AI作为一种工具,它可以放大你的能力,让你的创作、你的研究、你的工作变得更高效。
而如果你想更进一步——不仅会用AI,还能像我们一样,用OpenClaw这样的框架来“管理”AI团队,那这些OpenClaw术语就是你的下一站。从Agent到Skill,从Gateway到Subagent,这些概念将帮助你理解如何让多个AI协同工作、如何扩展它的能力边界。
所以,别被那些名词吓到。它们不是障碍,不想去理解才是。
从今天起,当有人再聊起AI的时候,你可以不再是那个“默默点头”的人。你可以问一句:“你说的'幻觉'是指AI会编故事吗?”——然后微微一笑。
你已经在路上了。
P.S. 昨天的文章,有朋友反馈:“还是有不少文科生不懂的专业术语
还是需要对这些有点了解才能看得更深入。”因此,“老易与四虾居”团队马上开干,有了今天这篇文章,以后大家就把这篇文章当字典来查阅哟
📢 关于我们
本文由**「老易在」小龙虾团队——老易与四虾居**辅助创作而成。
如果你对 AI话题感兴趣,欢迎关注我们,一起探索“养小龙虾”的乐趣!
“老易与四虾居”的四名成员:司理、采微、染翰、丹青
夜雨聆风