AI术语词典:让你不再对AI术语一头雾水

你听过这些AI术语却只能点头附和？是时候做出改变了。人工智能正在改变世界，同时也发明了一套全新的语言来描述它如何做到这一点。花五分钟阅读关于AI的资料，你就会遇到LLM、RAG、RLHF等十几个术语，这些术语甚至能让科技界的非常聪明的人也感到不自信。本文是我们试图解决这一问题的尝试。我们会随着领域的发展定期更新，因此它是一份活文档——就像它所描述的AI系统一样。

AGI（通用人工智能）

Artificial general intelligence，简称AGI，是一个模糊的术语。但它通常指的是在许多（甚至大多数）任务上比普通人更有能力的AI。OpenAI CEO萨姆·奥特曼曾将AGI描述为"一个你可以雇佣作为同事的普通人"。同时，OpenAI的宪章将AGI定义为"在大多数经济价值工作上超越人类的高度自主系统"。Google DeepMind的理解与这两个定义略有不同；该实验室将AGI视为"在大多数认知任务上至少与人类一样有能力的AI"。感到困惑？不必担心——前沿AI研究领域的专家们也是如此。

AI Agent（AI智能体）

AI Agent指的是使用AI技术代表你执行一系列任务的工具——超出更基本的AI聊天机器人所能做的范围——比如提交费用报销、预订机票或餐厅座位，甚至编写和维护代码。然而，正如我们之前解释过的，这个新兴领域有很多移动部件，所以"AI Agent"对不同的人可能有不同的含义。基础设施也仍在建设中，以实现其设想的能力。但基本概念意味着一个可以从多个AI系统获取信息来执行多步骤任务的自主系统。

API端点

把API端点想象成软件背面上的"按钮"，其他程序可以按下这些按钮使其执行操作。开发者使用这些接口来构建集成——例如，允许一个应用程序从另一个应用程序获取数据，或使AI Agent能够直接控制第三方服务，而无需人工手动操作每个界面。大多数智能家居设备和连接平台都有这些隐藏的按钮可用，即使普通用户从未看到或与之互动。随着AI Agent变得越来越有能力，它们越来越能够自己找到并使用这些端点，为自动化开辟了强大的——有时是意想不到的——可能性。

思维链（Chain of Thought）

对于一个简单的问题，人脑甚至不需要太多思考就能回答——比如"长颈鹿和猫哪个更高？"但在很多情况下，你可能需要纸和笔来得出正确答案，因为有中间步骤。例如，如果一个农民有鸡和牛，它们共有40个头和120条腿，你可能需要写下简单的方程来得出答案（20只鸡和20头牛）。在AI背景下，大语言模型的思维链推理意味着将问题分解为更小的中间步骤，以提高最终结果的质量。得到答案通常需要更长时间，但答案更有可能正确，特别是在逻辑或编码领域。推理模型从传统的大语言模型开发而来，由于强化学习的优化，它们针对思维链思维进行了优化。

编码智能体（Coding Agents）

这是一个比"AI Agent"更具体的概念，后者指的是一个可以自主采取行动、逐步完成目标的程序。编码智能体是应用于软件开发的专用版本。编码智能体不是简单地为一个有待人工审查和粘贴的代码提供建议，而是可以自主编写、测试和调试代码，处理那种通常消耗开发者时间的迭代性试错工作。这些智能体可以跨整个代码库工作，发现bug、运行测试并在最少的人力监督下推送修复。可以把它想象成雇佣了一个非常快速的实习生，而且从不睡觉、从不走神——不过，和任何实习生一样，仍然需要人工审核工作。

算力（Compute）

虽然是一个多义词，但算力通常指的是允许AI模型运行的重要计算能力。这种处理为AI行业提供动力，使其能够训练和部署强大的模型。这个术语通常是提供计算能力的硬件类型的简写——如GPU、CPU、TPU和其他形式的基础设施，这些构成了现代AI行业的基石。

深度学习（Deep Learning）

深度学习是自我改进的机器学习的一个子集，其中AI算法被设计成具有多层人工神经网络（ANN）结构。这使得它们能够与更简单的基于机器学习的系统（如线性模型或决策树）相比做出更复杂的关联。深度学习算法的结构灵感来自人类大脑中神经元的相互连接的通路。深度学习AI模型能够自行识别数据中的重要特征，而不是要求人类工程师定义这些特征。该结构还支持通过重复和调整的过程从错误中学习的算法，从而改善自己的输出。然而，深度学习系统需要大量数据点才能产生良好结果（数百万或更多）。与更简单的机器学习算法相比，它们的训练时间通常更长——所以开发成本往往更高。

扩散模型（Diffusion）

扩散模型是许多艺术、音乐和文本生成AI模型的核心技术。受到物理学的启发，扩散系统通过添加噪声慢慢"破坏"数据的结构——例如照片、歌曲等——直到什么都不剩。在物理学中，扩散是自发的、不可逆的——扩散在咖啡中的糖不能恢复成立方体形状。但AI中的扩散系统旨在学习一种"反向扩散"过程来恢复被破坏的数据，获得从噪声中恢复数据的能力。

知识蒸馏（Distillation）

蒸馏是一种用于从大型AI模型中提取知识的技术，使用"教师-学生"模型。开发者向教师模型发送请求并记录输出。答案有时会与数据集进行比较以查看其准确性。然后使用这些输出来训练学生模型，训练它来近似教师的行为。蒸馏可用于基于更大模型创建更小、更高效的模型，同时几乎没有蒸馏损失。这可能是OpenAI开发GPT-4 Turbo（GPT-4的更快版本）的方式。虽然所有AI公司都在内部使用蒸馏，但一些AI公司也可能使用它来追赶前沿模型。从竞争对手那里蒸馏通常违反AI API和聊天助手的服务条款。

微调（Fine-tuning）

这指的是对AI模型进行进一步训练，以优化其在比之前训练重点更具体的任务或领域的性能——通常通过输入新的、专业化的（即面向任务的）数据。许多AI初创公司以大语言模型为起点来构建商业产品，但试图通过基于自己的领域特定知识和专业知识补充早期训练周期来为目标领域或任务提升效用。

GAN（生成对抗网络）

GAN，即Generative Adversarial Network，是一种机器学习框架，在产生真实数据（包括但不限于深度伪造工具）方面支持一些重要的生成式AI进展。GAN涉及使用一对神经网络，其中一个从其训练数据中生成传递给另一个模型进行评估的输出。这两个模型本质上是编程来互相超越的。生成器试图让它的输出通过判别器，而判别器则努力发现人工生成的数据。这种结构化的竞赛可以优化AI输出使其更真实，而无需额外的干预。虽然GAN最适合更狭窄的应用（如产生真实照片或视频），而不是通用AI。

幻觉（Hallucination）

幻觉是AI行业用来描述AI模型胡编乱造的术语——即生成不正确的信息。显然，这是AI质量的一个巨大问题。幻觉会产生可能误导的GenAI输出，甚至可能导致真实生活中的风险——想想返回有害医疗建议的健康查询可能带来的危险后果。AI捏造信息的问题被认为源于训练数据中的空白。幻觉正在推动越来越专业化和/或垂直AI模型的发展——即需要更窄专业知识的领域特定AI——作为减少知识空白和缩小虚假信息风险的一种方式。

推理（Inference）

推理是运行AI模型的过程。是让模型从之前见过的数据中进行预测或得出结论。需要明确的是，没有训练就不可能有推理；模型必须先学习数据中的模式，然后才能有效地从这些训练数据中进行推断。许多类型的硬件都可以执行推理，从智能手机处理器到强大的GPU再到定制设计的AI加速器。但并非所有硬件都能同样出色地运行模型。非常大的模型在笔记本电脑上运行预测可能需要很长时间，而云服务器配备高端AI芯片则快得多。

大语言模型（Large Language Model / LLM）

大语言模型（LLM）是流行AI助手如ChatGPT、Claude、Google的Gemini、Meta的AI Llama、Microsoft Copilot或Mistral的Le Chat所使用的AI模型。当你与AI助手聊天时，你直接交互或借助网络浏览或代码解释器等不同可用工具来处理你的请求的是一个大型语言模型。LLM是由数十亿个数字参数（权重）组成的深度神经网络，这些参数学习单词和短语之间的关系，并创建一种语言表示——一种多维的单词地图。这些模型是通过对数十亿本书、文章和转录中发现模式进行编码而创建的。当你向LLM提示时，模型会生成最符合提示的模式。

记忆缓存（Memory Cache）

记忆缓存指的是一种重要的提升推理过程效率的过程。本质上，缓存是一种优化技术，旨在使推理更高效。AI显然是由高强度的数学计算驱动的，每次进行这些计算都会消耗更多电力。缓存旨在通过为未来的用户查询和操作保存特定计算来减少模型可能需要运行的计算量。有不同类型的记忆缓存，其中一种比较著名的是KV（键值）缓存。KV缓存在基于Transformer的模型中工作，通过减少生成用户问题答案所需的时间和算法劳动来提高效率，从而推动更快的结果。

神经网络（Neural Network）

神经网络指的是支撑深度学习的多层算法结构——更广泛地说，是在大型语言模型出现后整个生成式AI工具热潮的基础。虽然从人脑中获取灵感作为数据处理算法的设计结构的想法可以追溯到1940年代，但正是来自视频游戏行业的图形处理硬件（GPU）的近期崛起才真正释放了这种理论的威力。这些芯片被证明非常适合训练比早期时代更多层的算法——使基于神经网络的AI系统能够在包括语音识别、自动导航和药物发现在内的许多领域实现更好的性能。

开源（Open Source）

开源指的是软件——或者越来越多的AI模型——其底层代码是公开的，任何人都可以使用、检查或修改。在AI世界中，Meta的Llama模型系列是一个突出的例子；Linux是操作系统领域著名的历史类比。开源方法允许世界各地的研究人员、开发者和公司相互建立工作，加速进步，并使封闭系统无法轻易提供的独立安全审计成为可能。闭源意味着代码是私密的——你可以使用产品但看不到它是如何工作的，就像OpenAI的GPT模型一样——这是AI行业定义性辩论之一。

并行化（Parallelization）

并行化意味着同时做很多事情而不是一个接一个地做——就像让10名员工同时处理项目的不同部分，而不是让一名员工按顺序做所有事情。在AI中，并行化对于训练和推理都是fundamental的；现代GPU专门设计为并行执行数千次计算，这是它们成为行业硬件主干的一个重要原因。随着AI系统变得越来越复杂、模型越来越大，在多个芯片和多台机器上并行化工作的能力已成为决定模型构建和部署速度和成本效益的最重要因素之一。研究更好的并行化策略现在是一个独立的研究领域。

RAMageddon（内存危机）

RAMageddon是一个有趣的新术语，用来形容科技行业正在席卷的一场不太有趣的潮流：随机存取存储器（RAM芯片）的持续短缺，而RAM芯片为我们日常生活中使用的所有科技产品提供动力。随着AI行业的蓬勃发展，最大的科技公司和AI实验室——都在争相拥有最强大、最有效的AI——正在购买如此多的RAM来为他们的数据中心提供动力，以至于剩下的不够我们其他人用了。供应瓶颈意味着剩余的东西越来越贵。包括游戏行业（主要公司不得不因为设备更难找到内存芯片而提高游戏机价格）、消费电子产品（内存短缺可能导致十多年来最大的智能手机出货量下降）和一般企业计算（因为这些公司无法为自己的数据中心获得足够的RAM）。价格上涨预计只会停止在可怕的短缺结束之后，但不幸的是，没有真正迹象表明这种情况会很快发生。

强化学习（Reinforcement Learning）

强化学习是一种训练AI的方法，其中系统通过尝试事物并根据正确答案获得奖励来学习——就像用零食训练你心爱的宠物一样，只不过这个"宠物"是一个神经网络，而"零食"是一个表示成功的数学信号。与监督学习不同，监督学习中模型是在固定的标记示例数据集上训练的，强化学习让模型探索其环境、采取行动并根据收到的反馈不断更新其行为。这种方法已被证明对于训练AI玩游戏、控制机器人以及最近提高大语言模型的推理能力特别强大。人类反馈强化学习（RLHF）等技术现在是领先AI实验室调整其模型以更有帮助、更准确和更安全的核心方法。

Token（词元）

当涉及人机通信时，有一些明显的挑战——人们使用人类语言交流，而AI程序通过复杂的算法过程执行任务，这些过程由数据提供信息。Token弥合了这一鸿沟：它们是人机通信的基本构建块，代表由LLM处理或产生的离散数据段。它们是通过称为分词的过程创建的，该过程将原始文本分解成语言模型可以消化的小单位，类似于编译器将人类语言翻译成计算机可以理解的二进制代码。在企业环境中，Token也决定成本——大多数AI公司按Token收费，这意味着企业使用越多，支付越多。

Token吞吐量（Token Throughput）

Token是AI语言模型在处理前将语言分解成的小块——通常是单词的一部分而不是整个单词——它们大致类似于理解AI工作负载目的的"单词"。吞吐量指的是在给定时间段内可以处理多少内容，所以Token吞吐量本质上是衡量一个系统一次可以处理多少AI工作的指标。高Token吞吐量是AI基础设施团队的一个关键目标，因为它决定了模型可以同时为多少用户服务以及每个用户获得回复的速度。AI研究人员Andrej Karpathy描述过当他的AI订阅闲置时感到焦虑——呼应了他作为一名研究生时昂贵的计算机硬件没有被充分利用时的感觉——这种情绪揭示了为什么最大化Token吞吐量已成为该领域的一种痴迷。

训练（Training）

开发机器学习AI涉及一个称为训练的过程。简单来说，这指的是输入数据以便模型可以从模式中学习并产生有用的输出的过程。从本质上讲，它是系统响应数据特征的过程，使其能够调整输出以接近所寻求的目标——无论是识别猫的图像还是按需创作俳句。训练可能很昂贵，因为它需要大量输入，而且所需数量一直在上升——这就是为什么混合方法（如用目标数据微调基于规则的AI）可以帮助管理成本而不必从头开始。

迁移学习（Transfer Learning）

一种技术，使用先前训练的AI模型作为开发用于不同但通常相关任务的新模型的起点——允许在先前训练周期中获得的知识被重新应用。迁移学习可以通过快捷模型开发来推动效率节省。当目标任务的数据有限时，它也很有用。但重要的是要注意该方法的局限性。依赖迁移学习获得泛化能力的模型可能需要额外的数据训练才能在其关注领域表现良好。

权重（Weights）

权重是AI训练的核心，因为它们决定了在用于训练系统的数据中给予不同特征（或输入变量）的重要性（或权重）——从而塑造AI模型的输出。换句话说，权重是定义对于给定训练任务在数据集中最重要的是什么的数值参数。它们通过将乘法应用于输入来实现其功能。模型训练通常从随机分配的权重开始，但随着过程的展开，权重会调整，因为模型寻求得出更接近目标的输出。例如，一个用于预测目标地区房价的AI模型，在历史房地产数据上训练时，可能包含卧室和浴室数量、房产是独立式还是半独立式、是否有停车位、车库等特征的权重。最终，模型为每个这些输入分配的权重反映了基于给定数据集它们对房产价值的影响程度。

验证损失（Validation Loss）

验证损失是一个告诉你在训练过程中AI模型学习效果如何的数字——越低越好。研究人员密切跟踪它作为一种实时报告卡，用它来决定何时停止训练、何时调整超参数，或是否调查潜在问题。它帮助标记的一个关键问题是过拟合，即模型记住训练数据而不是真正学习可以泛化到新情况的模式。把它想象成理解材料的学生和只是死记硬背去年考试的学生之间的区别——验证损失有助于揭示你的模型正在成为哪一种。