LLM(Large Language Model,大语言模型):基于海量文本数据训练的语言预测模型,是当前AI能力的核心载体,GPT、Claude、Gemini均属于大语言模型。
GPT(Generative Pre-trained Transformer,生成式预训练Transformer):OpenAI开创的模型架构范式,也是其产品系列的名称。
Token(词元):模型处理文本的最小单位,约等于3/4个英文单词,是大模型计费、上下文容量的基础计量单位。
Context Window(上下文窗口):模型单次推理能“读取并记住”的最大Token数量,窗口越大,能承载的历史信息和知识就越多。
Inference(推理):模型接收输入并生成输出结果的过程,与模型训练相对应。
Hallucination(幻觉):模型看似逻辑自洽,实则编造出不符合事实、不存在的信息,是大模型的核心问题之一。
Temperature(温度):控制模型输出随机性的参数,数值越高输出越发散、越有创意,数值越低输出越稳定、越严谨;写代码场景通常建议调低温度。
Top-p / Top-k(采样参数):控制模型候选词采样范围的参数,直接影响输出内容的多样性。
Embedding(向量嵌入):将文本、图像等信息转化为数字向量,用于计算相似度,是检索增强生成(RAG)的技术基础。
Fine-tuning(微调):在通用大模型基础上,用特定领域数据继续训练,让模型更适配垂直场景。
RLHF(基于人类反馈的强化学习):通过人类偏好数据对模型进行强化学习,让模型行为对齐人类意图,通俗说就是让AI“更听话”。
MoE(Mixture of Experts,混合专家):一种模型架构,每次推理只激活部分参数(专家),用更低算力实现更强的模型能力。
Multimodal(多模态):模型可同时处理文本、图像、音频、视频等多种类型的信息,GPT-4o、Gemini均为多模态模型。
Transformer(Transformer架构):现代大语言模型的底层神经网络结构,核心是自注意力机制。
KV Cache(键值缓存):缓存上下文的计算结果,避免重复计算,大幅提升推理速度,类似做菜时提前备好半成品,不用每次从头切配。
Latency(延迟):模型从接收请求到返回结果的耗时,直接影响用户体验。
Throughput(吞吐量):模型单位时间内能处理的任务数量,决定了系统的并发承载能力。
Claude Code(cc):Anthropic官方推出的终端Agent,是Harness范式的典型代表
Codex CLI:OpenAI官方命令行编码Agent
Aider:开源命令行AI结对编程工具
OpenHands:开源自主软件开发Agent,支持完整工程级任务执行
Cursor:内置AI的代码编辑器,是Vibe Coding的主流工具
Windsurf:Codeium出品的AI原生IDE
Qoder:国内面向AI编程的智能开发环境,主打Agent能力、项目理解与代码生成
Trae:字节跳动推出的新一代AI编程工具,支持对话式开发与工程级协作
GitHub Copilot:最早普及的AI编程插件,以代码补全辅助为主
Cline / Roo Code:VS Code中的开源自主编码Agent插件
Continue:可自定义模型的开源AI代码助手插件
ZCode:Z.ai推出的智能编程产品,支持代码生成、理解、重构与工程协同
Devin:Cognition推出的“首个AI软件工程师”,主打端到端全自主开发
Bolt:快速生成完整应用,偏向产品快速落地
Lovable:通过自然语言生成Web应用,强调产品级交付体验
Eval(评估):通过标准化测试集衡量模型与Agent的能力水平,验证效果是否达标。
Alignment(对齐):让AI的行为、输出符合人类的意图与价值观,避免AI“跑偏”。
Guardrail(护栏):限制AI输出范围与操作边界的安全机制,防止违规内容与危险操作。
Red Teaming(红队测试):主动以攻击、诱导的方式测试AI,发现安全漏洞与缺陷。
Prompt Injection(提示词注入):通过恶意输入篡改AI指令,劫持AI行为,最典型的就是“忽略以上所有指令”。
Context Poisoning(上下文污染):向上下文中掺入恶意信息,误导Agent做出错误判断。
Sandbox(沙箱):隔离的执行环境,将Agent的操作限制在封闭环境内,防止破坏真实系统。
夜雨聆风