AI火这么久,这54个AI 产品术语你能看懂吗?

AI 产品术语表

这份术语表用于帮助读者快速理解 AI 产品常见概念。

它不是技术百科，而是面向产品经理、业务负责人和 AI 学习者的解释。每个术语都尽量回答三个问题：

1.
它是什么；
2.
对产品有什么意义；
3.
产品经理要注意什么。

大模型基础术语

大模型

大模型是一类通过大量数据训练出来，能够理解和生成文本、代码、图片、语音等内容的 AI 基础能力。

产品意义：

它不是一个具体产品，而是很多 AI 产品背后的能力底座。

产品经理要注意：

大模型有能力边界，会幻觉、会遗忘上下文、会受成本和延迟影响。

LLM

LLM 是 Large Language Model，大语言模型。

产品意义：

很多文本生成、问答、总结、推理、工具调用类产品都基于 LLM。

产品经理要注意：

不要把 LLM 等同于完整 AI 产品。产品还需要数据、工具、交互、评估和运营。

Token

Token 是模型处理文本时的基本单位，可以理解成被模型切分后的文字片段。

产品意义：

Token 影响成本、上下文长度和响应速度。

产品经理要注意：

长文档、长对话、复杂上下文都会增加 token 成本。

上下文窗口

上下文窗口是模型一次能处理的信息范围。

产品意义：

它决定模型能同时看到多少历史对话、文档内容和任务说明。

产品经理要注意：

上下文窗口再大，也不等于无限记忆。要设计信息选择和上下文压缩。

幻觉

幻觉是指模型生成看似合理但不真实、不准确或没有依据的内容。

产品意义：

幻觉会影响用户信任，尤其在医疗、法律、金融、企业政策等场景风险更高。

产品经理要注意：

可以用 RAG、引用来源、评估、人工确认和风险提示降低幻觉，但不能完全消除。

微调

微调是在已有模型基础上，用特定数据进一步训练模型，让它更适应某类任务或风格。

产品意义：

适合稳定输出风格、特定任务格式或垂直领域行为。

产品经理要注意：

不要把微调当成所有问题的答案。知识更新、事实查询和企业私有资料通常更适合 RAG。

Embedding

Embedding 是把文本、图片等内容转换成向量表示，用于计算语义相似度。

产品意义：

它是向量检索和 RAG 的基础能力之一。

产品经理要注意：

Embedding 质量会影响检索结果，但检索质量还取决于切分、清洗、重排序和评估。

向量数据库

向量数据库用于存储和检索向量，帮助系统找到语义相近的内容。

产品意义：

常用于知识库问答、相似案例推荐、语义搜索。

产品经理要注意：

向量数据库不是知识库产品本身。还需要文档治理、权限、引用、评估和反馈。

Prompt 相关术语

Prompt

Prompt 是给模型的任务指令和上下文。

产品意义：

它决定模型在某次任务中如何理解目标、使用资料和输出结果。

产品经理要注意：

Prompt 不是咒语，而是任务设计。复杂产品不能只靠 Prompt 保证稳定。

System Prompt

System Prompt 是系统层指令，用于设定模型的角色、行为边界和长期规则。

产品意义：

它适合放产品级规则，例如角色定位、禁止事项、输出原则。

产品经理要注意：

不要把所有业务规则都塞进用户输入。稳定规则应该由系统管理和版本化。

Few-shot

Few-shot 是在 Prompt 中提供少量示例，让模型模仿示例完成任务。

产品意义：

适合提升格式稳定性和任务理解。

产品经理要注意：

示例质量会强烈影响输出质量。示例要覆盖典型场景和边界场景。

结构化输出

结构化输出是让模型按固定格式返回结果，例如表格、JSON、字段列表。

产品意义：

它能让 AI 输出进入下一步系统流程。

产品经理要注意：

如果输出要被系统读取，格式必须严格，并要处理异常输出。

上下文工程

上下文工程是为模型选择、组织、压缩和传递合适上下文的过程。

产品意义：

它决定模型在回答或执行任务时能看到什么信息。

产品经理要注意：

上下文不是越多越好，要选择对当前任务真正有用的信息。

RAG 相关术语

RAG

RAG 是 Retrieval-Augmented Generation，检索增强生成。

产品意义：

它让模型在回答前先检索外部知识，再基于资料生成答案。

产品经理要注意：

RAG 的关键不是上传文档，而是知识治理、检索质量、引用溯源和持续评估。

检索

检索是从知识库中找到与用户问题相关的资料。

产品意义：

检索结果决定模型能不能拿到正确依据。

产品经理要注意：

检索失败会导致答案错误，即使模型本身很强。

关键词检索

关键词检索是根据用户问题中的词语，在文档中查找字面匹配内容。

产品意义：

适合查找专有名词、错误码、订单号、合同编号、API 字段、政策条款等需要精确匹配的内容。

产品经理要注意：

关键词检索不擅长理解同义表达和隐含语义，通常需要和向量检索结合使用。

向量检索

向量检索是把问题和文档转换成向量，再根据语义相似度查找相关内容。

产品意义：

适合处理同义表达、口语化提问、概念相似和长文本语义召回。

产品经理要注意：

向量检索可能漏掉精确词，比如型号、字段名、代码、数字、错误码。它不是关键词检索的完全替代。

混合检索

混合检索是把关键词检索和向量检索结合起来，一起召回和排序资料。

产品意义：

它同时利用关键词检索的精确匹配能力和向量检索的语义理解能力，适合企业知识库、技术文档、客服问答和复杂 RAG 场景。

产品经理要注意：

混合检索不是默认更好，效果取决于用户问题类型、资料结构、权重设置、重排序和评估集。参考：混合检索是什么。

Chunk

Chunk 是文档被切分后的片段。

产品意义：

RAG 通常检索的是 chunk，而不是整篇文档。

产品经理要注意：

切分方式会影响语义完整性。不能只按固定长度粗暴切分。

重排序

重排序是对初步检索结果再次排序，把更相关的内容排到前面。

产品意义：

它能提高进入上下文的资料质量。

产品经理要注意：

重排序会增加成本和延迟，需要结合场景取舍。

引用溯源

引用溯源是让答案标明来自哪份文档、哪一段资料。

产品意义：

它能提升可信度，也方便用户核查。

产品经理要注意：

引用必须真正支持答案，不能只给一个看似相关的链接。

Groundedness

Groundedness 指答案是否基于给定资料。

产品意义：

用于判断模型有没有脱离资料自由发挥。

产品经理要注意：

RAG 评估不能只看答案像不像，还要看答案是否忠于资料。

工具调用与 MCP 术语

Function Calling

Function Calling 是让模型按定义好的函数或工具格式输出调用参数，由系统执行外部操作。

产品意义：

它让 AI 从回答问题走向调用系统。

产品经理要注意：

工具调用必须设计参数、权限、失败处理和确认机制。

Tool

Tool 是模型可以调用的外部能力，例如搜索、查订单、发消息、创建任务。

产品意义：

工具决定 AI 能做什么。

产品经理要注意：

工具描述、参数设计和权限边界会影响 Agent 质量。

Schema

Schema 是工具输入输出的数据结构定义。

产品意义：

它让模型知道调用工具时需要哪些参数。

产品经理要注意：

Schema 要清晰、稳定、少歧义，并覆盖必填字段和异常情况。

MCP

MCP 是 Model Context Protocol，模型上下文协议。

产品意义：

它提供了一种连接模型、数据源和工具的标准方式。

产品经理要注意：

MCP 适合连接实时系统、外部工具和权限敏感数据，但不是 RAG 的替代品。

Workflow 术语

Workflow

Workflow 是按固定步骤、规则和节点执行的工作流。

产品意义：

适合可控、可解释、步骤稳定的 AI 自动化。

产品经理要注意：

很多场景用 Workflow 比 Agent 更稳。

节点

节点是工作流中的一个步骤，例如输入、判断、生成、审批、执行。

产品意义：

节点化可以让复杂任务可视化和可管理。

产品经理要注意：

每个节点都要有输入、输出和失败处理。

人在回路

人在回路是指关键节点需要人确认、审核或接管。

产品意义：

它能降低高风险 AI 自动化的错误成本。

产品经理要注意：

不是所有事情都应该全自动。涉及钱、权限、法律、客户承诺时要谨慎。

Agent 术语

Agent

Agent 是能围绕目标理解任务、规划步骤、调用工具并根据反馈继续执行的 AI 系统。

产品意义：

Agent 的核心不是聊天，而是完成任务。

产品经理要注意：

Agent 带来更强能力，也带来更高不确定性。

单 Agent

单 Agent 是一个智能体负责完成一个任务链路。

产品意义：

适合目标清晰、工具有限、风险可控的任务。

产品经理要注意：

单 Agent 是很多 Agent 产品的合理起点。

多 Agent

多 Agent 是多个智能体分工协作完成任务。

产品意义：

适合复杂任务、交叉验证、角色分工和多系统协作。

产品经理要注意：

多 Agent 会增加成本、延迟、评估和权限复杂度。

Agent Team

Agent Team 是有组织结构和协作协议的智能体团队。

产品意义：

适合更复杂的企业任务和跨系统协作。

产品经理要注意：

必须设计职责、通信、冲突处理、最终责任和评估机制。

规划

规划是 Agent 把目标拆成步骤的过程。

产品意义：

规划能力决定 Agent 能否处理复杂任务。

产品经理要注意：

规划不一定正确，需要日志、检查点和人工确认。

记忆

记忆是 Agent 保存用户偏好、历史任务或长期上下文的能力。

产品意义：

记忆可以提升个性化和连续任务体验。

产品经理要注意：

记忆涉及隐私、权限、可删除和可解释问题。

Skill / Harness 术语

Skill

Skill 是可复用、可版本化、按需加载的任务能力包。

产品意义：

它把 Prompt、流程、脚本、资料和工具说明封装成可复用能力。

产品经理要注意：

Skill 适合沉淀高频任务，而不是每次重新写 Prompt。

Harness

Harness 是 Agent 的运行和治理环境。

产品意义：

它负责执行循环、工具调用、权限、日志、评估和可观测性。

产品经理要注意：

Agent 从 Demo 到生产，必须考虑 Harness 类能力。

Agent Harness

Agent Harness 是包在模型外面的运行系统，通常包括工具、记忆、状态、执行环境、权限、guardrails、日志、评估和可观测性。

产品意义：

它让 Agent 不只是“会回答”，而是能在受控环境中执行任务。

产品经理要注意：

不要只设计 Agent 会做什么，还要设计 Agent 被允许做什么、不被允许做什么、如何记录、如何停止、如何回滚。

Harness Engineering

Harness Engineering 是为 Agent 设计可控、可观测、可评估、可回滚运行环境的工程和产品设计方法。

产品意义：

它解决的是 Agent 从 Demo 走向生产时的约束和治理问题。

产品经理要注意：

Harness Engineering 里的约束不是 Prompt 提醒，而是工具权限、文件范围、人工确认、成本上限、失败停止、日志和测试等系统边界。

Tracing

Tracing 是记录 AI 执行过程的轨迹，包括模型调用、工具调用、中间结果和最终输出。

产品意义：

它帮助团队调试、评估和监控 Agent。

产品经理要注意：

没有 tracing，很难知道 Agent 为什么做错。

Guardrails

Guardrails 是对 AI 输出和行为的保护机制，可以包括内容安全、格式校验、权限限制、工具调用限制和人工确认。

产品意义：

它帮助 AI 产品降低越权、错误执行、敏感信息泄露和高风险输出。

产品经理要注意：

Guardrails 不能只靠一句 Prompt，应该结合规则、权限、评估、工具边界和日志。

AI 编程与 Agentic 工程术语

Vibe Coding

Vibe Coding 是用自然语言驱动 AI 生成代码、快速做出可运行作品或原型的方式。

产品意义：

它降低了从想法到作品的门槛，适合产品原型、个人工具、落地页、小型 Demo 和超级个体最小作品。

产品经理要注意：

Vibe Coding 适合验证想法，不等于生产级工程。能跑不代表可维护、可测试、可交付。

Agentic Coding

Agentic Coding 是让 AI Coding Agent 参与更完整的软件开发任务，例如理解需求、阅读代码库、修改文件、运行测试、修复错误和提交结果。

产品意义：

它让 AI 从代码补全工具变成工程协作者。

产品经理要注意：

Agentic Coding 需要清晰任务、上下文、验收标准、测试和权限边界。

Agentic Engineering

Agentic Engineering 是用 AI Agent 参与工程全流程，同时由人定义目标、约束、验收标准和最终责任的工程协作方式。

产品意义：

它帮助团队把 AI 从原型生成带入真实交付流程。

产品经理要注意：

Agentic Engineering 的重点不是“让 AI 全自动”，而是设计人、Agent、工具、测试和审查之间的协作秩序。

约束

约束是限制 AI 或 Agent 行为边界的规则和系统机制。

产品意义：

约束让 AI 的能力可控、可信、可复用。

产品经理要注意：

Prompt 约束只是行为提醒，Harness 约束才是环境控制。例如 Agent 没有删除权限，比告诉它“不要删除文件”更可靠。

AI 产品评估术语

Eval

Eval 是对 AI 输出或行为进行评估的方法。

产品意义：

它让团队知道 AI 产品是否真的变好。

产品经理要注意：

Eval 要结合真实场景，不要只用几条人工感觉不错的问题。

测试集

测试集是一组用于评估 AI 产品的问题、任务或案例。

产品意义：

它帮助团队稳定比较不同版本效果。

产品经理要注意：

测试集要包含正常问题、边界问题和高风险问题。

Bad Case

Bad Case 是 AI 产品表现不好的具体案例。

产品意义：

它是迭代 AI 产品的重要输入。

产品经理要注意：

Bad Case 要分类，不要只记录“回答不好”。

离线评估

离线评估是在上线前或非实时环境中，用测试集评估模型或系统表现。

产品意义：

适合版本对比和上线前验证。

产品经理要注意：

离线评估不能完全代表真实用户环境。

在线评估

在线评估是在真实用户使用中观察效果。

产品意义：

能反映真实行为、满意度和业务结果。

产品经理要注意：

要注意灰度、风险控制和用户反馈收集。

商业化术语

ROI

ROI 是投入产出比。

产品意义：

AI 产品最终要证明业务价值，而不只是展示能力。

产品经理要注意：

ROI 要同时看模型成本、人工成本、维护成本和业务收益。

模型成本

模型成本是调用模型产生的费用，通常和 token、模型类型、调用次数有关。

产品意义：

成本会影响定价、毛利和功能设计。

产品经理要注意：

不要只算单次调用成本，还要算重试、长上下文、工具调用和人工审核。

推理延迟

推理延迟是模型生成结果所需时间。

产品意义：

它直接影响用户体验。

产品经理要注意：

复杂 Agent、多步 RAG、多工具调用都会增加延迟。

人工接管率

人工接管率是 AI 无法完成任务后转给人工的比例。

产品意义：

在客服、销售、审批等场景中，它是衡量 AI 可用性的重要指标。

产品经理要注意：

人工接管不是失败，而是高风险场景中的必要兜底。

小结

AI 产品术语很多，但产品经理不需要把它们背成技术名词。

更重要的是理解：

1.
这个概念解决什么问题；
2.
它影响产品哪一部分；
3.
它带来什么风险；
4.
它如何进入真实业务流程。

真正掌握术语，不是能解释定义，而是能用它们做产品判断。

本文资料基础

参考资料：

1.
OpenAI: Tools guide, https://platform.openai.com/docs/guides/tools?api-mode=responses
2.
OpenAI: File Search, https://platform.openai.com/docs/guides/tools-file-search/
3.
Anthropic: Model Context Protocol, https://docs.anthropic.com/en/docs/mcp
4.
Anthropic: Building effective agents, https://www.anthropic.com/engineering/building-effective-agents
5.
LlamaIndex: Introduction to RAG, https://docs.llamaindex.ai/en/stable/understanding/rag/
6.
Ragas Metrics, https://docs.ragas.io/en/stable/concepts/metrics/available_metrics/
7.
Weaviate: Hybrid search, https://docs.weaviate.io/weaviate/concepts/search/hybrid-search
8.
Pinecone: Hybrid search, https://docs.pinecone.io/guides/search/hybrid-search
9.
MongoDB: The Agent Harness, https://www.mongodb.com/company/blog/technical/agent-harness-why-llm-is-smallest-part-of-your-agent-system
10.
Andrej Karpathy: Sequoia Ascent 2026, https://karpathy.bearblog.dev/sequoia-ascent-2026/