AI 产品术语表
这份术语表用于帮助读者快速理解 AI 产品常见概念。
它不是技术百科,而是面向产品经理、业务负责人和 AI 学习者的解释。每个术语都尽量回答三个问题:
- 1.
它是什么;
- 2.
对产品有什么意义;
- 3.
产品经理要注意什么。
大模型基础术语
大模型
大模型是一类通过大量数据训练出来,能够理解和生成文本、代码、图片、语音等内容的 AI 基础能力。
产品意义:
它不是一个具体产品,而是很多 AI 产品背后的能力底座。
产品经理要注意:
大模型有能力边界,会幻觉、会遗忘上下文、会受成本和延迟影响。
LLM
LLM 是 Large Language Model,大语言模型。
产品意义:
很多文本生成、问答、总结、推理、工具调用类产品都基于 LLM。
产品经理要注意:
不要把 LLM 等同于完整 AI 产品。产品还需要数据、工具、交互、评估和运营。
Token
Token 是模型处理文本时的基本单位,可以理解成被模型切分后的文字片段。
产品意义:
Token 影响成本、上下文长度和响应速度。
产品经理要注意:
长文档、长对话、复杂上下文都会增加 token 成本。
上下文窗口
上下文窗口是模型一次能处理的信息范围。
产品意义:
它决定模型能同时看到多少历史对话、文档内容和任务说明。
产品经理要注意:
上下文窗口再大,也不等于无限记忆。要设计信息选择和上下文压缩。
幻觉
幻觉是指模型生成看似合理但不真实、不准确或没有依据的内容。
产品意义:
幻觉会影响用户信任,尤其在医疗、法律、金融、企业政策等场景风险更高。
产品经理要注意:
可以用 RAG、引用来源、评估、人工确认和风险提示降低幻觉,但不能完全消除。
微调
微调是在已有模型基础上,用特定数据进一步训练模型,让它更适应某类任务或风格。
产品意义:
适合稳定输出风格、特定任务格式或垂直领域行为。
产品经理要注意:
不要把微调当成所有问题的答案。知识更新、事实查询和企业私有资料通常更适合 RAG。
Embedding
Embedding 是把文本、图片等内容转换成向量表示,用于计算语义相似度。
产品意义:
它是向量检索和 RAG 的基础能力之一。
产品经理要注意:
Embedding 质量会影响检索结果,但检索质量还取决于切分、清洗、重排序和评估。
向量数据库
向量数据库用于存储和检索向量,帮助系统找到语义相近的内容。
产品意义:
常用于知识库问答、相似案例推荐、语义搜索。
产品经理要注意:
向量数据库不是知识库产品本身。还需要文档治理、权限、引用、评估和反馈。
Prompt 相关术语
Prompt
Prompt 是给模型的任务指令和上下文。
产品意义:
它决定模型在某次任务中如何理解目标、使用资料和输出结果。
产品经理要注意:
Prompt 不是咒语,而是任务设计。复杂产品不能只靠 Prompt 保证稳定。
System Prompt
System Prompt 是系统层指令,用于设定模型的角色、行为边界和长期规则。
产品意义:
它适合放产品级规则,例如角色定位、禁止事项、输出原则。
产品经理要注意:
不要把所有业务规则都塞进用户输入。稳定规则应该由系统管理和版本化。
Few-shot
Few-shot 是在 Prompt 中提供少量示例,让模型模仿示例完成任务。
产品意义:
适合提升格式稳定性和任务理解。
产品经理要注意:
示例质量会强烈影响输出质量。示例要覆盖典型场景和边界场景。
结构化输出
结构化输出是让模型按固定格式返回结果,例如表格、JSON、字段列表。
产品意义:
它能让 AI 输出进入下一步系统流程。
产品经理要注意:
如果输出要被系统读取,格式必须严格,并要处理异常输出。
上下文工程
上下文工程是为模型选择、组织、压缩和传递合适上下文的过程。
产品意义:
它决定模型在回答或执行任务时能看到什么信息。
产品经理要注意:
上下文不是越多越好,要选择对当前任务真正有用的信息。
RAG 相关术语
RAG
RAG 是 Retrieval-Augmented Generation,检索增强生成。
产品意义:
它让模型在回答前先检索外部知识,再基于资料生成答案。
产品经理要注意:
RAG 的关键不是上传文档,而是知识治理、检索质量、引用溯源和持续评估。
检索
检索是从知识库中找到与用户问题相关的资料。
产品意义:
检索结果决定模型能不能拿到正确依据。
产品经理要注意:
检索失败会导致答案错误,即使模型本身很强。
关键词检索
关键词检索是根据用户问题中的词语,在文档中查找字面匹配内容。
产品意义:
适合查找专有名词、错误码、订单号、合同编号、API 字段、政策条款等需要精确匹配的内容。
产品经理要注意:
关键词检索不擅长理解同义表达和隐含语义,通常需要和向量检索结合使用。
向量检索
向量检索是把问题和文档转换成向量,再根据语义相似度查找相关内容。
产品意义:
适合处理同义表达、口语化提问、概念相似和长文本语义召回。
产品经理要注意:
向量检索可能漏掉精确词,比如型号、字段名、代码、数字、错误码。它不是关键词检索的完全替代。
混合检索
混合检索是把关键词检索和向量检索结合起来,一起召回和排序资料。
产品意义:
它同时利用关键词检索的精确匹配能力和向量检索的语义理解能力,适合企业知识库、技术文档、客服问答和复杂 RAG 场景。
产品经理要注意:
混合检索不是默认更好,效果取决于用户问题类型、资料结构、权重设置、重排序和评估集。参考:混合检索是什么。
Chunk
Chunk 是文档被切分后的片段。
产品意义:
RAG 通常检索的是 chunk,而不是整篇文档。
产品经理要注意:
切分方式会影响语义完整性。不能只按固定长度粗暴切分。
重排序
重排序是对初步检索结果再次排序,把更相关的内容排到前面。
产品意义:
它能提高进入上下文的资料质量。
产品经理要注意:
重排序会增加成本和延迟,需要结合场景取舍。
引用溯源
引用溯源是让答案标明来自哪份文档、哪一段资料。
产品意义:
它能提升可信度,也方便用户核查。
产品经理要注意:
引用必须真正支持答案,不能只给一个看似相关的链接。
Groundedness
Groundedness 指答案是否基于给定资料。
产品意义:
用于判断模型有没有脱离资料自由发挥。
产品经理要注意:
RAG 评估不能只看答案像不像,还要看答案是否忠于资料。
工具调用与 MCP 术语
Function Calling
Function Calling 是让模型按定义好的函数或工具格式输出调用参数,由系统执行外部操作。
产品意义:
它让 AI 从回答问题走向调用系统。
产品经理要注意:
工具调用必须设计参数、权限、失败处理和确认机制。
Tool
Tool 是模型可以调用的外部能力,例如搜索、查订单、发消息、创建任务。
产品意义:
工具决定 AI 能做什么。
产品经理要注意:
工具描述、参数设计和权限边界会影响 Agent 质量。
Schema
Schema 是工具输入输出的数据结构定义。
产品意义:
它让模型知道调用工具时需要哪些参数。
产品经理要注意:
Schema 要清晰、稳定、少歧义,并覆盖必填字段和异常情况。
MCP
MCP 是 Model Context Protocol,模型上下文协议。
产品意义:
它提供了一种连接模型、数据源和工具的标准方式。
产品经理要注意:
MCP 适合连接实时系统、外部工具和权限敏感数据,但不是 RAG 的替代品。
Workflow 术语
Workflow
Workflow 是按固定步骤、规则和节点执行的工作流。
产品意义:
适合可控、可解释、步骤稳定的 AI 自动化。
产品经理要注意:
很多场景用 Workflow 比 Agent 更稳。
节点
节点是工作流中的一个步骤,例如输入、判断、生成、审批、执行。
产品意义:
节点化可以让复杂任务可视化和可管理。
产品经理要注意:
每个节点都要有输入、输出和失败处理。
人在回路
人在回路是指关键节点需要人确认、审核或接管。
产品意义:
它能降低高风险 AI 自动化的错误成本。
产品经理要注意:
不是所有事情都应该全自动。涉及钱、权限、法律、客户承诺时要谨慎。
Agent 术语
Agent
Agent 是能围绕目标理解任务、规划步骤、调用工具并根据反馈继续执行的 AI 系统。
产品意义:
Agent 的核心不是聊天,而是完成任务。
产品经理要注意:
Agent 带来更强能力,也带来更高不确定性。
单 Agent
单 Agent 是一个智能体负责完成一个任务链路。
产品意义:
适合目标清晰、工具有限、风险可控的任务。
产品经理要注意:
单 Agent 是很多 Agent 产品的合理起点。
多 Agent
多 Agent 是多个智能体分工协作完成任务。
产品意义:
适合复杂任务、交叉验证、角色分工和多系统协作。
产品经理要注意:
多 Agent 会增加成本、延迟、评估和权限复杂度。
Agent Team
Agent Team 是有组织结构和协作协议的智能体团队。
产品意义:
适合更复杂的企业任务和跨系统协作。
产品经理要注意:
必须设计职责、通信、冲突处理、最终责任和评估机制。
规划
规划是 Agent 把目标拆成步骤的过程。
产品意义:
规划能力决定 Agent 能否处理复杂任务。
产品经理要注意:
规划不一定正确,需要日志、检查点和人工确认。
记忆
记忆是 Agent 保存用户偏好、历史任务或长期上下文的能力。
产品意义:
记忆可以提升个性化和连续任务体验。
产品经理要注意:
记忆涉及隐私、权限、可删除和可解释问题。
Skill / Harness 术语
Skill
Skill 是可复用、可版本化、按需加载的任务能力包。
产品意义:
它把 Prompt、流程、脚本、资料和工具说明封装成可复用能力。
产品经理要注意:
Skill 适合沉淀高频任务,而不是每次重新写 Prompt。
Harness
Harness 是 Agent 的运行和治理环境。
产品意义:
它负责执行循环、工具调用、权限、日志、评估和可观测性。
产品经理要注意:
Agent 从 Demo 到生产,必须考虑 Harness 类能力。
Agent Harness
Agent Harness 是包在模型外面的运行系统,通常包括工具、记忆、状态、执行环境、权限、guardrails、日志、评估和可观测性。
产品意义:
它让 Agent 不只是“会回答”,而是能在受控环境中执行任务。
产品经理要注意:
不要只设计 Agent 会做什么,还要设计 Agent 被允许做什么、不被允许做什么、如何记录、如何停止、如何回滚。
Harness Engineering
Harness Engineering 是为 Agent 设计可控、可观测、可评估、可回滚运行环境的工程和产品设计方法。
产品意义:
它解决的是 Agent 从 Demo 走向生产时的约束和治理问题。
产品经理要注意:
Harness Engineering 里的约束不是 Prompt 提醒,而是工具权限、文件范围、人工确认、成本上限、失败停止、日志和测试等系统边界。
Tracing
Tracing 是记录 AI 执行过程的轨迹,包括模型调用、工具调用、中间结果和最终输出。
产品意义:
它帮助团队调试、评估和监控 Agent。
产品经理要注意:
没有 tracing,很难知道 Agent 为什么做错。
Guardrails
Guardrails 是对 AI 输出和行为的保护机制,可以包括内容安全、格式校验、权限限制、工具调用限制和人工确认。
产品意义:
它帮助 AI 产品降低越权、错误执行、敏感信息泄露和高风险输出。
产品经理要注意:
Guardrails 不能只靠一句 Prompt,应该结合规则、权限、评估、工具边界和日志。
AI 编程与 Agentic 工程术语
Vibe Coding
Vibe Coding 是用自然语言驱动 AI 生成代码、快速做出可运行作品或原型的方式。
产品意义:
它降低了从想法到作品的门槛,适合产品原型、个人工具、落地页、小型 Demo 和超级个体最小作品。
产品经理要注意:
Vibe Coding 适合验证想法,不等于生产级工程。能跑不代表可维护、可测试、可交付。
Agentic Coding
Agentic Coding 是让 AI Coding Agent 参与更完整的软件开发任务,例如理解需求、阅读代码库、修改文件、运行测试、修复错误和提交结果。
产品意义:
它让 AI 从代码补全工具变成工程协作者。
产品经理要注意:
Agentic Coding 需要清晰任务、上下文、验收标准、测试和权限边界。
Agentic Engineering
Agentic Engineering 是用 AI Agent 参与工程全流程,同时由人定义目标、约束、验收标准和最终责任的工程协作方式。
产品意义:
它帮助团队把 AI 从原型生成带入真实交付流程。
产品经理要注意:
Agentic Engineering 的重点不是“让 AI 全自动”,而是设计人、Agent、工具、测试和审查之间的协作秩序。
约束
约束是限制 AI 或 Agent 行为边界的规则和系统机制。
产品意义:
约束让 AI 的能力可控、可信、可复用。
产品经理要注意:
Prompt 约束只是行为提醒,Harness 约束才是环境控制。例如 Agent 没有删除权限,比告诉它“不要删除文件”更可靠。
AI 产品评估术语
Eval
Eval 是对 AI 输出或行为进行评估的方法。
产品意义:
它让团队知道 AI 产品是否真的变好。
产品经理要注意:
Eval 要结合真实场景,不要只用几条人工感觉不错的问题。
测试集
测试集是一组用于评估 AI 产品的问题、任务或案例。
产品意义:
它帮助团队稳定比较不同版本效果。
产品经理要注意:
测试集要包含正常问题、边界问题和高风险问题。
Bad Case
Bad Case 是 AI 产品表现不好的具体案例。
产品意义:
它是迭代 AI 产品的重要输入。
产品经理要注意:
Bad Case 要分类,不要只记录“回答不好”。
离线评估
离线评估是在上线前或非实时环境中,用测试集评估模型或系统表现。
产品意义:
适合版本对比和上线前验证。
产品经理要注意:
离线评估不能完全代表真实用户环境。
在线评估
在线评估是在真实用户使用中观察效果。
产品意义:
能反映真实行为、满意度和业务结果。
产品经理要注意:
要注意灰度、风险控制和用户反馈收集。
商业化术语
ROI
ROI 是投入产出比。
产品意义:
AI 产品最终要证明业务价值,而不只是展示能力。
产品经理要注意:
ROI 要同时看模型成本、人工成本、维护成本和业务收益。
模型成本
模型成本是调用模型产生的费用,通常和 token、模型类型、调用次数有关。
产品意义:
成本会影响定价、毛利和功能设计。
产品经理要注意:
不要只算单次调用成本,还要算重试、长上下文、工具调用和人工审核。
推理延迟
推理延迟是模型生成结果所需时间。
产品意义:
它直接影响用户体验。
产品经理要注意:
复杂 Agent、多步 RAG、多工具调用都会增加延迟。
人工接管率
人工接管率是 AI 无法完成任务后转给人工的比例。
产品意义:
在客服、销售、审批等场景中,它是衡量 AI 可用性的重要指标。
产品经理要注意:
人工接管不是失败,而是高风险场景中的必要兜底。
小结
AI 产品术语很多,但产品经理不需要把它们背成技术名词。
更重要的是理解:
- 1.
这个概念解决什么问题;
- 2.
它影响产品哪一部分;
- 3.
它带来什么风险;
- 4.
它如何进入真实业务流程。
真正掌握术语,不是能解释定义,而是能用它们做产品判断。
本文资料基础
参考资料:
- 1.
OpenAI: Tools guide, https://platform.openai.com/docs/guides/tools?api-mode=responses
- 2.
OpenAI: File Search, https://platform.openai.com/docs/guides/tools-file-search/
- 3.
Anthropic: Model Context Protocol, https://docs.anthropic.com/en/docs/mcp
- 4.
Anthropic: Building effective agents, https://www.anthropic.com/engineering/building-effective-agents
- 5.
LlamaIndex: Introduction to RAG, https://docs.llamaindex.ai/en/stable/understanding/rag/
- 6.
Ragas Metrics, https://docs.ragas.io/en/stable/concepts/metrics/available_metrics/
- 7.
Weaviate: Hybrid search, https://docs.weaviate.io/weaviate/concepts/search/hybrid-search
- 8.
Pinecone: Hybrid search, https://docs.pinecone.io/guides/search/hybrid-search
- 9.
MongoDB: The Agent Harness, https://www.mongodb.com/company/blog/technical/agent-harness-why-llm-is-smallest-part-of-your-agent-system
- 10.
Andrej Karpathy: Sequoia Ascent 2026, https://karpathy.bearblog.dev/sequoia-ascent-2026/
夜雨聆风