AI 学习与智能体开发核心概念<一>

一、机器学习基础

· 监督学习：用带答案的标注数据训练，学习输入到输出的映射。
· 无监督学习：用无标签数据，自主发现隐藏结构或模式。
· 强化学习：智能体通过与环境试错互动，根据奖惩学习最优策略。
· 特征与标签：特征是输入属性，标签是预测的目标值。

二、核心算法与模型

· 神经网络：模拟人脑神经元连接的计算模型。
· 深度学习：使用深层神经网络的机器学习子集。
· Transformer：基于自注意力机制的架构，现代大模型核心。
· 大语言模型（LLM）：在海量文本上训练的巨型Transformer模型，能生成和理解语言。

三、训练关键技术

· 损失函数：衡量模型预测与真实答案的差距，目标是最小化它。
· 反向传播：计算损失相对参数的梯度，神经网络学习的关键。
· 优化器（SGD、Adam等）：根据梯度更新模型参数的方法。
· 过拟合与欠拟合：过拟合是学了噪声，欠拟合是没学好训练集。
· 训练/验证/测试集：分别用于学习、调参、最终评估。

四、数据处理与工程

· Token：LLM处理的最小文本单位，单词或子词。
· Embedding：将文本、图像等数据转换为稠密数值向量。
· 提示词（Prompt）：给AI的输入指令，引导生成。
· RAG（检索增强生成）：先检索相关知识，再交给LLM生成答案，缓解幻觉。

五、生成式AI常用概念

· 温度（Temperature）：控制生成随机性的参数，越高越多样。
· 上下文窗口：模型一次能“记住”的输入Token总数。
· 幻觉：模型自信地生成看似合理但错误的信息。
· 多模态：同时处理文本、图像、音频等多种数据类型。现代多模态还体现在A2A协议的多模态体验协商上。

六、智能体开发核心概念

（一）基础概念

· 智能体（Agent）：自主感知环境、做出决策并执行行动的AI程序。
· 大模型作为智能体核心：以LLM为“大脑”，负责理解任务、规划、调用工具。
· 规划（Planning）：将复杂任务分解为子任务并决定执行顺序。常用：思维链（CoT）、任务分解。
· 工具使用（Tool Use）：智能体调用外部函数、API、数据库等获取信息或执行操作。
· 记忆（Memory）：存储和利用历史信息。分短期记忆（上下文）和长期记忆（向量数据库）。
· 反射（Reflection）：智能体对自己过去行为进行自我批评和修正。
· 自主行为（Autonomous Action）：无需人为逐步指导，自动执行系列动作。
· 多智能体系统（Multi-Agent System）：多个智能体协作或竞争解决任务。
· 智能体框架：开发编排工具，如LangChain、AutoGen、CrewAI、Semantic Kernel。
· ReAct模式：结合“推理（Reason）”和“行动（Act）”的智能体范式：思考→行动→观察→循环。
· 工具调用 / 函数调用：模型输出结构化调用请求，由宿主执行并返回结果。它是LLM调用外部工具的基础，但常带有厂商绑定；MCP在此之上构建标准化协议。
· 智能体循环（Agent Loop）：反复执行的“思考→选工具→执行→观察→再思考”主循环。
· 知识库：结合RAG，为智能体提供外部权威知识。
· 动作空间：智能体可执行的所有可能动作的集合。
· 观测（Observation）：执行动作后从环境获得的结果反馈。
· 环境（Environment）：智能体所处并交互的外部世界（数字、模拟或物理）。

（二）核心通信协议层（MCP、A2A、AG-UI等）

· MCP（模型上下文协议）：Anthropic推出的开源标准，为AI模型与外部数据源、工具和API提供统一交互方式。规范了Tools（执行操作）、Resources（资源读取）、Prompts（复用提示模板）三大能力。解决传统函数调用的厂商绑定、无执行标准等问题。
· A2A（代理间协议）：Google发起的开放标准，解决不同框架、不同厂商的Agent之间的协作问题。通过Agent Card（代理卡）描述能力与接口，支持任务全生命周期管理。
· AG-UI（代理-用户界面协议）：打通AI与用户界面的双向交互通道，建立标准化的前端交互范式。
· MCP与A2A的协同：MCP负责智能体（大脑）与外部工具（手脚）的纵向连接；A2A负责智能体之间的横向协作。
· AIP（智能体互联协议）：中国主导的国家标准级多中心化通信协议，侧重可信接入、身份认证、结算审计等大规模产业应用问题。
· ANP（代理网络协议）：侧重构建底层开放生态的智能体通信协议。
· ACP（代理通信协议）：源自IBM的BeeAI框架，适用于强逻辑推理的智能体协作场景。
· ATH（智能体可信握手协议）：侧重于安全，通过三方（智能体-应用-用户）参与的9步可信握手流程实现双向身份验证。

七、其他常见概念

· 图灵测试：测试机器能否表现出与人类不可区分的智能。
· 强AI vs 弱AI：弱AI专精特定任务（当前所有AI）；强AI拥有通用意识（尚未实现）。
· AGI（通用人工智能）：在广泛任务上达到或超越人类水平的AI。
· 对齐：确保AI的目标和行动与人类价值观一致。