
一、机器学习基础
· 监督学习:用带答案的标注数据训练,学习输入到输出的映射。
· 无监督学习:用无标签数据,自主发现隐藏结构或模式。
· 强化学习:智能体通过与环境试错互动,根据奖惩学习最优策略。
· 特征与标签:特征是输入属性,标签是预测的目标值。
二、核心算法与模型
· 神经网络:模拟人脑神经元连接的计算模型。
· 深度学习:使用深层神经网络的机器学习子集。
· Transformer:基于自注意力机制的架构,现代大模型核心。
· 大语言模型(LLM):在海量文本上训练的巨型Transformer模型,能生成和理解语言。
三、训练关键技术
· 损失函数:衡量模型预测与真实答案的差距,目标是最小化它。
· 反向传播:计算损失相对参数的梯度,神经网络学习的关键。
· 优化器(SGD、Adam等):根据梯度更新模型参数的方法。
· 过拟合与欠拟合:过拟合是学了噪声,欠拟合是没学好训练集。
· 训练/验证/测试集:分别用于学习、调参、最终评估。
四、数据处理与工程
· Token:LLM处理的最小文本单位,单词或子词。
· Embedding:将文本、图像等数据转换为稠密数值向量。
· 提示词(Prompt):给AI的输入指令,引导生成。
· RAG(检索增强生成):先检索相关知识,再交给LLM生成答案,缓解幻觉。
五、生成式AI常用概念
· 温度(Temperature):控制生成随机性的参数,越高越多样。
· 上下文窗口:模型一次能“记住”的输入Token总数。
· 幻觉:模型自信地生成看似合理但错误的信息。
· 多模态:同时处理文本、图像、音频等多种数据类型。现代多模态还体现在A2A协议的多模态体验协商上。
六、智能体开发核心概念
(一)基础概念
· 智能体(Agent):自主感知环境、做出决策并执行行动的AI程序。
· 大模型作为智能体核心:以LLM为“大脑”,负责理解任务、规划、调用工具。
· 规划(Planning):将复杂任务分解为子任务并决定执行顺序。常用:思维链(CoT)、任务分解。
· 工具使用(Tool Use):智能体调用外部函数、API、数据库等获取信息或执行操作。
· 记忆(Memory):存储和利用历史信息。分短期记忆(上下文)和长期记忆(向量数据库)。
· 反射(Reflection):智能体对自己过去行为进行自我批评和修正。
· 自主行为(Autonomous Action):无需人为逐步指导,自动执行系列动作。
· 多智能体系统(Multi-Agent System):多个智能体协作或竞争解决任务。
· 智能体框架:开发编排工具,如LangChain、AutoGen、CrewAI、Semantic Kernel。
· ReAct模式:结合“推理(Reason)”和“行动(Act)”的智能体范式:思考→行动→观察→循环。
· 工具调用 / 函数调用:模型输出结构化调用请求,由宿主执行并返回结果。它是LLM调用外部工具的基础,但常带有厂商绑定;MCP在此之上构建标准化协议。
· 智能体循环(Agent Loop):反复执行的“思考→选工具→执行→观察→再思考”主循环。
· 知识库:结合RAG,为智能体提供外部权威知识。
· 动作空间:智能体可执行的所有可能动作的集合。
· 观测(Observation):执行动作后从环境获得的结果反馈。
· 环境(Environment):智能体所处并交互的外部世界(数字、模拟或物理)。
(二)核心通信协议层(MCP、A2A、AG-UI等)
· MCP(模型上下文协议):Anthropic推出的开源标准,为AI模型与外部数据源、工具和API提供统一交互方式。规范了Tools(执行操作)、Resources(资源读取)、Prompts(复用提示模板) 三大能力。解决传统函数调用的厂商绑定、无执行标准等问题。
· A2A(代理间协议):Google发起的开放标准,解决不同框架、不同厂商的Agent之间的协作问题。通过Agent Card(代理卡) 描述能力与接口,支持任务全生命周期管理。
· AG-UI(代理-用户界面协议):打通AI与用户界面的双向交互通道,建立标准化的前端交互范式。
· MCP与A2A的协同:MCP负责智能体(大脑)与外部工具(手脚)的纵向连接;A2A负责智能体之间的横向协作。
· AIP(智能体互联协议):中国主导的国家标准级多中心化通信协议,侧重可信接入、身份认证、结算审计等大规模产业应用问题。
· ANP(代理网络协议):侧重构建底层开放生态的智能体通信协议。
· ACP(代理通信协议):源自IBM的BeeAI框架,适用于强逻辑推理的智能体协作场景。
· ATH(智能体可信握手协议):侧重于安全,通过三方(智能体-应用-用户)参与的9步可信握手流程实现双向身份验证。
七、其他常见概念
· 图灵测试:测试机器能否表现出与人类不可区分的智能。
· 强AI vs 弱AI:弱AI专精特定任务(当前所有AI);强AI拥有通用意识(尚未实现)。
· AGI(通用人工智能):在广泛任务上达到或超越人类水平的AI。
· 对齐:确保AI的目标和行动与人类价值观一致。
夜雨聆风