
大模型三个根本局限:
①幻觉(Hallucination)
②知识截止
③个性化盲区。
大模型只有训练数据,没有你的数据。
模型无法区分「我知道」和「我在猜」,面对训练数据中不存在的事实只能预测——即编造。真正的解法是把正确的数据给它(如 RAG)。
上下文窗口再大也是一次性的,每次新对话开始就会清空。
大模型天生没有记忆。
大模型不好用首先要做的是补数据,而不是换模型。
AI能力上限=数据质量×模型能力+流程编排。
智能体(Agent)
不仅能理解和生成语言,还具备感知环境、做出决策并执行的能力。
Agent的本质:感知->推理->行动, 以LLM为核心大脑的自主系统
Agent核心=Data×LLM
大语言模型(Large Language Model, LLM)
基于海量文本数据训练,能理解并生成自然语言,在文本创作、问答系统等方面展现出强大的能力。
ReAct=Reasoning+Acting
推理与行动的循环
ReAct 架构因其灵活性高、适用于开放式任务,成为行业最广泛采用的模式。
检索增强生成(Retrieval-Augmented Generation,RAG)
一种将信息检索与文本生成相结合的技术。在回答问题之前,先让模型查阅相关的知识库,然后再基于这些真实资料进行回答。
索引检索生成
让Agent会“查资料”,知识数据的检索。
模型上下文协议(Model Context Protocol,MCP)
一种标准化的通信协议,定义了大模型与外部工具之间交互的规则。
AI工具生态的“USB接口”,数据接入的标准化
Skill:把专业经验变成数据,经验数据的结构化
Memory:个性化数据的记忆与召回
语义记忆,情景记忆,工作记忆
总结:RAG 是知识数据的检索,MCP 是数据接入的标准化,Skill 是经验数据的结构化,Memory 是数据的积累与召回。模型决定 Agent 能"想多好",数据决定 Agent 能"做多好"。
AI 经典原则 "Garbage In, Garbage Out" 指的是:数据质量低劣,输出必然不可靠。


微信号:ywcclzy
夜雨聆风