企业级 AI 落地的核心问题,正在从“模型够不够强”,转向“智能体能不能长期、规范、安全地工作”。
文章主线:大模型本质上是无状态的。要让它从一次性问答工具变成企业里的“AI 员工”,中间必须补上一套可持续、可演化、可治理的记忆系统。
在 AI Agent 浪潮席卷产业的当下,企业级 AI 落地的核心诉求,已经从“模型性能突破”转向“实际价值落地”。
企业真正关心的问题变成了:AI 能不能转化为可感知、可量化的生产力?它能不能在具体岗位、具体流程、具体业务约束里稳定发挥价值?
滴普科技创始人、执行董事、董事会主席兼 CEO 赵杰辉围绕企业 AI 价值落地推出系列文章,第一篇聚焦的正是 AI 智能体的关键突破口:记忆机制。
一、企业 AI 落地,首先是一道经济学题
从 2023 年到 2026 年,关于 AI 的讨论,主旋律一直是“模型”:模型更强、跑分更高、上下文更长、推理更准。
但只要真正做企业 AI 落地,就会遇到一个很现实的事实:
赵杰辉把这个问题称为一件经济学问题:
每一个 token 在价值端创造的生产力价值,能否大于它在成本端消耗的算力、人力和运营成本。
这就是所谓的“token 经济”约束。
过去三年,大多数企业在深度专业岗位上的 AI 落地挑战,根本原因并不只是模型不够强,而是 token 创造的业务价值仍然不够高。
二、大模型为什么需要记忆
企业搭建 AI 平台,要让每个 token 真正产出业务价值,需要面对很多因素:企业治理、模型规划能力、数据质量、组织协同等。
但在模型工程层面,有一个变量被严重低估了:
大模型本质上是无状态的。
每一次 API 调用都是独立的。模型不记得上一次对话,不记得用户是谁,不记得这家公司的业务,也不记得昨天告诉它的那条业务规则。
模型的“知识”被冻结在训练参数里。对话过程中产生的所有信息,在 API 返回的那一刻就消失了。
一个无状态系统,如果要成为企业里的“员工”,就必须拥有记忆。因为员工的核心特征之一,就是知道自己属于哪家公司、处在什么岗位、遵循哪些流程、承担哪些责任。
从无状态的大模型到有状态的智能系统,中间靠的正是记忆机制。
三、记忆机制决定 token 经济的两端
记忆机制的好坏,直接影响 token 经济等式的两端。
好的记忆机制
让 AI 真正理解一家企业的具体知识基础,把每个 token 的业务价值密度成倍拉高。
糟糕的记忆机制
让 AI 反复重读、重算、重复解释,每个任务消耗的 token 被成倍放大。
同样的算力账单,能不能换回真正的业务产出,记忆机制是关键变量之一。
四、第一代记忆:会话级缓冲
第一代记忆机制的代表,是早期 LangChain 和早期 Dify。
Dify 是开源智能体平台早期最具代表性的产品之一。它解决了 2023 年最迫切的工程问题:让 LLM 在多轮对话里“不要忘记上一句话”。
它的做法是为每个会话维护一个对话历史缓冲区,按 token 计数动态截断,再自动注入下一次 LLM 调用的 prompt。
第一代记忆解决了什么?
让对话具备短期连续性 让开发者快速搭建可用的对话型 AI 应用 降低了智能体应用的工程门槛
在 2023 至 2024 年的产业语境里,这是一项非常重要的开源贡献。
但放到企业级 AI 场景中,会话级记忆有一个天然边界:
每一次新会话,智能体都从零开始。它不积累,也不沉淀。对企业来说,这不是小问题,因为企业最有价值的资产之一,正是 know-how、规程、经验和客户档案。
五、第二代记忆:任务级工作空间
第二代记忆的代表,是 2025 年迅速走红的 Manus,以及 OpenAI、Google 等推出的 DeepResearch 类产品。
这一代解决的问题是:当任务需要数十次工具调用、数小时连续推理、跨网页/文件/代码进行复杂研究时,智能体如何组织中间结果、推理路径和外部信息。
Manus 的做法,是把记忆从“会话缓冲”升级为“任务级工作空间”。
任务级工作空间包括:
沙箱文件系统 检索摘要 中间产物 任务规划与回溯 跨资料的层级化记忆
这一代记忆机制让智能体第一次能够在数小时跨度的任务中保持连贯。
但它的设计目标仍然很清晰:帮助一个用户完成一次复杂研究。
任务结束后,工作空间往往归档或清理。跨任务、跨岗位、跨组织的长期知识沉淀,并不是它的核心设计目标。
六、第三代记忆:持久化与自进化
第三代记忆的代表,是 OpenClaw 和 Nous Research 在 2026 年开源的 Hermes Agent。
它们要解决的问题更进一步:让记忆跨任务、跨会话长期存在,并且能够自我进化。
OpenClaw:把记忆变成可持久化工件
OpenClaw 选择用结构化文本文件作为记忆载体:
- MEMORY.md:
记录持久事实、用户偏好、项目状态 - AGENTS.md:
定义智能体启动序列与角色 - SKILL.md:
沉淀可复用技能脚本
这套设计的哲学很清晰:让记忆变成可以读、可以改、可以提交到 Git、可以团队共享的工件。
这标志着智能体记忆从“情景记忆”走向“程序性记忆”。
Hermes Agent:让记忆成为主动演化的认知系统
2026 年 2 月,Nous Research 开源 Hermes Agent。它的核心理念是:
The agent that grows with you.一个与你共同成长的智能体。
Hermes 的记忆架构由三层叠加构成:
上下文压缩层:接近窗口上限时自动摘要压缩历史 SQLite + FTS5 全文索引层:保存历史会话,支持跨会话召回 MEMORY.md 持久层 + Honcho 用户模型:持续构建对用户的理解
更重要的是,Hermes 引入了自我改进闭环:智能体能在复杂任务后自动总结生成新的 Skill,发现已有 Skill 过时或错误时主动修订,并定期提醒自己持久化重要知识。
这把记忆从“被动文档”升级为“主动演化的认知系统”。
七、企业级落地还缺什么
从第一代到第三代,每一代都在解决前一代的问题,也都是真正的进步。
但它们有一个共同点:大多仍在文档、向量、会话日志这个范式内做工程优化。
无论是 buffer、任务工作空间、markdown,还是 FTS5 索引,记忆载体本质上仍然是通用形式。企业知识必须被翻译成这种通用形式,才能被智能体记住。
这也是为什么“本体逻辑”“企业图谱”“语义层”正在成为企业级智能体平台的重要方向。
八、产业正在向结构化记忆收敛
如果一个判断只来自一家公司,那可能只是观点;如果学术界和产业界多个团队同时收敛到同一方向,就更接近趋势。
在“智能体记忆需要从文档/向量转向结构化、可推理”这件事上,多个团队已经给出了相似答案。
Glean:企业图谱作为 Agent 上下文
Glean 将记忆、连接器、索引、个人图谱、企业图谱和治理整合在一起,作为自主智能体的统一上下文层。它的设计哲学是:智能体的记忆不是文档堆,而是一家公司里人、文档、概念、动作之间的关系图。
Snowflake / Databricks:在数据之上构建语义层
Snowflake、Databricks 等数据平台,也在朝同一个架构收敛:在企业数据与 LLM 之间插入一层语义或本体表示,让智能体理解数据背后的业务含义、权限关系和操作约束。
这说明,企业级智能体真正需要的不是“记住更多文本”,而是记住可被组织理解、可被系统治理、可被推理执行的结构化知识。
最后
记忆机制,是智能体从工具走向员工的关键变量。
第一代记忆让 AI 记住对话,第二代记忆让 AI 记住任务,第三代记忆让 AI 开始积累经验和技能。
但企业最终需要的,是一套能长期沉淀业务知识、理解组织结构、遵守权限规则,并能在工作中持续演化的记忆系统。
夜雨聆风