

本文基于2026年6月上海Agentic AICon智能体应用于架构工程大会上,同济大学王昊奋教授《面向智能体的记忆体系:理论与实践》核心演讲,结合当下最前沿的记忆工程技术栈、MemOS 架构体系、产业落地实战,带你穿透行业误区,看懂 AI 记忆的技术迭代、真实边界、落地路径与未来趋势。
引言
真实 Agent 产品落地,所有人都会撞上同一堵墙:单轮对话聪慧无比,多轮长期交互频频“失忆”;用户偏好说忘就忘、事件逻辑前后割裂、回答自相矛盾;静态知识库堆满资料,却沉淀不了用户习惯、场景经验和长期任务进度。
这也是当下 AI 产品最普遍的痛点:模型聪明,但产品没有成长能力。
哪怕是搭载百万级 Token 超长上下文的顶级大模型,在长期多会话、跨场景、长周期交互中,依然逃不开“失忆魔咒”。常规 RAG 只能检索静态文档,做不到动态沉淀、持续迭代、个性化适配。这也解释了为什么绝大多数 AI 助手、陪伴 Agent、企业智能体,都停留在“工具阶段”,无法真正进化为可长期服务、可自主成长的智能体。
当 AI 从单次问答工具,进化为长期在线、持续交互、自主作业、不断进化的 Agent 智能体,行业底层逻辑已经彻底改写。如果说复杂性是AI软件工程的第一性原理,那记忆就是智能体时代的第一性原理。模型决定 AI 的智商上限,记忆体系决定 AI 的成长下限。没有系统化记忆工程,所有智能体都只是“一次性应答工具”,无法形成人格、经验、能力沉淀与持续进化。
🔔 金句
“模型决定了能力的上限,应用决定了能力的下限。现在的问题是上限够高,但下限不行,所以大家才这么关注记忆系统这样的工程级技术。”
深度纠偏:
AI 进入记忆时代,不是功能升级,是范式革命

很多人对 AI 记忆的理解,还停留在“存聊天记录”的浅层阶段。但纵观 AI 二十年发展,行业经历了四次完整范式迁移:无状态推理 → 感知聚焦 → 推理聚焦 → 记忆聚焦。
记忆从来不是附加功能,而是 AI 从“能用”走向“好用、可成长、可商用”的核心分水岭。


早期传统机器学习是典型的“无状态模型”,只负责单次预测,不求留存、不求延续、不求成长,完全不需要记忆能力。2015 年深度学习爆发,注意力机制大幅强化感知能力,但依然局限在单轮、单次、单场景,只有瞬时感知,没有长期记忆。
2020 年大模型时代到来,超长上下文、多轮对话、复杂推理成为标配,但本质依然是临时状态加载。对话结束,状态清零,所有交互无法跨会话沉淀、无法长期积累、无法形成用户专属特征。这也是为什么早期大模型永远“记不住你”。
2025 年,行业全面迈入 Agentic 智能体时代。智能体需要长期在线、跨任务联动、跨场景作业、持续复用经验、自主迭代优化。此时,记忆不再是可选项,而是刚需底座。
无论是 OpenAI、Claude 持续加码全局记忆,还是谷歌、字节、高校团队密集落地记忆技术,都指向同一个结论:AI 下半场的核心竞争,是记忆工程的竞争。
在此之前,行业解决“记忆缺失”的方式,全是治标不治本的补丁方案:堆更长上下文、堆更大模型、堆更复杂的 RAG。这些方式只能靠算力、参数、检索“临时续命”,却无法解决核心问题:没有体系化的记忆沉淀、更新、遗忘与迭代机制。最终导致 AI 产品体验割裂、下限不稳、难以商业化落地。
也正因如此,AI 研发范式完成三代终极迭代:从提示工程、上下文工程,正式迈入记忆工程(Memory Engineering)时代。
提示工程优化单次指令,上下文工程优化单轮对话,而记忆工程构建 AI 的长期成长体系,让智能体真正记住用户、理解场景、沉淀经验、持续进化,完成从“被动应答”到“主动成长”的质变。
两大技术路线:
模型原生 VS 应用外挂,谁才是未来?

目前业界所有 AI 记忆落地方案,均可归为两大阵营:模型内生驱动与应用外向驱动。两者各有优劣、互补共生,而内外融合,是行业唯一终极解。


记忆工程实现路径:内外驱动对比
模型内生驱动,代表 AI 记忆能力的技术上限。它不依赖外挂、不依赖检索,而是从模型底层重构架构与训练机制,让模型原生具备记忆存储、更新、遗忘、检索、学习的能力,是真正意义上的“会记忆的大模型”。
近几年学术前沿持续突破:Google Memorizing Transformers、UCSD MemoryLLM、记忆张量的Memory3、Google Titans 神经长时记忆模型等,不断刷新模型原生记忆的能力边界。这类方案读取效率高、认知深度强、成长性极佳,但缺点也非常明显:研发门槛极高、落地周期长、成本巨大,难以快速适配产业场景。应用外向驱动,是当前产业落地的主流方案与体验下限。无需改动基座大模型,在应用层搭建独立记忆管理框架,通过 Agent 流程调度、记忆策略优化,低成本实现长期记忆、个性化留存、跨会话延续。
如今开源生态已经非常成熟:MemGPT/Letta 奠定状态记忆 Agent 基础范式,Mem0 成为生产级通用记忆层标杆,Zep 主打时序图谱记忆,Memories.ai 补齐多模态记忆短板。轻量化、可落地、可快速迭代,是企业落地记忆能力的首选路径。
简言之:模型驱动定上限,应用驱动保落地。纯底层研发太慢,纯外挂架构太浅,未来行业必然走向「模型原生能力 + 应用层工程体系」的内外融合范式,兼顾效率、深度、成长性与落地速度。
核心工程体系:
真正的 AI 记忆,是全生命周期闭环能力

很多团队误以为“搭个向量库就是记忆系统”。真正工业级、可商用、可成长的 AI 记忆体系,是一套判别-构建-管理-检索-使用的全链路闭环工程,完整解决:记什么、怎么存、如何管、怎么找、怎么用五大核心问题,彻底甩开传统 RAG 的碎片化短板。工业界的记忆工程更聚焦**落地可用、稳定可控、成本最优、适配产业场景**,经过数年迭代,已形成成熟的开源产品体系、标准化落地范式与多行业规模化实践,真正从实验室技术变成智能体产业的基础设施。

01
记忆判别:精准过滤,只记高价值信息
人机交互中 80% 以上都是无效闲聊、重复话术、噪声信息,全部存储只会造成信息爆炸、检索失真、成本飙升。依托信息瓶颈理论与人脑认知过滤模型,行业落地 SAMD 场景敏感判别机制,智能筛选用户偏好、关键事件、行为规则、核心约束等高价值信息。实测可降低 28%-55% Token 消耗,大幅提升关键线索精准度。
02
记忆构建:结构化沉淀,告别杂乱数据
当前产业形成三套成熟存储范式,覆盖全部业务场景:键值对轻量化存储适配用户基础偏好;向量存储适配通用语义检索;知识图谱结构化存储支撑复杂推理与长期用户画像。搭配 MetaPKE 精细化个人知识抽取能力,AI 可自动梳理人物关系、事件细节、行为属性,让零散对话变成可复用的结构化经验。
03
记忆管理:动态迭代,会更新、会遗忘、会整合
人类记忆的核心是“动态演化”,AI 记忆同理。好的记忆体系不是静态存档,而是持续新增、及时更新、智能淘汰、自动整合。通过 MemoryBank、CREEM 等工程框架,系统可自动修剪冗余记忆、固化长期经验、淘汰过期偏好,杜绝记忆堆积、冲突、溢出,保证 AI 记忆始终干净、有效、与时俱进。
04
记忆检索:自适应精准召回,告别盲匹配
传统 RAG 只做相似度匹配,极易出现漏召回、误召回、噪声干扰。新一代记忆体系搭建多维检索矩阵,并创新 HingeMem 自适应检索机制,模仿人脑事件分割逻辑:时序问题侧重全量召回、推理问题侧重精准匹配、简单查询侧重极速返回。在多轮、对抗、复杂时序场景下,检索精度远超传统方案,彻底解决“该记的记不住、不该记的乱召回”。
05
记忆使用:赋能推理,让记忆真正产生价值
高级记忆能力,不是检索拼接,而是记忆推理。通过 MemReasoner 多跳时序推理框架,AI 能够梳理事件逻辑、关联隐性信息、结合长期偏好给出个性化应答,让分层记忆各司其职:实时会话记忆保连贯、短期动态记忆保场景、长期静态记忆保个性,最终实现真正的拟人化、专业化、一致性交互。
从工业界整体落地格局来看,当前 AI 记忆系统已形成开源框架规模化普及、商业产品系统化落地、行业场景定制化迭代的三维生态,彻底告别早期零散测试的阶段,成为企业智能体项目的标配基建。结合本次演讲核心内容,当下工业界主流记忆产品与落地体系可分为三大梯队,覆盖从轻量化创业项目到大型企业级系统的全场景需求。


第一梯队为通用生产级记忆开源框架,主打轻量化、高兼容、快速落地,是绝大多数企业AI项目的首选方案。其中Mem0凭借极简的通用记忆层设计、极强的模型适配能力、稳定的生产环境适配性,斩获55k+开源Star,成为行业通用记忆基础设施标杆,主打为各类AI智能体提供统一的记忆读写、更新、沉淀能力,适配绝大多数To B、To C标准化场景。Zep则另辟蹊径,依托时序知识图谱架构重构记忆存储逻辑,区别于传统向量匹配,重点解决记忆时序混乱、事件逻辑割裂、长期上下文错乱问题,适配需要持续跟踪用户行为、事件流程的长周期交互场景,Star量突破30k+。MemGPT/Letta作为最早的状态记忆智能体框架,开创性实现了“有状态AI”落地,打破大模型无状态局限,为后续所有记忆智能体产品奠定核心范式,成为学术研究与初创项目的基础底座。
第二梯队为场景定制化记忆系统,聚焦细分产业痛点,针对性优化记忆架构,适配垂直领域的专业需求。Memobase主打用户画像式长期记忆,将零散会话内容结构化拆解为用户固定属性、时序事件、行为偏好三大类数据,精准适配陪伴AI、个人助手、消费级智能产品,解决C端产品个性化不足、用户粘性弱的核心痛点。Memories.ai则深耕多模态记忆赛道,突破传统文本记忆的局限,可将视频、图片、语音等非结构化交互内容结构化编码、索引存储,支持多模态内容检索与复盘,适配沉浸式交互、智能硬件、视觉Agent等新兴场景,补齐行业多模态记忆短板。
第三梯队为大厂自研系统化记忆架构,依托自身业务生态与算力底座,搭建全链路自研记忆体系,适配超大流量、超高并发、高安全要求的产业场景。OpenAI、Google、Meta等头部企业持续迭代原生记忆能力,从2024年试水对话记忆功能,到2025年全面落地全局记忆、个性化上下文、长期偏好留存能力,持续验证“记忆决定智能体上限”的产业逻辑。国内字节、阿里、同济科研团队联合迭代的MemTensor、MemOS等体系,主打记忆分层治理、端云协同、记忆冲突修正、大规模并发调度,专门解决企业级多智能体、多用户、多会话场景下的记忆混乱、冗余、失效问题,支撑大型产业AI项目稳定落地。
在具体行业落地层面,工业界记忆工程已完成多领域规模化验证,形成成熟的落地范式。在电商与智能客服领域,记忆系统可沉淀用户消费偏好、历史咨询问题、常见诉求、售后记录,让客服智能体无需重复问询、精准匹配用户需求,实现千人千面的服务体验,同时沉淀企业客户资产,某头部电商智能客服依托记忆体系,单日可支撑数千商家、百万级用户咨询,大幅降低人工转接率。在情感陪伴与虚拟人领域,记忆可留存用户情绪偏好、互动习惯、禁忌内容、关键节点,实现拟人化成长,让虚拟角色具备持续稳定的人格特质,彻底告别“每次对话都陌生”的体验短板。在企业办公与长程Agent领域,记忆系统可沉淀任务执行经验、工具调用规律、项目迭代记录、失败复盘经验,让办公智能体持续复用成熟工作流程,自主优化任务执行逻辑,大幅提升复杂办公、自动化作业效率。在教育、金融等严谨行业,记忆体系可沉淀用户学习轨迹、知识薄弱点、业务办理习惯,同时依托记忆治理机制规避隐私泄露、信息错乱风险,在合规前提下实现个性化服务迭代。
纵观工业界整体实践,可总结出核心落地规律:早期AI落地拼模型能力,当下智能体落地拼记忆工程能力。模型能力决定单次交互的上限,而工业化记忆体系决定产品长期稳定、个性化、可商业化的核心下限。所有成熟的产业级AI智能体,无一例外都搭建了标准化的记忆判别、存储、治理、检索、推理体系,这也是区别于Demo级AI与商用级AI的核心标志。
产业落地升级:
MemOS 记忆操作系统,重构智能体底层架构

AI 记忆已经走出“零散外挂”的草根阶段,正式进入系统化、工程化、平台化时代。MemOS 记忆操作系统,正是当前产业最落地、最成熟的智能体记忆底座,解决多用户、多会话、多应用、多智能体的统一记忆管控难题。
01
MemOS 1.0:效率优先,搭建分层记忆体系
1.0 阶段核心目标是效率最优,搭建三级记忆架构:参数记忆负责通识能力、激活记忆负责会话上下文、明文记忆负责个性化业务经验。配合调度队列、负载均衡、多粒度资源分配,让不同场景下的记忆读写效率最大化,解决传统架构卡顿、冗余、混乱问题。
02
MemOS 2.0:范式升级,走向记忆原生可进化
2.0 彻底推翻“外挂记忆”模式,将记忆能力原生融入模型训练、架构与推理流程,实现参数、激活、明文记忆的联合学习与自主进化。AI 不再是“用完记忆就丢弃”,而是持续积累、持续修正、持续成长,真正具备长期智能体的核心特质。
对比传统 RAG,MemOS 驱动的 MAG(记忆增强生成)模式形成碾压式优势:RAG 只能查资料,MAG 能成长、能更新、能修正、能沉淀、能跨会话复用,从根源解决 AI 一致性差、个性化弱、幻觉频发的产业顽疾。


目前 MemOS 已全面落地六大高价值场景:游戏 NPC 个性化剧情演化、情感陪伴拟人化成长、个人助手习惯沉淀、长程复杂任务 Agent、企业客服客户资产沉淀、团队组织知识传承,真正实现规模化商用落地。
依托 OpenMem 开源生态,整个产业落地门槛被大幅降低。当前项目 Star 突破 9.5K、开发者超 1.7 万,配套记忆迁移、跨平台同步、多端互通工具,推动 AI 记忆从单点技术创新,走向全行业基础设施普及。
行业真实边界:
AI 记忆工程,仍有五大未解难题

热度之下必须冷静:AI 记忆工程已经落地,但远未成熟。和软件工程的复杂性约束一样,记忆工程也存在天然边界,这些未解难题,正是行业下一阶段的核心攻坚方向。
01
长周期记忆治理难题
长期交互下记忆持续膨胀、冲突、过期、冗余,行业缺少成熟的分支、合并、回滚、验证治理体系,极易出现“该忘不忘、该记记不住”的失衡问题。
02
多模态记忆能力短板
当前记忆体系高度依赖文本,视频、图像、音频等非结构化数据的编码、存储、检索能力严重不足,跟不上多模态智能体、穿戴设备、视觉交互的爆发需求。
03
隐私与个性化的天然矛盾
越个性化的记忆,越需要采集用户隐私数据。目前行业缺少完善的隐私分级、用户自主管控、合规脱敏体系,隐私风险成为 ToC 产品深度落地的最大枷锁。
04
评测体系不完善,幻觉无法根治
过往评测只看对话效果,不考核记忆质量。新兴评测框架虽补齐部分空白,但记忆幻觉、检索噪声、信息偏差依然是 AI 出错的核心源头,尚无彻底根治方案。
05
多智能体分布式记忆缺失
现有记忆体系大多服务单用户、单 Agent,无法支撑多智能体协作、团队知识共享、群体协同进化,制约集群智能、企业级多 Agent 场景落地。
未来趋势预判:
记忆,将成为 AI 下一代基础设施

站在 2026 年的 AI 产业节点,我们可以清晰预判:记忆工程不是短期热点,而是智能体时代的底层基础设施。未来 AI 的竞争,不再是模型参数比拼,而是记忆体系、工程架构、成长能力的全面比拼。
第一,记忆原生模型成为行业标配:外挂式记忆将逐步淘汰,模型原生记忆、自主学习、动态进化能力,成为大模型的核心基础能力。
第二,端云协同记忆架构全面普及:云侧负责大规模存储与全局调度,端侧负责隐私安全与实时推理,在个性化、体验、安全、效率之间找到最优平衡。
第三,生物启发+多模态记忆迎来突破:借鉴人脑记忆机制优化迭代逻辑,同时打通图文音视频全模态记忆能力,适配下一代沉浸式、多感官智能交互场景。
第四,评测与隐私体系走向标准化:行业将形成统一的记忆质量评测、抗幻觉、隐私安全标准,让记忆工程从“野蛮生长”走向“规范落地”。
行业需要认清两个真相:不神化记忆,它无法解决所有 AI 问题;不轻视记忆,它是智能体进化的唯一生命线。
模型决定 AI 的认知上限,记忆决定 AI 的成长下限。大模型让 AI 变聪明,记忆工程让 AI 变长情、可成长、可复用、可商用。
未来,真正有价值的 AI 产品,一定不是只会单次应答的工具,而是记得用户、理解场景、沉淀经验、持续进化的专属智能体。深耕记忆工程体系,才是抓住 AI 下半场最核心的产业红利。

分享

收藏

在看

点赞

学习资源 | 演讲配套资料
如需本次演讲PPT,可将本文分享至朋友圈,截图联系小助手(微信号:SECon2023)即可领取。


夜雨聆风