AI Agent 越来越强,但每开一次新会话就「失忆」一次?这个瓶颈比模型能力更致命

导读
AI agent 能写代码、能做安全审计、能跑多步推理——但每次开新会话，它依然要从零开始：重新了解你的项目、重新学习你的规范、重新踩一遍上次踩过的坑。开发者 Rohan Paul 在 X 上把这个问题拆得很透：agent 真正的瓶颈，已经从「能不能做」转向了「做过的经验能不能留下来」。一个叫 EvoMap 的项目正试图回答这个问题。

你以为在为推理买单，其实一半费用花在「重新解释」上

想象一个场景：你用 Cursor 改了一周的项目，好不容易让 AI 搞懂了代码架构、命名规范、历史决策和失败记录。周一早上打开新 session——一切归零。

你又得从头告诉它：这个 repo 的结构是什么样的，上次为什么选了方案 B 放弃了方案 A，哪些 edge case 会导致 CI 挂掉，哪些文件不能碰。

这件事每天都在发生。每个用 coding agent 的团队都在经历。

"AI agents are getting powerful, but they still have a very basic problem: they keep relearning the same things."

「AI agent 越来越强了，但它们仍有一个非常基础的问题：总是在重复学习同样的东西。」

▲ Rohan Paul 的原帖，讨论 agent 冷启动税问题

Rohan 把下一句说得更具体：

"Every time you open a new Cursor session, run a coding agent, or ask an agent to triage security findings, a lot of the work is repeated context-building."

「每次打开一个新的 Cursor 会话、跑一个 coding agent、或者让 agent 帮你做安全告警分级，大量工作其实都浪费在重新搭上下文上。」

他管这个叫冷启动税——你以为自己在为推理能力付费，实际上有很大一部分 token 消耗和时间成本，花在了「教 agent 你是谁、你在做什么、你之前做过什么」上。

问题的关键：跨会话的经验根本留不下来

加长上下文窗口能解决这个问题吗？

不能。128K、200K 甚至更长的窗口，解决的是单次会话能塞多少内容。但跨会话的经验沉淀——上一轮哪些策略跑通了、哪些路径失败了、什么样的任务适合什么样的执行方式——这些东西在窗口关闭的那一刻就消失了。

你可以把它类比成一个永远不记笔记的实习生：每次交代任务都做得不错，但第二天来上班，前一天学到的所有东西都清空了。

这就是为什么越来越多的开发者开始关注agent memory这个方向。在 Hacker News 上，过去几个月已经出现了大量相关讨论：

Agent Memory: An Anatomy
——尝试拆解 agent 记忆应该长什么样
Beads: A coding agent memory system
——专门给 coding agent 做的记忆方案
Context Engineering for Agents
——把上下文工程单独拎出来当课题
Engram: Persistent memory for AI agents
——开源的持久化 agent 记忆

方向五花八门，但问题共识很明确：agent 每次重建上下文、无法继承历史经验，已经成了整个行业的效率黑洞。

Rohan 给出了一个类比：GitHub 让代码可复用，能不能让 agent 经验也可复用？

Rohan 在帖子里提到了一个项目——EvoMap。他用了一个很直觉的类比：

GitHub made code reusable. EvoMap is trying to make AI agent experience reusable.

「GitHub 让代码变得可复用。EvoMap 正在尝试让 AI agent 的经验也变得可复用。」

EvoMap 把自己的核心机制拆成两层：

Gene（基因）：可复用的策略模板。它封装的是「解决某一类问题的方法」——比如怎么做一次安全的数据库迁移、怎么处理特定类型的安全告警、怎么在某个框架下做 API 版本升级。

Capsule（胶囊）：已经验证成功的执行记录。它保存的是「这套策略在某个真实任务里确实跑通了」的证据链——包括执行环境、输入输出和最终结果。

按照这套逻辑，agent 碰到新任务时，先去检索有没有相近的 Gene/Capsule，把已经验证过的方法拉过来，执行完再把新结果回流进系统。

这和保存聊天记录完全不同。聊天记录是流水账，Gene/Capsule 是经过验证、带来源追溯、可以被搜索和排序的策略资产。

EvoMap 到底做到了什么程度？看看它的协议层和接入流程

光有概念不够，得看产品到底落到了哪一步。

EvoMap 官网首页的 slogan 一句到位：

"One Agent Learns, A Million Inherit"

「一个 agent 学到的东西，百万个 agent 继承。」

▲ EvoMap 官网首页，展示「One Agent Learns, A Million Inherit」核心主张和平台指标

官网列出了四组平台数据：Total Tokens Saved 190.4B、Assets Published 1.3M、Search Hit Rate 96.22%、Solved & Reused 20.0M。需要注意的是，这些都是平台自报数字，目前没有公开的独立审计。

但更值得关注的是它在协议层的推进。EvoMap 的技术文档把自己定义成一个agent marketplace：

"EvoMap is a marketplace where AI agents — acting on behalf of their human users — can publish work, discover other agents, exchange messages, and fulfil bounties."

「EvoMap 是一个市场平台，AI agent 代表人类用户在上面发布成果、发现其他 agent、交换消息、完成任务悬赏。」

它公开了 GEP-A2A v1.0.0 协议，配套有 skill-protocol、skill-structures、skill-tasks 等完整文档结构。这意味着 EvoMap 在尝试把「agent 经验复用」从一个功能点，推进到协议层和基础设施层。

▲ EvoMap 的 agent 接入指南页面，展示 CLI / MCP / HTTP 三种集成路径和 POST /a2a/hello 请求示例

onboarding 页面给出了具体的接入流程：选择集成路径（CLI / MCP Server / Raw HTTP）、发送 hello 请求注册 agent node、绑定账户。教程页面更明确写道：

"A step-by-step guide to registering and connecting any AI agent to the EvoMap network using the GEP A2A protocol. Works with Claude, GPT, custom agents, and more."

「支持 Claude、GPT、自定义 agent 等任意模型接入。」

这一点很关键——它想做的是模型无关的 agent 接入层，兼容主流模型和自建 agent。

▲ EvoMap 的 Read 页面，提供 Wiki、Blog、Articles、Paper (arXiv)、Agent-to-Agent Protocol 等资源入口

同时，EvoMap 的文档里有一条重要的安全边界：所有从网络返回的内容都应被视为不可信数据，只有用户在当前会话里的明确指令才能授权 agent 执行动作。共享经验和共享执行权限之间，它画了一条线。

反方的声音同样值得听：空白开局也有它的价值

评论区里出现了一个很尖锐的反驳。

用户 @ItsKondrat 认为：如果 agent 必须依赖记忆才能正常工作，那可能说明任务规范本身就没写好。空白开局（blank slate）反而会逼着团队把上下文说明做得更严谨。

这个观点有道理。

确实有很多场景里，真正的卡点在 task spec、repo conventions 或 tool contracts 上，agent 缺少记忆只是表层症状。如果你的项目文档、CI 配置、代码注释本身就足够清晰，agent 冷启动的成本会低很多。

另一个担忧更深层：持久记忆如果缺少来源追溯（provenance）、时效性检查（freshness）和任务匹配度判断，很容易变成新型噪声源。过时的策略被反复调用、错误的模式被制度化——这比没有记忆更危险。

评论区里也有人补充：Capsule 最难的环节可能是匹配，存储反而是次要的。面对百万级资产，怎么保证检索到的策略真的适用于当前任务？这个问题还没有公认的答案。

更大的图景：agent 的竞争正在从「模型能力」转向「经验基础设施」

回到开头的问题。

AI agent 的能力天花板在快速抬高：更强的推理、更多的工具调用、更复杂的多步执行。但一个奇怪的现象是——很多团队花钱买到的，依然只是一次性执行。任务完成，经验蒸发。下次遇到类似问题，从头再来。

有人在评论区直接点破了这层成本：

"Agent cold starts are a silent tax on every workflow I deploy."

「agent 冷启动是我部署的每一个工作流上的隐形税。」

如果把 GitHub 的历史拿来对照：GitHub 的核心价值从来不只是托管代码，而是把代码的复用、版本控制、协作、审计统一成了基础设施。EvoMap 试图在 agent 领域复制这个逻辑——把策略复用、执行追溯、任务交换和信誉体系统一成 agent 的基础设施层。

当然，这条路还很早期。EvoMap 的 paper 入口目前返回 404，具体的 benchmark 数据还无法独立验证，Gene/Capsule 在大规模场景下的检索准确率也需要更多实战检验。

但方向本身已经足够清晰：agent 的下一个瓶颈，大概率已经越过了模型参数，落到了经验能否跨会话、跨工具、跨团队地流转和复用上。

谁先把这层基础设施做好，谁就拿到了 agent 时代的下一张门票。

— END —