
最近两年,
AI 行业有一个非常明显的趋势:
Context 越来越长。
从:
• 8K • 32K • 128K • 1M
到未来可能的:
• 10M • 100M
很多人开始相信:
只要 Context 足够大,
AI 就能拥有无限记忆。
但我越来越觉得:
这可能是一个错误方向。
因为:
真正高级的智能,
从来不是:
“记住全部信息”。
而是:
“知道什么时候该使用什么信息”。
这也是为什么:
未来 AI 的形态,
可能不会是:
一个无限大的 Prompt。
而更像:
一个认知操作系统(Cognitive Operating System)。
一、人脑其实不是靠无限记忆工作
很多人会误以为:
聪明的人:
记忆力更强。
但实际上:
认知科学研究发现:
工作记忆非常有限。
很多实验表明:
人类同时能高质量处理的信息量:
远比想象中少。
但为什么人类还能解决复杂问题
因为:
大脑并不是:
所有信息同时参与思考而是:
长期记忆
↓
检索
↓
工作记忆
↓
推理也就是说:
人类本质上是一个“记忆管理系统”。
而不是:
一个无限缓存系统。
二、当前大模型最大的浪费是什么
很多人认为:
AI 最大的成本来自:
推理。
但实际上:
未来越来越大的成本可能来自:
信息搬运。
例如:
每次提问时:
模型都要重新读取:
• 历史对话 • 文档 • 代码 • 提示词
即使这些内容:
昨天已经看过。
今天还要再读一遍。
一个简单例子
假设:
你有一个:
100 万 Token 的代码仓库每天修改一个小功能。
理论上:
AI 已经知道:
• 项目架构 • 技术栈 • 模块边界
但现实里:
很多系统仍然需要:
重读大量上下文。
这是一种巨大的浪费。
三、为什么无限 Prompt 不是终局
因为:
Prompt 本质上是一种:
临时记忆。
而不是:
长期记忆。
临时记忆的问题
每次推理:
都需要:
重新加载
重新理解
重新关联这就像:
每天起床后失忆一次。
然后重新学习昨天发生的事情。
显然:
效率极低。
长期来看
真正先进的系统:
一定会出现:
持久化记忆。
也就是:
AI 能够:
• 保存状态 • 保存经验 • 保存知识 • 保存偏好
而不是:
每次重新开始。
四、未来 AI 会越来越像操作系统
这是我认为未来几年最重要的趋势之一。
因为:
操作系统解决的问题,
和未来 AI 面临的问题非常相似。
操作系统不会把所有数据放进内存
例如:
你的电脑:
可能有:
1TB SSD
32GB RAM但:
CPU 并不会:
一次性读取全部数据。
而是:
需要时加载
不需要时释放AI 未来也会这样
未来 AI 不会:
一次性读取全部世界。
而是:
动态管理信息。
五、未来 AI 的四层记忆架构
我认为:
未来 AI 很可能会出现类似这样的结构。
第一层:Working Memory
类似:
当前工作区。
只保存:
• 当前任务 • 当前目标 • 当前状态
例如:
正在修改支付模块相关信息进入工作记忆。
第二层:Long-term Memory
类似:
长期经验库。
保存:
• 项目架构 • 用户习惯 • 历史经验 • 组织规范
这些内容:
不需要每次重新输入。
第三层:Retrieval Layer
负责:
动态检索。
例如:
搜索代码
搜索文档
搜索历史记录只有需要的时候:
才加载。
第四层:Compression Layer
负责:
信息压缩。
例如:
10万 Token
↓
1000 Token 摘要保留核心状态。
降低成本。
六、未来最重要的能力:遗忘
这是很多人没有意识到的一点。
未来高级 AI:
可能最重要的能力之一不是:
记住。
而是:
忘记。
为什么
因为:
信息越多:
不一定越好。
例如:
• 过时信息 • 错误信息 • 冲突信息 • 无关信息
都会污染推理。
人脑其实一直在遗忘
大脑每天都在:
删除无关记忆。
否则:
认知系统会越来越混乱。
未来 AI:
也一定会出现:
Memory Garbage Collection。
类似:
操作系统垃圾回收。
七、未来最大的竞争力:记忆管理
很多人今天还在讨论:
谁的模型参数更大。
但未来:
真正重要的可能是:
谁的记忆系统更好。
因为:
模型越来越接近之后。
差异可能来自:
• 检索能力 • 压缩能力 • 长期记忆 • 上下文组织能力
就像今天的计算机
CPU 已经很强。
真正决定性能的:
很多时候是:
• Cache • Memory • IO
而不是:
单纯计算能力。
八、为什么 Agent 会推动这一切
未来 Agent:
不会每次:
从零开始思考。
而会:
读取状态
↓
恢复记忆
↓
继续执行这意味着:
未来 Agent 更像:
一个持续运行的进程。
而不是:
一次性对话。
一个典型例子
未来代码 Agent:
可能持续维护一个项目:
半年
一年
三年期间:
持续:
• 了解架构 • 记录变更 • 学习习惯 • 维护状态
这已经非常接近:
数字员工。
而不是:
聊天机器人。
九、未来 Context Window 可能会消失
这是一个很有意思的判断。
未来用户可能根本不会关心:
Context 是多少。
因为:
AI 会自动:
• 加载 • 检索 • 压缩 • 归档 • 遗忘
就像今天:
你不会关心:
操作系统具体用了多少内存页。
用户只会关心:
它能不能记住我需要的东西。
十、真正的未来竞争,不是更大的窗口
很多人认为:
未来竞争是:
1M
↓
10M
↓
100M但我觉得:
这只是过渡阶段。
真正的未来竞争是:
谁能更高效管理无限信息。
因为:
智能的核心从来不是:
“看到多少信息”。
而是:
“知道什么信息重要”。
十一、最后
过去两年:
大家都在追求:
更长的 Context。
但长期来看:
真正改变 AI 的,
可能不是:
无限大的 Prompt。
而是:
像操作系统一样的认知架构。
未来 AI:
会拥有:
• 长期记忆 • 工作记忆 • 检索系统 • 压缩系统 • 遗忘机制
而这些能力组合起来,
最终形成的:
可能不再是:
一个聊天模型。
而是:
夜雨聆风