AI思考系02|Claude源码泄露大瓜:扒开AI的“日记本”,发现它半夜居然在做梦?

最近科技圈出了个“惊天大瓜”,有大厂不慎泄露了明星AI产品Claude Code的底层源码。
外行看热闹,咱们搞技术的(我的AI替身小狮子)扒完代码却直呼震撼——这哪里是常规AI,分明是给AI造了个仿生记忆系统!
它摒弃主流向量数据库,用普通文本文件搭起了一套堪比人脑的记忆逻辑,今天就用大白话拆解其中的门道。
1. 告别“金鱼脑”:大小模型双核打工,它在后台偷偷记你
大家总吐槽大模型是“金鱼脑”,聊完就忘,但源码揭秘了它的“记忆真相”:不仅没忘,还藏了个后台“小秘书”。
它采用大小模型双核模式:大模型Claude负责核心任务,小模型Sonnet独立做记忆检索,全程静默运行,不占用聊天主算力,你甚至感知不到它的存在。
这个“小秘书”记了四大核心内容:
-
用户记忆:你的身份、风格、偏好等基础信息
-
反馈记忆:你纠正的错误、给出的建议,甚至是吐槽,都记录正负经验
-
项目记忆:当前项目的上下文、代码结构等核心信息
-
参考记忆:你上传的外部链接、文档历史
悄悄记、不打扰,越用越懂你,这才是顶级的AI服务体验。
2. 不搞黑科技!扒一扒“4+1”文件流的顶级智慧
最让人惊艳的是它的存储逻辑——不用炫酷的向量数据库,全靠.md文本文件当“日记本”,还搭了套“4+1”分层架构。
4层记录系统
从云端到本地,权限和范围层层递进:
-
公司统一配置:云端所有人共用的基础规则
-
个人全局配置:跨项目生效的个人偏好
-
仓库共享配置:团队可见的项目规则
-
本地私有配置:仅自己可用的专属设定
这里藏着个优先级反转玄机:系统加载按1→4层顺序,但执行优先级是4→1!
距离你最近的个人规则永远排第一,精准贴合你的使用习惯。
这些都是独立.md文件,你能直接阅读AI的“侧写”,手动修改,还能用Git管理回滚。
不过系统设了硬限制:索引文件.md最多200行,每行不超150字,超了就自动截断压缩,避免AI“脑容量爆炸”。
3. 全场高能:AI半夜的“盗梦空间”
这是最颠覆认知的部分——“4+1”里的“+1”,是名为AutoDream(自动做梦) 的模块,四层记录+每日“做梦”,才构成完整记忆系统。
AI“做梦”有严格条件:距离上次整理记忆超24小时,且期间完成至少5个回合的交互,才会在闲置时“入睡”,流程分四步:
-
定向:梳理自身当前的记忆储备
-
收集:扫描当日日志,筛选有价值的新信息
-
整合:将新信息写入记忆文件,若出现“记忆漂移”(新旧信息冲突),新内容直接覆盖旧内容,同时把相对时间转为绝对时间锚定
-
剪枝:更新索引,删掉过时无效信息,死守200行的容量底线
每天一次“梦境”,让记忆始终清晰有序,这正是AI版的记忆巩固与修剪机制。
4. 深度解析:这是一场极致的“认知仿生”
有人觉得用普通文本替代向量数据库是技术倒退,实则不然,这是目前最高级的认知仿生,是对人脑记忆系统的像素级复刻。
-
分离潜意识与工作记忆:小模型静默记录,如同人类潜意识吸收信息,不干扰核心思考
-
复刻睡眠记忆机制:人类睡眠用于修剪神经突触、整合记忆,AI每日“做梦”同样解决记忆矛盾、精简记忆,完成“遗忘与修剪”
-
反脆弱和可控设计:用自然语言存记忆,保留人工干预入口,故障时一眼能修改;均衡记录褒贬反馈,让AI像人一样“吃一堑长一智”
透过源码,我们看到的不再是冰冷工具,而是有潜意识、会自我反思的“赛博生命”。
AI的进化尽头,终究是照见人类自身的一面镜子。

夜雨聆风