乐于分享
好东西不私藏

3.6万星:生化危机女星开源AI工具意外爆火

3.6万星:生化危机女星开源AI工具意外爆火

2026年4月10日


快讯

生化危机女星Milla Jovovich开源AI记忆工具MemPalace,GitHub星标破3.6万

    🔥 特别关注| 生化危机女星的AI反杀:从好莱坞到GitHub的意外之旅

    一个意想不到的名字出现在AI开发者的视野中:Milla Jovovich(《生化危机》系列Alice扮演者、《第五元素》Leeloo扮演者)在Instagram发布视频宣布,她与加密货币CEO Ben Sigman合作开发的开源AI记忆工具MemPalace正式发布。

    核心数据:GitHub星标15,000+,MIT开源协议,完全本地运行,声称LongMemEval 100%分数

    直接影响:AI记忆工具成本归零,付费厂商面临降维打击

    就业信号:技术民主化加速,AI辅助编程让非技术人也能构建实用工具


    故事始末:从 frustrated AI用户到开源开发者

    起源:一次AI使用体验的挫败

    今年年初,Milla Jovovich在为一个独立游戏项目筹备素材时,花了数月时间精心组织AI文件和参考资料。但她很快发现一个反复出现的问题:即使文件整理得井井有条,AI仍然无法可靠地检索和记忆这些信息。

    每次对话都从零开始。六个月的AI使用积累,数百万token的上下文,全部在对话关闭后消失。她不得不一遍又一遍地向AI解释同样的背景、设定和决策逻辑。

    这种挫败感让她开始思考:为什么AI不能像人类一样拥有持久记忆?

    灵感:古希腊的”记忆宫殿”

    在研究记忆方法时,Jovovich读到了古希腊”方法 of loci”(记忆宫殿)的记载。古希腊演说家通过将信息在想象中放置到”建筑物的房间”里,来记住整篇演讲。

    这个两千多年前的记忆技巧给了她灵感:如果将AI记忆也组织成一个有结构的”宫殿”,而不是扁平的向量数据库,是否能解决AI的”遗忘”问题?

    她把这个想法告诉了朋友Ben Sigman——Libre Labs(比特币借贷平台)的CEO,也是一名资深开发者。

    实现:用AI工具构建AI工具

    Sigman认为这个想法可行。他们决定使用Anthropic的Claude Code来实现这个概念。

    几个月后,MemPalace诞生了。

    4月5日,代码被推送到GitHub上的milla-jovovich账号下。4月7日,Jovovich在Instagram发布视频正式宣布项目。

    爆发:

    发布推文在几小时内获得150万次曝光。GitHub仓库在48小时内收获7,000+星标,目前已超过36,000。

    但就在项目爆火的同时,AI开发者社区开始对声称的基准测试分数提出质疑。

    争议:100%分数背后的真相

    MemPalace的README声称在LongMemEval基准测试中获得100% R@5分数,以及100%的LoCoMo分数——这两项都是AI记忆系统的行业标准测试。

    48小时内,Penfield Research等独立研究机构发布了详细分析,指出这些数字存在方法论问题:

    • LongMemEval的100%分数:针对之前失败的三个问题进行针对性修复后,加上LLM重新排序才达到的。社区笔记显示,真实的hold-out分数是98.4%。原始verbatim模式(无重新排序)得分是96.6%。

    • LoCoMo的100%分数:使用了top_k=50的设置。问题在于LoCoMo数据集中的对话只有19-32个会话。设置top_k=50意味着检索到的候选集数量超过了实际会话数,无论嵌入模型表现如何,真实会话都会在候选池中。这实际上绕过了检索步骤。真实的LoCoMo分数是88.9%(混合打分,无LLM重新排序)。

    团队的回应:宁愿正确而非令人印象深刻

    面对质疑,MemPalace团队没有沉默或反驳。他们在README中添加了致谢:

    “感谢社区的残酷诚实批评。我们宁愿正确而非令人印象深刻。”

    承认了原始基准测试声明存在问题,同时强调:即使是96.6%的原始LongMemEval分数,仍然超过了付费竞争对手Mem0和Zep的85%左右。


    MemPalace到底是什么?技术架构详解

    核心思想:层次化记忆宫殿

    MemPalace将AI记忆组织成五层结构:

    复制

    Palace(宫殿)├── Wings(侧楼)- 项目和人物│   ├── Halls(大厅)- 记忆类型(事实/事件/偏好)│   │   ├── Rooms(房间)- 具体主题│   │   │   ├── Closets(储物柜)- 指向原始内容的压缩摘要│   │   │   └── Tunnels(通道)- 房间之间的交叉引用

    这种结构模仿了人类记忆的组织方式,而不是简单地将所有对话存储为扁平的嵌入向量。

    技术栈

    • ChromaDB
      :向量存储和语义搜索
    • SQLite
      :带时间戳的知识图谱(跟踪facts的valid_from和valid_to日期)
    • AAAK压缩
      :实验性压缩方言,将重复实体打包到更少的token中(声称压缩比约30x,1000-token passage压缩到120 token)
    • MCP集成
      :19个工具,让Claude、ChatGPT等LLM能自动查询记忆

    工作流程

    1. 初始化
      mempalace init ~/projects/myapp – 为项目创建宫殿结构
    2. 数据挖掘
      • 项目文件:mempalace mine ~/projects/myapp
      • 对话导出:mempalace mine ~/chats/ --mode convos
    3. MCP连接
      claude mcp add mempalace -- python -m mempalace.mcp_server
    4. 自动检索
      :之后Claude会在相关时自动查询记忆
    5. 唤醒上下文
      mempalace wake-up > context.txt – 加载完整上下文到任何本地模型

    关键特性

    • 完全本地运行
      :所有数据存储在你的机器上,零API成本
    • 隐私友好
      :数据不离开你的基础设施,对GDPR合规意义重大
    • 跨会话持久记忆
      :六个月的日常AI使用不再是1950万token的丢失上下文
    • 层次化检索
      :wing → hall → room的渐进式搜索将检索准确率从60.9%提升到94.8%,比扁平搜索提高34%

    为什么这个故事重要?四大启示

    启示1:AI工具的民主化时代已来

    Milla Jovovich不是职业软件工程师。她是演员、模特、时装设计师。但她和Sigman一起,使用Claude Code在几个月内构建了一个功能完整的、能够挑战VC资助的AI公司的产品。

    这标志着技术创造门槛的戏剧性降低。

    历史对比

    • 2020年前
      :构建类似的AI记忆系统需要一个全职工程师团队数月的工作
    • 2024年
      :需要资深AI工程师和基础设施投入
    • 2026年
      :一个有想法的非技术人+AI辅助编程工具+几个月的时间

    这不是孤例。Paperclip(38,000+星标)、Karpathy的知识库”编译法”等项目都印证了同一个趋势:AI辅助编程正在让”想法→产品”的路径前所未有的短。

    启示2:开源社区的自我纠错机制依然强劲

    48小时内,从爆火到被事实核查,再到团队承认错误并修正——这个过程展示了开源社区最宝贵的品质:透明和纠错。

    对比:AI记忆工具领域的基准测试战争早已丑陋

    • Zep指责Mem0虚报LoCoMo数字
    • Mem0的CTO反击发布反向分析
    • Letta发布研究质疑同一基准的可重复性

    MemPalace走进了一个基准测试信用已破产的领域。社区的反应不是盲目相信100%的营销数字,而是立即进行独立验证。

    这个时间线值得学习

    1. Day 0-1
      :项目爆火,营销数字被广泛传播
    2. Day 2
      :独立研究机构发布详细分析
    3. Day 2-3
      :X社区笔记添加更正
    4. Day 3-4
      :团队承认错误,更新文档

    整个过程不到一周。这种速度是闭源付费产品无法比拟的。

    启示3:本地优先和数据主权成为核心竞争力

    MemPalace的吸引力不仅是免费,更是本地优先(local-first)。

    隐私和合规的价值

    • 付费方案
      (Mem0、Zep):数据存储在云端,需要数据处理协议,GDPR合规复杂
    • MemPalace
      :数据永远不离开你的机器,无需第三方协议,完全控制

    对于欧洲的初创企业,这不是锦上添花,而是make-or-break的考量。GDPR不是可选项。

    成本计算

    • 付费记忆工具
      :$10-50/用户/月,4人团队每年$480-2,400
    • MemPalace
      :$0,仅需要设置时间

    对于自举初创企业(bootstrapped startups),这是简单的财务决策。

    启示4:AI工具的真实应用场景被忽视太久

    AI记忆工具在2026年4月前是”开发工具的一个安静角落”。大多数AI用户甚至不知道自己有这个问题:每次对话都从零开始,月复一月重复解释同样的背景。

    Jovovich作为”重度AI用户”的挫败感,反映了一个更大的问题:AI工具的设计者不是重度AI用户

    她发现了真实痛点,不是因为她是AI专家,而是因为她是AI的真实消费者

    这启示我们:最好的产品想法往往来自”用户”,而不是”行业专家”。


    实操指南:如何安装和使用MemPalace

    当前限制

    • ✅ Mac、Linux支持
    • ⏳ Windows支持在开发中(社区最请求的功能)

    安装步骤

    bash

    复制

    # 1. 安装pip install mempalace# 2. 初始化项目宫殿mempalace init ~/projects/myapp# 3. 挖掘现有数据# 项目文件(代码、文档、笔记)mempalace mine ~/projects/myapp# 对话导出(Claude、ChatGPT、Slack)mempalace mine ~/chats/ --mode convos# 4. 连接到Claude via MCPclaude mcp add mempalace -- python -m mempalace.mcp_server# 5. 搜索mempalace search "为什么我们决定用ChromaDB而不是Pinecone"# 6. 唤醒上下文(用于本地模型)mempalace wake-up > context.txt

    支持的数据格式

    • Claude Code JSONL导出
    • Claude.ai JSON
    • ChatGPT conversations.json
    • Slack导出
    • 项目文件(代码、文档、笔记)

    真实使用场景

    1. 战略决策记忆
      :为什么我们放弃技术栈A选择B?记录决策逻辑,避免重新讨论
    2. 客户沟通历史
      :三个月前承诺客户的功能变更,AI应该记得
    3. 代码审查上下文
      :为什么这个架构决策如此设计?历史讨论全部可检索
    4. 学习进度追踪
      :语言学习、技能习得的完整路径,不因重置对话而丢失

    争议与反思:基准测试的信用危机

    MemPalace的基准测试争议暴露了AI记忆工具领域的系统性问题:基准测试数字已经失去了可信度

    各家的声称 vs 独立验证

    公司
    声称分数
    独立验证
    争议
    MemPalace
    100% LongMemEval
    96.6% raw / 98.4% held-out
    top_k参数争议
    Mem0
    ~85% LongMemEval
    无独立验证
    被Zep指控虚报
    Zep
    ~85% LongMemEval
    无独立验证
    指控Mem0虚报

    问题根源

    1. 缺乏标准化测试协议
      :各家使用不同配置,数字不可比
    2. 选择性报告
      :只报告最优配置,不报告基线
    3. 数据泄露风险
      :测试集信息无意中泄露到训练或配置中
    4. 过度拟合测试
      :针对特定基准调参,牺牲实际性能

    用户的真实问题基准测试分数重要吗?重要,但不是唯一的指标。

    对于真实用户,更重要的问题是:

    • 这个工具能解决我的实际问题吗?
    • 设置成本 vs 收益是否合理?
    • 数据隐私和安全是否有保障?
    • 长期维护和社区支持是否可持续?

    MemPalace的诚实分数96.6%仍然超过付费竞品的85%,而且它是免费的、本地的。这是关键。


    谁应该考虑MemPalace?决策框架

    ✅ 应该尝试的人

    1. Claude/ChatGPT重度用户
      :每天使用AI,月复一月重复解释背景
    2. 欧洲GDPR意识强的团队
      :需要数据主权,不能随意发送对话到云端
    3. 自举初创企业
      :预算有限,每一美元订阅都要justify
    4. Mac/Linux用户
      :Windows支持待定,但现在可用
    5. 愿意接受早期摩擦
      :项目仅发布一周,文档和工具有rough edges

    ⏳ 应该等待的人

    1. Windows用户
      :正在开发中,给社区1-2个月时间
    2. 需要企业级稳定性
      :项目太新,生产部署有风险
    3. 完全非技术用户
      :目前需要CLI操作,设置复杂度中等
    4. 依��特定云服务集成
      :MemPalace是local-first,云集成有限

    ❌ 不适合的人

    1. 轻度AI用户
      :偶尔用ChatGPT,没有积累大量对话历史
    2. 需要零配置解决方案
      :付费SaaS产品仍然更易用
    3. 已经在付费工具上深度集成
      :迁移成本可能高于收益

    📌 昨日焦点| 2026年4月10日

    CoreWeave与Meta签署210亿美元AI算力合作

    4月8日,AI算力提供商CoreWeave宣布与Meta签署价值210亿美元的多年合作协议,为Meta的AI基础设施提供算力支持。

    • 核心数据
      :210亿美元,多年协议,AI算力基础设施
    • 直接影响
      :Meta继续扩大AI算力储备,减少对单一供应商依赖
    • 战略信号
      :科技巨头在AI基础设施上的军备竞赛加速

    Anthropic意外泄露Mythos模型文档

    4月7日,Anthropic意外泄露了未发布的Mythos模型(内部代号Capybara)计划文档,这是继Claude Code源代码泄露后的第二次事故。

    文档显示Mythos将取代Opus成为最高端版本,能力更强但成本更高。

    • 核心数据
      :第二次泄露,未发布模型信息曝光
    • 直接影响
      :竞争对手获得产品路线图信息,可能提前应对
    • 治理信号
      :Anthropic内部管理流程需要审查

    📊 今日数据| 2026年4月10日

    指标
    数据
    时间
    MemPalace GitHub星标
    15,000+
    4月10日
    MemPalace LongMemEval分数
    96.6%(raw)/ 98.4%(held-out)
    4月8日验证
    付费竞品LongMemEval分数
    ~85%
    持续
    CoreWeave-Meta合作额
    210亿美元
    4月8日
    Claude Code采用率增长
    300% QoQ
    Q1 2026
    AAAK压缩比
    ~30x(声称)
    项目文档
    付费记忆工具成本
    $10-50/用户/月
    市场价
    4人团队年成本(付费)
    $480-2,400
    计算

    🔗 信息来源

    特别关注

    • GitHub: milla-jovovich/mempalace
    • Mean CEO Blog: Milla Jovovich Just Beat Every Paid AI Memory Tool
    • Let’s Data Science: Milla Jovovich Launches Open-Source AI Memory System
    • LinkedIn: An Unexpected Entry Into AI Memory
    • Reddit: An actress Milla Jovovich just released a free open-source AI memory system

    今日焦点

    • Bloomberg: CoreWeave, Meta Strike $21 Billion for AI Computing
    • Instagram: Anthropic accidentally leaked their most powerful model ever

    本周动态

    • 新浪AI热点报:2026年04月10日00时
    • 掘金:4月ai新闻2026年4月初AI圈新闻

    💬 欢迎在评论区聊聊:你会尝试MemPalace吗?开源vs付费,你更倾向哪方?AI辅助编程是否降低了技术创造的门槛?

    本文为AI资讯日报,截至2026年4月10日整理,数据来源于公开报道与官方公告;涉及行业判断、商业化节奏与基准测试解读的内容仅供参考,不构成投资或技术决策建议。