我在自己电脑上装了个 AI,它记得住我,也从不上传我的东西
你有没有想过,每次跟 ChatGPT 聊完,那些工作安排、项目想法、甚至随口的吐槽,都去哪了?前阵子老王问了我一句,我没答上来。

一、饭桌上那句话
做律师的老王跟我吃饭时提了一嘴:他想用 AI 帮忙整理案卷,但客户资料是要保密的,传到云上万一出事,执业证就没了。所以那些好用的工具,他一个都不敢碰。
我当时没接话。其实我自己也差不多——跟 AI 聊得越多,它越懂我,但代价是我把自己一点点交了出去。对话、习惯、那些不想让人知道的东西,全在别人的服务器上躺着。
那天回去我就琢磨,能不能有个 AI 是真正属于我的:跑在自己电脑上,记得住我,但什么都不往外传。
二、我们用的 AI,其实是租来的
ChatGPT、Notion AI 这些云端工具确实聪明省心,但有两个地方我后来越想越别扭。
一个是它不记事。今天你告诉它"回答简洁点别废话",明天它照样给你长篇大论,因为它压根不记得你是谁。
另一个就是数据。普通人觉得这是隐私问题,但对律师、医生、或者手里攥着公司机密的创业者来说,这直接就是"没法用"。
说白了,用云端 AI 有点像住酒店,方便归方便,但东西都得搁在别人那儿。我想要的更像家里的管家,东西都在屋里,人还越用越懂你。
三、想搭这么一个本地 AI,得先想明白几件事
模型跑在自己机器上。 用 Ollama 基本一行命令就能把开源模型(Llama 3.3、Qwen 3 这些)拉起来在本地跑。日常对话用 8B 的就够,一张 RTX 4060 都能带得动;真要做复杂推理再上 70B。没独显也不是不行,Ollama 支持 CPU 跑,就是慢点。把它定位成日常助手就好,啃硬骨头的活儿留个口子调云端。
记忆不是把聊天记录全塞回去。 很多人第一反应是把历史对话一股脑喂给模型,但上下文根本装不下你几个月的东西。靠谱的做法是聊完之后让模型把关键事实提炼出来——"这人喜欢简洁""老王是合作方"——存进本地的向量库,下次先检索相关的再带进去。mem0 这类库就是帮你把这套流程自动跑起来。
工具集成靠 Function Calling。 把 Notion、日历、邮件这些封装成工具,模型自己判断该调哪个,帮你记笔记、加提醒、起草邮件。不过本地小模型在这块没 GPT-4o 稳,偶尔会乱传参数,所以工具描述写清楚点、参数别搞太复杂、加上校验和重试。
隐私是这事的根。 默认全本地,推理、嵌入、记忆库都在你机器上。只有你自己点头了,才把脱敏后的内容发去云端兜底。本地优先、云端可选,这样隐私和能力才能两头都顾着。
四、上手其实没几行
import ollama
from mem0 import Memory
# 模型、嵌入、向量库全配本地,数据不出门
memory = Memory.from_config({
"llm": {"provider": "ollama", "config": {"model": "llama3.3:8b"}},
"embedder": {"provider": "ollama", "config": {"model": "nomic-embed-text"}},
"vector_store": {"provider": "chroma", "config": {"path": "./local_memory"}},
})
def chat(user_input: str) -> str:
# 先把相关的记忆捞出来
mems = memory.search(query=user_input, user_id="me", limit=5)
ctx = "\n".join(f"- {m['memory']}" for m in mems["results"])
# 带着记忆做本地推理
resp = ollama.chat(model="llama3.3:8b", messages=[
{"role": "system", "content": f"你是用户的私人助理,已知记忆:\n{ctx}"},
{"role": "user", "content": user_input},
])
reply = resp["message"]["content"]
# 这次聊的内容再存回去(mem0 会自动抽关键事实)
memory.add([{"role": "user", "content": user_input},
{"role": "assistant", "content": reply}], user_id="me")
return reply
# 第一次:"我喜欢简洁的回答,别废话" → 它记下了
# 一周后:"帮我总结下 AI 发展" → 自动给你简洁版跑一阵你会发现它是真记得你说过的话。这种慢慢被它"摸熟"的感觉,云端 AI 给不了。
五、几个我踩过或者差点踩的坑
别指望 8B 的小模型有 GPT-4o 那么聪明。它有上限,把预期放对位置,复杂的活儿走云端兜底,就不至于失望。
别把记忆做成黑盒。用户得能看到 AI 记了啥、能删、能改。记忆这东西看不见摸不着的话,跟云端 AI 又有什么区别。
Notion、邮箱的 API Token 别明文写代码里。用系统密钥链或者加密存一下。本地不代表就能不管安全了。
记忆库用久了会塞满一堆没用的碎信息,得时不时去重、合并、把过期的清掉,不然检索越来越不准。
六、最后
老王后来真把这套搭起来了,案卷资料一个字都没离开过他那台工作站。他说终于有个 AI 敢让他说点心里话了。
我们把数据往外交了这么多年,现在能要回来一点是一点。
你会愿意花点时间,给自己也搭一个吗?评论区聊聊。
觉得有用就转给那个"不敢用云 AI"的朋友吧 🙌
夜雨聆风