乐于分享
好东西不私藏

数据不出门,秒级问文档——开源本地 RAG 知识库 mindvaults 正式发布

数据不出门,秒级问文档——开源本地 RAG 知识库 mindvaults 正式发布

你丢文档,它出答案。全程本地运行,零外网依赖。


mindvaults 是什么

mindvaults是一个开源的、隐私至上的本地 RAG 知识库问答系统。

上传你的 PDF、Word、Markdown,它自动解析 → 切片 → 向量化 → 存进本地向量数据库。然后用自然语言提问,大模型结合你的文档生成答案,并告诉你答案来自哪篇文档的第几页

最重要的是:全程本地运行,数据从不出你的电脑/服务器


为什么你需要它

如果你有以下场景:

公司文档(制度手册、技术规范、API 文档)散落在各处,每次找都要翻半天

用 Obsidian / Notion 记了大量笔记,但搜起从来痛苦

金融/医疗/政务 — 合规文档绝对不能上传任何云服务

不想付费 ChatGPT Plus / Dify 企业版

那么 mindvaults 就是你的趁手工具。


核心能力一览

1. RAG 全链路透明,不黑盒

传统知识库问答是”丢进去 → 出答案”,中间发生了什么一概不知。

mindvaults 通过SSE progress 事件实时推送检索全过程:

code
用户提问 → 意图识别 → 向量检索(HNSW) → Reranker精排 → LLM生成 → 引回复每一步的耗时、匹配度、中间结果,你都能看到。

2. 引用溯源:每个论断都能翻原文

每个答案的声明后面都标注了来源文档、原文片段和相似度评分。鼠标悬浮就能预览原文,点击直接定位。

这跟市面上”给你个答案但不告诉你为什么”完全不同 — mindvaults 追求的是可信 AI

3. 双模式部署,丰俭由人

模式
容器数
说明
轻量模式
5 个
LLM / Embedding 走 DeepSeek / OpenAI / 硅基流动云端 API
全栈模式
6 个
加挂 Ollama,大模型也跑本地,完全离线运行

Mac mini 能跑,云服务器也能跑,树莓派有兴趣也可以试试。

4. 多知识库隔离

创建多个知识库,每个知识库独立管理文档、配置检索参数。问技术问题时限定在”研发文档”库,问制度时切到”公司规章”库,互不干扰,也支持全局搜索。

5. Obsidian Vault 一键导入

用 Obsidian 记了几百篇笔记?mindvaults 直接导入整个 Vault,自动提取 YAML frontmatter 属性,建索引、开问答。

6. 可拔插模型架构

LLM 和 Embedding分开配置,不绑死任何一个厂商:

LLM:DeepSeek / OpenAI / 通义千问 / Ollama 本地 任意切换

Embedding:硅基流动 / OpenAI / 本地 BGE-large-zh-v1.5

API 挂了换本地,本地不够用换云端 — 开关一拨就行。


技术栈

技术选型
前端
Next.js 14 (App Router) + TypeScript + TailwindCSS
后端
FastAPI + SQLAlchemy 2.0 + Pydantic
向量库
PostgreSQL 16 + pgvector (HNSW 索引)
缓存
Redis 7
Embedding
BGE-M3 1024 维
部署
Docker Compose + Nginx 反向代理

技术选型主打一个务实:没有引入 Kafka / ES / K8s 等重型组件,5-6 个容器跑全链路,学习成本极低。


三分钟跑起来

bash
1. 拉代码git clone https://github.com/sqking-coke/mindvaults.git && cd mindvaults2. 复制配置(.env 里已预设常用 API Key 字段)cp .env.demo .env3. 一键启动docker compose --env-file .env up -d4. 打开浏览器 http://localhost#    进入系统设置 → 填入 API Key → 开始问答

就这些。Demo 模式还预置了示例文档,不用上传就能体验完整流程。


未来方向

我们正在推进的能力:

外部数据源订阅(RSS / API 定时抓取 → 清洗 → 入库)

LLM 数据清洗管道(原始内容 → 去噪摘要 → 智能切片)

问答反馈学习(点赞/踩 → 影响检索排序)

多 Agent 协同(检索 Agent + 摘要 Agent + 校验 Agent)


它适合谁

独立开发者 & 小团队:零成本自建知识库,告别 ChatGPT Plus 订阅

安全敏感企业(金融/医疗/政务):内网物理隔离,不碰任何外部 API

个人知识管理爱好者:给 Obsidian Vault 装上 AI 问答引擎

想学 RAG 的开发者:项目结构清晰、文档完备、架构分层规范,是很好的学习素材


立即尝试

🔥在线体验:https://mindvaults.app

🔗GitHub:https://github.com/sqking-coke/mindvaults

📖文档:15 篇规划文档覆盖架构 / API / 数据库 / 部署 / 日志监控 / 异常处理等全模块

⭐ Star 是对开源作者最大的鼓励。发现 bug 欢迎提 Issue,有想法欢迎开 Discussion。


你的下一代知识库,不在云端。

— mindvaults