🚀 Qdrant 向量数据库安装与入门指南
“本文整理自 Qdrant 官方文档,带你从零开始认识并安装这款当红的向量数据库
📌 写在前面
在 AI 大模型爆发的今天,向量数据库已经成为了 RAG(检索增强生成)、智能推荐、语义搜索等场景的核心基础设施。而 Qdrant 凭借其优秀的性能和友好的 API,正在成为众多开发者的首选。
这篇文章将带你从基础概念开始,一步步完成 Qdrant 的安装和配置~
🤔 什么是向量数据库?
向量数据库是一种专门为处理 AI 模型生成的高维向量数据而设计的数据库。
传统的关系型数据库(MySQL、PostgreSQL 等)存储的是结构化的表格数据,而向量数据库存储的是:
🎯 向量数据:AI 模型生成的 embedding(嵌入向量) 🏷️ ID:每个向量的唯一标识 📦 Payload:附加的元数据信息(可以理解为"备注")
这些数据共同组成了 Qdrant 中的"集合"(Collection)。
💡 为什么需要向量数据库?
想象一下这些场景:
图像识别:每张图片被转换成一个包含成千上万个数值的向量,每个数值代表图片的某个特征 音乐推荐:每首歌被表示为一个向量,元素包含节奏、流派、歌词情感等信息 语义搜索:每篇文章、每个问题都被向量化,用来计算"意思相近"的程度
向量数据库就是专门为高效处理这类数据而生的!它使用:
HNSW 索引:分层可导航小世界算法,实现毫秒级的近似最近邻搜索 乘积量化:压缩向量体积,节省存储空间
📐 Qdrant 支持的三种距离度量
1️⃣ 余弦相似度 📐
衡量两个向量"方向"是否一致,值范围从 -1 到 1。
1 = 完全相同 0 = 不相关 -1 = 完全相反
💡 最常用于文本相似度比较!
2️⃣ 点积 🎯
和余弦相似度类似,但还考虑了向量的"长度"。 如果向量已经归一化(长度为 1),点积就等于余弦相似度。
💡 适合基于词频构建的向量表示!
3️⃣ 欧氏距离 📏
就是我们中学学过的"空间两点之间的直线距离"。 计算两个向量对应位置差值的平方和,再开平方。
💡 直观易懂,广泛应用于各类机器学习场景!
🎯 什么是 Qdrant?
Qdrant 是一款开源的向量相似度搜索引擎,它提供:
✅ 生产级服务:稳定可靠,可直接用于线上环境 ✅ 友好的 API:REST API + gRPC 双支持 ✅ Payload 支持:每个向量都可以附带额外信息 ✅ 多语言客户端:Python、JavaScript、Rust、Go 等 ✅ 三种部署方式: 本地 Docker 部署 Python 客户端直连 Qdrant Cloud(有免费额度!)
⚙️ Qdrant 安装教程
🐳 Docker 安装(推荐)
Qdrant 官方最推荐的部署方式就是 Docker,一键启动,无需复杂配置!

“💡 小提示:通常建议把软件安装到
/opt目录下
⚠️ 国内用户注意:镜像拉取问题
直接从 Docker Hub 拉取 Qdrant 镜像可能会非常慢,甚至失败:

别担心,配置一下国内镜像源就能解决!
🔧 配置 Docker 国内镜像源
步骤 1:编辑(或创建)配置文件
vim /etc/docker/daemon.json
步骤 2:添加镜像配置
{
"registry-mirrors": [
"https://docker.m.daocloud.io"
]
}
步骤 3:重启 Docker 服务
systemctl daemon-reload
systemctl restart docker
📋 可用的 Docker 镜像源列表
配置完成后,再次拉取镜像就非常顺畅啦!

▶️ 启动 Qdrant
执行以下命令一键启动:
docker run -p 6333:6333 -p 6334:6334 \
-v "$(pwd)/qdrant_storage:/qdrant/storage:z" \
qdrant/qdrant
参数说明:
6333 端口:REST API 和 Web UI 6334 端口:gRPC API 数据卷挂载:将数据持久化到本地目录
启动成功后,你会看到类似这样的日志:

🌐 访问地址
启动成功后,可以通过以下地址访问:
http://你的IP:6333 | |
http://你的IP:6333/dashboard | |
http://你的IP:6334 |
打开 Web UI,你会看到这个欢迎页面:

🎉 恭喜!
Qdrant 已经成功安装并运行了!接下来你可以:
创建你的第一个 Collection 导入向量数据 开始你的语义搜索之旅
“💡 提示:官方文档有非常详细的快速入门教程,建议继续阅读哦~
夜雨聆风