从开源插件到生产级引擎:PolarDB PostgreSQL的向量能力新范式

导读

本文基于团队工程实践与独立思考，沿量化能力 → 性能增强 → 生态增强 → 海量场景 → 基座能力五条主线，系统拆解阿里云瑶池旗下的云原生数据库 PolarDB PostgreSQL 版（以下简称 PolarDB-PG）如何将 pgvector 从开源插件升级为支撑亿级向量、毫秒响应的一体化向量数据库引擎。

背景：向量数据库面临的三重权衡

自 2023 年以来，向量数据库经历了从类型支持（引入向量类型与距离算子）、到检索加速（借助 IVF、HNSW 等 ANN 索引实现毫秒级响应）、再到生产承载（亿级数据与千级 QPS 下的工程化能力）三个阶段的演进。工程能力的系统性短板在最后一阶段集中暴露。

这一阶段的核心挑战，可归纳为向量数据库的“不可能三角”：

向量数据库的不可能三角

上述不可能三角的难点在于：任何只解决其中一个顶点的方案，往往需要以另外两个顶点的能力作为支撑。

基于这一判断，我们的思路是：在 PolarDB-PG 的一体化数据库架构之上，系统性补齐 pgvector 在大规模生产场景中的工程能力短板，使向量检索能力能够与数据库内核、存储、计算和运维体系深度融合。具体落到如下图的五个动作上：

下文将逐项展开。

量化能力：单机承载亿级向量的关键能力

概括

量化是在精度可控的前提下，对向量进行有损压缩，将单条向量的存储与计算开销降至原来的 1/4 至 1/64。

能力建设

PolarDB-PG 的 pgvector 同时支持 IVF+量化与 HNSW+量化两种索引骨架，并在量化方案上覆盖了业界三种主流方案：PQ / SQ / RaBitQ。

▲ 三种量化方案的核心差异：

PQ（Product Quantization · 乘积量化）：将高维向量切分为 M 个子段，每段独立训练码本。压缩比高，召回精度依赖码本训练质量。
SQ（Scalar Quantization · 标量量化）：对每一维独立做线性量化（float32 → int8/int4）。实现简单、训练成本低，性价比最优。
RaBitQ（Random Bit Quantization · 随机位量化）：基于随机正交变换 + 1-bit 量化，理论上具有可证明的精度下界。

对于量化方案的选择，考虑的因素较多，包括数据集大小、特征集中度、特征维度、是否有采样需求等等，很难确认某一种或者几种方案能覆盖所有场景。因此我们有下面建议。

选型建议

💡 关键能力点：量化方案的核心价值在于针对不同业务场景适配最优方案，而非追求单一最优解。

性能增强：pgvector 的工程能力完善

在容量问题之外，本节聚焦于写入吞吐、长期稳定性与性能一致性。

1、bulkIO + 预读加速：提升构建/查询批量 IO 吞吐能力

pgvector 原生的索引构建走的是标准 PG buffer manager 路径：每写一页都要经过 shared buffer、加锁、生成 WAL、再异步刷盘。当向量规模上到亿级、索引体量来到几百 GB 时，bufferIO 成为整体性能的关键瓶颈。基于此，我们针对向量索引和查询场景引入索引构建批量读写能力、查询预读窗口能力，降低小 IO 冲突。

经过实测该方案在亿级向量场景下可显著加速构建/查询，提升 1.5×–2×。

2、FSM 改造：让 INSERT 效率加倍

在实际生产中，我们识别出大数据量 INSERT 场景中的一项隐性瓶颈：

🔬 原始痛点：不少向量引擎没有独立的 FSM（Free Space Map）管理能力。当索引中出现空闲页时，新 INSERT 仅能顺序遍历数据页定位可用空间，IO 冲突随数据规模显著上升。

我们创新性地引入高效的 FSM 管理机制，在插入场景解决 IO 阻塞问题。实测在亿级数据持续 INSERT 场景下，IO 冲突显著下降 90%，p99 写入延迟更平稳。

3、新一代 VACUUM：让索引页面可持续

向量数据的特点是单条向量本身体积较大，因此如何让旧数据空间更高效地被复用，是向量数据长远稳定运行的关键。

我们正在适配更加通用的向量数据清理逻辑——通过index_bulk_delete/index_vacuum_cleanup框架，与上一节的 FSM 改造形成闭环，使长期高写入/高删除场景下，索引膨胀率从“线性增长”变成“稳态可控”。

除此之外，我们还在 IO、并行、缓存等维度提供了一系列性能加速手段，可针对不同场景的瓶颈灵活调整策略。

生态增强：自研 polar_vectorboost，打通向量检索工程链路

很多团队在初次接入向量检索时，通常需要手写大量融合查询逻辑，不仅实现繁琐，还普遍面临调用门槛高、量纲不一致、融合排序缺失、召回稳定性差等工程难题。

解决方案

自研的向量生态增强插件polar_vectorboost，把“高频 SQL”压缩成一次函数调用。基本能力分三个方面介绍：

🟢 基础能力自动化

-- 一条 SQL 完成：补 embedding 列 + 自动分词 + 回填数据 + 推荐索引 + 注册元信息SELECT step, statusFROM polar_vectorboost.bootstrap('faq', 'content',    index_name => 'faq_idx',    id_column  => 'id');

核心功能包括：

bootstrap：打通 polar_ai，自动给文本表补embedding vector(N) +v tsvector两列；
register_index / list_indexes / drop_index：元信息注册表，简化使用流程；
recommend_vector_index：根据数据量 / 维度自动给出索引选型建议。

🟡 混合召回 + 融合排序

SELECT * FROM polar_vectorboost.hybrid_search('faq_idx',                              -- 注册表里的 index_name    query_text    => '云原生数据库',    top_k         => 10,    fusion        => 'weighted',    vector_weight => 0.7);                  -- 偏向量