6月25日,我有幸线下参加了“GBASE 技术云享会 2026”。可以说这场活动是GBASE南大通用成立22周年的技术盛会,地点在天津天开高教科创园报告厅。会上,南大通用董事长 丁明峰 发表致辞,中国信息通信研究院人工智能研究所大数据与智能化部主任 姜春宇、佰晟智算(深圳)技术有限联合创始人 徐戟、openGauss 社区秘书长 openGauss 领域总经理 蔡亚杰、以及 GBASE 的三位产品线负责人 8c 产品经营部总经理 张益、8a 产品经营部总经理 关连坡、8s 产品经营部总经理 杨蔚,分别分享了数据库产业的最新动态和技术趋势。线上直播有 10.8w 人看过。
作为南大的老朋友,我对GBASE的产品并不陌生,但这次参会还是让我收获了不少新东西。尤其是三条产品线在AI方向上的布局和探索,让我看到了一家经营超过20年的老牌国产数据库厂商在新技术浪潮中的思考和行动。接下来,从GBase 8c、GBase 8a、GBase 8s三条产线分别聊聊GBASE在AI方面的特性和探索。
GBase 8c:把自己定位成"AI原生数据库"
GBase 8c 是GBASE这次大会上AI相关内容的重头戏。分享嘉宾是8c产品经营部总经理张益,他的演讲题目是"多模多态,智联未来",直接把8c的定位拉到了"新一代AI原生数据库"这个高度。
多模多态的底子
GBase 8c全名叫"多模多态数据库管理系统",这个命名有点意思。张益在会上解释说,"多模"指的是多种数据存储模式,包括行存、列存和行列混存;"多态"指的是多种部署形态,包括主备、分布式和存算分离。这两个概念在产品创立之初(2020年左右)就有了,跟后来AI领域流行的"多模态"概念其实是一回事。
这个巧合说明了一个问题:8c在设计上天然就适合处理多种类型的数据。当2024年AI大潮真正起来的时候,8c只需要把非结构化数据管理能力纳入进来,就能顺理成章地成为一个真正的"多模态"数据库产品。8c现在支持的存储模式包括行存、列存、行列混存,这三种模式都做到了表层级。也就是说在同一个数据库里面,你可以让某些表用行存,某些表用列存,某些表定义成行列混存。这对用户来说意味着选型成本和使用成本都降低了。

GBase 8c 支持主备、分布式、存算分离三种部署方式,每种都对应不同的业务阶段和需求。
• 主备部署:系统建设初期数据量不大的时候,用一台主加几台备就能跑起来。部署简单,交付高效。 • 分布式部署:业务增长以后,可以平滑切换到分布式,通过增加节点来支撑更大的数据量和并发量。张益特别强调了一个点:8c是原生分布式数据库,不是那种通过中间件拼出来的分布式方案。原生分布式在跨节点JOIN查询、数据一致性等方面有明显优势。 • 存算分离部署:这是2024年AI兴起以后8c重点发展的方向。计算层完全无状态,状态通过WAL日志同步到存储层。这样做的好处是计算节点可以秒级扩缩容,甚至可以把计算资源缩到零(Scale-to-Zero),空闲时几乎不产生成本。张益在演讲中说,这种部署形态"能更好地服务于 AI Agent"。

向量存储和标量融合检索
GBase 8c 在AI方面最核心的能力,是原生向量存储和向量标量融合检索。现在的AI应用大部分是在传统业务系统上叠加的新能力,这意味着一个业务系统往往同时存在传统标量数据和向量数据。8c的做法是把向量数据和标量数据统一存储在同一个数据库里,用同一套SQL来查询。
具体的技术实现上,8c支持:
• 相似性搜索JOIN关系型数据:向量检索结果可以和关系型表做JOIN,满足过滤条件后再返回最终结果 • 复杂融合SQL:向量搜索可以和传统的SQL查询(包括窗口函数、聚合、子查询等)组合使用 • 多标签过滤:先用标量条件过滤缩小范围,再在候选集上做向量检索
这种做法避免了"分库查询、业务整合"的改造方式,降低了改造成本和运维复杂度。
值得一提的是,8c的向量数据库能力跟openGauss社区有很深的渊源。openGauss社区秘书长蔡亚杰在会上提到,openGauss首个版本的向量扩展就是由GBase贡献的。这个版本经过社区多轮迭代后,演变成了现在openGauss的DataVec向量数据库能力。

对了,值得庆贺的是,GBase 8c 于上个月末顺利通过了安全可靠评测,当你在做数据库选型时,可以放心选择 GBase 8c。
GBase 8a:云数仓和向量数据库双线并进
GBase 8a 是GBASE最老牌的产品,大规模分布式并行数据库,在金融、通信、能源、交通等行业有着广泛部署。这次大会上,8a产品经营部总经理关连坡分享了8a的技术迭代方向,其中跟AI相关的主要是两条线:GCDW云数仓和GCVD向量数据库。

GCDW 云数仓,全称 GBase Cloud Data Warehouse,是8a的云原生版本。它的核心架构是存算分离,计算层和存储层可以独立扩缩容。存算分离这个架构在AI时代有一个天然的优势:AI训练/推理的负载波动很大,训练的时候可能需要大量计算资源,推理/空闲阶段资源需求就降下来了。存算分离架构下,计算节点可以按需增减,不需要做数据迁移,实现秒级扩缩容。负载降低时还能把计算资源缩到零,大幅降低空闲成本。GCDW已经在国内某国有大行实现了近千节点的部署,承载着风险集市、监管报送、财会平台等核心业务系统。
GCVD 向量数据库,全程 GBase Cloud Vector DB,是GBASE与英特尔联合推出的向量数据库系统。它的技术底座是GBase 8a MPP Cluster,在保留8a高可用、高扩展、高安全等企业级能力的基础上,增加了向量存储和检索能力。GCVD最值得说的一点是它与英特尔第五代至强可扩展处理器的深度优化。通过英特尔的AMX(Advanced Matrix Extensions)加速引擎,向量检索性能提升了2.44倍,数据库整体性能提升超过2倍。这种"数据库+硬件"的联合优化路线,是国产数据库在性能上追赶甚至超越国际产品的一个重要方向。
GBase 8s:稳重的事务型数据库也在拥抱AI
GBase 8s 是GBASE的事务型数据库产品,主打金融级高可用和安全。虽然8s在AI方面的动静没有8c那么大,但8s产品经营部总经理杨蔚在会上分享的存储引擎重构工作,实际上是为未来的AI化打下了坚实的基础。
杨蔚的团队花了两年时间对8s的存储引擎进行了彻底重构。这次重构的核心成果包括:
• 内存化MVCC:融合了内存化引擎和传统disk-based引擎的优势 • 3秒切换:重构了主备切换机制,在压测负载下RTO小于3秒 • 万级并发:通过无锁化编程和动态资源分配,实现了万级并发连接 • 从节点一致性读:解决了读写分离场景下的一致性难题 • DDL Online:支持更广泛的在线DDL操作 • 极速闪回读:无需等待日志回滚即可读取历史数据
这些改进看似跟AI没有直接关系,但它们解决的其实是AI时代数据库必须面对的基础问题:高并发、低延迟、高可用。当 AI Agent 以百万级并发访问数据库的时候,这些基础能力决定了数据库能不能扛得住。

最后,杨蔚在会上透露,8s今年会发布V10版本。虽然他没有透露太多细节,但从存储引擎重构的方向来看,V10很可能会在向量存储、AI运维等方面有大幅进步。
从"DB for AI"到"DB for DATA":嘉宾视角
除了三条产品线的分享,会上还有两位嘉宾的观点值得记录。
姜春宇:向量数据库热度持续攀升
信通院人工智能研究所的姜春宇主任从产业视角分享了数据库的最新趋势。有几个数据值得关注:
中国数据库市场规模接近600亿元,公有云占比已经超过本地部署,预计到2025年公有云市场占比将达到67.1%。在产品类型方面,向量数据库在国内非关系型数据库中的热度排名从2022年的第7位攀升到2025年的第2位,仅次于图数据库。
姜主任还提到了几个关键技术趋势:AI for DB(AI重塑数据库内核,包括查询优化、索引管理、连接排序等)、DB for AI(数据库赋能AI应用落地,包括多模态统一处理、向量数据库、AI原生数据库)、以及 Agent-Native DB(数据库从"人类开发者工具"转变为"AI Agent可直接理解、调用和协作的智能基础设施")。
白鳝:数据库的未来不是给AI打工,而是回归数据本身
白鳝老师的演讲题目是:"数据库的未来:从 DB for AI 到 DB for DATA"。他的核心观点是:现在大家都在讲数据库怎么为AI服务(DB for AI),这很重要,但还不够。数据库的未来应该是回归数据的本质(DB for DATA),AI只是数据处理的一种方式,或许未来不再存在“数据库”,而是会重建为“数据X”(一种尚未命名的新软件)。
白鳝在现场提到了几个的观点值得记录:
向量会成为标准数据类型。就像当年BLOB/CLOB成为数据库的标准数据类型一样,向量未来也会成为数据库原生支持的数据类型。不是为了做RAG,而是因为很多场景天然就需要向量。比如指纹识别、图像分析、工业质检,这些场景首先要做向量化,然后才能进行后续处理。
RAG不是唯一的召回方式。白鳝说,"随着AI的发展,RAG其实不是一种特别重要的召回方式了"。RAG的核心价值在于提供了一种新的数据结构,而不是某种特定的应用模式。
数据处理与AI计算的深度融合。未来的数据库查询可能不再是"先做关系计算,再做向量计算,最后做推理"这种分步骤的模式,而是在一次计算中把所有事情都做完。关系数据可以直接嵌入到AI模型里做推理。
AI 数据工厂的概念。白鳝认为,未来的数据库可能成为"AI数据工厂"的核心。这个工厂不是简单地存储数据,而是能够自动决定:为了完成某个分析任务,需要分成几个步骤,需要从哪些数据源获取数据,甚至在任务发起之前,具体的执行方法都是未知的,由AI实时决定。
写在最后
参加完这场大会,我对GBASE在AI方向的布局有了更清晰的认识。8c 是最积极拥抱AI的产品,把自己定位为"AI原生数据库",在向量存储、存算分离、弹性伸缩等方面做了大量工作。8a 依托新存算分离架构的优势,在云数仓和向量数据库两个方向并行推进。8s 则在做扎实的基础工作,通过存储引擎重构为未来的AI化打基础。
南大通用20多年一路走来真的不易,同时也向所有廿年以上的数据库软件厂商致敬!


相关阅读:
Have a nice day ~ ☕
👉 这里有得聊
如果你对国产基础软件(操作系统、数据库、中间件)、AI Agent、Vibe Coding、OpenClaw 、Hermes Agent 等感兴趣,欢迎关注微信公众号:「少安事务所」。如果这篇文章为你带来了灵感或启发,请帮忙『点赞、转发、推荐』,感谢!ღ( ´・ᴗ・` )~
夜雨聆风