上周有个同行在群里吐槽:用Select AI查数据库,问了一句"上个月退货最多的商品是啥",AI给我翻译成了"most returned product last month",然后生成的SQL查的全是英文表。
这事儿太典型了。
AI工具看着热闹,但中国DBA真正用起来,到处是坑。工具是英文的,文档是英文的,可你的业务表叫T_DINGDAN,字段叫SHOUHUO_DIZHI,注释一行没写。AI看不懂,你也没法全改成英文。
这不是一个Prompt的问题,是一个结构性的困境。
第一个卡点:AI工具默认就是给英文环境设计的
拿Select AI来说,Oracle官方文档确实写了支持中文自然语言查询。但你看推荐的模型配置——默认的嵌入模型是cohere.embed-english-v2.0,英文专用的。想支持中文?你得手动换成cohere.embed-multilingual-v3.0,还得在Profile里指定command-r-plus这种支持多语言的模型。
问题来了:有多少DBA知道要换嵌入模型?官方Quick Start没写这步,默认配置直接上,中文问一句,返回的SQL全是英文表名匹配,查出来不是你要的东西。
而且Select AI的chat模式比NL2SQL模式更依赖上下文。中文表名、中文注释、中文列名,LLM理解起来天然打折扣。你让AI"查一下上个月的订单金额",它根本不知道DINGDAN是订单,JINE是金额。
这还不是最糟的。
第二个卡点:你的数据库里压根没有注释
我见过太多Oracle数据库了,表名拼音缩写,字段名拼音缩写,注释?不存在的。
AI要理解"查最近7天的活跃用户",它得知道哪些表存用户、哪些字段是登录时间、什么算"活跃"。没有注释,没有视图,它就是瞎猜。
英文环境下这个问题也存在,但英文表名好歹有业务语义——ORDER、CUSTOMER、LOGIN_TIME,AI能猜个七八成。中文环境呢?YHXX是什么?用户信息?还是银行信息?没注释,人都不一定分得清,AI更不行。
所以AI辅助查询这件事,在中国企业里第一步不是选模型,是补注释。这个脏活累活,谁都不想干,但不干,AI就是个摆设。
第三个卡点:英文文档是一道隐形门槛
Oracle的AI相关文档,90%以上是英文的。中文文档有,但翻译质量参差不齐,而且更新滞后。
比如26ai的向量搜索、Select AI、Agentic AI,英文文档已经迭代了好几版,中文文档很多还停在23ai时代。你遇到问题去MOS搜,知识库也是英文为主。社区讨论?Reddit、Stack Overflow全是英文。
中国DBA的英文水平其实不差,毕竟干了这么多年运维,英文文档硬啃也能啃。但AI这个东西不一样,它需要你理解Prompt工程、模型参数、RAG架构这些新概念。本来就新,文档还是英文的,学习成本直接翻倍。
很多DBA不是不想学,是学不动。白天处理告警、做变更、开会,晚上还得啃英文文档搞明白embedding和vector index的区别。这种强度的学习,能坚持下来的不多。
第四个卡点:国产大模型和Oracle生态还没接上
这两年国产大模型发展很快,DeepSeek、千问、智谱,中文理解能力已经很强了。有个数据说国产大模型训练数据里中文占比超60%,有的模型到80%,中文语义理解确实比以前好太多。
但问题是——这些模型和Oracle的对接还很少。
Select AI目前支持OCI Generative AI、OpenAI、Cohere、Google、Anthropic这几家。国内大模型呢?没有官方适配。你要用DeepSeek连Oracle数据库,得自己写中间层、自己封装API,工作量不小。
国产大模型中文理解强,但没接上Oracle。国外模型接上了Oracle,但中文理解差点意思。这个中间地带,目前没人填。
那怎么办?几个务实的做法
先说补注释这件事,别觉得是苦力活就不干。没有注释的数据库,不光AI看不懂,新来的同事也看不懂。花一周时间把核心表的注释补上,这是对未来的投资。而且AI本身就能帮你干这事——把表结构丢给AI,让它帮你生成注释,你审核确认就行。
然后用Select AI的时候,别用默认配置。中文环境一定要换多语言嵌入模型,command-r-plus或者gemini-1.5-pro的中文表现都不错。别偷懒用默认的英文模型,查出来的东西牛头不对马嘴。
如果你团队确实受英文文档困扰,一个折中方案是用国产大模型当翻译助手。把Oracle英文文档丢给DeepSeek或千问,让它用中文给你解释关键概念和配置步骤。这不完美,但比硬啃英文文档快很多。
还有一条路是建视图。给核心业务表建一层英文别名视图,加上注释。AI查视图比直接查中文表名靠谱得多。这比改表名安全,不影响现有业务。
最后,期待国产大模型和Oracle生态的对接。这不是DBA能解决的,但需求确实在这里。谁先做出来,谁就吃下这个市场。
说句实在话
中国DBA用AI,不是不想用,是用起来处处是坎。
工具层面,默认配置对中文不友好。数据层面,注释缺失是普遍问题。文档层面,英文门槛挡住了很多人。生态层面,国产大模型和Oracle还没接上。
这些问题不会一夜之间解决。但每个DBA能做的,是把注释补上,把配置改对,把视图建好。这些小事做好了,AI才能真正帮上忙。
困境是真实的,但不做点什么,困境就永远是困境。
夜雨聆风