乐于分享
好东西不私藏

我用 AI 工具干了一个月 DBA 的活,说说真实体验

我用 AI 工具干了一个月 DBA 的活,说说真实体验

标题党?不完全是。

过去一个月,我刻意在日常工作中尽可能多地使用 AI 工具,想看看它们到底能覆盖多少 DBA 的工作。以下是真实记录。

实验对象

我日常管理 50 套 Oracle 数据库(19c 为主,少量 11gR2),包含 15 套 RAC 和 20 套 DataGuard。

使用的 AI 工具包括:

  • 大语言模型(用于 SQL 编写、文档查询、问题诊断)
  • AI 驱动的数据库监控平台
  • 自然语言查询工具(Text-to-SQL 类)

第一周:感觉良好

SQL 编写和优化建议

让 AI 帮忙写一些查询:统计各表空间使用率的 SQL、查最近 7 天 RMAN 备份状态的 SQL、找出无效对象的 SQL。

效果不错。生成速度快,语法基本正确,省了查文档的时间。

让它看一条慢 SQL 的执行计划,给优化建议。它说:”建议在 ORDER_DATE 列上创建索引。”

嗯……这个建议不能说错,但太泛了。我这张表有 2 亿行数据,按月分区的,问题出在分区裁剪没生效。加索引不但解决不了问题,还浪费存储空间。

文档查询

问 AI:”Oracle 19c 的 RMAN 增量备份 Level 0 和 Level 1 有什么区别?”

回答得很好,比翻官方文档快。对于基础概念类的问题,AI 确实是合格的助手。

结论:AI 在标准化、知识检索类工作上表现不错。

第二周:遇到了边界

故障诊断

周二下午,一套生产库的应用端反馈查询变慢。

我让 AI 分析 AWR 报告,它指出了几个等待事件偏高。但当我追问”db file sequential read 等待时间从上周的 2ms 涨到 15ms,可能是什么原因”时,它给了一个标准答案:”可能是 IO 子系统性能下降、Buffer Cache 不足或索引碎片化导致。”

三个可能原因都对,但等于没说。

实际情况是:存储团队前一天做了一次 LUN 迁移,新的 LUN 所在的磁盘组性能不如原来的。这个信息 AI 不可能知道——它看不到存储层面的变更记录,也不知道我们公司的运维流程。

最终解决方案是协调存储团队把 LUN 迁回去。从发现问题到定位原因,花了 2 小时——全靠人工排查和跨部门沟通。

变更评估

开发提了一个需求,要在一张 5000 万行的表上删除两个字段。

AI 说:”ALTER TABLE … DROP COLUMN 可以完成。”

技术上没错。但它不知道的是:这张表上有物化视图依赖、有好几个存储过程引用了这两个字段、删列操作会锁表影响在线业务。正确做法是标记为 UNUSED 然后在维护窗口里处理,同时还得协调开发和测试确认依赖关系。

结论:AI 的”知道”是通用知识,不是对你环境的理解。两者差距巨大。

第三周:找到了平衡点

我开始调整策略,不再指望 AI 替代我的判断,而是把它当成一个高效助手

用 AI 做的事:

  • 快速生成常用 SQL 模板(巡检脚本、监控查询)
  • 查 Oracle 语法和参数说明(比翻文档快 10 倍)
  • 给初级同事解释基础概念(”帮我用通俗的语言解释 redo log 的工作原理”)
  • 辅助写运维文档和操作手册的初稿

自己做的事:

  • 所有涉及生产环境的变更决策
  • 性能问题的根因分析(AI 给方向,但结论我来判断)
  • 架构设计和容量规划
  • 和其他团队的协调沟通
  • 故障应急处理

结论:AI 是很好的加速器,但不是自动驾驶。

第四周:反思

一个月下来,我大概节省了 30% 的工作时间,主要省在文档查询、SQL 编写和巡检报告整理上。

但省下来的时间我并没有空着——而是有更多精力去做以前”想做但没时间做”的事:

  • 优化了两套库的分区策略
  • 完成了一个 DataGuard 切换演练
  • 给团队做了一次 AWR 分析的内部培训

这让我意识到一件事:AI 时代 DBA 的价值不是”更便宜地做同样的事”,而是”在同样的时间里做更有价值的事”。

对同行的几点建议

1. 不要抗拒 AI,也不要神化 AI

它就是一个工具。锤子能帮你钉钉子,但不能帮你设计房子。

2. 基本功比以往任何时候都重要

AI 让信息获取变得容易了,但这也意味着”知道皮毛”不再有价值——每个人都能问 AI 得到皮毛级的答案。你的竞争力在于深度:能不能看懂 10046 trace、能不能分析 AWR 里的异常模式、能不能在 3 分钟内判断一个故障的根因。

3. 系统化学习,别只靠碎片信息

AI 回答问题很快,但它不会帮你建立知识体系。Oracle 的知识点之间是有关联的——理解了内存结构才能做好 SGA 调优,理解了 redo 机制才能做好备份恢复策略。

如果你觉得自己的知识体系有缺口,可以看看 ora100.com 的 100 天实战课程(https://ora100.com/articles),10 个专题、100 篇文章,系统化地覆盖 Oracle 运维的主要方向。不是替代 AI,而是让你在用 AI 时有足够的判断力来评估它给出的答案。

4. 把重复性工作自动化,释放你的时间

安装部署、日常巡检这些标准化工作,能自动化就自动化。ora100.com 也提供了一键安装脚本(https://ora100.com/shell-install)和巡检报告自动生成(https://ora100.com/oracheck-report),和 AI 的逻辑一样——让工具做工具擅长的事,你去做需要人脑的事。

最后说句大实话:每一次技术变革都有人喊”XX 要失业了”,但最终失业的从来不是整个职业,而是那些不愿意适应变化的个体。

10 年前 Oracle 推云数据库,有人喊”DBA 要失业了”。5 年前容器化盛行,又有人喊。现在轮到 AI 了。

DBA 还在,而且比以前更重要——因为数据比以前更重要。

100 天实战课程:https://ora100.com/articlesOracle 一键安装脚本:https://ora100.com/shell-installOracle 巡检报告生成:https://ora100.com/oracheck-report