现在到处都在说"AI提效",好像不用AI就落伍了。
我也跟风用了3个月。说实话,有些场景确实爽——AWR报告5分钟出结论,巡检脚本10秒生成,ORA报错不用翻Metalink了。
但今天不想说这些。
今天想聊聊那些AI根本帮不上忙的场景。 不是泼冷水,是用了3个月之后,我觉得这比"AI有多好用"更值得说清楚。
场景1:跨部门排查故障
周二下午,生产库查询变慢。
我把AWR报告丢给AI,它说"db file sequential read等待时间偏高,可能是IO子系统性能下降、Buffer Cache不足或索引碎片化"。
三个可能,都对,也都没用。
实际情况是:存储团队前一天做了LUN迁移,新LUN性能不如旧的。
这个信息AI不可能知道。它看不到存储层的变更记录,不知道我们公司有运维流程,更不会跑到隔壁工位去问存储工程师"你们昨天动过什么"。
最终解决问题靠什么?我打了3个电话,拉了个群,2小时定位到LUN迁移,协调存储团队迁回去。
全程AI帮不上任何忙。
这种事太常见了。数据库出问题,根因往往不在数据库里——是存储变了、网络抖了、应用发了个新版本、安全组规则改了。AI只能看到数据库内部的数据,看不到数据库外面的世界。
而排障最耗时的,恰恰是"外面"那部分。
场景2:变更影响评估
开发提了个需求:在一张5000万行的表上删两个字段。
AI说:ALTER TABLE ... DROP COLUMN
技术上完全正确。但它不知道:
这张表上有物化视图依赖 有6个存储过程引用了这两个字段 删列会锁表,影响在线业务 正确做法是标记UNUSED,在维护窗口处理,还得协调开发和测试确认依赖关系
AI给出的是"教科书答案",但生产环境从来不是教科书。
你表上有几个视图、哪些存储过程在引用、删列会不会影响正在跑的批处理——这些信息AI一概不知。
做变更评估,最核心的能力不是"知道语法",是知道你的环境里有什么、改了之后会牵连到谁。这是经验、是对业务的熟悉、是对系统间依赖关系的理解。
AI能做到语法正确,但做不到"心中有数"。
场景3:架构决策
要不要上RAC?Data Guard用物理备库还是逻辑备库?SGA给多少?归档日志放本地还是NFS?
这些问题AI都能给你一个"标准答案",但标准答案往往不适用。
比如"要不要上RAC":
AI会说:RAC提供高可用和横向扩展,适用于关键业务系统 但它不会告诉你:你们公司只有2个DBA,RAC的运维复杂度远超单实例,出问题时排查难度也高得多 它也不会告诉你:你们的业务其实用Active Data Guard就够,成本还低
架构决策要考虑的东西太多了:业务规模、增长预期、预算、团队能力、合规要求、已有技术债……这些AI全不知道。
AI能给你选项,但替不了你做决定。
场景4:紧急故障应急
凌晨2点,数据库挂了。
这时候你要的不是"分析",是"行动"——快速判断影响范围、决定是否切换、协调相关团队、同步信息给领导。
AI能做什么?它能帮你分析alert日志、建议排查方向。但:
- 它不能替你做切换决策
——切换有风险,出了事谁担? - 它不能替你协调人
——凌晨2点把应用负责人叫起来,AI打不了这个电话 - 它不能替你判断"能不能等"
——有些故障可以等到早上处理,有些一分钟都不能等,这个判断取决于你对业务的理解
应急处理的核心是"在信息不完整的情况下快速做决策",这恰恰是AI最不擅长的——它需要完整输入才能给出靠谱输出,但紧急时刻永远没有完整信息。
场景5:数据倾斜和执行计划飘忽
一条SQL昨天还跑得好好的,今天突然慢了。
你看执行计划,变了。昨天走索引,今天走全表扫描。
问AI,它说"建议收集统计信息"。
收集了,好了一阵子。过两天又飘了。
因为根因不是统计信息过期,是数据倾斜。 某个分区里90%的数据是同一个状态值,优化器认为走索引更划算,但实际查的是那90%的数据,走索引反而更慢。
这种情况AI很难理解。因为:
它不知道你的数据分布长什么样 它不知道业务上"状态值=已处理"的查询会命中大量数据 它不会想到要用SQL Profile绑定执行计划,或者用直方图告诉优化器数据是歪的
数据倾斜是Oracle调优里最玄学的部分。它要求你对数据分布、业务查询模式、优化器行为都有理解。AI能帮你发现"执行计划变了",但解释不了"为什么变"和"怎么稳住"。
场景6:安全合规审计
等保要求:敏感字段加密、操作审计留痕、权限最小化、数据脱敏……
这些AI能帮忙吗?部分能——它能帮你写加密的SQL、生成审计策略的初稿。
但合规不是写几条SQL的事。它要的是:
你能证明"谁在什么时间访问了什么数据" 你能证明"脱敏规则对AI智能体同样生效" 你能证明"备份数据也满足加密要求"
合规的本质是"可证明",不是"能做到"。 AI能帮你做到,但帮不了你证明。审计员来查的时候,他要看的是文档、流程、记录,不是AI生成的一段SQL。
那AI到底能干嘛?
说了这么多帮不上忙的,不是为了否定AI,是为了划清边界。
AI擅长的:
写SQL、写脚本、写文档初稿 查语法、查参数、解释概念 读AWR/ASH报告,标出异常指标 生成巡检报告、变更方案的框架
AI不擅长的:
跨部门沟通和协调 理解你环境的隐含上下文 在信息不完整时做决策 处理数据倾斜等需要深度经验的调优 满足合规审计的"可证明"要求 替你扛责任
简单说:AI能帮你"做得更快",但不能帮你"想得更清楚"。
真正的提效是什么?
用了3个月AI,我最大的体会是:
AI确实帮我省了30%的时间,但省下来的时间不是用来摸鱼的——是用在了AI帮不了的事情上。
以前没时间做的:
梳理系统间的依赖关系 做DataGuard切换演练 给团队做培训 优化分区策略
这些事,AI一件都干不了,但对团队的价值远比"写10个巡检SQL"大得多。
所以AI提效不是伪命题,但前提是你把省下来的时间花在AI帮不了的地方。
如果你用AI省了1小时,然后刷了1小时手机——那AI对你来说确实是个伪命题。
最后说句大实话
AI是个好工具,但不是所有活都适合用工具干。
就像电钻打孔很快,但你不会用电钻来拧螺丝——不是不能,是拧花了。
Oracle运维里有些活,就得靠人:靠人的经验、靠人的判断、靠人的沟通能力、靠人扛责任。
AI替代不了这些,也不该替代这些。
把AI当加速器,别当自动驾驶。方向盘,还是得自己握着。
夜雨聆风