AI提效是伪命题?Oracle运维这些场景AI根本帮不上忙

每餐小记小棉袄药箱

现在到处都在说"AI提效"，好像不用AI就落伍了。

我也跟风用了3个月。说实话，有些场景确实爽——AWR报告5分钟出结论，巡检脚本10秒生成，ORA报错不用翻Metalink了。

但今天不想说这些。

今天想聊聊那些AI根本帮不上忙的场景。 不是泼冷水，是用了3个月之后，我觉得这比"AI有多好用"更值得说清楚。

场景1：跨部门排查故障

周二下午，生产库查询变慢。

我把AWR报告丢给AI，它说"db file sequential read等待时间偏高，可能是IO子系统性能下降、Buffer Cache不足或索引碎片化"。

三个可能，都对，也都没用。

实际情况是：存储团队前一天做了LUN迁移，新LUN性能不如旧的。

这个信息AI不可能知道。它看不到存储层的变更记录，不知道我们公司有运维流程，更不会跑到隔壁工位去问存储工程师"你们昨天动过什么"。

最终解决问题靠什么？我打了3个电话，拉了个群，2小时定位到LUN迁移，协调存储团队迁回去。

全程AI帮不上任何忙。

这种事太常见了。数据库出问题，根因往往不在数据库里——是存储变了、网络抖了、应用发了个新版本、安全组规则改了。AI只能看到数据库内部的数据，看不到数据库外面的世界。

而排障最耗时的，恰恰是"外面"那部分。

场景2：变更影响评估

开发提了个需求：在一张5000万行的表上删两个字段。

AI说：ALTER TABLE ... DROP COLUMN

技术上完全正确。但它不知道：

这张表上有物化视图依赖
有6个存储过程引用了这两个字段
删列会锁表，影响在线业务
正确做法是标记UNUSED，在维护窗口处理，还得协调开发和测试确认依赖关系

AI给出的是"教科书答案"，但生产环境从来不是教科书。

你表上有几个视图、哪些存储过程在引用、删列会不会影响正在跑的批处理——这些信息AI一概不知。

做变更评估，最核心的能力不是"知道语法"，是知道你的环境里有什么、改了之后会牵连到谁。这是经验、是对业务的熟悉、是对系统间依赖关系的理解。

AI能做到语法正确，但做不到"心中有数"。

场景3：架构决策

要不要上RAC？Data Guard用物理备库还是逻辑备库？SGA给多少？归档日志放本地还是NFS？

这些问题AI都能给你一个"标准答案"，但标准答案往往不适用。

比如"要不要上RAC"：

AI会说：RAC提供高可用和横向扩展，适用于关键业务系统
但它不会告诉你：你们公司只有2个DBA，RAC的运维复杂度远超单实例，出问题时排查难度也高得多
它也不会告诉你：你们的业务其实用Active Data Guard就够，成本还低

架构决策要考虑的东西太多了：业务规模、增长预期、预算、团队能力、合规要求、已有技术债……这些AI全不知道。

AI能给你选项，但替不了你做决定。

场景4：紧急故障应急

凌晨2点，数据库挂了。

这时候你要的不是"分析"，是"行动"——快速判断影响范围、决定是否切换、协调相关团队、同步信息给领导。

AI能做什么？它能帮你分析alert日志、建议排查方向。但：

它不能替你做切换决策
——切换有风险，出了事谁担？
它不能替你协调人
——凌晨2点把应用负责人叫起来，AI打不了这个电话
它不能替你判断"能不能等"
——有些故障可以等到早上处理，有些一分钟都不能等，这个判断取决于你对业务的理解

应急处理的核心是"在信息不完整的情况下快速做决策"，这恰恰是AI最不擅长的——它需要完整输入才能给出靠谱输出，但紧急时刻永远没有完整信息。

场景5：数据倾斜和执行计划飘忽

一条SQL昨天还跑得好好的，今天突然慢了。

你看执行计划，变了。昨天走索引，今天走全表扫描。

问AI，它说"建议收集统计信息"。

收集了，好了一阵子。过两天又飘了。

因为根因不是统计信息过期，是数据倾斜。 某个分区里90%的数据是同一个状态值，优化器认为走索引更划算，但实际查的是那90%的数据，走索引反而更慢。

这种情况AI很难理解。因为：

它不知道你的数据分布长什么样
它不知道业务上"状态值=已处理"的查询会命中大量数据
它不会想到要用SQL Profile绑定执行计划，或者用直方图告诉优化器数据是歪的

数据倾斜是Oracle调优里最玄学的部分。它要求你对数据分布、业务查询模式、优化器行为都有理解。AI能帮你发现"执行计划变了"，但解释不了"为什么变"和"怎么稳住"。

场景6：安全合规审计

等保要求：敏感字段加密、操作审计留痕、权限最小化、数据脱敏……

这些AI能帮忙吗？部分能——它能帮你写加密的SQL、生成审计策略的初稿。

但合规不是写几条SQL的事。它要的是：

你能证明"谁在什么时间访问了什么数据"
你能证明"脱敏规则对AI智能体同样生效"
你能证明"备份数据也满足加密要求"

合规的本质是"可证明"，不是"能做到"。 AI能帮你做到，但帮不了你证明。审计员来查的时候，他要看的是文档、流程、记录，不是AI生成的一段SQL。

那AI到底能干嘛？

说了这么多帮不上忙的，不是为了否定AI，是为了划清边界。

AI擅长的：

写SQL、写脚本、写文档初稿
查语法、查参数、解释概念
读AWR/ASH报告，标出异常指标
生成巡检报告、变更方案的框架

AI不擅长的：

跨部门沟通和协调
理解你环境的隐含上下文
在信息不完整时做决策
处理数据倾斜等需要深度经验的调优
满足合规审计的"可证明"要求
替你扛责任

简单说：AI能帮你"做得更快"，但不能帮你"想得更清楚"。

真正的提效是什么？

用了3个月AI，我最大的体会是：

AI确实帮我省了30%的时间，但省下来的时间不是用来摸鱼的——是用在了AI帮不了的事情上。

以前没时间做的：

梳理系统间的依赖关系
做DataGuard切换演练
给团队做培训
优化分区策略

这些事，AI一件都干不了，但对团队的价值远比"写10个巡检SQL"大得多。

所以AI提效不是伪命题，但前提是你把省下来的时间花在AI帮不了的地方。

如果你用AI省了1小时，然后刷了1小时手机——那AI对你来说确实是个伪命题。

最后说句大实话

AI是个好工具，但不是所有活都适合用工具干。

就像电钻打孔很快，但你不会用电钻来拧螺丝——不是不能，是拧花了。

Oracle运维里有些活，就得靠人：靠人的经验、靠人的判断、靠人的沟通能力、靠人扛责任。

AI替代不了这些，也不该替代这些。

把AI当加速器，别当自动驾驶。方向盘，还是得自己握着。