一、AIOps 是什么
AIOps = AI + DevOps
中文:智能运维 / 人工智能运维
简单一句话:
用大模型、算法、机器学习,替代传统人工做服务器、系统、业务的运维、监控、排障、预警。
二、属于什么岗位方向
归类:
偏后端研发 + 运维平台 + 算法应用
不是纯算法,也不是纯传统运维,是运维平台智能化方向。
三、日常做什么
系统监控告警
海量日志、指标、链路数据,用 AI 做异常检测、故障识别
智能根因定位
系统崩了、接口超时,AI 自动分析是谁的问题、哪段链路、哪个服务
日志智能分析、文本收敛
把成千上万条告警,用大模型聚合、归纳,减少轰炸式报警
故障自愈
自动发现问题、自动触发扩容、重启、切流量,不用人工半夜救火
运维大平台建设
搭建 AIOps 平台、运维数据中台、告警中心、可观测平台
四、技术栈是什么
后端:Java/Go、微服务、中间件
数据:时序数据库、日志系统、链路追踪
AI 部分:大模型应用、RAG、时序异常检测、聚类分类算法
五、岗位性质定性
不是算法研究岗(不做模型预训练、后训练)
不是传统机房运维(不搬机器、不手动敲命令)
属于:后端平台研发 / 智能运维开发 / 可观测平台工程师
六、发展 & 对标职级
互联网大厂标配团队:AIOps 团队、稳定性团队、运维中台
对标职级:和后端开发一致,P6/P7/P8 都有,越往上越偏架构、平台负责人。
●●极简总结
AIOps 就是用 AI 和大模型做系统智能监控、自动排障、运维平台建设,
本质是后端平台岗,带一点 AI 算法应用,不属于纯算法岗。
(工作笔记 方便个人查看)
夜雨聆风