想象一个场景:告警响起,7个 AI 专家同时动了起来——盯盘官第一时间响应,变更侦探关联变更历史,根因分析专家定位问题,止损决策官给出方案。
AI 做运维,真的靠谱吗?
答案可能是可以做,但不敢让它独当一面。
能力够不够从来都不是问题,问题是能不能预期它做什么以及团队的经验它能不能学会。7月10日-11日,第29届 GOPS 全球运维大会暨研运数智化技术峰会 · 北京站即将盛大开幕!
来自阿里巴巴、小红书、中国电信、快猫星云的大咖将分享精彩内容,期望对当下运维问题的回答。它们来自真实的落地实践,不讲正确的废话,只聊踩过的坑和见过的成效。
01
演讲议题:以多智能体协同为核心的 SRE 故障应急体系落地实践


王雨桐
小红书
高可用架构师
听众收益
了解大模型驱动的多智能体协同在 SRE 故障管理中的完整落地范式
获得 AI 赋能故障应急体系从设计到规模化实践的核心方法论
洞察智能体时代运维工程师角色演进与组织能力建设方向
02
演讲议题:基于故障树训练IT运维数字员工


田野
中国电信集团 云网运营部
高级项目经理
资深运维专家
听众收益
掌握故障分类分级思想,能够将具体故障拆解为可标记可枚举的基本故障类型;
探索如何基于故障分类分析形成故障知识体系,用于训练数字员工
03
演讲议题:从故障注入到自演进:RCA Agent 评估体系的双轨实践

楼海斌
阿里巴巴 云原生可观测团队算法与智能化
技术专家
听众收益
了解 Agent 评估在 RCA / SRE 场景下的一些工程实践——包括故障注入驱动的数据集构建、双轨评估流水线、数据飞轮闭环等思路,作为自身 Agent 评测体系建设的参考;
一起探讨 "通用 LLM Benchmark 为什么不足以衡量垂直域 Agent"这一问题,在私有知识利用、跨域实体对齐、因果回溯等维度上交换看法,为各自评估方向的取舍提供一些参照;
获取 一份"评估平台逐步演化为 Agent 运行环境"的早期工程观察——围绕在线置信度评分、案例生命周期管理、环境自构造等方向,提供可参考的思路与待解问题。
04
演讲议题:借力 AI RCA,筑牢企业生产稳定性实战


秦晓辉
快猫星云
联合创始人
听众收益
了解 RCA 的体系化方法和业内实践经验,让听众了解 RCA 不只是可观测性数据,还有告警降噪、排障入口收敛、知识图谱、现场诊断等多方面实践
了解业内头部厂商采取不同路径的原因,基于自己公司的情况构建实践路径
05
演讲议题:面向 Ops 场景的 AI Native 团队协作与知识工程实践


张华伟
小红书
平台工程研发专家
听众收益
获得"确定性优先"的 AI Agent 设计方法论——理解 Workflow 与 Sub-Agent 的选型逻辑,学会将团队 SOP 显式编排为 AI 可执行的确定性流程,解决当前 Agent 落地"不可预期"的核心痛点;
掌握一套可落地的 Ops 知识工程体系——从协作中自动沉淀经验、L1-L4 分层治理、防劣化闭环,将团队个人"秘法"转化为随时间复利增长的组织级 AI 资产;
了解确定性执行与知识工程如何协同产生乘数效应,获得构建 AI Native Ops 团队协作平台的完整架构思路,直接可用于评估和推进自己团队的 AI 协作演进路径。

以上议题为 710 GOPS 2026 · 北京站演讲的一部分,更多精彩内容,请访问大会官网
部分精彩议题(持续更新中)

(点击查看高清大图)
议题申报
7月10日,GOPS舞台已就位,就差你的故事!胜利在向你招手,成就技术影响力!
申报议题请联系:156 5212 7323(微信同号)
GOPS 门票马上抢
第29届 GOPS 全球运维大会暨
研运数智化技术峰会 2026 · 北京站
7月10-11日 与您准时相约

长按上方二维码
将 GOPS 大会收入囊中
联系我们

1
渠道合作:
渠道总监:刘 欣 158 0111 5386(微信同号)
2
赞助和门票业务咨询:
业务经理:周 静 130 7118 2180 (微信同号)
业务经理:刘毅菲 130 2108 2989(微信同号)
3
议题申报:
项目负责人:
刘 杰 156 5212 7323(微信同号)
小 雪 131 4122 7956(微信同号)

点击阅读原文,更多精彩
夜雨聆风