告别"找日志、翻文档、等专家"——TCS Agent 让云原生运维自己会思考

为助力企业突破传统运维瓶颈,腾讯专有云 PaaS 平台(Tencent TCS)正式推出基于大语言模型的云原生智能运维专家——TCS Agent。TCS Agent 深度融合了 TCS 长期沉淀的专家知识库,并具备深入生产环境执行自动化拓扑分析与指令下发的工程能力。通过构建“认知-决策-执行”的闭环,帮企业更快、更准地解决云原生运维问题。
从“被动响应”走向“全局智能管理”
TCS Agent 并非基础的对话式交互助手,而是深度赋能生产场景的核心效能工具。它聚焦于云平台使用最常见的两个场景:知识问答与智能排障。

TCS Agent深度集成了云原生与TCS 专属知识库,用户通过向 TCS Agent 提问,即可获取精准的技术解答与操作指引。

当系统出现异常时,TCS Agent 能够迅速介入,执行深度诊断:
-
自动执行环境排障:具备自动在生产环境中执行 kubectl 命令进行多轮排障的能力,全程无需人工干预。精准定位 Service 配置异常、IP 冲突及网络连通性等底层根因;
-
多 Agent 协同作战: 采用“指挥 Agent + 诊断 Agent”双引擎驱动。指挥 Agent 基于意图识别进行任务委派,诊断 Agent 跨越应用与底座层级深度挖掘,最终提供清晰的优化建议与执行闭环。
在产品侧,TCS Agent 深度打通了 TCS与 TSF(Tencent Service Framework) 的能力,构建了一个统一的跨场景智能矩阵:TCS Agent 承载统一入口与通用排障;TSF Agent 则在微服务治理等垂直场景中提供专业协同。
双模交互形态:图形化界面开箱即用,命令行自然语言交互
为了适配不同阶段、不同习惯的用户,TCS Agent 提供“图形化界面 + 命令行”的全场景覆盖。
形态一:图形化界面,开箱即用的顺滑体验
-
随处唤醒: 支持页面右上角全局唤醒,或在 Deployment 资源旁上下文唤醒。

-
过程透明: 界面默认展开 AI 的诊断思考过程,生成最终方案后自动折叠。排障逻辑清晰可追溯,诊断结果一目了然。

-
历史留痕: 支持历史会话查询与文档导出,排障经验可沉淀、可追溯。

形态二:命令行,用自然语言指挥硬核排障
用户无需记忆复杂的 K8s 长串命令,只需在终端输入自然语言,TCS Agent 即可精准进行意图解析并转化为执行动作。

同时,在底层执行层面,TCS Agent 引入了基于 Kata 的 Sandbox 安全沙箱,并严格执行白名单命令行机制。所有的排障脚本与诊断动作均在强隔离环境中运行,确保不触碰生产系统边界,兼顾高效与安全。

产品演示
持续运营:数据驱动的效能闭环
为了保障长期的服务质量与诊断精度,TCS Agent 引入了完善的准确率持续运营与评测闭环体系。
-
真实场景感知(Feedback Loop):系统实时捕获用户在实际使用场景下的反馈数据,将其作为微调与对齐的核心语料。

-
端到端标准评测(E2E Benchmarking):反馈数据将自动与后台内置的 TCS 标准端到端(E2E)评测集进行交叉验证,确保任何逻辑优化均具备全局泛化性。
-
动态进化机制:通过这套闭环,TCS Agent 能够持续重构大模型微调策略、动态查漏补缺专家知识库,实现诊断准确率与场景覆盖率的自适应迭代升级。
从精准理解用户意图,到动态检索专家知识库,再到安全调动底层工具链执行,直至基于真实场景反馈实现自我进化 ——TCS Agent 正在以严密的工程逻辑,彻底打通“感知-决策-执行-反馈”的闭环。
未来,TCS 将持续深耕云原生底座与 AI 基础设施的深度融合,全面发力 AI Agent Infra(智能体基础设施)的能力建设。我们将围绕高效的 Agent 运行时环境(Runtime)、毫秒级弹性容器沙箱(Sandbox)等核心技术栈,打造面向 AI 时代更坚实、更敏捷、更具前瞻性的数字底座。TCS 旨在携手千行百业在智能化的浪潮中破局前行,全面释放 Agent 时代数据与算力的新质动能!
END
夜雨聆风