告别＂找日志、翻文档、等专家＂——TCS Agent 让云原生运维自己会思考-夜雨聆风

告别＂找日志、翻文档、等专家＂——TCS Agent 让云原生运维自己会思考

导读：在云原生架构演进的过程中，随着集群规模的指数级增长与网络拓扑的日益复杂，运维团队常面临三大痛点：知识文档分散导致信息获取效率低、网络环境复杂导致故障根因定位难、部署配置链路长导致上手门槛高。

为助力企业突破传统运维瓶颈，腾讯专有云 PaaS 平台（Tencent TCS）正式推出基于大语言模型的云原生智能运维专家——TCS Agent。TCS Agent 深度融合了 TCS 长期沉淀的专家知识库，并具备深入生产环境执行自动化拓扑分析与指令下发的工程能力。通过构建“认知-决策-执行”的闭环，帮企业更快、更准地解决云原生运维问题。

从“被动响应”走向“全局智能管理”

TCS Agent 并非基础的对话式交互助手，而是深度赋能生产场景的核心效能工具。它聚焦于云平台使用最常见的两个场景：知识问答与智能排障。

全栈智能问答

TCS Agent深度集成了云原生与TCS 专属知识库，用户通过向 TCS Agent 提问，即可获取精准的技术解答与操作指引。

多维自动排障

当系统出现异常时，TCS Agent 能够迅速介入，执行深度诊断：

自动执行环境排障：具备自动在生产环境中执行 kubectl 命令进行多轮排障的能力，全程无需人工干预。精准定位 Service 配置异常、IP 冲突及网络连通性等底层根因；
多 Agent 协同作战：采用“指挥 Agent + 诊断 Agent”双引擎驱动。指挥 Agent 基于意图识别进行任务委派，诊断 Agent 跨越应用与底座层级深度挖掘，最终提供清晰的优化建议与执行闭环。

全局产品协同

在产品侧，TCS Agent 深度打通了 TCS与 TSF（Tencent Service Framework）的能力，构建了一个统一的跨场景智能矩阵：TCS Agent 承载统一入口与通用排障；TSF Agent 则在微服务治理等垂直场景中提供专业协同。

双模交互形态：图形化界面开箱即用，命令行自然语言交互

为了适配不同阶段、不同习惯的用户，TCS Agent 提供“图形化界面 + 命令行”的全场景覆盖。

形态一：图形化界面，开箱即用的顺滑体验

针对日常管理与常规问答，TCS Agent 提供了极其友好的图形化交互版本：

随处唤醒：支持页面右上角全局唤醒，或在 Deployment 资源旁上下文唤醒。

过程透明：界面默认展开 AI 的诊断思考过程，生成最终方案后自动折叠。排障逻辑清晰可追溯，诊断结果一目了然。

历史留痕：支持历史会话查询与文档导出，排障经验可沉淀、可追溯。

形态二：命令行，用自然语言指挥硬核排障

用户无需记忆复杂的 K8s 长串命令，只需在终端输入自然语言，TCS Agent 即可精准进行意图解析并转化为执行动作。

同时，在底层执行层面，TCS Agent 引入了基于 Kata 的 Sandbox 安全沙箱，并严格执行白名单命令行机制。所有的排障脚本与诊断动作均在强隔离环境中运行，确保不触碰生产系统边界，兼顾高效与安全。

产品演示

已关注

关注

重播分享赞

视频详情

持续运营：数据驱动的效能闭环

为了保障长期的服务质量与诊断精度，TCS Agent 引入了完善的准确率持续运营与评测闭环体系。

真实场景感知（Feedback Loop）：系统实时捕获用户在实际使用场景下的反馈数据，将其作为微调与对齐的核心语料。

端到端标准评测（E2E Benchmarking）：反馈数据将自动与后台内置的 TCS 标准端到端（E2E）评测集进行交叉验证，确保任何逻辑优化均具备全局泛化性。
动态进化机制：通过这套闭环，TCS Agent 能够持续重构大模型微调策略、动态查漏补缺专家知识库，实现诊断准确率与场景覆盖率的自适应迭代升级。

从精准理解用户意图，到动态检索专家知识库，再到安全调动底层工具链执行，直至基于真实场景反馈实现自我进化 ——TCS Agent 正在以严密的工程逻辑，彻底打通“感知-决策-执行-反馈”的闭环。

未来，TCS 将持续深耕云原生底座与 AI 基础设施的深度融合，全面发力 AI Agent Infra（智能体基础设施）的能力建设。我们将围绕高效的 Agent 运行时环境（Runtime）、毫秒级弹性容器沙箱（Sandbox）等核心技术栈，打造面向 AI 时代更坚实、更敏捷、更具前瞻性的数字底座。TCS 旨在携手千行百业在智能化的浪潮中破局前行，全面释放 Agent 时代数据与算力的新质动能！

END

关注腾讯专有云公众号，了解更多云与 AI 应用的最佳实践！