Agent管理
更新时间:2024-09-06
概述
- 采集 Agent 即部署在用户侧 Kubernetes 集群中的轻量级采集组件,能够在具备原生采集能力的基础上,最大程度减少资源的占用。
- 监控实例可接入相同地域的一个或多个私有网络 VPC(即内网打通监控数据上报通道),对已接入的私有网络 VPC 下的 CCE 集群可进行一键关联,即在 CCE 集群中安装采集 Agent,开始指标数据的采集和上报。
- 本文将介绍采集 CCE 集群指标数据的 Agent 组件的安装、查看、调整副本数、卸载等操作。
准备工作
-
登录百度智能云控制台:
- 登录成功后,选择“产品服务 > 云原生 > Prometheus 监控服务”,进入“监控实例 > 实例列表”页面。
- 创建监控实例,监控实例与目标监控集群必须在同一地域下,详情参见 创建实例。
- (可选)在监控实例详情中,接入目标集群所在的私有网络 VPC,详情参见 接入网络。
安装 Agent
- 登录 Prometheus 监控服务控制台,在监控实例列表中,点击监控实例名称,进入监控实例详情页面,选择“关联集群”,可见当前地域下的 CCE 集群列表。
- 在目标 CCE 集群的操作选项中,点击“安装 Agent”,系统将在对应的 CCE 集群中,以 Helm 的形式自动部署采集组件 Agent(若目标 CCE 集群所在的私有网络 VPC 未接入到当前监控实例,系统会进行检测并在安装 Agent 前自动完成接入)。
- 安装成功后,可以看到目标 CCE 集群的监控状态由“部署中”变为“运行中”,表明当前监控实例开始对目标 CCE 集群进行指标数据的采集,通过访问 Grafana 将可以看到相关数据展示。
查看 Agent 信息
- 登录 Prometheus 监控服务控制台,在监控实例列表中,点击监控实例名称,进入监控实例详情页面,选择“关联集群”,可见当前地域下的 CCE 集群列表。
- 已成功安装 Agent 的集群,可在操作列点击【采集任务】,进入采集配置详情页面,选择【Agent 管理】,可查看已安装 Agent 的基本信息,包括:Agent版本、Agent副本数、Helm版本、运行时长、更新时间、创建时间。
- 如需查看 Helm 部署的具体情况,可登录 容器引擎 CCE 控制台,点击“Helm 实例”,选择对应的集群名称,以及“cprom-system”命名空间,筛选出对应部署的Helm实例。也可以登录Prometheus 监控服务控制台,在监控实例详情的“关联集群”页面,点击集群操作“查看集群”跳转到CCE集群详情页面进行查看。
调整 Agent 副本数
- 登录 Prometheus监控服务控制台,在监控实例列表中,点击监控实例名称,进入监控实例详情页面,选择“关联集群”,可见当前地域下的 CCE 集群列表。
- 已成功安装 Agent 的集群,可在操作列点击【采集任务】,进入采集配置详情页面,选择【Agent 管理】,查看 Agent 当前的副本数(就绪数/期望数)。
- 可点击“调整”对 Agent 副本数进行动态水平伸缩(HPA),增加采集任务负载,提高采集性能和高可用。
卸载 Agent
注意:Agent 卸载后,对应容器集群将会停止采集监控指标数据,并同步清理采集配置、卸载集群中安装的相关组件等。
- 登录 Prometheus监控服务控制台,在监控实例列表中,点击监控实例名称,进入监控实例详情页面,选择“关联集群”,可见当前地域下的 CCE 集群列表。
- 在目标 CCE 集群的操作选项中,点击“卸载 Agent”,并经过二次确认之后,系统将自动卸载目标 CCE 集群中已部署的采集组件 Agent,以及对应 Helm 包中的其他相关组件。
- 卸载成功后,目标 CCE 集群将被停止采集监控指标数据,并同步清理采集配置。如需重新开始采集对应 CCE 集群,可再次点击“安装 Agent”。