Agent管理
更新时间:2022-03-30
概述
采集Agent即部署在用户侧Kubernetes集群中的轻量级采集组件,能够在具备原生采集能力的基础上,最大程度减少资源的占用。
监控实例可接入相同地域的一个或多个私有网络VPC(即内网打通监控数据上报通道),对已接入的私有网络VPC下的CCE集群可进行一键关联,即在CCE集群中安装采集Agent,开始指标数据的采集和上报。
本文将介绍采集CCE集群指标数据的Agent组件的安装、查看、调整副本数、卸载等操作。
准备工作
-
登录百度智能云控制台:
- 登录成功后,选择“产品服务 > 云原生 > Prometheus 监控服务”,进入“监控实例 > 实例列表”页面。
- 创建监控实例,监控实例与目标监控集群必须在同一地域下,详情见创建实例。
- (可选)在监控实例详情中,接入目标集群所在的私有网络VPC,详情见接入网络。
安装Agent
- 登录Prometheus监控服务控制台,在监控实例列表中,点击监控实例名称,进入监控实例详情页面,选择“关联集群”,可见当前地域下的CCE集群列表。
- 在目标CCE集群的操作选项中,点击“安装Agent”,系统将在对应的CCE集群中,以Helm的形式自动部署采集组件Agent(若目标CCE集群所在的私有网络VPC未接入到当前监控实例,系统会进行检测并在安装Agent前自动完成接入)。
- 安装成功后,可以看到目标CCE集群的监控状态由“部署中”变为“运行中”,集群名称变为可点击状态。表明当前监控实例开始对目标CCE集群进行指标数据的采集,通过访问Grafana将可以看到相关数据展示。
查看Agent信息
- 登录Prometheus监控服务控制台,在监控实例列表中,点击监控实例名称,进入监控实例详情页面,选择“关联集群”,可见当前地域下的CCE集群列表。
- 已成功安装Agent的集群,可点击集群名称进入监控详情页面,选择“Agent管理”,可查看已安装Agent的基本信息,包括:Agent版本、Agent副本数、Helm版本、运行时长、更新时间、创建时间。
- 如需查看Helm部署的具体情况,可登录容器引擎CCE控制台,点击“Helm实例”,选择对应的集群名称,以及“cprom-system”命名空间,筛选出对应部署的Helm实例。也可以登录Prometheus监控服务控制台,在监控实例详情的“关联集群”页面,点击集群操作“查看集群”跳转到CCE集群详情页面进行查看。
调整Agent副本数
- 登录Prometheus监控服务控制台,在监控实例列表中,点击监控实例名称,进入监控实例详情页面,选择“关联集群”,可见当前地域下的CCE集群列表。
- 已成功安装Agent的集群,可点击集群名称进入监控详情页面,选择“Agent管理”,查看Agent当前的副本数(就绪数/期望数)。
- 可点击“调整”对Agent副本数进行动态水平伸缩(HPA),增加采集任务负载,提高采集性能和高可用。
卸载Agent
- 登录Prometheus监控服务控制台,在监控实例列表中,点击监控实例名称,进入监控实例详情页面,选择“关联集群”,可见当前地域下的CCE集群列表。
- 在目标CCE集群的操作选项中,点击“卸载Agent”,并经过二次确认之后,系统将自动卸载目标CCE集群中已部署的采集组件Agent,以及对应Helm包中的其他相关组件。
- 卸载成功后,目标CCE集群将被停止采集监控指标数据,并同步清理采集配置。如需重新开始采集对应CCE集群,可再次点击“安装Agent”。