Targets
更新时间:2024-09-05
概述
Targets 是 Prometheus 采集 Agent 需要抓取的采集目标。采集目标暴露自身运行、业务指标,或者代理暴露监控对象的运行、业务指标。当需要查询指标采集任务的状态时,Targets 信息是最直接的状态反馈。(指标即采集目标暴露的、可以完整反映监控对象运行或者业务状态的一系列标签化数据。Prometheus 监控采用 OpenMetrics 的标准数据格式描述指标。
本文将介绍如何查看 Prometheus 抓取运行的状态,实时了解监控数据是否正常被 Agent 抓取到。
准备工作
-
登录百度智能云控制台:
- 登录成功后,选择“产品服务 > 云原生 > Prometheus 监控服务”,进入“监控实例 > 实例列表”页面。
- 创建监控实例,监控实例与目标监控集群必须在同一地域下,详情见 创建实例。
- (可选)在监控实例详情中,接入目标集群所在的私有网络 VPC,详情见 接入网络。
- 在监控实例详情中,关联目标 CCE 集群(安装 Agent),详情见 安装 Agent。
操作步骤
- 登录 Prometheus监控服务控制台,选择【监控实例】,在监控实例列表页中点击目标实例名称进入详情页,在左侧选择【Targets管理】,即可查看已安装 Agent 的 CCE 集群下,当前所有抓取任务的状态和失败原因。
- 在 Target 管理页面,单击页面左上角 all,然后单击目标名称前的 >。
- 单击 Endpoint 下面的地址,即可发起一次 Metrics 查询。
说明:
-
Targets 列表的第一层级,是任务名称。
- 如没有找到对应的抓取任务,说明 Prometheus Agent 没有正确获取到对应的抓取任务的配置,请查看对应的配置是否正确。
- Targets 信息展示了当前正在收集的 Job 任务及服务发现的结果,通过这些信息您可以验证配置的正确性。
-
任务名称后的数字表示 endpoint 的状态统计(up数/总数),例如,targets(1/1)表示(实际抓取的 targets 数为1 / 探测的采集目标数为1)。
- 当实际抓取数和探测数的数值相等时,显示为 up,即表示当前抓取正常。
- 当实际抓取数小于探测数时,显示为 down,即表示有部分 endpoints 抓取失败。
- 切换到 unhealthy 可查看抓取失败的任务,展开可查看任务下有哪些状态为 down 的 endpoint,以及具体的失败原因。
- 部分端点提供的 Metrics 数据量较大,查询可能较慢或超时失败。