采集配置
更新时间:2022-10-10
概述
采集任务(Job)是一组Target的配置集合。定义了抓取间隔、访问限制等作用于一组Target的抓取行为。Prometheus监控服务默认预置常用基础监控的采集任务,也支持自定义采集任务。
本文将介绍如何创建、管理、删除采集任务配置。
准备工作
-
登录百度智能云控制台:
- 登录成功后,选择“产品服务 > 云原生 > Prometheus监控服务”,进入“监控实例 > 实例列表”页面。
- 创建监控实例,监控实例与目标监控集群必须在同一地域下,详情见创建实例。
- (可选)在监控实例详情中,接入目标集群所在的私有网络VPC,详情见接入网络。
- 在监控实例详情中,关联目标CCE集群(安装Agent),详情见安装Agent。
创建采集任务
- 登录Prometheus监控服务控制台,选择“监控实例 > 关联集群”,点击集群名称进入监控详情,点击“采集配置”。
- 点击“创建采集任务”,使用YAML配置Agent采集任务规则,点击确认即完成提交。
相应配置项说明如下:
# 采集任务名称,同时会在对应采集的指标中加了一个 label(job=job_name)
job_name: <job_name>
# 采集任务时间间隔
[ scrape_interval: <duration> | default = <global_config.scrape_interval> ]
# 采集请求超时时间
[ scrape_timeout: <duration> | default = <global_config.scrape_timeout> ]
# 采集任务请求 URI 路径
[ metrics_path: <path> | default = /metrics ]
# 采集协议: http 或者 https
[ scheme: <scheme> | default = http ]
# 采集请求对应 URL 参数
params:
[ <string>: [<string>, ...] ]
# 采集连接是否通过 TLS 安全通道,配置对应的 TLS 参数
tls_config:
[ <tls_config> ]
# K8s 服务发现配置。
kubernetes_sd_configs:
[ - <kubernetes_sd_config> ... ]
# 在采集数据之后,把 target 上对应的 label 通过 relabel 的机制进行改写,按顺序执行多个 relabel 规则。
relabel_configs:
[ - <relabel_config> ... ]
# 一次采集数据点限制,0:不作限制,默认为 0
[ sample_limit: <int> | default = 0 ]
# 一次采集 Target 限制,0:不作限制,默认为 0
[ target_limit: <int> | default = 0 ]
以下为一个简单采集任务规则例子:
job_name: 'cadvisor'
scheme: http
metrics_path: /metrics/cadvisor
kubernetes_sd_configs:
- role: node
relabel_configs:
- action: labelmap
regex: __meta_kubernetes_node_label_(.+)
- source_labels: [__address__]
action: replace
regex: '(.*):(10250)'
replacement: $1:10255
target_label: __address__
- source_labels: [ instance ]
action: replace
target_label: node
管理采集任务
- 创建采集任务成功后,在“监控实例 > 关联集群 > 采集配置”中可查看当前监控实例关联集群的Agent采集任务列表,展示任务名称、监控类型、请求路径、状态、创建时间等信息。
集群Agent配置中预设配置中预设了基础监控的采集任务,默认采集核心组件的监控指标数据。
- 在采集任务的操作列中,点击“编辑”,即可修改采集任务的YAML信息。
- 采集任务创建成功后,默认启用,即规则生效。可在采集任务的操作列中,点击“禁用”,采集任务状态将变成“禁用”,则规则失效,可点击“启用”恢复。
删除采集任务
创建采集任务成功后,在“监控实例 > 关联集群 > 采集任务”中可查看当前监控实例关联集群的采集任务列表,在采集任务的操作列中,点击“删除”,在二次确认弹窗中,点击“确认”,即可删除采集任务。
注:删除采集任务配置,相应的采集任务将会停止,请谨慎操作。