采集配置
更新时间:2026-04-15
概述
本文档介绍如何在 Prometheus 监控服务中创建、管理和复制采集任务。采集任务(Job)是一组 Target 的配置集合,用于定义抓取间隔、访问限制等针对一组 Target 的抓取行为。Prometheus 监控服务默认预置常用基础监控的采集任务,也支持自定义采集任务。
前提条件
- 登录百度智能云控制台。若没有用户名,请先完成注册,操作请参考 注册百度账号。若有用户名,登录操作请参考 登录。
- 登录成功后,选择“产品服务 > 云原生 > Prometheus 监控服务”,进入“监控实例 > 实例列表”页面。
- 创建监控实例,监控实例与目标监控集群必须在同一地域下,详情见 创建实例。
- (可选)在监控实例详情中,接入目标集群所在的私有网络 VPC,详情见 接入网络。
- 在监控实例详情中,关联目标 CCE 集群(安装 Agent),详情见 安装Agent。
说明:Agent 安装完成后,系统会自动生成基础监控采集任务,您可在 采集配置 -> RawJobs 中直接查看。
创建自定义采集任务
导航路径:产品服务->云原生->Prometheus 监控服务->监控实例->实例列表->实例详情->关联集群->采集任务
- 登录 Prometheus监控服务控制台,选择 【监控实例】 后,点击目标实例名称进入实例详情页。
- 选择 【关联集群】 后,在目标关联集群操作列点击 【采集任务】,进入采集配置页面。
- 点击 【创建采集任务】 后,在
YAML编辑区填写Agent采集任务规则,再点击 【确认】 提交。一个任务支持多组Job配置。

- 按需配置采集任务规则。常用字段如下。
| 参数 | 必填 | 说明 |
|---|---|---|
job_name |
是 | 自定义采集任务名称。 |
scrape_interval |
否 | 当前 Job 的采集时间间隔,优先级高于全局配置。 |
scrape_timeout |
否 | 当前 Job 的采集超时时间,优先级高于全局配置。 |
metrics_path |
是 | 采集指标的 URI 路径,默认为 /metrics。 |
scheme |
是 | 采集协议,支持 http 和 https,默认为 http。 |
params |
否 | HTTP 协议参数,仅在 scheme 为 http 时有效。 |
tls_config |
否 | HTTPS 协议下的 TLS 配置,仅在 scheme 为 https 时有效,可配置 CA 证书、证书、密钥、服务器名称和证书校验策略。 |
kubernetes_sd_configs |
否 | Kubernetes 服务发现配置,用于指定发现对象类型。 |
relabel_configs |
否 | 标签过滤与重写规则,用于保留、替换、丢弃或映射指标标签。 |
YAML
1job_name: '<任务名称>'
2scrape_interval: 30s # 可选,该 Job 的采集时间间隔,优先级高于全局配置
3scrape_timeout: 30s # 可选,该 Job 的采集超时时间,优先级高于全局配置
4metrics_path: /metrics # 必选,采集指标的 URI 路径,默认为 /metrics
5honor_labels: true # 可选,标签冲突处理策略,true 表示保留标签,false 表示重命名冲突标签
6honor_timestamps: true # 可选,是否使用指标中的时间戳
7scheme: https # 必选,采集协议,支持 http 和 https,默认为 http
8params: # 可选,HTTP 协议参数,仅在 scheme 为 http 时有效
9 p1: ['<参数值>']
10tls_config: # 可选,HTTPS 协议下的 TLS 配置,仅在 scheme 为 https 时有效
11 ca_file: '<CA 证书路径>'
12 cert_file: '<TLS 证书路径>'
13 key_file: '<TLS 密钥路径>'
14 server_name: '<TLS 服务器名称>'
15 insecure_skip_verify: true # 是否禁用 HTTPS 服务器证书验证
16kubernetes_sd_configs:
17 - role: pod
18relabel_configs:
19 - source_labels: [__meta_kubernetes_service_annotation_prometheus_io_scheme]
20 action: replace
21 target_label: __scheme__
22 regex: (https?)
23 - source_labels: [__meta_kubernetes_pod_annotation_prometheus_io_scrape]
24 action: keep
25 regex: true
26 - source_labels: [__meta_kubernetes_pod_annotation_prometheus_io_path]
27 action: replace
28 target_label: __metrics_path__
29 regex: (.+)
30 - source_labels: [__meta_kubernetes_pod_label_app]
31 action: drop
32 regex: kube-state-metrics|node-exporter|dcgm-exporter|training-operator
33 - source_labels: [__address__, __meta_kubernetes_pod_annotation_prometheus_io_port]
34 action: replace
35 regex: ([^:]+)(?::\\d+)?;(\\d+)
36 replacement: $1:$2
37 target_label: __address__
38 - action: labelmap
39 regex: __meta_kubernetes_pod_label_(.+)
40 - action: labeldrop
41 regex: (.+)_revision_hash|(.+)_template_generation
以下为一个简单采集任务规则例子:
YAML
1job_name: 'kubernetes-pods-user-test'
2kubernetes_sd_configs:
3 - role: pod
4scrape_interval: 30s
5scrape_timeout: 30s
6metrics_path: /metrics
7relabel_configs:
8 - source_labels: [__meta_kubernetes_service_annotation_prometheus_io_scheme]
9 action: replace
10 target_label: __scheme__
11 regex: (https?)
12 - source_labels: [__meta_kubernetes_pod_annotation_prometheus_io_scrape]
13 action: keep
14 regex: true
15 - source_labels: [__meta_kubernetes_pod_annotation_prometheus_io_path]
16 action: replace
17 target_label: __metrics_path__
18 regex: (.+)
19 - source_labels: [__meta_kubernetes_pod_label_app]
20 action: drop
21 regex: kube-state-metrics|node-exporter|dcgm-exporter|training-operator
22 - source_labels: [__address__, __meta_kubernetes_pod_annotation_prometheus_io_port]
23 action: replace
24 regex: ([^:]+)(?::\\d+)?;(\\d+)
25 replacement: $1:$2
26 target_label: __address__
27 - action: labelmap
28 regex: __meta_kubernetes_pod_label_(.+)
29 - action: labeldrop
30 regex: (.+)_revision_hash|(.+)_template_generation
说明:
- 更多配置项说明,可参见 官网文档。
- 采集任务配置修改并下发后,约 1 分钟 后才会生效,请您耐心等待。
管理采集任务
导航路径:产品服务->云原生->Prometheus 监控服务->监控实例->实例列表->实例详情->关联集群->采集任务
-
创建采集任务成功后,在采集任务列表中可查看当前监控实例关联集群的
Agent采集任务列表,包括任务名称、监控类型、请求路径、状态、创建时间等信息。说明: 集群
Agent配置中预设了基础监控的采集任务,默认采集核心组件的监控指标数据。 - 采集任务创建成功后,默认启用,即规则生效。可在采集任务的操作列中,点击“禁用”,采集任务状态将变成“禁用”,则规则失效,可点击“启用”恢复。
复制采集任务
导航路径:产品服务->云原生->Prometheus 监控服务->监控实例->实例列表->实例详情->关联集群->采集任务
- 在采集任务列表中,找到需要复制的采集任务。
- 在操作列点击 【复制】 后,在二次确认弹窗中输入新任务名称,再点击 【确认】。
- 复制成功后,系统会生成一条新的采集任务。
调整采集间隔
说明:所有采集任务默认每 15s 采集一次;若曾修改,可在“采集间隔”列查看最新值。
您可按业务敏感度自定义采集频率,为不同重要性的采集任务设置不同的采集间隔,从而在“监控精度”与“成本/性能”之间取得平衡。详细操作可参见 调整采集间隔。
评价此篇文章
