告警规则模版
更新时间:2025-08-21
概览
对于多个 Prometheus 实例,当需要为这些 Prometheus 实例创建告警规则时,如果每个 Prometheus 实例都单独创建,工作量较大并且难以同步管理。为了解决这个问题,CProm 提供了告警规则模板功能,可以帮助用户快速为多个 Prometheus 实例创建告警规则,并且可以统一管理,降低用户管理多个 Prometheus 实例告警规则的成本。本文介绍如何创建、管理告警规则模版。
自定义告警规则模版
创建自定义模版
方式一:手动创建
- 登陆百度智能云 Prometheus 监控服务控制台。
- 左侧导航栏选择 告警管理 > 告警规则模版,进入告警规则模版页面。
- 在告警规则模版页面中点击 创建自定义模版 按钮,进入创建自定义模版页面。
- 根据自身需求进行相应配置,包含基本信息、告警规则两个模块,各模块字段说明可参见 告警配置。
- 单击 确定,完成自定义模版创建。
- 在告警规则模版列表中可以查看到刚刚创建的自定义模版。
方式二:YAML 文件导入
- 登陆百度智能云 Prometheus 监控服务控制台。
- 左侧导航栏选择 告警管理 > 告警规则模版,进入告警规则模版页面。
- 选择 导入,在导入弹窗中粘贴 YAML 配置内容,确认无误后点击 确定 完成导入。
导入 YAML 格式说明
说明:以下为导入 YAML 示例,若 YAML 类型为 PrometheusRule 注意仅需导入 groups 及其之后内容,如图片所示。
YAML
1groups:
2 - name: PodHighCPUUsage
3 rules:
4 - alert: PodHighCPUUsage
5 expr: >-
6 sum by (pod, namespace, service,container)
7 (rate(container_cpu_usage_seconds_total{image!=""}[1m])) / (sum by
8 (pod, namespace, service,container)
9 (container_spec_cpu_quota{image!=""} / 100000)) * 100 > 90 and sum by
10 (pod, namespace, service,container)
11 (rate(container_cpu_usage_seconds_total{image!="",namespace!=""}[1m]))
12 * 100 != +Inf
13 for: 5m
14 labels:
15 cluster: manage-prod
16 container: '{{ $labels.container }}'
17 cprom_notify_rule_id: notify-default
18 cprom_severity: notice
19 severity: info
20 annotations:
21 current_value: '{{$value}}'
22 description: >-
23 {{ $labels.namespace }}.{{ $labels.pod }} cpu usage is high above
24 90% for more than 5 minute.
25 summary: Pod cpu Usage 高于90%
方式三:告警配置保存为自定义模版
- 登陆百度智能云 Prometheus 监控服务控制台。
- 左侧导航栏选择 监控实例,在监控实例列表中点击实例名称进入实例信息页面。
- 左侧选择 告警配置,在告警配置页面点击 创建告警,进入创建告警页面。
-
根据业务需求进行告警配置,若您需要将当前告警配置保存为模版以供其他实例使用,则可点击页面左下角 确定并保存为模版,当前告警配置即可作为自定义模版保存在 告警管理 > 告警规则模版 中。
说明:若您期望将告警配置保存为模版,请在创建告警时选择 确定并保存为模版,目前仅创建时支持另存为模版。另外,模版中仅保存配置告警部分内容(告警名称、告警规则、持续时间、告警等级、告警内容、标签、注解),通知策略不会被保存至模版中。
管理自定义模版
告警规则模版创建完成后,您可以在 告警管理 > 告警规则模版 中管理模版,支持查看模版的详情、复制模版、更新模版、删除模版、应用模版。
为实例应用模版
- 登陆百度智能云 Prometheus 监控服务控制台。
- 左侧导航栏选择 告警管理 > 告警规则模版,进入告警规则模版页面。
- 点击操作列中的 应用模版,在应用模版弹窗中点击地域右侧筛选图标可进行地域切换,找到期望应用模版的 Prometheus 实例,点击操作列的 应用 即可完成模版应用。
说明:同一个告警规则模版支持应用至多个 Prometheus 实例,若您需要告警通知,在模版应用后需要进一步在实例的告警配置中配置通知策略。
更新模版
- 登陆百度智能云 Prometheus 监控服务控制台。
- 左侧导航栏选择 告警管理 > 告警规则模版,进入告警规则模版页面。
- 点击告警规则模版列表操作列中的 更新,在更新自定义模版页面中更新告警规则模版应用,点击 确定 按钮完成模版更新。
注意:此时仅更新模版内容,若需要将应用当前模版的实例同步更新,可点击告警规则模版列表中操作列的应用模版,在应用模版弹窗中找到需要同步更新的实例,点击操作列的同步即可完成实例内模版同步更新。
复制模版
- 登陆百度智能云 Prometheus 监控服务控制台。
- 左侧导航栏选择 告警管理 > 告警规则模版,进入告警规则模版页面。
- 点击告警规则模版列表操作列中的 复制,进入复制自定义模版页面,将基于原模版内容进行预填充,您可根据自身需求进行细微调整或直接点击 确定 完成模版创建。模版名称将自动命名为<原模版名称_副本>。
导出模版
- 登陆百度智能云 Prometheus 监控服务控制台。
- 左侧导航栏选择 告警管理 > 告警规则模版,进入告警规则模版页面。
- 在告警规则模版列表中勾选需要导出的模版,点击 导出 按钮。
- 在导出弹窗中可以预览即将导出的所有告警规则,确认无误后点击 确定 执行导出操作。
删除模版
- 登陆百度智能云 Prometheus 监控服务控制台。
- 左侧导航栏选择 告警管理 > 告警规则模版,进入告警规则模版页面。
- 找到需要删除的告警规则模版,点击操作列中 删除,在二次确认弹窗中点击 确定 完成删除。
系统预置告警规则模版
在为实例创建告警规则时,除自定义模版外,CProm 还预置了许多系统告警规则。您可根据自身业务需求自行选择自定义告警规则模版或直接使用系统模版。
- 登陆百度智能云 Prometheus 监控服务控制台。
- 左侧导航栏选择 监控实例,在监控实例列表中点击实例名称进入实例信息页面。
- 左侧选择 告警配置,在告警配置页面点击 创建告警,进入创建告警页面。
- 在创建告警页面中 告警模版 选择 使用模版,在下方选择模版中点击下拉列表即可展示所有告警规则模版,系统预置模版名称后会带上 “(系统)” 字样。