告警配置
更新时间:2022-03-30
概述
Prometheus监控服务的告警配置功能,不仅预置多种常用告警模板,还支持自定义告警规则。当规则条件被触发时,会根据通知策略发送告警信息,以便能够及时通知告警接收人,让其发现指标异常,并采取相应措施。
本文将介绍如何创建、管理、删除告警策略。
准备工作
-
登录百度智能云控制台:
- 登录成功后,选择“产品服务 > 云原生 > Prometheus监控服务”,进入“监控实例 > 实例列表”页面。
- 创建监控实例,监控实例与目标监控集群必须在同一地域下,详情见创建实例。
- (可选)在监控实例详情中,接入目标集群所在的私有网络VPC,详情见接入网络。
- 在监控实例详情中,关联目标CCE集群(安装Agent),详情见安装Agent。
创建告警策略
- 登录Prometheus监控服务控制台,选择“监控实例 > 告警配置”,点击“创建告警”。
-
配置告警策略信息:
- 告警模板:不使用告警模板(自定义告警策略)或选择预置的告警模板(使用告警模板将自动填入以下告警策略信息)。
- 告警名称:可使用模版的告警名称也可以自定义。
- 告警规则(PromQL):可使用模版的告警规则,也可以自定义,表示基于PromQL的表达式告警触发条件,用于计算是否有时间序列满足该条件。详情可查看Prometheus告警规则说明。
- 持续时间:可使用模版的持续时间,也可以自定义,表示当触发条件持续多少时间后才发送告警。
- 告警内容:可使用模板的告警内容,也可以自定义,表示发送告警消息的内容。
- 标签(Labels):自定义,可指定一组标签附加到告警上,根据接收到告警的标签匹配相应的处理方式。
- 注释(Annotations):自定义,可定义告警附加消息。
- 配置通知策略,包括策略名称、通知时段、通知周期、通知方式、通知对象、通知回调等,可选择已有通知策略模板,也可以新建自定义通知模板。详情可查看通知策略。
- 点击“创建”,创建告警策略和对应的通知策略。
管理告警策略
- 创建告警策略成功后,在“监控实例 > 告警配置”中可查看当前监控实例的告警策略列表,展示告警名称、告警规则、持续时间、通知策略、状态等信息。
- 在告警策略的操作列中,点击“编辑”,即可修改告警策略的信息。
删除告警策略
创建告警策略成功后,在“监控实例 > 告警配置”中可查看当前监控实例的告警策略列表,在告警策略的操作列中,点击“删除”,在二次确认弹窗中,点击“确认”,即可删除告警策略,相关告警规则自动失效。
注:告警策略暂不支持自定义模板保存和管理,删除后将无法找回,请谨慎操作。