告警配置
更新时间:2024-09-05
概述
Prometheus 监控服务的告警配置功能,不仅预置多种常用告警模板,还支持自定义告警规则。当规则条件被触发时,会根据通知策略发送告警信息,以便能够及时通知告警接收人,让其发现指标异常,并采取相应措施。本文将介绍如何创建、管理、删除、禁用告警策略。
准备工作
-
登录百度智能云控制台:
- 登录成功后,选择“产品服务 > 云原生 > Prometheus 监控服务”,进入“监控实例 > 实例列表”页面。
- 创建监控实例,监控实例与目标监控集群必须在同一地域下,详情见 创建实例。
- (可选)在监控实例详情中,接入目标集群所在的私有网络 VPC,详情见 接入网络。
- 在监控实例详情中,关联目标 CCE 集群(安装 Agent),详情见 安装Agent。
创建告警策略
- 登录 Prometheus 监控服务控制台,选择【监控实例】进入监控实例列表,点击目标实例名称进入实例详情页,选择左侧【告警配置】,点击【创建告警】进入创建告警页面。
- 在创建告警页面配置以下告警参数:
参数 | 说明 |
---|---|
告警模版 |
|
告警名称 | 告警的名称,可使用模版的告警名称也可以自定义。 |
告警规则 (PromQL) | 使用PromQL语句设置告警表达式。可使用模版的告警规则,也可以自定义,表示基于PromQL的表达式告警触发条件,用于计算是否有时间序列满足该条件。详情可查看 Prometheus告警规则说明。 |
持续时间 | 触发条件持续多少时间后发送告警。可使用模版的持续时间,也可以自定义。
|
告警等级 | 自定义告警等级,表示当前告警规则的严重程度。默认告警等级为通知,告警严重程度从通知、警告、重要、严重逐级上升。 |
告警内容 | 用户收到的告警信息。可使用模板的告警内容,也可以自定义,表示发送告警消息的内容。 |
标签 (Labels) | 自定义设置告警标签,可指定一组标签附加到告警上,根据接收到告警的标签匹配相应的处理方式。 |
注释 (Annotations) | 自定义设置告警的注释,用于定义告警附加消息。 |
- 配置通知策略,您可选择已有通知策略模板,也可在当前页或通知策略页面新建自定义通知策略模板,详情参见 通知策略。通知策略参数及说明如下:
参数 | 说明 |
---|---|
策略名称 | 告警通知策略的名称。 |
通知时段 | 选择发送告警通知的时间段。 |
通知方式 | 通知策略的匹配事件规则被触发后,发送告警通知的方式。目前支持的方式包括:
|
通知对象 |
|
告警升级 | 当告警在一定时间内未得到响应或处理时,您可开启告警升级,将告警通知升级至更高级别的负责人或团队,以确保告警能够及时得到关注和解决。 |
- 点击【创建】,创建告警策略和对应的通知策略。
管理告警策略
- 创建告警策略成功后,在【监控实例】页面选择监控实例名称,在左侧点击【告警配置】,即可查看当前监控实例的告警策略列表,您可在当前页面查看告警策略的告警名称、告警规则、持续时间、通知策略、状态,也可在操作列选择对应按钮执行编辑、禁用、删除操作。
- 在告警策略的操作列中,点击【编辑】进入告警编辑页面,您可在当前页修改告警策略的信息,点击【确定】后生效。
删除告警策略
- 创建告警策略成功后,在【监控实例】页面选择监控实例名称,在左侧点击【告警配置】,进入当前监控实例的告警策略列表,在您需要删除的告警策略操作列中,点击【删除】。
- 在二次确认弹窗中,点击【确认】,即可删除告警策略,相关告警规则自动失效。
注意:告警策略暂不支持自定义模板保存和管理,删除后将无法找回,请谨慎操作。
禁用告警策略
- 创建告警策略成功后,在【监控实例】页面选择监控实例名称,在左侧点击【告警配置】,进入当前监控实例的告警策略列表,在您需要禁用的告警策略操作列中,点击【禁用】。
- 在二次确认弹窗中,点击【确认】,即可禁用告警策略,该告警策略状态将更新为禁用。
- 若您需要重新启用已被禁用的告警策略,在操作列点击【启用】,在二次弹窗中点击【确认】即可重新启用。