管理报警策略
功能简介
对日志中的错误日志或系统及业务指标等配置报警,主动发现系统及业务异常问题。
创建报警策略
登录百度智能云,选择日志服务,在左侧导航栏中点击<报警管理>-><报警策略>,进入报警策略列表页面,点击“创建报警策略”,进入创建报警策略页面,填写配置信息。
配置基本信息
在"基本信息“中,请输入报警策略名称。 在"监控对象"中,选择待监控的日志集。支持执行语句共享日志集和在下面执行语句中单独选择日志集两种方式;执行语句共享日志集支持多选日志集,最多10个;执行语句中单独选择日志集为单选
报警规则配置
- 执行语句:输入日志检索分析语句,支持添加多条,最多添加3条;支持纯检索语句
match ...
, 支持查询语句select ...
以及带有检索条件的查询语句match ...| select ...
- 查询时间范围:查询语句筛选日志的时间范围,最多可查询一天日志。
-
触发条件:满足触发条件时进行报警,支持通知、警告和严重三种级别,满足条件时触发对应等级的报警,同时满足多个条件时将触发多个报警。
- 触发表达式:语法规则参见触发条件表达式。
-
分组触发:是否需要使用分组触发功能。使用分组触发功能时,如果某一个执行语句有多条结果,将根据指定的分组字段对这多条结果进行分组,按组分别判断是否满足报警触发条件,满足触发条件的每个组分别单独触发报警。
- 分组字段:从执行语句执行结果中选择需要作为分组依据的字段,至少选择1个字段。
- 使用分组触发功能时,一次报警执行可能会有大量的执行结果满足触发条件,进而同时产生大量报警,造成报警风暴。请合理设定分组字段及触发条件。
-
执行周期:监控任务的执行频率,提供如下两种周期配置方式:
- 固定频率:按固定的时间间隔执行一次监控任务时间间隔:1分钟 - 24小时
- 固定时间:按固定的时间点执行一次监控任务时间点范围:00:00 - 23:59
- 报警频率:连续多少次满足报警条件则触发报警
- 重复报警:当报警产生时,支持定义以特定的频率和次数进行重复通知
- 恢复报警通知:当报警恢复时,支持触发恢复报警通知
报警通知
- 报警通知:BLS目前获取BCM报警通知模版内容,在BLS侧可选择通知模版,如需新建需要点击“去BCM新建模版”按钮跳转到BCM报警通知模版模块进行新建,如需编辑也需要在BCM报警通知模版模块选择对应模版进行编辑
复制、编辑、删除、启用、禁用报警策略
1.登录百度智能云,选择日志服务BLS,在左侧导航栏中点击<报警管理>-><报警策略>,进入报警策略列表页面。
2.点击“操作”列的<复制>、<编辑>、<删除>、<启用>、<禁用>按钮,您可以对单个报警策略进行复制、修改、启用、禁用或删除操作。 勾选策略名称前的复选框,您可以对报警规则进行批量删除,启用,禁用操作。
开启/关闭报警通知
1.登录百度智能云,选择日志服务BLS,在左侧导航栏中点击<报警管理>-><报警策略>,进入报警策略列表页面。
2.在“通知状态”列进行操作,展示“ON”则报警通知开启,“OFF”则报警通知关闭。
说明:关闭报警通知时,您不会收到该报警策略的邮件或者短信的报警通知,但BLS平台会记录关闭报警通知期间的报警,查看报警的方法可参见查看报警历史。
查看报警策略详情
1.登录百度智能云,选择日志服务BLS,在左侧导航栏中点击<报警管理>-><报警策略>,进入报警策略列表页面。
2.点击报警策略名称链接,您可以查看当前报警策略的详情信息。
说明:为方便您对策略进行编辑操作,在报警策略详情界面也提供了<复制>、<编辑>、<删除>和<启/禁用>按钮,您可在查看详情的同时直接在此页面进行相关操作。