智能巡检
智能巡检是百度智能云Elasticsearch提供的自动化运维工具,提供集群、节点、索引维度的多个巡检项。自动归纳巡检结果生成报告,帮助用户持续分析集群状态,监测集群潜在风险,高效定位集群问题,并提供优化建议,提升运维效率
开启智能巡检
智能巡检需要访问用户集群的基本信息和日志,因此当首次启用智能巡检服务时,需要用户对访问授权
操作步骤
- 登录百度智能云Elasticsearch控制台,在集群列表中单击需要开启智能巡检的集群ID/名称,进入集群详情页
- 在集群详情页,侧边栏点击智能巡检,进入智能巡检功能,开始初始化流程
- 在初始化页面中,阅读相关说明和注意事项
- 确认无误后,点击【授权】按钮,即可开启智能巡检功能
查看巡检概览
巡检概览统计并展示了集群的巡检结果及其趋势变化,方便用户查看集群近期的健康状况。巡检结果通过高风险、低风险、安全和失败,一共4种状态来展示各巡检项的结果:
高风险:表示集群已经出现了严重的问题或隐患,已经影响集群可用性,需要立即处理,否则会导致数据丢失、集群故障等问题
低风险:表示集群存在较严重的问题或隐患,可能会影响集群可用性,建议尽快处理
安全:表示集群健康
失败:表示巡检项巡检失败,建议用户检查对应索引或提工单咨询
操作步骤
- 登录百度智能云Elasticsearch控制台,在集群列表中单击需要开启智能巡检的集群ID/名称,进入集群详情页
-
在集群详情页,侧边栏点击智能巡检,进入智能巡检功能。页面上方展示了最新巡检结果摘要和近7天巡检结果累计分布
- 最新巡检结果摘要:会展示最近一次的集群巡检结果的关键指标,包括最近一次巡检时间、高风险巡检项个数、低风险巡检项个数等
- 近7天巡检结果累计分布:展示最近7天内全部巡检次数累计的巡检结果,帮助用户判断巡检项的健康状况
巡检集群
开启智能巡检功能后,支持巡检集群,并产生巡检报告。支持自动巡检和手动巡检,用户可选择需要巡检的索引和巡检项。每次巡检约耗时约几分钟
- 自动巡检:系统将在每天凌晨2点进行巡检,默认选择全部巡检项并生成巡检报告,每天一次
- 手动巡检:除了每天的自动巡检外,支持手动随时触发巡检任务,用户可以指定部分巡检项和索引,并立即生成巡检报告,无次数限制
操作步骤
- 登录百度智能云Elasticsearch控制台,在集群列表中单击需要开启智能巡检的集群ID/名称,进入集群详情页
- 在集群详情页,侧边栏点击智能巡检,进入智能巡检功能。自动巡检和手动巡检的操作步骤将分别介绍
自动巡检
智能巡检页面右上角提供自动巡检开关,智能巡检初始化完成后,自动巡检功能默认开启,用户可勾选关闭
手动巡检
智能巡检页面的最新巡检结果摘要模块,提供手动巡检按钮,点击后即刻进行手动巡检,生成巡检报告
另外手动巡检支持用户配置巡检项和索引,用户可配置业务上关注重点的巡检项和索引。功能入口在智能巡检页面右上角-手动巡检项配置,单击后在弹窗中配置。手动巡检项配置完成后,点击确认,巡检项的配置将被保存。再点击开始手动巡检,配置的巡检项和索引会在手动巡检生成的报告中生效
查看巡检报告
巡检报告中包含巡检项说明、巡检结果、巡检建议以及详情,手动巡检报告内容由用户选择的巡检项构成。最多支持查看最近7天的历史巡检报告。
操作步骤
- 登录百度智能云Elasticsearch控制台,在集群列表中单击需要开启智能巡检的集群ID/名称,进入集群详情页
- 在集群详情页,侧边栏点击智能巡检,进入智能巡检功能。
- 在智能巡检页面下方的巡检报告模块,提供报告列表功能,可以查看不同日期的历史报告。在列表中点击巡检报告名称或操作列的查看报告,在右侧查看对应的历史巡检报告
巡检报告支持下载,在巡检报告右上角点击下载报告,支持下载巡检报告pdf版
关闭智能巡检
当用户不再需要使用智能巡检功能时,可关闭该服务,关闭后,系统将不会再定时巡检集群并生成新的巡检报告
操作步骤
- 登录百度智能云Elasticsearch控制台,在集群列表中单击需要开启智能巡检的集群ID/名称,进入集群详情页
- 在集群详情页,侧边栏点击智能巡检,进入智能巡检功能。
- 智能巡检页面右上角提供自动巡检开关,用户勾选关闭后,功能关闭