维修平台
更新时间:2023-06-02
概述
BBC实例在实际使用过程中会有极小概率出现硬件级别故障。百度智能云推荐对这些问题进行完整的维修处理,从而充分保证实例和业务的可用性。 维修平台是一个能够提供相关能力支持的工具,通过此平台,用户能够直接获取到涵盖故障感知、维修任务处理、维修进度确认、维修任务交互(如授权、验收)等一系列操作的能力。当前维修平台功能处于白名单开放阶段,如果您需要使用维修平台功能,您可以通过您的专属客户经理传递相关要求。
维修任务
BBC实例感知到关键硬件故障时,会自动生成一条维修任务信息,并且在BBC的实例列表页面将对应实例显示为“待维修”状态。此时您可以前往维修任务页面查看相关信息,包括维修任务ID、关联实例信息、故障名称、状态、创建时间等。在相关的维修任务生成后,百度智能云也会通过BCM向您推送相关信息,并告知相关解决建议。
注:为保证故障告警信息正常推送,请确保故障监控组件HAS Agent已安装并处于在线状态。
授权维修
选择待处理的维修任务,可选择 “授权” 维修或 “暂不处理” 操作。
- “授权”:授权开始维修故障操作,请确保业务已离线;操作后设备转为”维修中”状态。
- “暂不处理”: 在未授权的情况下,如果无法停机或是有冗余硬件故障,可选择”暂不处理”,后续完成数据备份或者业务迁移后,安排时间再进行”授权”维修。
确认恢复
机器维修处理完成后,在操作中可选择”确认恢复”、”未恢复”操作。
- “确认恢复”:确认机器已恢复,维修任务结束,可在”维修记录”查看历史记录。
- “未恢复”:机器未恢复,继续维修处理。
查看详情
点击维修任务ID即可查看维修任务详情信息。
设置预授权
用户针对某些BBC实例,可以预先设置授权,成功预授权的机器自动进入维修流程,无需等待用户人工审核和授权处理,减少响应时间和故障影响时长。
新建预授权规则
进入设置预授权页面,单击【新建预授权规则】,即可进入规则设置页面。
- 授权规则必须关联标签键,标签范围内的实例才可以触发预授权。
-
授权上限可基于业务容量考虑,如果在规则中设置授权上限(默认不填的话,表示无上限)
- 如果关联标签范围内的故障机器数未超出授权上限,则自动触发授权维修
- 如果关联故障数超出授权上限,超出范围的机器将不会触发自动授权维修,同时会发送通知,通知用户到控制台操作手工授权,后续流程同未授权维修流程。
其他操作
- 新增规则时勾选【创建规则后默认生效】,则规则会立即生效;如果新建时没有勾选该选项,也可以在新建完成后选择【启动】操作,生效规则。
- 生效规则后执行【停止】操作,预授权规则将不再生效(维修中的实例除外)。
- 不再使用的规则可以执行【删除】操作,删除前请先保证要删除的预授权规则已停止使用。