故障类问题 云服务器/关系型数据库列表为什么会为空? 用户未创建云服务器/关系型数据库实例,需要去“控制台>云服务器/关系型数据库”页面创建实例,创建成功后会自动同步展示到监控列表中。 站点监控为何会频繁出现数据不足或者监控项趋势图出现断点(不连续)的状态? 监控的目标网站不稳定导致监控超时,没有采集到有效数据。 用户已经配置了异常通知,当报警状态变为异常后,为什么只发送一次报警短信或报警邮件?
4、目前香港区域使用共享Ip的站点,香港和国外的用户访问站点网络质量良好,但是内地用户访问会出现访问慢或者偶发的无法访问的状况,对于此类情况建议根据自己的业务需求,如果访问的用户群是内地用户较多,建议购买内地主机或者购买 独享Ip服务 来保证网站的访问质量。 网站访问已过期或者故障迁移中 站点到期时,网站访问会显示如下图主机已过期或者故障迁移中。请前往BCH控制台找到对应站点,查看到期时间。
故障类问题 BCC实例异常会影响BLB服务吗? BLB会主动检查后端BCC实例的状态,如果某个BCC实例异常,BLB就会把新的请求发送到其它健康的BCC实例上,所以只要有一台正常的BCC实例,整个服务就可以正常工作。 健康检查的状态总是异常怎么办? 1.确保云主机上的健康检查端口有进程/服务在监听。
如何检测GPU常见故障 在GPU云服务器使用过程中可能会出现GPU硬件故障或者亚健康状态,如果您发现应用程序出现报错或者GPU硬件性能下降,可通过以下检测方法检测是否存在故障,发现故障后,可通过重启实例或者重置GPU卡等方式修复,如果问题持续发生,请您提交工单。 掉卡故障检测 您可依次通过以下几种检测方法,判断当前实例是否存在GPU掉卡故障。 方法一:检测GPU掉卡数量 检测步骤 登录实例。
故障类问题 为什么日志查询报错?
如何检测RDMA常见故障 在GPU云服务器使用过程中可能会出现RDMA硬件故障或者亚健康状态,如果您发现应用程序出现报错或者RDMA硬件性能下降,可通过以下检测方法检测是否存在故障,发现故障后,可通过重启实例等方式修复,如果问题持续发生,请您提交工单。 网卡状态检测 您可通过以下检测方法,判断当前实例是否存在网卡状态故障。 检测步骤 登录实例。
发起故障注入操作 接口说明 发起故障注入操作。 此接口为v1接口。
39;] } //表示请求用户的故障注入白名单列表为:允许此用户下的所有满足故障注入条件的实例发起故障注入操作 { "appList": ["rds-xxxxx"] } //返回一个实例列表,仅允许列表内的实例发起故障注入操作
在 自动故障隔离 选项处,展示当前自动隔离的故障节点个数 鼠标移入后,浮窗显示被隔离节点的IP以及节点ID信息 手动操作被自动隔离的节点 节点被 自动 隔离后,若您需要解除节点的隔离状态,需要先 关闭 该节点的自动故障隔离功能,然后手动解除节点的隔离状态。 若未关闭该节点的自动故障隔离功能,手动解除节点隔离状态后,在下一个检测周期,系统仍然会自动隔离该节点
将实例加入故障注入白名单 接口说明 将实例加入故障注入白名单 请求结构 PUT /v{version}/failinject/whitelist HTTP/1.1 HOST: rds.bj.baidubce.com Content-Type: application/json Authorization: authorization string { "appList": ["