故障类问题 BCC实例异常会影响BLB服务吗? BLB会主动检查后端BCC实例的状态,如果某个BCC实例异常,BLB就会把新的请求发送到其它健康的BCC实例上,所以只要有一台正常的BCC实例,整个服务就可以正常工作。 健康检查的状态总是异常怎么办? 1.确保云主机上的健康检查端口有进程/服务在监听。
终止按小时后付费TPM配额 接口描述 本接口用于终止按小时后付费TPM配额。 权限说明 调用本文API,需符合以下权限要求,权限介绍及分配,请查看 角色与权限控制列表 、 账号创建与权限分配 。
在 自动故障隔离 选项处,展示当前自动隔离的故障节点个数 鼠标移入后,浮窗显示被隔离节点的IP以及节点ID信息 手动操作被自动隔离的节点 节点被 自动 隔离后,若您需要解除节点的隔离状态,需要先 关闭 该节点的自动故障隔离功能,然后手动解除节点的隔离状态。 若未关闭该节点的自动故障隔离功能,手动解除节点隔离状态后,在下一个检测周期,系统仍然会自动隔离该节点
如何检测RDMA常见故障 在GPU云服务器使用过程中可能会出现RDMA硬件故障或者亚健康状态,如果您发现应用程序出现报错或者RDMA硬件性能下降,可通过以下检测方法检测是否存在故障,发现故障后,可通过重启实例等方式修复,如果问题持续发生,请您提交工单。 网卡状态检测 您可通过以下检测方法,判断当前实例是否存在网卡状态故障。 检测步骤 登录实例。
设置BCI Pod的故障处理策略 默认情况下,BCI Pod创建失败后,系统会自动重试尝试创建。如果您希望尽快得到创建结果以便及时处理故障,可以修改BCI Pod的故障处理策略。 配置说明 在虚拟节点上创建BCI Pod时,可能会因为库存不足等原因导致Pod创建失败,默认情况下,系统会自动进行重调度,尝试重新创建Pod。
设置BCI Pod的故障处理策略 默认情况下,BCI Pod创建失败后,系统会自动重试尝试创建。如果您希望尽快得到创建结果以便及时处理故障,可以修改BCI Pod的故障处理策略。 配置说明 在虚拟节点上创建BCI Pod时,可能会因为库存不足等原因导致Pod创建失败,默认情况下,系统会自动进行重调度,尝试重新创建Pod。
此用户下的所有实例都不允许发起故障注入操作 5 { 6 "appList": ['*'] 7 } 8 //表示请求用户的故障注入白名单列表为:允许此用户下的所有满足故障注入条件的实例发起故障注入操作 9 { 10 "appList": ["rds-xxxxx"] 11 } 12 //返回一个实例列表,仅允许列表内的实例发起故障注入操作
将实例加入故障注入白名单 接口说明 将实例加入故障注入白名单 请求结构 Plain Text 复制 1 PUT /v{version}/failinject/whitelist HTTP/1.1 2 HOST: rds.bj.baidubce.com 3 Content-Type: application/json 4 Authorization: authorization string 5 {
使用限制 由于疏散功能对于底层资源逻辑有一定要求,而且一般需要技术客户经理提供相应支持,当前该功能仅针对部分用户开放。后续本能力将作为维修平台的附加功能面向更多用户放开。 疏散实例结果可能会出现失败的情况,失败之后百度智能云将回滚您的实例,不会出现实例异常删除、数据丢失等情况。 当前仅限EBC/EHC产品可以选择执行针对故障实例的疏散动作。 EBC/EHC实例在疏散后,本地盘的数据会完全丢失。
故障类问题 使用CDN后网站有文件不显示或网站出现403,应该如何处理? 百度智能云CDN为避免缓存的文件不完整的问题,会在CDN的节点上使用Content-Length来校验文件长度是否正确。所以需要源站的文件携带Content-Length或transfer-encoding参数。 针对报错403问题,您可以排查以下部分: 核实下源站是否正常,是否返回403。