如何检测RDMA常见故障 在GPU云服务器使用过程中可能会出现RDMA硬件故障或者亚健康状态,如果您发现应用程序出现报错或者RDMA硬件性能下降,可通过以下检测方法检测是否存在故障,发现故障后,可通过重启实例等方式修复,如果问题持续发生,请您提交工单。 网卡状态检测 您可通过以下检测方法,判断当前实例是否存在网卡状态故障。 检测步骤 登录实例。
预授权规则设置 维修平台提供实例维修预授权功能,您可根据实例标签,设置维修的预授权规则,该规则对标签下的所有实例生效。当维修任务产生时,将按照正在启用中的预授权策略进行处理,立即开始维修,无需再单独操作授权。 新建预授权规则 进入维修平台的 设置预授权 页面,单击【新建预授权规则】,即可进入规则设置页面。 授权规则必须
云助手概述 概述 百度智能云提供的云助手是云服务器BCC、裸金属服务器BBC的原生运维部署工具。无需远程连接实例,云助手便能帮您自动批量执行PowerShell或者Shell等命令,完成运行自动化运维脚本、安装或者卸载软件、更新应用以及安装补丁等任务。
如何检测GPU常见故障 在GPU云服务器使用过程中可能会出现GPU硬件故障或者亚健康状态,如果您发现应用程序出现报错或者GPU硬件性能下降,可通过以下检测方法检测是否存在故障,发现故障后,可通过重启实例或者重置GPU卡等方式修复,如果问题持续发生,请您提交工单。 掉卡故障检测 您可依次通过以下几种检测方法,判断当前实例是否存在GPU掉卡故障。 方法一:检测GPU掉卡数量 检测步骤 登录实例。
删除预授权规则 该接口用于删除预授权规则。 请求结构 Plain Text 复制 1 POST /?action={action} 2 Host: bcc.bj.baidubce.com 3 Authorization: authorization string 请求头域 除公共头域外,无其它特殊头域。 请求参数 参数
撤销安全组规则 该接口用于撤销安全组中的规则。 同一安全组中的规则以remark、protocol、direction、portRange、sourceIp|destIp、sourceGroupId|destGroupId六元组作为唯一性索引。若安全组中不存在对应的规则,将报404错误。 请求结构 Plain Text
授权安全组规则 该接口用于在安全组中授权新的安全组规则。 同一安全组中的规则以remark、protocol、direction、portRange、sourceIp | destIp、sourceGroupId | destGroupId六元组作为唯一性索引,若安全组中存在相同的规则,则会报409错误。 请求结构 P
删除自动续费规则 该接口用于删除自动续费规则。 实例关联的预付费CDS磁盘会同时删除自动续费规则。 请求结构 Plain Text 复制 1 POST /v{version}/instance/batchDeleteAutoRenewRules HTTP/1.1 2 Host: bcc.bj.baidubce.com
删除安全组规则 该接口用于删除指定的安全组规则。 请求结构 Plain Text 复制 1 DELETE /v{version}/securityGroup/rule/{securityGroupRuleId}?sgVersion={sgVersion} HTTP/1.1 2 Host: bcc.bj.baidubce
获取授权规则列表 获取授权规则的列表信息。 请求结构 Plain Text 复制 1 POST /?action={action} 2 Host: bcc.bj.baidubce.com 3 Authorization: authorization string 请求头域 除公共头域外,无其它特殊头域。 请求参数 参数