通过该能力,您可以在一台无故障的宿主机上恢复您的实例,实例的关键信息皆与原实例保持一致,包括: 实例ID、名称、主机名等实例基本信息 VPC、子网IP等,以及主网卡的辅助IP、弹性网卡IP RDMA IP(如有)等信息 云盘(数据盘)、弹性网卡等的挂载状态 前置条件 如果需要正常使用疏散功能,您需要保证EBC/EHC实例的 /etc/fstab 配置文件中,所有数据盘都已经加入nofail参数。
机器人详情查看 语义配置>机器人管理,即可进入机器人管理页面,点击【查看】查看所建立机器人详情。 基本信息 语义配置>机器人管理>【查看】,可以查看机器人的基本信息,包括机器人名称、机器人ID、机器人类型等。 技能详情查看 语义配置>机器人管理>【查看】 进入机器人详情页,点击技能详情【查看】,可以查看机器人技能详情,度家基础控制技能、度家基础资源服务、度家媒咨技能、度家大模型服务等。
方法二:选择“管理控制台”进入“云数据库 RDS -实例列表”,云数据库 RDS 实例的状态会显示为“变配中”,变更完成后,状态恢复为“运行中”。
变更配置 概述 本文为您介绍通过云数据库 Redis 管理控制台变更配置的基本方法。 注意事项 如果变更配置时所需IP数量超过子网剩余IP数量,请提交 工单 。 变更配置后历史备份将失效,请在变更前下载备份,并在扩容成功后新建备份。
节点自动维修系统,实现节点故障自愈,要求组件版本>=0.2.3 CCE Node Problem Detector :实时检测节点上各种异常情况,并将检测结果上报至集群 >=0.8.30 开启故障自愈 选择“资源池详情 > 节点管理 > 故障自愈”,点击“立即开启” 故障自愈配置 故障检测:开启故障自愈后,会自动开启故障节点检测。
单击 确认变更 按钮,确认变更的实例配置订单。 确认后,单击 提交订单 按钮,根据提示完成支付。 查看变更实例 方法一:用户可以选择“查看订单明细”进行订单查询。 方法二:选择“管理控制台”进入“云数据库 RDS -实例列表”。云数据库 RDS 实例的状态会显示为“变配中”,变更完成后,状态恢复为“运行中”。 方法三:左侧导航栏选择任务列表查看变更配置任务进度。
设备模型管理 简介 产品(设备模型)提供对一类设备的统一定义,包括设备的属性,测点和接入协议等信息。通过使用设备模型作为模板可以创建同一类型的多个设备。 属性: 属性是指设备的静态描述信息,例如设备的品牌,厂商等信息。这些信息是设备固有的,不因外部环境影响而改变。 测点:测点是指设备的实时动态信息,例如设备实时状态,传感器数据监测到的当前数据,需要对设备进行控制的开关参数等信息。
设备分组管理 设备分组管理 测试设备分组: 为保证升级资源可用且设备SDK配置正确,所有升级任务均需要通过测试流程后才能进入正式下发流程。用户需要在创建升级任务前为各个产品线添加测试设备。进入产品线后,点击“设备分组管理”>“测试设备分组”添加测试设备分组,直接导入或输入设备ID便可成功添加,用户可以修改备注方便分辨测试设备,也可以删除测试设备。
故障原因 CentOS等Linux操作系统默认开启透明大页,若您GPU实例上部署的业务中有频繁的内存分配场景,就可能触发透明大页频繁进行内存规整、内存迁移等操作来聚合透明大页,这些操作可能会通过发送ipi让某个CPU执行flush tlb操作,当这些flush tlb操作堆积起来,CPU没办法调度其他进程运行,可能造成soft lockup,最终导致系统宕机。
故障类问题 作业运行失败怎么办? 可以在集群的作业列表中,找到运行失败作业的日志,分别为syslog、stderr、stdout三个日志。其中Syslog日志记录了作业运行的信息,stderr记录了作业运行失败的原因,stdout记录了作业运行的过程中输出的信息。通过查看stderr日志,找到作业运行失败的原因并进行修复,再次运行作业。 作业为什么会运行失败?