说明: 选择列表节点,单击节点组名称,进入节点组详情页面,查看更多节点组详情请参见“查看节点组”。
查看节点列表 登录管理控制台。 选择“产品导览 > 专有云 > 广目混合云管理平台 > 容器引擎 > 集群列表”,进入集群列表页面。 在集群列表页面,单击集群名称/ID,进入集群详情页面,选择“节点管理 > 节点组”。 单击列表节点组名称,进入节点组详情页面,选择节点列表。 说明: 在节点列表页面,可为节点添加已有节点,操作详情请参见“添加已有节点”章节。
前置说明 全托管资源池 为了保证测试质量,建议创建一个专用于nccl-test的空队列,将需要进行nccl-test的节点移入该队列中,再在该队列上创建nccl-test分布式训练任务进行测试。 自运维资源池 对于新购入的节点,为了防止被自动归入默认队列被调用,需要在购入节点时开启封锁设置。 创建物理队列用于nccl-test,可指定节点加入该队列。
API Server 访问 自动创建负载均衡器 BLB: 系统将自动为集群 API Server 创建一个内网应用型负载均衡 BLB 实例,若删除该 BLB 实例会导致 API Server 无法访问。若选择自动创建负载均衡器 BLB,还需进行 API Server 子网和公网访问设置。
自动扩容时创建节点的配置如何决定? 如何防止特定节点被缩容释放? 集群管理常见问题 常见问题 工单注意事项
目的类型 支持普通型负载均衡、云服务器、弹性网卡。 镜像目的 指定普通型负载均衡实例作为镜像目的,说明:普通型负载均衡的监听配置需要是UDP:4789。 指定VNI 指定VNI(VXLAN Network Identifier)来区分不同的镜像流量,取值范围0~16777215。如果未指定,将随机分配VNI。 数据包长度 镜像的每个数据包中的字节数,取值范围100~1500。
包含BES集群:A、B、C)的高可用BES集群为例,三个地域的BES集群,每个集群均订阅另外两个集群中的数据,保证每个地域的BES集群都具备完整数据并都提供读写服务,如下图所示: 当上述任何一个地域故障时,负载均衡系统会切断故障机房流量,上层业务系统仍可以正常使用ES集群对故障无感。
对接概述 BCI能为Kubernetes提供基础的容器Pod运行环境,但业务间的依赖、负载均衡、弹性伸缩、定期调度等能力依然需要Kubernetes来提供。本文为您介绍百度智能云容器引擎(Cloud Container Engine,即CCE)如何与BCI对接,使用BCI作为Pod的运行资源。
列举所有可选巡检项 接口说明 可选巡检项包括:集群健康状态(ClusterHealth)、集群负载(ClusterPayload)、节点分片数(NodeShardNum)、节点负载(NodePayload)、节点计算资源(NodeCompute)、节点堆内存(NodeHeap)、节点存储资源(NodeDisk)、数据节点负载均衡(NodePayloadBalance)、节点离群(NodeOffline
前面提到的对象存储架构,数据流从计算节点访问至少要经过四层的负载均衡设备 Load Balance、Webservice、再去访问元数据,拿到 blob 数据的实际的存储位置,然后再去实际的存储节点拿到数据,至少要经过四个步骤。