什么是高性能计算集群?百度智能云 CHPC 集群概述 作者: xxinjiang 2024.12.25 07:48 浏览量: 2998 简介: 本文将介绍 CHPC 集群涉及的基本概念。
一般选择机房级专属,成本基本接近于专属AZ,因此多建议选择使用机房级专属LCC-Native方案建设数百机柜甚至更大规模的大型集群。
对于覆盖两个不同机房的专属集群,集群上创建的实例支持选择主备模式/主主模式,默认为主备模式 主备模式与主主模式都是相对于客户端访问BLB的数据流访问特点,主备场景下无论客户端从云上哪个机房发起访问,默认都会到对应实例在专属集群的主机房,主机房宕机场景才会将流量转发到备机房,主主模式遵循就近访问,会依据客户端发起访问的机房按照物理链路最短,选择专属集群对应的机房承接流量 如果该BLB的后端服务器集中在一个云机房
在集群管理页面通过 添加集群 按钮进入添加集群页面,可添加更多集群。 在添加集群页面中,勾选要添加的 CCE 集群,点击 确认 。 说明: 若需使用服务网格 CSM 纳管集群,需具有 CCE 集群的管理员权限,若您无相关权限,可前往 权限管理 申请。 服务网格 CSM 的不同版本兼容不同 Kubernets 版本的 CCE 集群,详情参见 版本支持说明 。
负载均衡专属集群 负载均衡专属集群提供性能可控、资源独享、物理资源隔离的专属负载均衡服务,满足超高性能和独占资源需求。 负载均衡专属集群使用专属物理服务器实现网络资源层面的硬隔离,用户可为不同业务部门申请创建多个独享专属集群,不同业务部门在与之对应的专属集群上产品化创建负载均衡实例。如需使用,可 提交申请 。
集群变更 操作场景 用于对已有集群进行节点扩容、节点规格变更、磁盘扩容等变更操作。 前提条件 集群必须处于 服务中 状态。 注意事项 每次进行集群变更仅可变更 一项 内容。 操作步骤 登录 消息服务 for Kafka控制台 进入集群列表页面。 可以在 集群列表 中点击集群右侧的“ 变更 ”按钮,或者在 集群详情 页面右上角点击的“ 变更 ”按钮进入集群变更页面。
非法RDMA申请、无资源申请、跨EHC调度、TOR策略等问题 GPU资源诊断 针对当前等待原因,提供了整理集群资源碎片、处理前序任务和调整任务优先级等推荐操作和详细方法,供客户选择。 集群资源碎片、集群资源不足、资源描述符混用等问题 单节点Pod数上限诊断 针对当前等待原因,提供了删除冗余Pod等推荐操作和详细方法,供客户选择。
删除集群 操作场景 当您不再需要使用某个集群时,可以选择对集群进行删除操作。 前提条件 如果集群的付费方式是 后付费 ,集群只有处于 服务中 的状态时才能够进行删除集群操作。 如果集群的付费方式是 预付费 ,集群只有处于 集群部署失败 时才能够进行删除操作。 注意事项 集群删除后, 底层所有资源均会释放,并且无法恢复,请谨慎操作 。
返回参数 参数名称 类型 描述 clusterId String 集群ID 错误码 错误码 错误描述 HTTP状态码 描述 ERROR_PARAMS 请求参数错误 400 请求参数错误 CLUSTER_NOT_FOUND 集群不存在 451 集群不存在 CLUSTER_HAD_DELETED 集群已删除 451 集群已删除 CLUSTER_NOT_BELONGED 未拥有该集群 451 未拥有该集群
集群监控 概述 集群监控提供了集群监控、节点监控、主题监控以及消费监控四种维度的监控信息。 集群监控 登录 消息服务 for Kafka控制台 进入集群列表页面,点击需要操作的集群。 在左侧选择 集群监控 ,可以看到集群中的监控指标展示。 集群监控默认展示生产消息速率、生产消息流量、消费消息流量、主题总数等7项监控指标。如果需要查看更多的监控指标,点击右上角的 指标筛选 按钮进行指标的选择。