region String 伸缩组所在地域 status AsGroupStatus 伸缩组状态 vpcId String 私有网络VpcId nodeNum int 伸缩组下节点数量 createTime String 创建时间 zoneInfo ZoneInfo 可用区及子网信息 groupConfig GroupConfig 伸缩组规格 blbId String 负载均衡Id ZoneInfo
执行以下命令,使用准备好的 yaml 文件创建: kubectl apply -f 文件名称.yaml 执行以下命令,验证 Deployment 是否创建成功: kubectl get deployments 查看工作负载详情 点击列表页任何一行的工作负载名称,即可进入工作负载详情页,详情页内容包括: 工作负载详情、关联容器组、关联服务、事件列表、更新升级、伸缩策略、调度策略、监控、事件 伸缩部署
Kubernetes 集群的资源利用率不高的主要原因是根据 Kubernetes 的资源调度逻辑,在创建 Kubernetes 工作负载时,通常需要为工作负载配置合适的资源 Request,表示对资源的占用和限制,其中对利用率影响最大的是 Request。 为防止自己的工作负载所用的资源被别的工作负载所占用,或者是为了应对高峰流量时的资源消耗诉求,用户习惯于为 Request 设置较大的数值。
人工智能推理 针对深度学习的在线推理场景,相比训练负载,推理负载对GPU性能的要求降低,但对运行稳定性要求更高,对服务器响应延时也有了更高要求。 可选择NVIDIA Tesla A10、NVIDIA Tesla T4等GPU类型,在满足性能要求的同时,提供更具性价比的选择,同时支持GPU硬件级的解码功能并加速端到端的图片类推理性能。
该方案可根据实例规模、集群磁盘使用率、集群机器负载、集群机架位和集群机器所在交换机等因素进行管理,使存储资源得到充分利用,并满足高性能的存储需求。 然而,随着时间的推移和集群的扩容或缩容等操作,存储系统中的副本分布可能会出现不均衡的现象。为了解决这一问题,GaiaDB 的分布式多租户存储方案能够提供统一的资源均衡策略。
使用免密组件提交工作负载 免密组件安装成功以后,在免密组件生效的命名空间下使用ServiceAccount创建工作负载时,会自动注入CCR实例的镜像访问凭据。
当前集群占用GPU的工作负载名称 类型 当前集群占用GPU的工作负载类型 命名空间 当前集群占用GPU的工作负载所在命名空间 开始时间 当前集群占用GPU的工作负载开始时间 运行时长 当前集群占用GPU的工作负载运行时长 GPU配给卡数 当前集群占用GPU的工作负载配给GPU卡数 显存平均利用率 当前集群占用GPU的工作负载内所有GPU卡显存平均利用率实时值 GPU平均利用率 当前集群占用GPU的工作负载内
当前集群占用NPU的工作负载类型 负载名称 当前集群占用NPU的工作负载名称 命名空间 当前集群占用NPU的工作负载所在命名空间 NPU配给卡数 当前集群占用NPU的工作负载配给NPU卡数 显存平均利用率 当前集群占用NPU的工作负载内所有NPU卡显存平均利用率实时值 NPU平均利用率 当前集群占用NPU的工作负载内NPU卡平均利用率实时值 内存使用量 当前集群占用NPU的工作负载的内存使用量 CPU
当前集群占用GPU的工作负载名称 类型 当前集群占用GPU的工作负载类型 命名空间 当前集群占用GPU的工作负载所在命名空间 开始时间 当前集群占用GPU的工作负载开始时间 运行时长 当前集群占用GPU的工作负载运行时长 GPU配给卡数 当前集群占用GPU的工作负载配给GPU卡数 显存平均利用率 当前集群占用GPU的工作负载内所有GPU卡显存平均利用率实时值 GPU平均利用率 当前集群占用GPU的工作负载内
高阶监控是节点和工作负载范畴的,包括TopN节点,节点详情,TopN工作负载,工作负载详情相关的指标信息。