使用免密组件提交工作负载 免密组件安装成功以后,在免密组件生效的命名空间下使用ServiceAccount创建工作负载时,会自动注入CCR实例的镜像访问凭据。
当前集群占用GPU的工作负载名称 类型 当前集群占用GPU的工作负载类型 命名空间 当前集群占用GPU的工作负载所在命名空间 开始时间 当前集群占用GPU的工作负载开始时间 运行时长 当前集群占用GPU的工作负载运行时长 GPU配给卡数 当前集群占用GPU的工作负载配给GPU卡数 显存平均利用率 当前集群占用GPU的工作负载内所有GPU卡显存平均利用率实时值 GPU平均利用率 当前集群占用GPU的工作负载内
该方案可根据实例规模、集群磁盘使用率、集群机器负载、集群机架位和集群机器所在交换机等因素进行管理,使存储资源得到充分利用,并满足高性能的存储需求。 然而,随着时间的推移和集群的扩容或缩容等操作,存储系统中的副本分布可能会出现不均衡的现象。为了解决这一问题,GaiaDB 的分布式多租户存储方案能够提供统一的资源均衡策略。
当前集群占用NPU的工作负载类型 负载名称 当前集群占用NPU的工作负载名称 命名空间 当前集群占用NPU的工作负载所在命名空间 NPU配给卡数 当前集群占用NPU的工作负载配给NPU卡数 显存平均利用率 当前集群占用NPU的工作负载内所有NPU卡显存平均利用率实时值 NPU平均利用率 当前集群占用NPU的工作负载内NPU卡平均利用率实时值 内存使用量 当前集群占用NPU的工作负载的内存使用量 CPU
当前集群占用GPU的工作负载名称 类型 当前集群占用GPU的工作负载类型 命名空间 当前集群占用GPU的工作负载所在命名空间 开始时间 当前集群占用GPU的工作负载开始时间 运行时长 当前集群占用GPU的工作负载运行时长 GPU配给卡数 当前集群占用GPU的工作负载配给GPU卡数 显存平均利用率 当前集群占用GPU的工作负载内所有GPU卡显存平均利用率实时值 GPU平均利用率 当前集群占用GPU的工作负载内
创建工作负载支持为容器配置临时存储资源 • 创建工作负载支持配置时区同步 • 工作负载新增重新部署操作 • 新增 CCE CSI RapidFS Plugin 组件 • 支持弹性RDMA全生命周期管理 2025-07 • 优化创建节点组的交互页面 • 升级集群审计组件,支持大规格集群能力 • 新增调整期望节点数二次确认信息 • 节点组扩容支持部分成功 • HPAS节点组支持本地盘自定义挂载 •
检查不同类别的数据量是否均衡,建议不同分类的数据量级相同,并尽量接近,如果有的类别数据量很高,有的类别数据量较低,会影响模型整体的识别效果。 通过模型效果评估报告中的错误识别示例,有针对性地扩充训练数据。 检查测试模型的数据与训练数据的采集来源是否一致,如果设备不一致、或者采集的环境不一致,那么很可能会存在模型效果不错但实际测试效果较差的情况。
gt;,若不设置此标签,则会以工作负载的名称 metadata.name 上报指标至 APM。
更多关于CCR企业版私有网络的操作参考: 私有网络访问控制 步骤二:CCE集群创建工作负载 在CCE集群里使用CCR镜像部署工作负载,推荐使用私有网络地址访问镜像。 在CCE控制台集群页面选择 工作负载 > 无状态 ,进入工作负载页面。
更多关于CCR企业版私有网络的操作参考: 私有网络访问控制 步骤二:CCE集群创建工作负载 在CCE集群里使用CCR镜像部署工作负载,推荐使用私有网络地址访问镜像。 在CCE控制台集群页面选择 工作负载 > 无状态 ,进入工作负载页面。