主要具有如下功能: 多维 数据模型(时序由 metric名字和k/v的labels 构成)。 灵活的查询语句(PromQL)。 无依赖存储,支持 local 和 remote 不同模型。 采用 http 协议,使用 pull 模式,拉取数据,简单易懂。 监控目标,可以采用服务发现或静态配置的方式。 支持多种统计数据模型,图形化友好。
只有配置了多个子网时该策略才能生效。 高级配置 配置项 说明 kubelet数据目录 volume文件、plugin文件等数据存储目录,例如 /var/lib/kubelet。 如果已挂载数据盘,建议存储到数据盘。 容器数据目录 容器、镜像等数据存储目录。勾选即可设置容器和镜像存储目录,例如 /home/cce/containerd。 如果已挂载数据盘,建议存储到数据盘。
IP版本为IPv4时必填 clusterIPCIDRIPv6 String 否 RequestBody 参数 Cluster IPv6 网段. IP版本为IPv6时必填 vpcID String 是 RequestBody 参数 VPC ID vpcCIDR String 否 RequestBody 参数 VPC IPv4 网段.
quot;4" 9 memory: 60Gi 单卡共享【同时支持显存隔离和算力隔离】示例: Plain Text 复制 1 resources: 2 requests: 3 baidu.com/cgpu_core: 50 // 50%, 0.5卡算力,用户可根据自己的需求填写 4 baidu.com/cgpu_memory: 10 // 10GB,用户可根据自己的需求填写 5 cpu: &
由于修改目的是让集群中可以容纳更多节点,也就是让节点上最大的 Pod 数量变小,我们需要修改 cluster-pool-ipv4-mask-size 值使其变大。 如果是多副本的 master,需要逐一修改各 master 节点上的配置。
概述 容器的特性决定了容器本身是非持久化的,容器被删除后容器内的数据也一并被删除,CCE 基于百度云存储产品,提供了容器数据共享和持久化解决方案,适用于大数据分析、媒体、游戏等很多场景。 PV(PersistentVolume)和 PVC(PersistentVolumeClaim)是 K8S 提供的用于抽象存储细节的 API 资源。
nginx-deployment-7fbd5f4c55-2xgd4 1/1 Running 0 45s 5 nginx-deployment-7fbd5f4c55-5xr75 1/1 Running 0 45s 6 nginx-deployment-7fbd5f4c55-fn6lr 1/1 Running 0 20m 7 8 # productionn 环境 9 $kubectl get pods
ce-volcano-cli queue -f volcano.1695461246.snapshot case2 混合卡调度 对于混合申请的场景,工具提供了 totalGPU字段 ,用于统计实际剩余的卡数,可以看到总卡数为8,已分配5卡,排队中4卡,剩余卡为-1。
Pod全部驱逐,建议开启 升级并发数 必选 输入范围为1~20,升级时会根据并发数多个节点同时升级,可提升升级速度 Pod不可用占比 必选 升级过程中Pod不可用数与集群总数占比超过设置的数值时将自动暂停升级任务,默认为20% 单击“升级”开始升级Worker Kubernetes版本。
检测 支持任务退出后回收cprom上的告警规则 创建训练任务注入 hostfile 此次升级不会对业务造成影响 1.6.25 CCE/v1.18+ 2024.09.20 新功能 : 支持导出容错监控指标 支持用户自定义容错pattern 修复 : 默认3分钟强删Terminating pod 此次升级不会对业务造成影响 1.6.24 CCE/v1.18+ 2024.09.18 新功能 : 支持Nvidia