nodes/${1}/proxy/metrics 118 119 # Scrape config for Kubelet cAdvisor. 120 # 121 # This is required for Kubernetes 1.7.3 and later, where cAdvisor metrics 122 # (those whose names begin with 'container
在新建任务页面中,完成任务基本信息配置: 任务名称:自定义任务名称,支持小写字母、数字、以及-或.且开头与结尾必须是小写字母或者数字,长度 1-65。 命名空间:选择新建任务所在的命名空间。 队列:选择新建任务关联的队列。 任务优先级:选择任务对应的任务优先级。 允许超发:允许超发将使用任务抢占超发功能,需要先安装CCE AI Job Scheduler组件并升级到1.4.0及以上版本。
访问上述 Service IPv6 EIP: Plain Text 复制 1 # curl -g [240c:4082:1:4202::8]:80 参考文档 IPv4/IPv6 双栈 验证 K8S IPv4/IPv6 双栈网络
CCE/v1.18+ 2024.09.10 首次上线 - 1.0.2 CCE/v1.18+ 2025.09.09 优化频繁新建serviceAccount对象时生成临时密码过多的问题 - 1.1.0 CCE/v1.18+ 2025.10.20 免密组件支持CCR实例的自定义域名 -
1.3 服务周期内费用: 为用户在一个服务周期(即自然月)内单托管集群所支付的服务费用总额。 1.4 服务周期总分钟数: 按照服务周期内的总天数 × 24(小时)× 60(分钟)计算。
Tensorboard:若需要任务可视化时,可开启Tensorboard功能,开启后需要指定“服务类型”与“ 训练日志读取路径”。 K8S标签:指定任务对应的K8S Label。 注释:指定任务对应的Annotation。 点击“完成”按钮,完成任务的新建。
GPU工作负载资源 GPU 工作负载资源,包含任务属性、GPU 卡数、GPU 资源使用情况、GPU 节点使用概要。 前提条件 已安装 CCE AI Job Scheduler 组件且版本 >= 1.7.9 已安装 CCE GPU Manager 组件 已接入监控实例 需启用采集任务,具体参考文档: 接入监控实例并启用采集任务 使用方法 登录 容器引擎CCE控制台 。
VPC 节点子网网络和容器网络不能冲突,比如,VPC 节点子网选择的是 172.16.0.0/16,容器网络也选择 172.16.0.0/16,则创建集群时会提示容器网络冲突,则建议使用推荐的容器网络。 CCE集群网络创建流程和示例 下面以一个完整的示例流程,来演示整个 VPC 内 CCE 集群的创建流程。 Step1: 创建VPC网络 登录 VPC 控制台 点击创建VPC。
Plain Text 复制 1 注意,以下两种行为是不合法的: 2 * 向有任务运行的物理队列下添加子队列 3 * 在物理队列有子队列的情况下,向物理队列提交任务 修改物理队列 (1)修改物理队列配额 使用 kubectl edit queue queue-physical-name 修改物理队列配额,修改配额为纳管新节点后的总配额数 (2)纳入新节点 类似划分节点步骤,给新节点执行下面两个操作 添加污点
创建LoadBalance类型Service时使用已有BLB时,CCE会自动为对应BLB设置 cce-resource-name 标签,CCE LB Controller组件不同版本标签内容及作用不同: CCE LB Controller组件版本为1.30.1及以上,标签为 cce-resource-name:<ClusterID> ,该标签用于标识已被集群使用,且支持该集群下的其他Service