CCE Ascend Mindx DL说明
更新时间:2026-04-10
概述
本文档介绍 CCE Ascend Mindx DL 组件的功能、适用场景、安装方式和状态确认方法。CCE Ascend Mindx DL 组件是基于昇腾 AI 处理器的深度学习组件,提供昇腾 AI 处理器调度、集群性能测试等基础功能,为上层模型训练、模型部署、模型推理等应用提供底层软件支持。
组件功能
- 集群调度:基于 Kubernetes 增强对昇腾 AI 处理器的调度,并支持查看昇腾节点、AI 处理器状态。
使用场景
可以使您的 CCE 集群适配昇腾 AI 处理器。通过使用高效的集群调度组件,能够迅速部署和管理基于昇腾 AI 处理器的 AI 任务,为所有 AI 作业提供昇腾 AI 处理器容器化支持。
前提条件
- 已创建并可进入目标 CCE 集群,且具备组件安装权限。
- 目标集群未安装冲突组件
CCE AI Job Scheduler,且组件目录中已提供CCE Ascend Mindx DL安装项;若未显示该组件,请先确认当前账号已开通对应组件能力。 - 如需执行组件状态确认,已获取目标集群的
kubeconfig,并可使用kubectl访问集群。
安装组件
导航路径:产品服务->云原生->容器引擎 CCE->集群管理->集群列表
- 登录 百度智能云官网 并进入管理控制台。
- 选择 产品服务->云原生->容器引擎 CCE,进入容器引擎管理控制台。
- 在集群列表中,单击目标集群名称,进入集群管理页面。
- 打开 【运维与管理】->【组件管理】。
- 在组件列表中找到 【CCE Ascend Mindx DL】,单击 【安装】。

组件状态确认
相关入口:产品服务->云原生->容器引擎 CCE->集群管理->集群列表
完成组件安装并获取目标集群访问凭证后,通过如下命令查看 Kubernetes 集群中与 CCE Ascend Mindx DL 组件相关的 Pod。若以下 Pod 的 STATUS 均为 Running,且 READY 均为 1/1,则该组件运行状态正常。
kubectl get pods -n volcano-system
Plain Text
1NAME READY STATUS RESTARTS AGE
2volcano-controllers-86bxxxxxx1-xxxx1 1/1 Running 0 038m
3volcano-controllers-86bxxxxxx2-xxxx2 1/1 Running 0 038m
4volcano-controllers-86bxxxxxx3-xxxx3 1/1 Running 0 138m
5volcano-node-controllers-6d8b9xxxxx-xxxxx 1/1 Running 0 09m10s
6volcano-scheduler-5bbxxxxxx1-xxxx1 1/1 Running 0 038m
7volcano-scheduler-5bbxxxxxx2-xxxx2 1/1 Running 0 138m
8volcano-scheduler-5bbxxxxxx3-xxxx3 1/1 Running 0 038m
kubectl get pods -n kube-system
Plain Text
1NAME READY STATUS RESTARTS AGE
2ascend-device-plugin-daemonset-xxxxx 1/1 Running 0 39m
3npu-exporter-xxxxx 1/1 Running 0 39m
如果当前集群中无昇腾对应的节点,则 ascend-device-plugin-daemonset 和 npu-exporter 的副本数为 0。
kubectl get pods -n mindx-dl
Plain Text
1NAME READY STATUS RESTARTS AGE
2ascend-operator-manager-xxxxxxx-xxxxx 1/1 Running 0 038m
评价此篇文章
