云数据库 RDS 云数据库 Redis 云数据库 DocDB for MongoDB 云数据库 HBase 云数据库 GaiaDB 分布式数据库 GaiaDB-X 数据传输服务 DTS 云数据库 TableStorage 消息服务 for RabbitMQ 云原生 函数计算 CFC 容器实例BCI 容器镜像服务CCR 安全 DDoS防护服务 应用防火墙 WAF 密钥管理服务 SSL证书 云堡垒机
云数据库 RDS 云数据库 Redis 云数据库 DocDB for MongoDB 云数据库 HBase 云数据库 GaiaDB 分布式数据库 GaiaDB-X 数据传输服务 DTS 云数据库 TableStorage 消息服务 for RabbitMQ 云原生 函数计算 CFC 容器实例BCI 容器镜像服务CCR 安全 DDoS防护服务 应用防火墙 WAF 密钥管理服务 SSL证书 云堡垒机
选择“产品服务 > 云原生 > 容器引擎 CCE”,进入 集群管理 > 集群列表 。 在集群列表页面中,单击目标集群名称进入集群管理页面。 在左侧导航栏,点击 节点组 ,进入节点组列表页。 点击 创建节点组 按钮或者 马上创建 链接,进入节点组创建页面。 在机型配置页面,支持进行本地盘和数据盘自定义挂载目录。
在控制台创建任务 操作步骤(可参考 云原生AI任务管理 ) 登录 百度智能云官网 ,并进入管理控制台。 选择“产品服务 > 云原生 > 容器引擎 CCE”,单击进入容器引擎管理控制台。 单击左侧导航栏中的 集群管理 > 集群列表 。 在集群列表页面中,单击目标集群名称进入集群管理页面。 在集群管理页面单击 云原生AI > 任务管理 。 在任务管理页面单击 新建任务 。
选择“产品服务 > 云原生 > 容器引擎 CCE”,单击进入容器引擎管理控制台。 单击左侧导航栏中的 集群管理 > 集群列表 。 在集群列表页面中,单击目标集群名称进入集群管理页面。 在集群管理页面单击 云原生AI > 任务管理 。 在任务管理页面单击 新建任务 。
备注:云原生AI控制台会默认向任务中注入上述 YAML示例中的关键参数,无需手动填写
Fluid 可选组件 基于Kubernetes原生的开源分布式数据编排和加速引擎,主要用于云原生场景下的大数据、AI应用等。 CCE PaddleFlow Pipeline 可选组件 基于云原生架构的AI工作流组件,可实现编排AI作业,模板化AI作业的训练流程,提升实验效率。 CCE NPU Manager 可选组件 支持昆仑芯NPU算力和显存的共享与隔离。
选择“产品服务 > 云原生 > 容器引擎 CCE”,单击进入容器引擎管理控制台。 单击左侧导航栏中的 集群管理 > 集群列表 。 在集群列表页面中,单击目标集群名称进入集群管理页面。 在集群管理页面单击 云原生AI > 数据集 。 在数据集管理单击 新建数据集 。
选择“产品服务 > 云原生 > 容器引擎 CCE”,单击进入容器引擎管理控制台。 单击左侧导航栏中的 集群管理 > 集群列表 。 在集群列表页面中,单击目标集群名称进入集群管理页面。 在集群管理页面单击 云原生AI > 任务管理 。 在任务管理页面单击 新建任务 。
通过节点组扩容cgroup v2节点 登录百度智能云管理控制台,进入 产品服务>云原生>容器引擎 CCE ,单击 集群管理>集群列表 ,单击目标集群名称,进入 集群详情 页,在侧边栏单击 节点管理>节点组 。 在节点组列表中单击 创建节点组 操作,在 节点配置 选择 公共镜像 ubuntu 22.04 或选择目标自定义镜像。 完成创建节点组其他配置。