CCE Deep Learning Frameworks Operator 说明
更新时间:2021-11-29
组件介绍
主流深度学习框架 operator 组件,结合 CCE AI Job Scheduler,可实现直接在 CCE 上进行深度学习模型训练。
组件功能
集成主流深度学习框架,提供开箱即用的深度学习任务提交能力,目前支持以下深度学习框架:
1、TensorFlow(TFJob)
2、PyTorch(PyTorchJob)
3、MXNet(MXJob)
4、PaddlePaddle(PaddleJob)
使用场景
您可以直接在 CCE 集群上运行深度学习任务,提高 AI 工程效率。
限制说明
- 仅支持 v1.18 版本的 Kubernetes 集群。
安装组件
- 登录百度智能云官网,并进入管理控制台。
- 选择“产品服务 > 云原生 > 容器引擎 CCE”,单击进入容器引擎管理控制台。
- 单击左侧导航栏中的 集群管理 > 集群列表 。
- 在集群列表页面中,单击目标集群名称进入集群管理页面。
- 在集群管理页面单击 组件管理 。
- 在组件管理列表中选择 CCE Deep Learning Frameworks Operator 组件单击“安装。
- 在组件配置页面中完成深度学习框架配置。
- 框架:目前支持 TensorFlow、Pytorch、Mxnet、PaddlePaddle 四种深度学习框架。
注意:至少需要选择一个组件,支持多选。
-
- 点击“安装”按钮完成组件的安装。