登录百度智能云镜像仓库 Plain Text 复制 1 >$ sudo docker login --username=[username] hub.baidubce.com username:镜像仓库名称,即是开通镜像仓库时填写的用户名。输入密码后完成登录。
VPC 节点子网网络和容器网络不能冲突,比如,VPC 节点子网选择的是 172.16.0.0/16,容器网络也选择 172.16.0.0/16,则创建集群时会提示容器网络冲突,则建议使用推荐的容器网络。 CCE集群网络创建流程和示例 下面以一个完整的示例流程,来演示整个 VPC 内 CCE 集群的创建流程。 Step1: 创建VPC网络 登录 VPC 控制台 点击创建VPC。
CUDA 11.2,Pytorch 1.8.1,TensorFlow 2.5.0,MxNet 1.8.0,如果AI应用是其他的版本,请提交工单。 操作流程 1.选择训练镜像 在CCR公共镜像的“百度智能云AI镜像” 中选择“Halo”加速镜像,作为训练基础镜像,该镜像内已安装了 CUDA、Python 3、PyTorch、Tensorflow、MxNet和AIAK-Training加速软件等。
Node 可挂载弹性网卡数量 = min(主机核数,8),内存与单个弹性网卡辅助 IP 数量对应关系如下: Node 内存 单个弹性网卡辅助 IP 数量上限 1G 1 (1-8]G 7 (8-32]G 15 (32-64]G 29 大于 64G 39 单个 Node 可分配给容器的 IP 数量 = 可挂载弹性网卡数量 × 单个弹性网卡辅助 IP 数量上限。
插件名称 提供者 插件描述 插件版本 portmap 社区 社区的 CNI 插件,支持Pod 上配置端口直通能力。当开启 DataPath V2 时,该插件会自动失效。 v1.0.0 及以上版本 cilium-cni CCE Cilium CNI 插件,支持网络策略、service加速等。
性能表现 在TCP-30Gbps-1NIC 场景下,2台单机8卡提升85.5%,4台单机8卡提升43.7%。 在TCP-100Gbps-1NIC 场景下,2台单机卡提升85.5%,4台单机8卡提升52.1%。 在RDMA-100Gbps-1NIC场景下,2台单机8卡提升8.5%,4台单机8卡提升11.4%。
CoreDNS 组件手动升级指南 CoreDNS 和 K8S 版本的兼容性 CoreDNS 镜像版本 支持的 K8S 版本 1.7.1 1.18 1.9.4-baidu 1.20,1.24,1.26,1.28 ⚠️ 注意:升级 CoreDNS 会导致全集群断网 5 分钟,请做好评估后再进行升级。
3.3 VPC 路由模式容器访问公网(可选) 3.3.1 确认容器网络模式信息 容器网络模式由创建集群时选定,进入 CCE -> 选中已有集群可以进入集群详情页面,再次确认容器网络模式和Pod子网信息。案例集群使用 VPC路由容器网络,并配置容器网络的网段是 172.21.0.0/16。
SignOption字段为生成签名字符串时的选项,详见下表说明: 名称 类型 含义 HeadersToSign map[string]struct{} 生成签名字符串时使用的HTTP头 Timestamp int64 生成的签名字符串中使用的时间戳,默认使用请求发送时的值 ExpireSeconds int 签名字符串的有效期 其中,HeadersToSign默认为Host,Content-Type
昇腾工作负载资源具体说明 卡数&NPU资源使用情况 .tg {border-collapse:collapse;border-spacing:0;} .tg td{border-color:black;border-style:solid;border-width:1px;font-family:Arial, sans-serif;font-size:14px; overflow:hidden