r 深度学习  内容精选
  • 部署 TensorFlow Serving 推理服务 - 容器引擎CCE | 百度智能云文档

    部署 TensorFlow Serving 推理服务 本文介绍如何部署 TensorFlow Serving 推理服务,并指定队列、GPU资源。 前提条件 您已成功安装 CCE GPU Manager 和 CCE AI Job Scheduler 组件,否则云原生 AI 功能将无法使用。 操作步骤示例 这里用 TensorFlow Serving 作为示例,演示如何通过 deployment 部署

    查看更多>>

  • 修改队列 - 容器引擎CCE | 百度智能云文档

    修改队列 您可以根据新的需要修改已有的队列的备注信息、配额信息和资源对象。 前提条件 您已成功安装 CCE AI Job Scheduler 和 CCE Deep Learning Frameworks Operator 组件,否则云原生 AI 功能将无法使用。 您已成功创建队列。 操作步骤 登录 百度智能云官网 ,并进入管理控制台。 选择“产品服务 > 云原生 > 容器引擎 CCE”,单击进入容

    查看更多>>

r 深度学习  更多内容
  • GPU资源池总览 - 容器引擎CCE | 百度智能云文档

    GPU资源池总览 GPU资源池总览,包含节点使用情况、集群GPU卡分配情况、GPU卡使用情况、CPU&内存使用情况、GPU卡分配数、GPU卡分配率、GPU卡利用率、GPU卡显存利用率、节点信息、占用GPU的工作负载信息。 前提条件 已安装CCE AI Job Scheduler组件且版本 >= 1.7.9 已安装CCE GPU Manager组件 已接入监控实例 需启用采集任务,具体参考

    查看更多>>

  • GPUManager组件 - 容器引擎CCE | 百度智能云文档

    GPUManager组件 GPUManager组件,包含GPUManager组件异常pod 数量、GPUManager组件重启次数,以及GPUManager相关组件的cpu利用率和men使用量。 前提条件 已安装CCE GPU Manager组件 已接入监控实例 需启用采集任务,具体参考文档: 接入监控实例并启用采集任务 使用方法 登录 容器引擎CCE控制台 。 点击左侧 集群管理 ,在 集群列表

    查看更多>>

  • CCE发布Kubernetes 1.22版本说明 - 容器引擎CCE | 百度智能云文档

    CCE发布Kubernetes 1.22版本说明 百度智能云容器引擎CCE严格遵循社区一致性认证, 本文介绍 CCE 发布 Kubernetes 1.22 版本相对 1.20 所做重要变更说明。 资源变更和弃用 storage.k8s.io/v1beta1 被弃用,推荐试用 storage.k8s.io/v1; scheduling.k8s.io/v1beta1 被弃用,推荐使用 scheduli

    查看更多>>

  • CCE CSI BOS Plugin 说明 - 容器引擎CCE | 百度智能云文档

    CCE CSI BOS Plugin 说明 组件介绍 CCE CSI BOS Plugin为百度云CCE集群中可用的BOS磁盘插件。 组件功能 容器的特性决定了容器本身是非持久化的,容器被删除,其上的数据也一并删除。 BOS可以解决容器的数据共享和持久化存储问题,适用于大数据分析、媒体、游戏等很多场景。 而PV(PersistentVolume)和PVC(PersistentVolumeClaim

    查看更多>>

  • 共享GPU场景下的镜像构建注意事项 - 容器引擎CCE | 百度智能云文档

    共享GPU场景下的镜像构建注意事项 以下环境变量会由 GPU Manager的组件进行注入,请不要添加到镜像的环境变量里面: 环境变量 说明 NVIDIA_VISIBLE_DEVICES 可见 GPU设备列表,由调度器分配 NVIDIA_VISIBLE_GPUS_SLOT 可见 GPU设备插槽,由调度器分配 NVIDIA_VISIBLE_GPUS_UUID UUID 形式的可见 GPU设备列表,由

    查看更多>>

  • 通过kubectl连接集群 - 容器引擎CCE | 百度智能云文档

    通过kubectl连接集群 通过kubectl连接Kubernetes集群 如果用户需要从本地个人计算机连接到百度智能云的 Kubernetes 集群,需要使用 Kubernetes 命令行客户端 kubectl. kubectl的安装步骤如下所示。 操作步骤 从 Kubernetes 版本下载页面 下载对应的 kubectl 客户端,关于kubectl 的其他信息,可以参见 kubernetes

    查看更多>>

  • 业务应用如何使用负载均衡? - 容器引擎CCE | 百度智能云文档

    业务应用如何使用负载均衡? 业务应用过程中,可能会遇到高并发的场景,通过负载均衡 BLB 的流量均衡和分发功能,可以为应用提供多台 WebServer 并发服务的能力,从而达到业务水平扩展的效果。 目前创建业务应用的方式有两种: 一是通过 kubectl 创建业务应用; 二是通过 Kubernetes Dashboard 创建业务应用,因此创建和使用负载均衡的方式也分为以下两种: kubectl

    查看更多>>

  • CCE发布Kubernetes 1.24版本说明 - 容器引擎CCE | 百度智能云文档

    CCE发布Kubernetes 1.24版本说明 百度智能云容器引擎CCE严格遵循社区一致性认证, 本文介绍 CCE 发布 Kubernetes 1.24 版本相对 1.22 所做重要变更说明。 资源变更和弃用 autoscaling/v1 被弃用,推荐使用 autoscaling/v2 flowcontrol.apiserver.k8s.io/v1beta1 被弃用,推荐使用 flowcontr

    查看更多>>