搜索本产品文档关键词
创建GPU实例
所有文档
menu
没有找到结果,请重新输入

GPU云服务器

创建GPU实例

操作步骤

基本配置

  1. 登录BCC管理控制台主界面。
  2. 登录成功后,选择“产品服务>云服务器 BCC”,进入“实例列表”页面,点击“创建实例”。
  3. 根据需要选择当前地域,可用区,付费方式。GPU云服务器支持预付费、后付费和抢占实例付费模式,具体配置信息如下。

    配置信息 说明
    类型 GPU 实例
    付费方式 预付费(包年包月)、后付费(按需购买)、抢占实例
    可选地域 华北-北京、华南-广州、华北-保定、华东-苏州
    可用区 可用区是指在同一区域下,电力和网络互相独立的区域,故障会被隔离在一个可用区内
    网络类型 当前服务器所属的虚拟私有网络,缺省情况下系统默认私有网络
  4. 在配置栏中架构选择异构计算GPU/FPGA/NPU并选择需要的实例分类。
  5. 选择镜像,创建GPU实例支持安装多种镜像类型。
  • 公共镜像:推荐使用。由百度智能云官方提供,包含基础操作系统环境。创建GPU计算型规格族时,使用Linux公共镜像同时可勾选安装GPU驱动来指定使用GPU所需要的CUDA、驱动、CUDNN版本,如下图。实例创建后会自动执行安装驱动的脚本命令,等待10-15分钟后即可获取GPU运行环境,之后可使用该实例,或者打包自定义镜像,以自定义镜像方式快速创建新的GPU实例。建议使用最新的GPU驱动环境以获取最新最全的GPU功能。

ee1c84596fd164a158caa208d34fa87e.png

当前系统支持的GPU环境版本您可参考GPU驱动选装发布记录查看。

自动安装驱动的脚本也可以通过自行复制到用户数据注入(详情见本文档第8条中的高级配置)来手动执行安装,或者在实例创建完后以命令行方式执行,脚本的内容如下,其中DRIVER_VERSION、CUDA_VERSION、CUDNN_VERSION可更换为兼容的其他版本号。

#!/bin/bash

set -ue

DRIVER_VERSION="470.86"
CUDA_VERSION="11.4"
CUDNN_VERSION="8.2.4"
WORK_DIR="/root/auto_install"
SCRIPT_URL="http://mirrors.baidubce.com/nvidia-binary-driver/api/auto_install.sh"

mkdir ${WORK_DIR}
cd ${WORK_DIR}
wget --timeout=10 -t 10 ${SCRIPT_URL}
bash ${WORK_DIR}/$(basename ${SCRIPT_URL}) ${DRIVER_VERSION} ${CUDA_VERSION} ${CUDNN_VERSION}
rm -rf ${WORK_DIR}

注:如勾选安装GPU驱动选项,实例后台会自动执行安装脚本,预计耗时10到15分钟。部分实例在执行完安装脚本后会自动重启一次。在安装过程中对实例进行关机、重装、重启等操作都会造成安装失败,可登录实例查看最新的安装进展并在安装结束后正常使用实例,安装进展的日志可通过如下命令查看。

cat /root/install_info.log
  • GPU镜像:由百度智能云官方提供,包含主流的基础操作系统环境和固定的GPU驱动及CUDA版本,使用此类型的镜像可以快速获取运行GPU的必备环境,以下为镜像版本详情
支持的GPU专用镜像 CUDA版本 深度学习框架版本 支持的GPU规格族
Ubuntu 16.04 LTS amd64 (64bit)-CUDA8.0 CUDA 8.0 LGN1、GN3
Ubuntu 16.04 LTS amd64 (64bit)-CUDA9.0 CUDA 9.0 LGN1、GN3
Ubuntu 16.04 LTS amd64 (64bit)-CUDA9.1 CUDA 8.1 LGN1、GN3
Ubuntu 16.04 LTS amd64 (64bit)-CUDA9.2 CUDA 9.2 LGN1、GN3
Ubuntu 16.04 LTS amd64 (64bit)-CUDA10.0 CUDA 10.0 LGN1、GN3
Ubuntu 16.04 LTS amd64 (64bit)-CUDA10.1 CUDA 10.1 LGN1、GN3
16.04 LTS amd64 (64bit)-CUDA9.0-framework-integration CUDA 9.0 深度学习开发镜像集成 TensorFlow_gpu 1.10.1、PaddlePaddle_gpu 0.14.0、Caffe2 LGN1、GN3
Ubuntu 16.04 LTS amd64 (64bit)-CUDA8.0-paddlepaddle_0.11.0 CUDA 8.0 PaddlePaddle_gpu 0.11.0 LGN1、GN3
Ubuntu 16.04 LTS amd64 (64bit)-CUDA8.0-tensorflow_1.3.0 CUDA 8.0 TensorFlow_gpu 1.3.0 LGN1、GN3
CentOS 7.5 x86_64 (64bit)-CUDA9.0 CUDA 9.0 LGN1、GN3
CentOS 7.5 x86_64 (64bit)-CUDA9.1 CUDA 9.1 LGN1、GN3
CentOS 7.5 x86_64 (64bit)-CUDA9.2 CUDA 9.2 LGN1、GN3
CentOS 7.5 x86_64 (64bit)-CUDA10.0 CUDA 10.0 LGN1、GN3
CentOS 7.5 x86_64 (64bit)-CUDA10.1 CUDA 10.1 LGN1、GN3
CentOS 6.8 x86_64 (64bit)-CUDA9.2 CUDA 9.2 LGN1、GN3
CentOS 7.5 x86_64 (64bit)-CUDA11.2 CUDA 11.2 GN5
CentOS 7.5 x86_64 (64bit)-CUDA11.4 CUDA 11.4 LGN1、GN3、GN5
  • 其他类型镜像:例如自定义镜像,市场镜像的使用方式和云服务器BCC的使用方式一致,可参考创建实例
  1. 选择 存储 相关配置

    配置信息 必选/可选 说明
    系统盘 必选 用于安装操作系统。
    非异构实例且镜像OS是Linux,默认大小20GB。若镜像OS是Windows,默认大小40GB。异构实例不区分操作系统默认均为40GB。
    根据地域以及实例规格的不同可供选择的云盘类型也不同,以页面实际提供云盘类型为准。
    CDS云盘 可选 即挂载的数据盘,用于提高云服务器的存储容量。默认不选择,您可根据需求选择云磁盘的容量和挂载数量,最多可同时挂载5块云磁盘。
    快照策略 可选 默认关闭绑定快照策略。通过快照,您可以实现磁盘数据备份,磁盘数据恢复以及磁盘镜像的制作。

网络和存储配置

  1. 配置以下信息,并单击 下一步。

    配置项 必选/可选 说明
    网络类型 必选 如果您没有创建私有网络,可以选择默认私有网络。目前,百度智能云私有网络VPC、子网、安全组、ACL、路由表免费,关于私有网络的更多介绍可参考 私有网络VPC
    安全组 必选 如果您没有创建安全组,可以选择默认安全组。
    弹性资源 可选 如需公网访问请购买弹性公网IP,或购买成功后绑定已有弹性公网IP。
    公网带宽支持以下购买方式。
    包年包月计费:需要提前一次性支付所选时间段内的带宽费用,购买预付费BCC时,费用将合并在实例中收取。
    按使用流量计费:根据用户实际传输的数据量计费,流量使用没有上限,但可限定最大峰值带宽。
    按使用带宽计费:根据用户选择的固定带宽值进行计费,最大可购买200Mbps的带宽。

信息配置

8.配置以下信息,并单击 确认购买

配置项 必选/可选 配置说明
标签 可选 当您拥有多台实例时,可以通过设置标签云服务器实现资源的分类管理。具体可参考 标签 进行设置。
部署集 可选 部署集在指定部署集中创建BCC实例时,会和处于同一部署集中的其他BCC实例严格按照物理服务器打散,保障在硬件故障等异常情况下的服务高可用性。具体可参考 部署集 设置。当前已支持选择最多2个部署集。
系统信息 必选 根据您的实际对系统信息进行设置。
  • 实例名称:您可自定义设置实例名称或由系统随机生成实例名称。
  • 主机名:您可自定义设置主机名(hostname)或由系统随机生成主机名。
  • 有序后缀:用户选择打开此选项,则有序后缀从 0001 开始递增,最大不能超过 9999。例如:InstanceName0001,InstanceName0002 和 HostName0001,HostName0002。
  • Domain开关:用户打开后,主机名将带有domain后缀,可以支持DNS解析。
  • 管理用户名:Windows系统的管理员账号为Administrator,Linux系统的管理员账号为root。
  • 管理员密码:根据实例操作系统的不同,密码可供选择的设置方式也不同。
    • 用户自定义:自定义设置登录实例的密码。
    • 随机生成:购买成功后需登录控制台重置密码,参考 重置密码
    • 密钥对:Linux操作系统可以选择使用密钥对的方式连接云服务器,SSH密钥对是一种比常规密码更安全的登录云服务器的方式,具体可参考 密钥对 设置。
高级配置 可选
  • 用户数据注入:作为实例自定义脚本在启动实例时执行,实现自动化配置实例,例如获取并安装软件资源包、开启服务、打印日志、初始化服务环境等操作。可使用User-Data脚本(仅在实例首次启动时运行一次)。通过以下示例,实例创建成功后可在/root/test文件中看到 Welcome to Baidu AI Cloud。
      示例:
      #!/bin/sh
      echo "Welcome to Baidu AI Cloud." | tee /root/test
购买信息 必选
  • 购买时长(预付费):1-9个月或1-3年选择配置。时长周期为实例创建日起的单位周期。如2015年5月20日购买BCC服务一个月,则使用周期为2015年5月20日-2015年6月20日(默认单位月份时间为30天)。
  • 自动续费(预付费):
    • 默认不勾选,不进行自动续费。
    • 勾选后可选择续费周期。
  • 自动释放(后付费):
    • 默认不勾选,不进行自动释放。
    • 勾选后实例将在指定时间自动释放,具体可参考 定时释放
  1. 确认订单 页核对各项配置信息及费用明细,点击提交订单进入支付环节。

    说明: 如果您有百度智能云代金券,可以使用代金券结算抵扣费用,如果代金券金额不足,则可以使用银行卡完成支付操作。

  2. 单击 确认付款,完成支付。支付成功后,系统在后台进行云服务器的创建。
  3. 点击链接 管理控制台,进入 实例列表 界面,查看创建实例的状态。

    • 创建时,实例状态为 创建中
    • 创建成功后,实例状态显示为 运行中
  4. 实例创建成功后,系统将以短信形式发送云服务器的信息给用户,包括IP和用户名。为了安全因素考虑,密码将不再通过短信形式发送,如果您忘记创建实例时配置的密码可以重置密码。
上一篇
快速入门
下一篇
管理GPU实例