Checkpoint间隔时间较短会使训练任务频繁暂停,GPU算力严重浪费;Checkpoint间隔时间较长,一旦发生中断,之前损失的迭代次数在恢复时需要重新计算。以1千卡为例,假设每4小时Checkpoint一次,单次保存耗时10分钟,那么每天因Checkpoint损失的GPU算力接近1000卡时。
获取BEC虚机服务详情 table td { white-space:nowrap; } 接口描述 本接口用于获取BEC虚机服务详情。 请求结构 GET /v2/vm/service/{serviceId} HTTP/1.1 Host: bec.baidubce.com Authorization: authorization string 请求头域 除公共头域外,无其它特殊头域。 请求参数 参数
查询APPBLB实例列表 table td { white-space:nowrap; } 接口描述 本接口用于查询APPBLB实例列表。 请求结构 GET /v2/appblb?marker={marker}&maxKeys={maxKeys} HTTP/1.1 Host: bec.baidubce.com Authorization: authorization string 请求头域
获取BEC虚机VNC地址 table td { white-space:nowrap; } 接口描述 本接口用于获取BEC虚机VNC地址。 请求结构 GET /v2/vm/instance/{instanceId}/vnc HTTP/1.1 Host: bec.baidubce.com Authorization: authorization string 请求头域 除公共头域外,无其它特殊头域。
获取BEC虚机实例详情 接口描述 本接口用于获取BEC虚机实例详情。 请求结构 GET /v1/vm/instance/{vmId} HTTP/1.1 Host: bec.baidubce.com Authorization: authorization string 请求头域 除公共头域外,无其它特殊头域。 请求参数 参数名称 类型 是否必需 参数位置 描述 vmId String 是 URL参
修改BEC虚机实例密码 table td { white-space:nowrap; } 接口描述 本接口用于修改BEC虚机实例密码。 请求结构 PUT /v2/vm/instance/{instanceId}?changePass HTTP/1.1 Host: bec.baidubce.com Authorization: authorization string X-Bce-Accesskey
删除弹性网卡内网IP 接口描述 删除弹性网卡内网IP。 主IP不能删除,仅可删除辅助IP 请求结构 DELETE /v 2 /vpc/eni/ { eniId } /privateIp/ { privateIpAddress } ?clientToken= { clientToken } HTTP/ 1.1 Host : bec.baidubce.com Authorization : autho
获取BEC虚机服务列表 接口描述 本接口用于获取BEC虚机服务列表。 请求结构 GET /v1/vm/service?pageNo={pageNo}&pageSize={pageSize}&keywordType={keywordType}&keyword={keyword}&order={order}&orderBy={orderBy} HTTP/1.1
获取BEC虚机实例列表 接口描述 本接口用于获取BEC虚机实例列表。 请求结构 GET /v1/vm/instance?pageNo={pageNo}&pageSize={pageSize}&keywordType={keywordType}&keyword={keyword} HTTP/1.1 Host: bec.baidubce.com Authorization: a
增加弹性网卡内网IP 接口描述 增加弹性网卡内网IP 如果privateIpAddress为 表示自动分配。 若privateIpAddress非空,则必须为该网卡所属子网内的IP地址。 新增的内网IP都是辅助IP。 请求结构 POST /v 2 /vpc/eni/ { eniId } /privateIp?clientToken= { clientToken } HTTP/ 1.1 Host