参数 说明 资源规格 规格建议说明: 2节点(主实例内存1G-2G) 4节点(主实例内存4G-8G) 6节点(主实例内存16G-24G) 8节点(主实例内存32G-64G) 16节点(主实例内存96G-256G) 网络信息 代理实例的所在网络,默认与主实例在同一个网络,可自定义子网 可用区是地域中的一个独立物理区域,不同可用区之间没有实质性区别。
否 RequestBody 参数 超发开关,队列是否允许超发,默认为false reclaimable Boolean 否 RequestBody 参数 被抢占开关,队列资源是否可被抢占,默认为false nodes Object 否 RequestBody 参数 物理队列绑定节点的信息,合法性同队列创建 guarantee Object 否 RequestBody 参数 队列预留独占型GPU资源配额
String 否 RequestBody参数 父队列,默认root deserved Object 否 RequestBody参数 队列可以申请的资源配额数量,包括共享型与独占型GPU资源配额 guarantee Object 否 RequestBody参数 队列预留的资源配额,包含独占型GPU资源配额 capability Object 否 RequestBody参数 队列在上线时可用的资源配额
参数 说明 可用区 可用区 可用区是地域中的一个独立物理区域,不同可用区之间没有实质性区别。
MessagePublishRateQueue 队列发布消息速度 条/秒 InstanceId,QueueName Messages 实例消息数 条 InstanceId MessagesReady 实例可消费消息数 条 InstanceId MessagesReadyQueue 队列可消费消息数 条 InstanceId,QueueName MessagesUnacknowledged 实例未确认消息数
查询队列详情 描述 获取指定队列详情,包括队列基本信息以及资源使用量等 请求结构 GET /api/v1/resourcepools/{resourcePoolId}/queue/{queueName} Host:aihc.bj.baidubce.com Authorization:authorization string ContentType: application/json 请求头域 除公共头域外
查询队列列表 描述 获取队列列表,包含队列详情 请求结构 GET /api/v1/resourcepools/{resourcePoolId}/queue Host:aihc.bj.baidubce.com Authorization:authorization string ContentType: application/json 请求头域 除公共头域外,无其它特殊头域。
创建和管理资源队列 概述 托管资源池资源队列是算力资源分配调度的单元,所有使用托管资源池算力的工作负载都需要提交到对应的资源队列中才能获得算力分配。本文将介绍如何创建和管理资源队列。 创建资源队列 登录 百舸异构计算平台AIHC控制台 。 在左侧菜单栏选择托管资源池,进入托管资源池页面,选择 资源队列 ,点击 新建资源队列 。 在创建资源队列页面,根据实际需求完成相关参数配置。
解决方案实践 > 不同消息通知渠道的使用场景介绍 不同消息通知渠道的使用场景介绍 概览 需求背景 方案概述 操作步骤 不同消息通知渠道的使用场景介绍 更新时间: 2022-01-10 概览 如果您在实际使用云监控过程中,对于消息通知渠道有不同的场景和需求,可以通过云监控BCM提供的多种方式满足需求。
配置训练任务的消息通知 百舸平台针对于训练任务的状态变化,提供了通知的机制。下面将介绍如何配置任务状态变化通知。 前提条件 资源池已经接入百度云 Prometheus监控服务 。请参考 资源池接入Prometheus监控实例 。 操作指南 登录 百舸控制台 。