监控展示 目前基于node-exporter、kube-state-metrics、dcgm-exporter、nvidia-exporter等基本采集agent,我们提供一系列基本的dashborad展示模板,用户可根据实际情况自行导入、使用和修改,若是客户自己agent采集的指标,需独自配置dashborad。 百舸相关dashboards已包含显卡监控,不需要导入gpu-dashboards
使用流程 您可以通过下面的说明大概了解下单并完成LCC的部署的系列流程。 提交LCC订单。 在LCC控制台页面,用户会选择一个百度智能云提供的区域,并在此提供部署位置信息、需要的LCR/LCN配置(配置可以参考 LCC配置定价 ),百度智能云经过工勘后会将其作为一个虚拟机房(Location Site),并且用户可以基于此部署位置信息看到由百度智能云生成的订单信息。 处理LCC订单。 用户确认订单
操作记录 功能说明 操作记录功能支持用户在BEC控制台查询账号近期的主要变动,并且支持查询 新增 、 删除 和 修改 等相关操作的详细信息,信息包括 用户名 、 事件名称 、 资源类型 和 资源名称 等,该功能覆盖BEC控制台所有资源层级。 使用说明 进入路径: 第一步:在控制台右上角点击头像右边的下拉按钮。 第二步:点击 多用户访问控制 。 第三步:点击页面左侧导航栏 操作记录 。 第四步:页面
更新VPC table td { white-space:nowrap; } 接口描述 本接口用于更新VPC。 请求结构 PUT /v2/vpc/{vpcId}?modifyAttribute HTTP/1.1 Host: bec.baidubce.com Authorization: authorization string { "description": "&q
错误返回 当用户访问API出现错误时,会返回给用户相应的错误码和错误信息,便于定位问题,并做出适当的处理。用户的请求会先经过网关,通过网关后才会转发到平台进行处理。当请求发生错误时,可能是网关的错误,也可能是平台的错误。 如果是网关发生错误,会将错误的信息写到响应的头部,遵循如下格式: 参数名 类型 说明 X-Bce-Request-Id String 表示响应对应请求的RequestId X-B
替换Secret 接口描述 替换Secret。 其中以下字段支持更新: metadata.labels metadata.annotations data 说明: <br> 当“type”的值为“Opaque”时,“data”的“key”和“value”都可以更新。<br> 当“type”的值不为“Opaque”时,“data”的“value”可以更新。 请求结构 PUT
部署管理 查看部署信息 在左侧导航栏点开“边缘容器”,点击“部署管理”,进入部署管理列表页面。 查看部署信息,包括:部署ID、部署名称、镜像、容器组、配置(CPU/内存/gpu)、所属边缘应用、区域与运营商、创建时间。 点击操作栏“查看”按钮,查看容器组配置信息,CPU使用量、内存使用量、带宽使用量。 伸缩部署 在左侧导航栏点开“边缘容器”,点击“部署管理”,进入部署管理列表页面。 点击操作栏“伸
创建Bucket 接口描述 本接口用于创建Bucket。 请求结构 POST /v1/bos/bucket Host: bec.baidubce.com Authorization: authorization string 请求头域 除公共头域外,无其它特殊头域。 请求参数 参数名称 类型 是否必选 参数位置 描述 request CreateBucketRequest 是 RequestBod
为了保障大规模分布式训练任务稳定运行,百舸异构计算平台提供了任务自动容错的能力,支持对训练任务进行异常感知、容错判断以及自动恢复。 功能说明 百舸训练容错提供以下几方面能力: 训练异常感知:提供训练进程异常的感知能力,特别是针对于难以识别的任务hang场景。 容错判断:基于百舸资源池 自动故障隔离能力 ,检测任务所在节点是否发生故障,如发生故障会自动隔离节点,触发任务容错流程。
函数运行环境及安全隔离性 函数运行时 CFC目前支持的运行环境有Node.js 10, Node.js 12, Node.js 14, Node.js 16, Python 2.7, Python 3.6, Python 3.10, Java 8, Golang, PHP 7.2, Lua 4.3, .Net Core 2.2, PowerShell 6.2。