性能监控 概述 代理监控就是监控集群内代理实例的各项监控指标,包括CPU利用率、CPU占用率、当前连接数等指标。 操作步骤 登录云原生数据库GaiaDB控制台。 在 GaiaDB 控制台的左上角,选择要在其中创建数据库集群的区域。 在”云原生数据库GaiaDB 列表“页面,点击左侧菜单监控管理。 在监控管理页面中,分为集群监控、节点监控、代理监控页签,默认选中集群监控页签。
安装注意事项 边缘服务器应在符合安装环境要求的环境下使用,否则可能造成设备故障,由此引发的设备功能异常或部件损坏、人身安全事故、财产损失等不在设备质量保证范围之内。 切勿将任何物体塞入边缘服务器的开孔处。 安装边缘服务器时,请确保安装牢固,避免跌落。 如果出现以下任何情况,请从电源插座拔下电源线插头,并与售后服务部门联系: 电源线或电源插头已损坏。 边缘服务器被水淋湿。 边缘服务器损坏。
创建用户组 接口说明 用于创建用户组 请求URL /baidu/5gai/v1/face-api/face-set/group/add [POST] 请求格式 header应为Content-Type:application/json 请求说明 参数名称 类型 是否必填 说明 groupId String 是 用户组I
合成任务查询 接口描述 本接口用于查询合成任务。 接口内容 GET /v1/merge 请求参数 参数名称 类型 是否必填 说明 id int 否 抽帧任务号 deviceId string 否 设备号 注意 : 不支持分页; id和deviceId为搜索条件,可以不填,不填表示不匹配该项数据。 响应参数 参数名称 类
监控指标 本文为您介绍监控指标。 说明: 以下监控指标数据可通过控制台查看,查看方法请参见 查看监控 。
torch 容错与诊断模块,开启自动容错,在高级设置中,开启 hang检测: 基于日志的检测,可以自定义日志间隔的阈值 高级诊断,在日志检测达到阈值后,平台会额外通过函数调用栈与进程IO监控指标,多维度判断任务状态,提高 hang 检测的准确度 任务启动运行后,会实时检测 hang。
训练任务性能劣化(slow)诊断 背景 使用 大模型训练服务观测 功能,如何接入训练任务,在训练任务出现性能问题(slow)时如何诊断并解读诊断报告、分析问题。 前置条件 训练框架: PyTorch 接入任务 根据接入任务说明文档,部署采集器,接入训练任务。 训练任务出现在任务列表中表明任务已接入成功,为了后续能够查看
登录平台 前置任务 边缘服务器已经预装了软件服务。且已通电、插入网线,可以正常使用使用。 用一台与此边缘服务器在相同局域网的PC电脑访问此地址:https:// 边缘节点ip地址:81(地址形式参考:https:// ip:81) 获取和修改边缘服务器IP地址 服务器支持有线网卡和无线网卡访问方式:发货的边缘服务器带有默认的有线网卡DHCP连接,需要从路由器界面或其他方式获取DHCP分配的IP。
人脸图片修改 接口说明 人脸库更新指定用户的人脸图片。 请求方式 POST /console/api/v1/face/pic/replace 请求头域 无特殊请求头。 请求参数 参数 类型 是否必填 说明 id Int64 是 用户ID reserve Array 是 要保留的图片ID,为空表示旧图片全部清除 data
删除用户人脸 接口说明 删除用户人脸图片(删除用户的人脸) 请求URL /baidu/5gai/v1/face-api/face-set/face/del [POST] 请求格式 header应为Content-Type:application/json 请求说明 参数名称 类型 是否必填 说明 groupId Str