NVIDIA GPU资源监控 前言 本文介绍百度智能边缘BIE如何纳管使用NVIDIA GPU的边缘节点,并实现对NVIDIA GPU的资源监控。此处提到的 使用NVIDIA GPU的边缘节点 ,一般特指使用了NVIDIA GPU AI加速卡的x86架构的GPU服务器,GPU AI加速卡可以是NVIDIA T4/P4/V100/A100/3090等。
高性能应用服务 HPAS 高性能应用服务 HPAS 仅包含实例监控(Instance)1种监控对象类型,实例监控包含的监控指标列表如下: 实例监控(Instance) 指标英文名称(metric name) 指标中文名称 单位 维度 备注 CPUUsagePercent CPU使用率 % InstanceId CpuIdlePercent CPU空闲率 % InstanceId CpuSystemPercent
该地址即企业微信机器人的 Webhook 地址,后续可用于 Prometheus 监控服务的企业微信通知对象配置。只有该消息推送的创建者可以查看 Webhook 地址 。
监控报警 集群监控 集群监控为用户提供实时监控和管理集群状态、性能功能以及资源使用情况,以确保集群稳定运行。本章节详细介绍了关于查看监控指标的位置和操作。监控指标说明详见集群指标。 集群仪表盘 在集群列表中点击集群名称进入详情页,侧边导航找到 监控详情-集群仪表盘 。 集群仪表盘支持对时间范围进行筛选查看,右上角点击指标筛选还可以对指标进行筛选。
存算分离-Master资源组监控(PostgresDecoupledMasterNode)、存算分离-计算资源组监控(PostgresDecoupledSegmentNode)6种监控对象类型,实例监控包含的监控指标列表如下: 存算一体-集群监控(PostgresIntegratedCluster) 指标英文名称(metric name) 指标中文名称 单位 维度 备注 ClusterConnectionCount
自定义监控项(Redis) 概述 云数据库 Redis 提供查看实例监控数据的功能,本文为您介绍 Redis 实例支持的监控项及其说明。 采样周期是指标的数据统计周期(默认为5s)。 Redis内存型(社区版) 实例监控 Redis控制台 单位 备注 CPU CPU使用率 百分比 常态下CPU使用率数值比主线程CPU使用率低,原因是CPU使用率=总CPU使用率/核数。
对接Cprom实现监控告警 概述 本文档介绍如何将服务网格 CSM 对接 Prometheus 监控服务 CProm,实现服务网格指标的监控、告警配置和大盘展示。通过完成本文档中的操作,您可以分别为托管网格开启控制面指标监控,为独立网格开启数据面指标监控,并进入 Grafana 和 CProm 页面完成后续查看与告警配置。
MLU270资源监控 前言 本文介绍百度智能边缘BIE如何纳管使用 MLU270-S4智能加速卡 的边缘节点,并实现对MLU270-S4智能加速卡的资源监控。 操作指南 创建一个边缘节点,AI加速卡选择 寒武纪思元270 ,如下图所示: 进入到节点详情界面,点击 安装 ,在弹出框当中复制 节点安装命令 ,然后在边缘节点上运行。
虚拟专用网络 VPN网关 VPN网关(VPN)包含3种监控对象类型,分别是:IPsec VPN网关(Instance)、SSL VPN网关(SslVpn),GRE VPN网关(GreVpn),各个类型包含的监控指标列表如下: IPsec VPN网关(Instance) 指标英文名称(Metric name) 指标中文名称 单位 维度 InBytes 入向流量 Bytes ConnID InPackets
支持按时间范围、监控实例、告警规则、告警等级、事件状态等多种条件过滤,并支持分页和排序。接口使用 BCE V1 签名鉴权,通过 Authorization 头传递签名串。 请求结构 Plain Text 复制 1 GET /v2/event?