云服务器 BCC
更新时间:2024-04-16
云服务器 BCC只包含实例监控(Instance)1种监控对象类型,实例监控包含的监控指标列表如下:
实例监控(Instance)
指标英文名称(metric name) | 指标中文名称 | 单位 | 维度 | 备注 |
---|---|---|---|---|
CpuIdlePercent | CPU空闲率 | % | InstanceId | |
CpuLoadAvg1 | 最近一分钟服务器负载 | 个 | InstanceId | 仅linux服务器具备 |
CpuLoadAvg15 | 最近十五分钟服务器负载 | 个 | InstanceId | 仅linux服务器具备 |
CpuLoadAvg5 | 最近五分钟服务器负载 | 个 | InstanceId | 仅linux服务器具备 |
CpuSystemPercent | 系统CPU时间比率 | % | InstanceId | |
CpuUserPercent | 用户CPU时间比率 | % | InstanceId | |
CpuWaitPercent | 等待IO CPU时间比率 | % | InstanceId | 仅linux服务器具备 |
Cpu0IdlePercent | 单核cpu空闲率 | % | InstanceId | 仅windows服务器具备 |
Cpu0ProcessorPercent | 单核cpu使用率 | % | InstanceId | 仅windows服务器具备 |
CpuContextSwitchSecond | 每秒上下文切换次数 | 次/秒 | InstanceId | |
CpuInterruptSecond | 每秒CPU的中断次数 | 次 | InstanceId | |
vDiskReadBytesPerSecond | 每秒磁盘IO读取量 | 字节/秒 | InstanceId | |
vDiskReadOpCountPerSecond | 每秒磁盘IO读取次数 | 次 | InstanceId | |
vDiskWriteBytesPerSecond | 每秒磁盘IO写入量 | 字节/秒 | InstanceId | |
vDiskWriteOpCountPerSecond | 每秒磁盘IO写入次数 | 次 | InstanceId | |
DiskCFreeBytes | C盘空闲空间 | Bytes | InstanceId | 仅windows服务器具备 |
DiskCTotalBytes | C盘总空间 | Bytes | InstanceId | 仅windows服务器具备 |
DiskCUsedBytes | C盘使用的空间 | Bytes | InstanceId | 仅windows服务器具备 |
DiskCUsedPercent | C盘空间使用率 | % | InstanceId | 仅windows服务器具备 |
DiskFreeBytes | 整台服务器的磁盘空闲总量 | Bytes | InstanceId | |
DiskFreeInodes | 服务器inode总空闲数 | 个 | InstanceId | 仅linux服务器具备 |
DiskInodesUsedPercent | 服务器inode总使用率 | % | InstanceId | 仅linux服务器具备 |
DiskTotalBytes | 整台服务器的磁盘空间总量 | Bytes | InstanceId | |
DiskTotalInodes | 服务器inode总数 | 个 | InstanceId | 仅linux服务器具备 |
DiskUsedBytes | 整台服务器的磁盘使用总量 | Bytes | InstanceId | |
DiskUsedInodes | 服务器inode总使用数 | 个 | InstanceId | 仅linux服务器具备 |
DiskUsedPercent | 整台服务器的磁盘使用率 | % | InstanceId | |
RootUsedBytes | 根磁盘空间使用量 | Bytes | InstanceId | 仅linux服务器具备 |
RootUsedPercent | 根磁盘空间使用率 | % | InstanceId | 仅linux服务器具备 |
HomeUsedBytes | HOME磁盘空间使用量 | Bytes | InstanceId | 仅linux服务器具备 |
HomeUsedPercent | HOME磁盘空间使用率 | % | InstanceId | 仅linux服务器具备 |
MemAvailableBytes | 内存可用量 | Bytes | InstanceId | 仅windows服务器具备 |
MemBufferBytes | 块设备读写内存缓冲量 | Bytes | InstanceId | 仅linux服务器具备 |
MemCacheBytes | 文件系统内存cache值 | Bytes | InstanceId | |
MemFreeBytes | 内存空闲量 | Bytes | InstanceId | |
MemTotalBytes | 内存总量 | Bytes | InstanceId | |
MemUsedBytes | 内存使用量 | Bytes | InstanceId | |
MemUsedPercent | 内存使用率 | % | InstanceId | |
SwapFreeBytes | 交换分区空闲量 | Bytes | InstanceId | 仅linux服务器具备 |
SwapTotalBytes | 交换分区总量 | Bytes | InstanceId | 仅linux服务器具备 |
SwapUsedBytes | 交换分区使用量 | Bytes | InstanceId | 仅linux服务器具备 |
TcpCurrentEstab | 已建立的TCP连接数 | 个 | InstanceId | |
TcpInSegs | TCP接收包数 | 个 | InstanceId | 1.含义_linux服务器:系统平均每秒接收tcp数据包的速率,读取系统/proc/net/snmp文件中Tcp的“InSegs”字段,周期差值/周期。 2. 含义_windows服务器:系统平均每秒接收tcp数据包的速率,通过调用Windows WMI.Win32_PerfFormattedData_Tcpip_TCPv4()接口获取。 |
TcpLossSegs | TCP错误包数 | 个 | InstanceId | 1.仅linux服务器具备。 2.含义_linux服务器:系统接受到的错误包的平均速率,读取系统/proc/net/snmp文件中Tcp的“InErrs”字段,周期差值/周期。 |
TcpOutSegs | TCP发送包数 | 个 | InstanceId | 1.含义_linux服务器:系统平均每秒发送tcp数据包的速率,读取系统/proc/net/snmp文件中Tcp的“OutSegs”字段,周期差值/周期。 2. 含义_windows服务器:系统平均每秒发送tcp数据包的速率,通过调用Windows WMI.Win32_PerfFormattedData_Tcpip_TCPv4()接口获取。 |
TcpRetranSegs | TCP重传数 | 次 | InstanceId | 1.仅windows服务器具备。 2.含义_windows服务器:系统平均每秒重传tcp数据包的速率,通过调用Windows WMI.Win32_PerfFormattedData_Tcpip_TCPv4()接口获取。 |
vNicInBytes | 网卡输入流量 | Bytes | InstanceId | |
vNicOutBytes | 网卡输出流量 | Bytes | InstanceId | 含义:采集周期内即一分钟内网卡输出流量的和值。 |
VNicInPPS | 网卡输入包速率 | pps | InstanceId | |
VNicOutPPS | 网卡输出包速率 | pps | InstanceId | |
VNicInBPS | 网卡输入带宽 | bps | InstanceId | |
VNicOutBPS | 网卡输出带宽 | bps | InstanceId | |
WebInBytes | 主IP从外网进入的流量 | Bytes | InstanceId | |
WebOutBytes | 主IP流向外网的流量 | Bytes | InstanceId | |
WebInBitsPerSecond | 主IP从外网进入的带宽 | bps | InstanceId | |
WebOutBitsPerSecond | 主IP流向外网的带宽 | bps | InstanceId | |
WebInPPS | 主IP从外网进入的包速率 | pps | InstanceId | |
WebOutPPS | 主IP流向外网的包速率 | pps | InstanceId | |
GpuError | gpu卡错误信息 | InstanceId | 仅GPU机型具备 | |
GpuStatus | gpu卡整体状态 | InstanceId | 仅GPU机型具备 | |
GpuMaxEccErrorsIndex | 最高ECC错误数的gpu卡编号 | InstanceId | 仅GPU机型具备 | |
GpuAllEccErrors | 所有gpu卡的ECC错误数 | 个 | InstanceId | 仅GPU机型具备 |
GpuMaxTemperatureIndex | 最高温度的gpu编号 | InstanceId | 仅GPU机型具备 | |
GpuMaxTemperature | 所有gpu的最高温度 | InstanceId | 仅GPU机型具备 | |
GpuMaxMemoryUtilizationIndex | 最大内存使用率的gpu编号 | InstanceId | 仅GPU机型具备 | |
GpuMaxMemoryUtilization | 所有gpu的最大内存使用率 | % | InstanceId | 仅GPU机型具备 |
GpuMaxGpuUtilizationIndex | 最大gpu使用率的gpu编号 | InstanceId | 仅GPU机型具备 | |
GpuMaxGpuUtilization | 所有gpu的最大gpu使用率 | % | InstanceId | 仅GPU机型具备 |
GpuAvgMemoryUtilizationForall | 所有gpu的平均内存使用率 | % | InstanceId | 仅GPU机型具备 |
GpuAvgGpuUtilizationForall | 所有gpu的平均gpu使用率 | % | InstanceId | 仅GPU机型具备 |
Gpu{序号}Error | gpu卡{序号}的错误信息 | InstanceId | 仅GPU机型具备,{序号}请用数字替换 | |
Gpu{序号}Status | gpu卡{序号}的状态 | InstanceId | 仅GPU机型具备,{序号}请用数字替换 | |
Gpu{序号}UtilizationMemory | gpu卡{序号}的内存使用率 | % | InstanceId | 仅GPU机型具备,{序号}请用数字替换 |
Gpu{序号}EccErrors | gpu卡{序号}的ECC错误数 | 个 | InstanceId | 仅GPU机型具备,{序号}请用数字替换 |
Gpu{序号}Temperature | gpu卡{序号}的温度 | InstanceId | 仅GPU机型具备,{序号}请用数字替换 | |
Gpu{序号}MemoryFree | gpu卡{序号}的内存空闲量 | Bytes | InstanceId | 仅GPU机型具备,{序号}请用数字替换 |
Gpu{序号}MemoryUsed | gpu卡{序号}的内存使用量 | Bytes | InstanceId | 仅GPU机型具备,{序号}请用数字替换 |
Gpu{序号}MemoryTotal | gpu卡{序号}的内存总量 | Bytes | InstanceId | 仅GPU机型具备,{序号}请用数字替换 |
Gpu{序号}UtilizationGpu | gpu卡{序号}的gpu使用率 | % | InstanceId | 仅GPU机型具备,{序号}请用数字替换 |
CPUUsagePercent | CPU使用率 | % | InstanceId | linux、Windows服务器具备 |
MemAlreadyUsedBytes | 内存已用量 | Bytes | InstanceId | 仅linux服务器具备,读取/proc/meminfo, MemTotal - MemFree |
MemUserUsedBytes | 用户实际内存使用量 | Bytes | InstanceId | 仅linux服务器具备,读取/proc/meminfo,MemTotal - MemFree - Buffers - Cached - SReclaimable |
MemAvailableBytes | 内存可用量 | Bytes | InstanceId | 仅linux服务器具备 |
MemAvailablePercent | 内存可用率 | % | InstanceId | 仅linux服务器具备 |
DiskXReadBytesPerSecond | 磁盘读带宽 | Bytes/s | 单个VFIO本地盘 | |
DiskXWriteBytesPerSecond | 磁盘写带宽 | Bytes/s | 单个VFIO本地盘 | |
DiskXReadOpCountPerSecond | 磁盘读IOPS | 次 | 单个VFIO本地盘 | |
DiskXWriteOpCountPerSecond | 磁盘写IOPS | 次 | 单个VFIO本地盘 | |
DiskXUsedPercent | 磁盘空间使用率 | % | 单个VFIO本地盘 | |
DiskXUsedBytes | 单磁盘空间使用量 | Bytes | disk | 仅linux |
DiskXUsedPercent | 单磁盘空间使用率 | % | disk | 仅linux |
Disk[X]UsedByte | 磁盘空间使用量 | Bytes | 磁盘盘符:Disk{盘符} | 仅windows |
Disk[X]UsedPercent | 磁盘空间使用率 | % | 磁盘盘符:Disk{盘符} | 仅windows |
RdmaXmitPps | RDMA网卡输出包速率 | pps | ip | 仅linux |
RdmaRcvPps | RDMA网卡输入包速率 | pps | ip | 仅linux |
RdmaRcvBps | RDMA网卡输出带宽 | bps | ip | 仅linux |
RdmaXmitBps | RDMA网卡输入带宽 | bps | ip | 仅linux |
RdmaXmitDiscardsPps | RDMA网卡丢弃包速率 | pps | ip | 仅linux |
RdmaLinkUp | RDMA网卡是否Up | - | ip | 仅linux |
GpuXUtilizationGpu | gpu卡的使用率 | % | gpu | 仅linux |
GpuXStatus | gpu卡状态 | - | gpu | 仅linux |
GpuXError | gpu卡错误信息 | - | gpu | 仅linux |
GpuXUtilizationMemory | gpu卡内存使用率 | % | gpu | 仅linux |
GpuXMemoryTotal | gpu卡的内存总量 | Bytes | gpu | 仅linux |
GpuXMemoryFree | gpu卡的内存空闲量 | Bytes | gpu | 仅linux |
GpuXMemoryUsed | gpu卡的内存使用量 | Bytes | gpu | 仅linux |
GpuXTemperature | gpu卡的温度 | 度 | gpu | 仅linux |
GpuXEccErrors | gpu卡的ECC错误数 | 个 | gpu | 仅linux |
DCGM_GPU_TEMP | GPU 运行的温度 | ℃ | gpu | 仅linux |
DCGM_MEM_TEMP | GPU的内存温度 | ℃ | gpu | 仅linux |
DCGM_FAN_SPEED_PERCENT | GPU 风扇转速占比 | % | gpu | 仅linux |
DCGM_POWER_USAGE | GPU 的功率 | W | gpu | 仅linux |
DCGM_GPU_PERF | GPU性能状态值 | - | gpu | 仅linux |
DCGM_FI_DEV_TOTAL_ENERGY_CONSUMPTION | GPU自启动以来的总能耗 | J | gpu | 仅linux |
DCGM_GPU_UTILIZATION | GPU 利用率 | % | gpu | 仅linux |
DCGM_ENC_UTILIZATION | GPU 编码器利用率 | % | gpu | 仅linux |
DCGM_DEC_UTILIZATION | GPU 解码器利用率 | % | gpu | 仅linux |
DCGM_MEM_COPY_UTILIZATION | GPU的内存拷贝利用率 | % | gpu | 仅linux |
DCGM_FB_FREE | GPU 帧缓存剩余 | MiB | gpu | 仅linux |
DCGM_FB_USED | GPU 帧缓存使用 | MiB | gpu | 仅linux |
DCGM_PROF_GR_ENGINE_ACTIVE | GPU Graphics或Compute引擎激活时间占比 | % | gpu | 仅linux |
DCGM_PROF_SM_ACTIVE | GPU SM激活的时间占比 | % | gpu | 仅linux |
DCGM_PROF_SM_OCCUPANCY | GPU 驻留在SM上的线程数占比 | % | gpu | 仅linux |
DCGM_PROF_PIPE_TENSOR_ACTIVE | GPU Tensor Pipe处于激活的周期分数 | % | gpu | 仅linux |
DCGM_PROF_PIPE_FP64_ACTIVE | GPU FP64管道处于激活的周期分数 | % | gpu | 仅linux |
DCGM_PROF_PIPE_FP32_ACTIVE | GPU FP32管道处于激活的周期分数 | % | gpu | 仅linux |
DCGM_PIPE_FP16_ACTIVE | GPU FP16管道处于激活的周期分数 | % | gpu | 仅linux |
DCGM_PROF_DRAM_ACTIVE | GPU 内存带宽利用率 | % | gpu | 仅linux |
PROF_NVLINK_TX_BYTES | NVLink传输的数据速率 | Bytes | gpu | 仅linux |
PROF_NVLINK_RX_BYTES | NVLink接收的数据速率 | Bytes | gpu | 仅linux |
DCGM_FI_DEV_NVLINK_CRC_FLIT_ERROR_COUNT_TOTAL | NVLink流控制 CRC 错误总数 | 个 | gpu | 仅linux |
DCGM_FI_DEV_NVLINK_CRC_DATA_ERROR_COUNT_TOTAL | NVLink数据 CRC 错误总数。 | 个 | gpu | 仅linux |
DCGM_FI_DEV_NVLINK_REPLAY_ERROR_COUNT_TOTAL | NVLink重试总数 | 个 | gpu | 仅linux |
DCGM_FI_DEV_NVLINK_RECOVERY_ERROR_COUNT_TOTAL | NVLink恢复错误总数 | 个 | gpu | 仅linux |
DCGM_FI_DEV_NVLINK_BANDWIDTH_TOTAL | NVLink 带宽计数器总数 | 个 | gpu | 仅linux |
PROF_PCIE_TX_BYTES | GPU PCIe总线传输的数据速率 | Bytes | gpu | 仅linux |
PROF_PCIE_RX_BYTES | GPU PCIe总线接收的数据速率 | Bytes | gpu | 仅linux |
DCGM_PCIE_REPLAY_COUNTER | GPU PCIe重试的总数 | - | gpu | 仅linux |
DCGM_SM_CLOCK | GPU sm 时钟频率 | HZ | gpu | 仅linux |
DCGM_MEMORY_CLOCK | GPU 内存时钟频率 | HZ | gpu | 仅linux |
DCGM_APP_SM_CLOCK | GPU SM应用时钟频率 | HZ | gpu | 仅linux |
DCGM_APP_MEMORY_CLOCK | GPU 内存应用时钟频率 | HZ | gpu | 仅linux |
DCGM_CLOCK_THROTTLE_REASONS | GPU 时钟慢下来的原因 | - | gpu | 仅linux |
DCGM_ECC_SBE_VOL_TOTAL | GPU 单位易失性 ECC 错误总数 | 个 | gpu | 仅linux |
DCGM_ECC_DBE_VOL_TOTAL | GPU 双位易失性 ECC 错误总数 | 个 | gpu | 仅linux |
DCGM_ECC_SBE_AGG_TOTAL | GPU 单位持久性 ECC 错误的总数 | 个 | gpu | 仅linux |
DCGM_ECC_DBE_AGG_TOTAL | GPU 双位持久性 ECC 错误的总数 | 个 | gpu | 仅linux |
DCGM_XID_ERRORS | GPU发生的XID错误号 | - | gpu | 仅linux |