云服务器 BCC
更新时间:2025-08-07
云服务器 BCC只包含实例监控(Instance)1种监控对象类型,实例监控包含的监控指标列表如下:
实例监控(Instance)
| 指标英文名称(metric name) | 指标中文名称 | 单位 | 维度 | 备注 |
|---|---|---|---|---|
| CpuIdlePercent | CPU空闲率 | % | InstanceId | |
| CpuLoadAvg1 | 最近一分钟服务器负载 | 个 | InstanceId | 仅linux服务器具备 |
| CpuLoadAvg15 | 最近十五分钟服务器负载 | 个 | InstanceId | 仅linux服务器具备 |
| CpuLoadAvg5 | 最近五分钟服务器负载 | 个 | InstanceId | 仅linux服务器具备 |
| CpuSystemPercent | 系统CPU时间比率 | % | InstanceId | |
| CpuUserPercent | 用户CPU时间比率 | % | InstanceId | |
| CpuWaitPercent | 等待IO CPU时间比率 | % | InstanceId | 仅linux服务器具备 |
| Cpu0IdlePercent | 单核cpu空闲率 | % | InstanceId | 仅windows服务器具备 |
| Cpu0ProcessorPercent | 单核cpu使用率 | % | InstanceId | 仅windows服务器具备 |
| CpuContextSwitchSecond | 每秒上下文切换次数 | 次/秒 | InstanceId | |
| CpuInterruptSecond | 每秒CPU的中断次数 | 次 | InstanceId | |
| vDiskReadBytesPerSecond | 每秒磁盘IO读取量 | 字节/秒 | InstanceId | |
| vDiskReadOpCountPerSecond | 每秒磁盘IO读取次数 | 次 | InstanceId | |
| vDiskWriteBytesPerSecond | 每秒磁盘IO写入量 | 字节/秒 | InstanceId | |
| vDiskWriteOpCountPerSecond | 每秒磁盘IO写入次数 | 次 | InstanceId | |
| DiskCFreeBytes | C盘空闲空间 | Bytes | InstanceId | 仅windows服务器具备 |
| DiskCTotalBytes | C盘总空间 | Bytes | InstanceId | 仅windows服务器具备 |
| DiskCUsedBytes | C盘使用的空间 | Bytes | InstanceId | 仅windows服务器具备 |
| DiskCUsedPercent | C盘空间使用率 | % | InstanceId | 仅windows服务器具备 |
| DiskFreeBytes | 整台服务器的磁盘空闲总量 | Bytes | InstanceId | |
| DiskFreeInodes | 服务器inode总空闲数 | 个 | InstanceId | 仅linux服务器具备 |
| DiskInodesUsedPercent | 服务器inode总使用率 | % | InstanceId | 仅linux服务器具备 |
| DiskTotalBytes | 整台服务器的磁盘空间总量 | Bytes | InstanceId | |
| DiskTotalInodes | 服务器inode总数 | 个 | InstanceId | 仅linux服务器具备 |
| DiskUsedBytes | 整台服务器的磁盘使用总量 | Bytes | InstanceId | |
| DiskUsedInodes | 服务器inode总使用数 | 个 | InstanceId | 仅linux服务器具备 |
| DiskUsedPercent | 整台服务器的磁盘使用率 | % | InstanceId | |
| RootUsedBytes | 根磁盘空间使用量 | Bytes | InstanceId | 仅linux服务器具备 |
| RootUsedPercent | 根磁盘空间使用率 | % | InstanceId | 仅linux服务器具备 |
| HomeUsedBytes | HOME磁盘空间使用量 | Bytes | InstanceId | 仅linux服务器具备 |
| HomeUsedPercent | HOME磁盘空间使用率 | % | InstanceId | 仅linux服务器具备 |
| MemAvailableBytes | 内存可用量 | Bytes | InstanceId | 仅windows服务器具备 |
| MemBufferBytes | 块设备读写内存缓冲量 | Bytes | InstanceId | 仅linux服务器具备 |
| MemCacheBytes | 文件系统内存cache值 | Bytes | InstanceId | |
| MemFreeBytes | 内存空闲量 | Bytes | InstanceId | |
| MemTotalBytes | 内存总量 | Bytes | InstanceId | |
| MemUsedBytes | 内存使用量 | Bytes | InstanceId | |
| MemUsedPercent | 内存使用率 | % | InstanceId | |
| SwapFreeBytes | 交换分区空闲量 | Bytes | InstanceId | 仅linux服务器具备 |
| SwapTotalBytes | 交换分区总量 | Bytes | InstanceId | 仅linux服务器具备 |
| SwapUsedBytes | 交换分区使用量 | Bytes | InstanceId | 仅linux服务器具备 |
| TcpCurrentEstab | 已建立的TCP连接数 | 个 | InstanceId | |
| TcpInSegs | TCP接收包数 | 个 | InstanceId | 1.含义_linux服务器:系统平均每秒接收tcp数据包的速率,读取系统/proc/net/snmp文件中Tcp的“InSegs”字段,周期差值/周期。 2. 含义_windows服务器:系统平均每秒接收tcp数据包的速率,通过调用Windows WMI.Win32_PerfFormattedData_Tcpip_TCPv4()接口获取。 |
| TcpLossSegs | TCP错误包数 | 个 | InstanceId | 1.仅linux服务器具备。 2.含义_linux服务器:系统接受到的错误包的平均速率,读取系统/proc/net/snmp文件中Tcp的“InErrs”字段,周期差值/周期。 |
| TcpOutSegs | TCP发送包数 | 个 | InstanceId | 1.含义_linux服务器:系统平均每秒发送tcp数据包的速率,读取系统/proc/net/snmp文件中Tcp的“OutSegs”字段,周期差值/周期。 2. 含义_windows服务器:系统平均每秒发送tcp数据包的速率,通过调用Windows WMI.Win32_PerfFormattedData_Tcpip_TCPv4()接口获取。 |
| TcpRetranSegs | TCP重传数 | 次 | InstanceId | 1.仅windows服务器具备。 2.含义_windows服务器:系统平均每秒重传tcp数据包的速率,通过调用Windows WMI.Win32_PerfFormattedData_Tcpip_TCPv4()接口获取。 |
| vNicInBytes | 网卡输入流量 | Bytes | InstanceId | |
| vNicOutBytes | 网卡输出流量 | Bytes | InstanceId | 含义:采集周期内即一分钟内网卡输出流量的和值。 |
| VNicInPPS | 网卡输入包速率 | pps | InstanceId | |
| VNicOutPPS | 网卡输出包速率 | pps | InstanceId | |
| VNicInBPS | 网卡输入带宽 | bps | InstanceId | |
| VNicOutBPS | 网卡输出带宽 | bps | InstanceId | |
| WebInBytes | 主IP从外网进入的流量 | Bytes | InstanceId | |
| WebOutBytes | 主IP流向外网的流量 | Bytes | InstanceId | |
| WebInBitsPerSecond | 主IP从外网进入的带宽 | bps | InstanceId | |
| WebOutBitsPerSecond | 主IP流向外网的带宽 | bps | InstanceId | |
| WebInPPS | 主IP从外网进入的包速率 | pps | InstanceId | |
| WebOutPPS | 主IP流向外网的包速率 | pps | InstanceId | |
| GpuError | gpu卡错误信息 | InstanceId | 仅GPU机型具备 | |
| GpuStatus | gpu卡整体状态 | InstanceId | 仅GPU机型具备 | |
| GpuMaxEccErrorsIndex | 最高ECC错误数的gpu卡编号 | InstanceId | 仅GPU机型具备 | |
| GpuAllEccErrors | 所有gpu卡的ECC错误数 | 个 | InstanceId | 仅GPU机型具备 |
| GpuMaxTemperatureIndex | 最高温度的gpu编号 | InstanceId | 仅GPU机型具备 | |
| GpuMaxTemperature | 所有gpu的最高温度 | InstanceId | 仅GPU机型具备 | |
| GpuMaxMemoryUtilizationIndex | 最大内存使用率的gpu编号 | InstanceId | 仅GPU机型具备 | |
| GpuMaxMemoryUtilization | 所有gpu的最大内存使用率 | % | InstanceId | 仅GPU机型具备 |
| GpuMaxGpuUtilizationIndex | 最大gpu使用率的gpu编号 | InstanceId | 仅GPU机型具备 | |
| GpuMaxGpuUtilization | 所有gpu的最大gpu使用率 | % | InstanceId | 仅GPU机型具备 |
| GpuAvgMemoryUtilizationForall | 所有gpu的平均内存使用率 | % | InstanceId | 仅GPU机型具备 |
| GpuAvgGpuUtilizationForall | 所有gpu的平均gpu使用率 | % | InstanceId | 仅GPU机型具备 |
| Gpu{序号}Error | gpu卡{序号}的错误信息 | InstanceId | 仅GPU机型具备,{序号}请用数字替换 | |
| Gpu{序号}Status | gpu卡{序号}的状态 | InstanceId | 仅GPU机型具备,{序号}请用数字替换 | |
| Gpu{序号}UtilizationMemory | gpu卡{序号}的内存使用率 | % | InstanceId | 仅GPU机型具备,{序号}请用数字替换 |
| Gpu{序号}EccErrors | gpu卡{序号}的ECC错误数 | 个 | InstanceId | 仅GPU机型具备,{序号}请用数字替换 |
| Gpu{序号}Temperature | gpu卡{序号}的温度 | InstanceId | 仅GPU机型具备,{序号}请用数字替换 | |
| Gpu{序号}MemoryFree | gpu卡{序号}的内存空闲量 | Bytes | InstanceId | 仅GPU机型具备,{序号}请用数字替换 |
| Gpu{序号}MemoryUsed | gpu卡{序号}的内存使用量 | Bytes | InstanceId | 仅GPU机型具备,{序号}请用数字替换 |
| Gpu{序号}MemoryTotal | gpu卡{序号}的内存总量 | Bytes | InstanceId | 仅GPU机型具备,{序号}请用数字替换 |
| Gpu{序号}UtilizationGpu | gpu卡{序号}的gpu使用率 | % | InstanceId | 仅GPU机型具备,{序号}请用数字替换 |
| CPUUsagePercent | CPU使用率 | % | InstanceId | linux、Windows服务器具备 |
| MemAlreadyUsedBytes | 内存已用量 | Bytes | InstanceId | 仅linux服务器具备,读取/proc/meminfo, MemTotal - MemFree |
| MemUserUsedBytes | 用户实际内存使用量 | Bytes | InstanceId | 仅linux服务器具备,读取/proc/meminfo,MemTotal - MemFree - Buffers - Cached - SReclaimable |
| MemAvailableBytes | 内存可用量 | Bytes | InstanceId | 仅linux服务器具备 |
| MemAvailablePercent | 内存可用率 | % | InstanceId | 仅linux服务器具备 |
| DiskXReadBytesPerSecond | 磁盘读带宽 | Bytes/s | InstanceId,disk | 单个VFIO本地盘 |
| DiskXWriteBytesPerSecond | 磁盘写带宽 | Bytes/s | InstanceId,disk | 单个VFIO本地盘 |
| DiskXReadOpCountPerSecond | 磁盘读IOPS | 次 | InstanceId,disk | 单个VFIO本地盘 |
| DiskXWriteOpCountPerSecond | 磁盘写IOPS | 次 | InstanceId,disk | 单个VFIO本地盘 |
| DiskXUsedBytes | 单磁盘空间使用量 | Bytes | InstanceId,disk | 仅linux |
| DiskXUsedPercent | 单磁盘空间使用率 | % | InstanceId,disk | 仅linux |
| Disk[X]UsedByte | 磁盘空间使用量 | Bytes | InstanceId,disk | 仅windows |
| Disk[X]UsedPercent | 磁盘空间使用率 | % | InstanceId,disk | 仅windows |
| RdmaXmitPps | RDMA网卡输出包速率 | pps | InstanceId,ip | 仅linux |
| RdmaRcvPps | RDMA网卡输入包速率 | pps | InstanceId,ip | 仅linux |
| RdmaRcvBps | RDMA网卡输入带宽 | bps | InstanceId,ip | 仅linux |
| RdmaXmitBps | RDMA网卡输出带宽 | bps | InstanceId,ip | 仅linux |
| RdmaXmitDiscardsPps | RDMA网卡丢弃包速率 | pps | InstanceId,ip | 仅linux |
| RdmaLinkUp | RDMA网卡是否Up | - | InstanceId,ip | 仅linux |
| RdmaSendCNP | RDMA网卡发送CNP数量 | 个/秒 | InstanceId,ip | 仅linux |
| RdmaHandleCNP | RDMA网卡处理CNP数量 | 个/秒 | InstanceId,ip | 仅linux |
| RdmaMarkedECN | RDMA网卡标记ECN数量 | 个/秒 | InstanceId,ip | 仅linux |
| RdmaRcvPFC | RDMA网卡接收PFC数量 | 个/秒 | InstanceId,ip | 仅linux |
| RdmdXmitPFC | RDMA网卡发送PFC数量 | 个/秒 | InstanceId,ip | 仅linux |
| RdmaACKTimeout | RDMA网卡ack超时数量 | 个/秒 | InstanceId,ip | 仅linux |
| RDMAOutOfSequencePacket | RDMA网卡乱序包数量 | 个/秒 | InstanceId,ip | 仅linux |
| RdmaCRCError | RDMA网卡CRC错误数量 | 个/秒 | InstanceId,ip | 仅linux |
| GpuXUtilizationGpu | gpu卡的使用率 | % | InstanceId,gpu | 仅linux |
| GpuXStatus | gpu卡状态 | - | InstanceId,gpu | 仅linux |
| GpuXError | gpu卡错误信息 | - | InstanceId,gpu | 仅linux |
| GpuXUtilizationMemory | gpu卡内存使用率 | % | InstanceId,gpu | 仅linux |
| GpuXMemoryTotal | gpu卡的内存总量 | Bytes | InstanceId,gpu | 仅linux |
| GpuXMemoryFree | gpu卡的内存空闲量 | Bytes | InstanceId,gpu | 仅linux |
| GpuXMemoryUsed | gpu卡的内存使用量 | Bytes | InstanceId,gpu | 仅linux |
| GpuXTemperature | gpu卡的温度 | 度 | InstanceId,gpu | 仅linux |
| GpuXEccErrors | gpu卡的ECC错误数 | 个 | InstanceId,gpu | 仅linux |
| DCGM_GPU_TEMP | GPU 运行的温度 | ℃ | InstanceId,gpu | 仅linux |
| DCGM_MEM_TEMP | GPU的内存温度 | ℃ | InstanceId,gpu | 仅linux |
| DCGM_FAN_SPEED_PERCENT | GPU 风扇转速占比 | % | InstanceId,gpu | 仅linux |
| DCGM_POWER_USAGE | GPU 的功率 | W | InstanceId,gpu | 仅linux |
| DCGM_GPU_PERF | GPU性能状态值 | - | InstanceId,gpu | 仅linux |
| DCGM_FI_DEV_TOTAL_ENERGY_CONSUMPTION | GPU自启动以来的总能耗 | J | InstanceId,gpu | 仅linux |
| DCGM_GPU_UTILIZATION | GPU 利用率 | % | InstanceId,gpu | 仅linux |
| DCGM_ENC_UTILIZATION | GPU 编码器利用率 | % | InstanceId,gpu | 仅linux |
| DCGM_DEC_UTILIZATION | GPU 解码器利用率 | % | InstanceId,gpu | 仅linux |
| DCGM_MEM_COPY_UTILIZATION | GPU的内存拷贝利用率 | % | InstanceId,gpu | 仅linux |
| DCGM_FB_FREE | GPU 帧缓存剩余 | MiB | InstanceId,gpu | 仅linux |
| DCGM_FB_USED | GPU 帧缓存使用 | MiB | InstanceId,gpu | 仅linux |
| DCGM_PROF_GR_ENGINE_ACTIVE | GPU Graphics或Compute引擎激活时间占比 | % | InstanceId,gpu | 仅linux |
| DCGM_PROF_SM_ACTIVE | GPU SM激活的时间占比 | % | InstanceId,gpu | 仅linux |
| DCGM_PROF_SM_OCCUPANCY | GPU 驻留在SM上的线程数占比 | % | InstanceId,gpu | 仅linux |
| DCGM_PROF_PIPE_TENSOR_ACTIVE | GPU Tensor Pipe处于激活的周期分数 | % | InstanceId,gpu | 仅linux |
| DCGM_PROF_PIPE_FP64_ACTIVE | GPU FP64管道处于激活的周期分数 | % | InstanceId,gpu | 仅linux |
| DCGM_PROF_PIPE_FP32_ACTIVE | GPU FP32管道处于激活的周期分数 | % | InstanceId,gpu | 仅linux |
| DCGM_PIPE_FP16_ACTIVE | GPU FP16管道处于激活的周期分数 | % | InstanceId,gpu | 仅linux |
| DCGM_PROF_DRAM_ACTIVE | GPU 内存带宽利用率 | % | InstanceId,gpu | 仅linux |
| PROF_NVLINK_TX_BYTES | NVLink传输的数据速率 | Bytes | InstanceId,gpu | 仅linux |
| PROF_NVLINK_RX_BYTES | NVLink接收的数据速率 | Bytes | InstanceId,gpu | 仅linux |
| DCGM_FI_DEV_NVLINK_CRC_FLIT_ERROR_COUNT_TOTAL | NVLink流控制 CRC 错误总数 | 个 | InstanceId,gpu | 仅linux |
| DCGM_FI_DEV_NVLINK_CRC_DATA_ERROR_COUNT_TOTAL | NVLink数据 CRC 错误总数。 | 个 | InstanceId,gpu | 仅linux |
| DCGM_FI_DEV_NVLINK_REPLAY_ERROR_COUNT_TOTAL | NVLink重试总数 | 个 | InstanceId,gpu | 仅linux |
| DCGM_FI_DEV_NVLINK_RECOVERY_ERROR_COUNT_TOTAL | NVLink恢复错误总数 | 个 | InstanceId,gpu | 仅linux |
| DCGM_FI_DEV_NVLINK_BANDWIDTH_TOTAL | NVLink 带宽计数器总数 | 个 | InstanceId,gpu | 仅linux |
| PROF_PCIE_TX_BYTES | GPU PCIe总线传输的数据速率 | Bytes | InstanceId,gpu | 仅linux |
| PROF_PCIE_RX_BYTES | GPU PCIe总线接收的数据速率 | Bytes | InstanceId,gpu | 仅linux |
| DCGM_PCIE_REPLAY_COUNTER | GPU PCIe重试的总数 | - | InstanceId,gpu | 仅linux |
| DCGM_SM_CLOCK | GPU sm 时钟频率 | HZ | InstanceId,gpu | 仅linux |
| DCGM_MEMORY_CLOCK | GPU 内存时钟频率 | HZ | InstanceId,gpu | 仅linux |
| DCGM_APP_SM_CLOCK | GPU SM应用时钟频率 | HZ | InstanceId,gpu | 仅linux |
| DCGM_APP_MEMORY_CLOCK | GPU 内存应用时钟频率 | HZ | InstanceId,gpu | 仅linux |
| DCGM_CLOCK_THROTTLE_REASONS | GPU 时钟慢下来的原因 | - | InstanceId,gpu | 仅linux |
| DCGM_ECC_SBE_VOL_TOTAL | GPU 单位易失性 ECC 错误总数 | 个 | InstanceId,gpu | 仅linux |
| DCGM_ECC_DBE_VOL_TOTAL | GPU 双位易失性 ECC 错误总数 | 个 | InstanceId,gpu | 仅linux |
| DCGM_ECC_SBE_AGG_TOTAL | GPU 单位持久性 ECC 错误的总数 | 个 | InstanceId,gpu | 仅linux |
| DCGM_ECC_DBE_AGG_TOTAL | GPU 双位持久性 ECC 错误的总数 | 个 | InstanceId,gpu | 仅linux |
| DCGM_XID_ERRORS | GPU发生的XID错误号 | - | InstanceId,gpu | 仅linux |
