集群指标
更新时间:2024-10-30
集群仪表盘
表一 集群仪表盘指标说明
指标英文名称(metric name) | 指标中文名称 | 单位 | 维度 |
---|---|---|---|
cluster_YARNResource_precent | YARN计算资源使用率 | % | ClusterId |
cluster_YARNVCoreResource | YARN计算资源(VCore) | 个 | ClusterId |
cluster_YARNMemoryResource | YARN计算资源(内存) | GB | ClusterId |
cluster_HDFSResourceCapacity_precent | HDFS存储资源使用率 | % | ClusterId |
cluster_cpu_used_percent | 集群平均CPU利用率 | % | ClusterId |
cluster_disk_used_percent | 集群平均磁盘利用率 | % | ClusterId |
cluster_disk_max_partition_used_percent | 集群最大磁盘利用率 | % | ClusterId |
cluster_net_in_bitps | 集群总网络入速率 | KB | ClusterId |
cluster_net_out_bitps | 集群总网络出速率 | KB | ClusterId |
cluster_HDFSResourceCapacity | HDFS存储资源 | % | ClusterId |
cluster_mem_used_percent | 集群平均内存利用率 | % | ClusterId |
cluster_disk_total_size | 集群磁盘总容量 | GB | ClusterId |
cluster_disk_total_free | 集群磁盘总空闲容量 | GB | ClusterId |
cluster_disk_total_used | 集群磁盘总使用容量 | GB | ClusterId |
主机监控仪表盘
表二 主机监控仪表盘指标说明
指标英文名称(metric name) | 指标中文名称 | 单位 | 维度 |
---|---|---|---|
cpu_user | 用户CPU利用率 | % | InstanceId |
cpu_sys | 系统CPU利用率 | % | InstanceId |
cpu_idle | CPU空闲率 | % | InstanceId |
cpu_wait_io | 等待IOCPU时间比率 | % | InstanceId |
mem_total | 内存总量 | GB | InstanceId |
mem_used | 内存使用量 | GB | InstanceId |
mem_free | 内存空闲量 | GB | InstanceId |
mem_cached | 文件系统内存cache值 | GB | InstanceId |
mem_buffers | 块设备读写内存缓冲量 | GB | InstanceId |
mem_used_percent | 内存利用率 | % | InstanceId |
swap_total | 交换分区总量 | GB | InstanceId |
swap_free | 交换分区空闲量 | GB | InstanceId |
swap_used | 交换分区使用量 | GB | InstanceId |
swap_used_percent | 交换分区使用率 | % | InstanceId |
disk_max_partition_used_percent | 最大磁盘分区利用率 | % | InstanceId |
disk_total_size | 磁盘总空间量 | GB | InstanceId |
disk_total_free | 磁盘总空闲量 | GB | InstanceId |
disk_total_used | 磁盘总使用量 | GB | InstanceId |
disk_total_used_percent | 磁盘总使用率 | % | InstanceId |
disk_total_write_kb | 磁盘总写速率 | KB/s | InstanceId |
disk_total_read_kb | 磁盘总读速率 | KB/s | InstanceId |
disk_size | 单块磁盘总容量 | GB | InstanceId,DiskName |
disk_free | 单块磁盘空闲量 | GB | InstanceId,DiskName |
disk_used | 单块磁盘使用量 | GB | InstanceId,DiskName |
disk_used_percent | 单块磁盘使用率 | % | InstanceId,DiskName |
disk_write_kb | 单块盘写速率 | KB/s | InstanceId,DiskName |
disk_read_kb | 单块盘读速率 | KB/s | InstanceId,DiskName |
disk_io_util | 单块盘io使用率 | % | InstanceId,DiskName |
disk_max_partition_io_util | 最大磁盘io使用率 | % | InstanceId |
fd_limitation | 整机的fd上限 | 个 | InstanceId |
fd_used | 整机已使用的fd个数 | 个 | InstanceId |
fd_used_percent | 整机的fd使用率 | % | InstanceId |
loadavg5 | 机器负载 | 个 | InstanceId |
net_total_in_bitps | 整机网卡总接受速率 | KB/s | InstanceId |
net_total_out_bitps | 整机网卡总发送速率 | KB/s | InstanceId |
net_tcp_curr_estab | 已建立的TCP连接数 | 个 | InstanceId |
net_total_sockets_used | socket连接句柄总数 | 个 | InstanceId |
net_tcp_close_wait | CLOSE_WAIT状态连接数 | 个 | InstanceId |
host_connect_status | 主机连接状态 | -- | InstanceId |
bmr_agent_connect_status | bmr-agent连接状态 | -- | InstanceId |
服务监控
HDFS
表三 HDFS服务指标说明
指标英文名称(metric name) | 指标中文名称 | 单位 | 维度 |
---|---|---|---|
dfs_FSNamesystem_BlockCapacity | block的总容量 | 个 | ServiceId |
dfs_FSNamesystem_BlocksTotal | block的当前容量 | 个 | ServiceId |
dfs_FSNamesystem_CapacityRemainingGB | HDFS文件系统剩余的容量 | GB | ServiceId |
dfs_FSNamesystem_CapacityTotalGB | HDFS文件系统总体容量 | GB | ServiceId |
dfs_FSNamesystem_CapacityUsedGB | HDFS文件系统已使用的容量 | GB | ServiceId |
dfs_FSNamesystem_CorruptBlocks | 已损坏的block数量 | 个 | ServiceId |
dfs_FSNamesystem_ExcessBlocks | 多余的block | 个 | ServiceId |
dfs_FSNamesystem_ExpiredHeartbeats | 超时的心跳 | 个 | ServiceId |
dfs_FSNamesystem_FilesTotal | 文件总数 | 个 | ServiceId |
dfs_FSNamesystem_LastCheckpointTime | 最近一次做checkpoint的时间 | datatime | ServiceId |
dfs_FSNamesystem_LastWrittenTransactionId | 最近一次写入的transactionid | 个 | ServiceId |
dfs_FSNamesystem_MillisSinceLastLoadedEdits | 距离上一次加载edit的时间 | ms | ServiceId |
dfs_FSNamesystem_MissingBlocks | 丢失的block数量 | 个 | ServiceId |
dfs_FSNamesystem_UnderReplicatedBlocks | 副本个数不够的block | 个 | ServiceId |
dfs_FSNamesystem_PendingDataNodeMessageCount | datanode的请求被queue在standby namenode的个数 | 个 | ServiceId |
dfs_FSNamesystem_PendingDeletionBlocks | 未被验证的block个数 | 个 | ServiceId |
dfs_FSNamesystem_PendingReplicationBlocks | 等待被备份的block个数 | 个 | ServiceId |
dfs_FSNamesystem_PostponedMisreplicatedBlocks | 被推迟处理的错误备份的block个数 | 个 | ServiceId |
dfs_FSNamesystem_ScheduledReplicationBlocks | 排定要备份的block个数 | 个 | ServiceId |
dfs_FSNamesystem_TotalLoad | namenode的Xceiver个数 | 个 | ServiceId |
dfs_FSNamesystem_TransactionsSinceLastLogRoll | 从上次roll editlog起到现在新的transcation的个数 | 个 | ServiceId |
dfs_FSNamesystem_CapacityUsed_percent | HDFS容量使用率 | % | ServiceId |
dfs_FSNamesystem_NumLiveDataNodes | DataNode正常节点数 | 个 | ServiceId |
dfs_FSNamesystem_NumDeadDataNodes | DataNode异常节点数 | 个 | ServiceId |
dfs_FSNamesystem_VolumeFailuresTotal | DataNode坏卷数 | 个 | ServiceId |
dfs_namenode_Safemode | 安全模式 | 个 | ServiceId |
HDFS NameNode
表四 HDFS组件指标说明
指标英文名称(metric name) | 指标中文名称 | 单位 | 维度 |
---|---|---|---|
dfs_namenode_MemHeapCommitted | heap已提交的内存 | MB | ComponentId |
dfs_namenode_MemHeapMaxM | heap总内存 | MB | ComponentId |
dfs_namenode_MemHeapUsedM | heap使用的内存 | MB | ComponentId |
dfs_namenode_MemMaxM | 最大内存 | MB | ComponentId |
dfs_namenode_MemNonHeapCommittedM | 非堆内存提交 | MB | ComponentId |
dfs_namenode_MemNonHeapMaxM | 最大非堆内存 | MB | ComponentId |
dfs_namenode_MemNonHeapUsedM | 非堆内存使用 | MB | ComponentId |
dfs_namenode_SafeModeTime | safemode时间 | ms | ComponentId |
dfs_namenode_AddBlockOps | 写入block次数 | 次 | ComponentId |
dfs_namenode_BlockReportAvgTime | block report的平均时间次数 | ms | ComponentId |
dfs_namenode_BlockReportNumOps | block report的次数 | 次 | ComponentId |
dfs_namenode_CreateFileOps | 创建文件次数 | 次 | ComponentId |
dfs_namenode_DeleteFileOps | 删除文件次数 | 次 | ComponentId |
dfs_namenode_FileInfoOps | 查看文件info次数 | 次 | ComponentId |
dfs_namenode_FilesCreated | 已创建的文件个数 | 个 | ComponentId |
dfs_namenode_FilesDeleted | 已删除的文件个数 | 个 | ComponentId |
dfs_namenode_FilesInGetListingOps | getlist操作次数 | 次 | ComponentId |
dfs_namenode_FilesRenamed | 重命名文件个数 | 个 | ComponentId |
dfs_namenode_FsImageLoadTime | fsimage加载时间 | ms | ComponentId |
dfs_namenode_GetAdditionalDatanodeOps | GetAdditionalDatanode操作次数 | 次 | ComponentId |
dfs_namenode_GetBlockLocations | 获取block位置操作次数 | 次 | ComponentId |
dfs_namenode_GetListingOps | getListing操作次数 | 次 | ComponentId |
dfs_namenode_SyncsAvgTime | 将操作同步为editlog的平均时间 | ms | ComponentId |
dfs_namenode_SyncsNumOps | 将操作同步为editlog的次数 | 次 | ComponentId |
dfs_namenode_TransactionsAvgTime | transcation的平均时间 | ms | ComponentId |
dfs_namenode_TransactionsBatchedInSync | transcation在flush时发现已经被sync的情况的次数 | 次 | ComponentId |
dfs_namenode_TransactionsNumOps | transcation的个数 | 个 | ComponentId |
HDFS DataNode
表五 HDFS DataNode组件指标说明
指标英文名称(metric name) | 指标中文名称 | 单位 | 维度 |
---|---|---|---|
dfs_datanode_MemHeapCommittedM | heap已提交的内存 | MB | ComponentId |
dfs_datanode_MemHeapMaxM | heap总内存 | MB | ComponentId |
dfs_datanode_MemHeapUsedM | heap使用的内存 | MB | ComponentId |
dfs_datanode_MemMaxM | 最大内存 | MB | ComponentId |
dfs_datanode_MemNonHeapCommittedM | 非堆内存提交 | MB | ComponentId |
dfs_datanode_MemNonHeapMaxM | 最大非堆内存 | MB | ComponentId |
dfs_datanode_MemNonHeapUsedM | 非堆内存使用 | MB | ComponentId |
dfs_datanode_BlockReportsAvgTime | 向namenode汇报block的平均时间 | ms | ComponentId |
dfs_datanode_BlockReportsNumOps | 向namenode汇报block的次数 | 次 | ComponentId |
dfs_datanode_BlocksRead | 从硬盘读块的次数 | 次 | ComponentId |
dfs_datanode_BlocksRemoved | 删除块的个数 | 次 | ComponentId |
dfs_datanode_BlocksReplicated | 备份块操作的个数 | 个 | ComponentId |
dfs_datanode_BlocksVerified | 验证块的次数 | 次 | ComponentId |
dfs_datanode_BlocksWritten | 写入块的个数 | 个 | ComponentId |
dfs_datanode_BytesRead | 读出总字节 | bytes | ComponentId |
dfs_datanode_BytesWritten | 写入总字节 | bytes | ComponentId |
dfs_datanode_CopyBlockOpAvgTime | 复制块的平均时间 | ms | ComponentId |
dfs_datanode_CopyBlockOpNumOps | 复制块的次数 | 次 | ComponentId |
dfs_datanode_HeartbeatsAvgTime | 向namenode汇报的平均时间 | ms | ComponentId |
dfs_datanode_HeartbeatsNumOps | 向namenode汇报的次数 | 次 | ComponentId |
dfs_datanode_ReadBlockOpAvgTime | 读数据块的平均时间 | ms | ComponentId |
dfs_datanode_ReadBlockOpNumOps | 读数据块的次数 | 次 | ComponentId |
dfs_datanode_ReadsFromLocalClient | 本地读取的次数 | 次 | ComponentId |
dfs_datanode_ReadsFromRemoteClient | 远程读取的次数 | 次 | ComponentId |
dfs_datanode_WriteBlockOpAvgTime | 写数据块的平均时间 | ms | ComponentId |
dfs_datanode_WriteBlockOpNumOps | 写数据块的次数 | 次 | ComponentId |
dfs_datanode_WritesFromLocalClient | 写本地的次数 | 次 | ComponentId |
dfs_datanode_WritesFromRemoteClient | 写远程的次数 | 次 | ComponentId |
dfs_datanode_PacketAckRoundTripTimeNanosAvgTime | 包确认平均时间 | ms | ComponentId |
dfs_datanode_PacketAckRoundTripTimeNanosNumOps | 包确认次数 | 次 | ComponentId |
dfs_datanode_FlushNanosAvgTime | 文件系统flush平均时间 | ms | ComponentId |
dfs_datanode_FlushNanosNumOps | 文件系统flush平均时间 | ms | ComponentId |
dfs_datanode_ReplaceBlockOpAvgTime | 块替换平均时间 | ms | ComponentId |
dfs_datanode_ReplaceBlockOpNumOps | 块替换次数 | 次 | ComponentId |
dfs_datanode_SendDataPacketBlockedOnNetworkNanosAvgTime | 网络上发送块平均时间 | ms | ComponentId |
dfs_datanode_SendDataPacketBlockedOnNetworkNanosNumOps | 网络上发生块次数 | 次 | ComponentId |
dfs_datanode_SendDataPacketTransferNanosAvgTime | 网络上发送包平均时间 | ms | ComponentId |
dfs_datanode_SendDataPacketTransferNanosNumOps | 网络上发送包个数 | 个 | ComponentId |
dfs_datanode_FsStat_Capacity | DataNode容量 | GB | ComponentId |
dfs_datanode_FsStat_DfsUsed | DataNode使用量 | GB | ComponentId |
dfs_datanode_FsStat_NumFailedVolumes | 坏卷数量 | GB | ComponentId |
HDFS JOURNALNODE
表六 HDFS JOURNALNODE组件指标说明
指标英文名称(metric name) | 指标中文名称 | 单位 | 维度 |
---|---|---|---|
status | 进程运行状态 | state | ComponentId |
proc cpu usage | 进程cpu利用率 | % | ComponentId |
proc mem usage | 进程内存利用率 | % | ComponentId |
jvm gc o | jvm gc o | % | ComponentId |
jvm_gc E | jvm_gc E | % | ComponentId |
jvm_gc M | jvm_gc M | % | ComponentId |
jvm gc ccs | jvm gc ccs | % | ComponentId |
jvm gc yGcT | jvm gc yGcT | % | ComponentId |
jvm gc FGCT | jvm gc FGCT | % | ComponentId |
jvm_gc_GCT | jvm_gc_GCT | % | ComponentId |
jvm_gc_YGC | jvm_gc_YGC | % | ComponentId |
jvm_gc_FGC | jvm_gc_FGC | % | ComponentId |
YARN
表七 YARN服务指标说明
指标英文名称(metric name) | 指标中文名称 | 单位 | 维度 |
---|---|---|---|
yarn_ClusterMetrics_NumActiveNMs | 活的nodemanager个数 | 个 | ServiceId |
yarn_ClusterMetrics_NumLostNMs | 丢失的nodemanager个数 | 个 | ServiceId |
yarn_ClusterMetrics_NumUnhealthyNMs | 不健康的nodemanager个数 | 个 | ServiceId |
yarn_QueueMetrics_TotalMB | 总内存 | GB | ServiceId |
yarn_QueueMetrics_TotalVCores | 总vcores | 个 | ServiceId |
yarn_QueueMetrics_ActiveApplications | 活跃的task的个数 | 个 | ServiceId |
yarn_QueueMetrics_ActiveUsers | 活跃的用户个数 | 个 | ServiceId |
yarn_QueueMetrics_AggregateContainersAllocated | 总共分配的container个数 | 个 | ServiceId |
yarn_QueueMetrics_AggregateContainersReleased | 总共释放的container个数 | 个 | ServiceId |
yarn_QueueMetrics_AllocatedContainers | 已经分配的container个数 | 个 | ServiceId |
yarn_QueueMetrics_AllocatedMB | 已经分配的内存 | GB | ServiceId |
yarn_QueueMetrics_AllocatedVCores | 已分配的vcore | 个 | ServiceId |
yarn_QueueMetrics_AppsCompleted | 已完成的task数 | 个 | ServiceId |
yarn_QueueMetrics_AppsPending | 挂起的task数 | 个 | ServiceId |
yarn_QueueMetrics_AppsRunning | 运行的task数 | 个 | ServiceId |
yarn_QueueMetrics_AppsSubmitted | 已经提交的task数 | 个 | ServiceId |
yarn_QueueMetrics_AvailableMB | 可用的内存 | GB | ServiceId |
yarn_QueueMetrics_AvailableVCores | 可用的vcore | 个 | ServiceId |
yarn_QueueMetrics_PendingContainers | 挂起的container数 | 个 | ServiceId |
yarn_QueueMetrics_PendingMB | 挂起的内存 | GB | ServiceId |
yarn_QueueMetrics_PendingVCores | 挂起的vcore | 个 | ServiceId |
yarn_QueueMetrics_running_0 | 运行时间在0-60分钟内的task个数 | 个 | ServiceId |
yarn_QueueMetrics_running_1440 | 运行时间在1440分钟以上的task个数 | 个 | ServiceId |
yarn_QueueMetrics_running_300 | 运行时间在300-1440分钟内的task个数 | 个 | ServiceId |
yarn_QueueMetrics_running_60 | 运行时间在60-300分钟内的task个数 | 个 | ServiceId |
yarn_QueueMetrics_AllocatedMem_precent | 分配内存占比 | % | ServiceId |
yarn_QueueMetrics_AllocatedVCore_precent | 分配VCore占比 | % | ServiceId |
YARN TimeLineServer
表八 yarn TimeLineServer组件指标说明
指标英文名称(metric name) | 指标中文名称 | 单位 | 维度 |
---|---|---|---|
yarn_timeline_GetEntitiesOps | TimelineServer获取批量entities操作数 | 次 | ComponentId |
yarn_timeline_GetEntitiesTimeAvgTime | TimelineServer获取批量entities平均时间 | ms | ComponentId |
yarn_timeline_GetEntityOps | TimelineServer获取entity操作数 | 次 | ComponentId |
yarn_timeline_GetEntityTimeAvgTime | TimelineServer获取entity平均时间 | ms | ComponentId |
yarn_timeline_GetEventsOps | TimelineServer获取批量events操作数 | 次 | ComponentId |
yarn_timeline_GetEventsTimeAvgTime | TimelineServer获取批量evnets平均时间 | ms | ComponentId |
yarn_timeline_PostEntitiesOps | TimelineServer更新批量entities操作数 | 次 | ComponentId |
yarn_timeline_PostEntitiesTimeAvgTime | TimelineServer更新批量entities的平均时间 | ms | ComponentId |
yarn_timeline_PutDomainOps | TimelineServer更新Domain操作数 | 次 | ComponentId |
yarn_timeline_PutDomainTimeAvgTime | TimelineServer更新Domain平均时间 | ms | ComponentId |
yarn_timeline_GetDomainOps | TimelineServer获取Domain操作数 | 次 | ComponentId |
yarn_timeline_GetDomainTimeAvgTime | TimelineServer获取Domain平均时间 | ms | ComponentId |
yarn_timeline_GetDomainsOps | TimelineServer批量获取Domains操作数 | 次 | ComponentId |
yarn_timeline_GetDomainsTimeAvgTime | TimelineServer批量获取Domains平均时间 | ms | ComponentId |
YARN ResourceManager
表九 YARN ResourceManager指标说明
指标英文名称(metric name) | 指标中文名称 | 单位 | 维度 |
---|---|---|---|
status | 进程运行状态 | state | ComponentId |
proc cpu usage | 进程cpu利用率 | % | ComponentId |
proc mem usage | 进程内存利用率 | % | ComponentId |
jvm gc o | jvm gc o | % | ComponentId |
jvm_gc E | jvm_gc E | % | ComponentId |
jvm_gc M | jvm_gc M | % | ComponentId |
jvm gc ccs | jvm gc ccs | % | ComponentId |
jvm gc yGcT | jvm gc yGcT | % | ComponentId |
jvm gc FGCT | jvm gc FGCT | % | ComponentId |
jvm_gc_GCT | jvm_gc_GCT | % | ComponentId |
jvm_gc_YGC | jvm_gc_YGC | % | ComponentId |
jvm_gc_FGC | jvm_gc_FGC | % | ComponentId |
YARN HISTORY_SERVER
表十 YARN HISTORY_SERVER指标说明
指标英文名称(metric name) | 指标中文名称 | 单位 | 维度 |
---|---|---|---|
status | 进程运行状态 | state | ComponentId |
proc cpu usage | 进程cpu利用率 | % | ComponentId |
proc mem usage | 进程内存利用率 | % | ComponentId |
jvm gc o | jvm gc o | % | ComponentId |
jvm_gc E | jvm_gc E | % | ComponentId |
jvm_gc M | jvm_gc M | % | ComponentId |
jvm gc ccs | jvm gc ccs | % | ComponentId |
jvm gc yGcT | jvm gc yGcT | % | ComponentId |
jvm gc FGCT | jvm gc FGCT | % | ComponentId |
jvm_gc_GCT | jvm_gc_GCT | % | ComponentId |
jvm_gc_YGC | jvm_gc_YGC | % | ComponentId |
jvm_gc_FGC | jvm_gc_FGC | % | ComponentId |
YARN NodeManager
表十一 YARN NodeManager指标说明
指标英文名称(metric name) | 指标中文名称 | 单位 | 维度 |
---|---|---|---|
status | 进程运行状态 | state | ComponentId |
proc cpu usage | 进程cpu利用率 | % | ComponentId |
proc mem usage | 进程内存利用率 | % | ComponentId |
jvm gc o | jvm gc o | % | ComponentId |
jvm_gc E | jvm_gc E | % | ComponentId |
jvm_gc M | jvm_gc M | % | ComponentId |
jvm gc ccs | jvm gc ccs | % | ComponentId |
jvm gc yGcT | jvm gc yGcT | % | ComponentId |
jvm gc FGCT | jvm gc FGCT | % | ComponentId |
jvm_gc_GCT | jvm_gc_GCT | % | ComponentId |
jvm_gc_YGC | jvm_gc_YGC | % | ComponentId |
jvm_gc_FGC | jvm_gc_FGC | % | ComponentId |
HIVE
HiveServer2
表十二 HIVE组件指标说明1
指标英文名称(metric name) | 指标中文名称 | 单位 | 维度 |
---|---|---|---|
hive_hs2_active_sessions | 当前活跃Session数 | 个 | ComponentId |
hive_hs2_open_sessions | 当前打开的Session数 | 个 | ComponentId |
hive_hs2_open_connections | 当前打开的连接数 | 个 | ComponentId |
hive_hs2_cumulative_connection_count | 累计连接数 | 个 | ComponentId |
hive_hs2_active_calls_api_runTasks | 当前Runtask请求数 | 个 | ComponentId |
hive_hs2_compiling_queries | 执行编译的平均时间 | ms | ComponentId |
hive_hs2_executing_queries | 执行查询的平均时间 | ms | ComponentId |
hive_hs2_submitted_queries | 提交查询的平均时间 | ms | ComponentId |
hive_hs2_succeeded_queries | 服务启动后成功的查询数 | 个 | ComponentId |
hive_hs2_sql_operation_active_user | 当前活跃用户数 | 个 | ComponentId |
hive_hs2_completed_sql_operation_FINISHED | 已结束的SQL总数 | 个 | ComponentId |
hive_hs2_sql_operation_PENDING | SQL任务处于PEEDING状态平均时间 | ms | ComponentId |
hive_hs2_sql_operation_RUNNING | SQL任务处于RUNNING状态平均时间 | ms | ComponentId |
status | 进程运行状态 | state | ComponentId |
proc cpu usage | 进程cpu利用率 | % | ComponentId |
proc mem usage | 进程内存利用率 | % | ComponentId |
jvm gc o | jvm gc o | % | ComponentId |
jvm_gc E | jvm_gc E | % | ComponentId |
jvm_gc M | jvm_gc M | % | ComponentId |
jvm gc ccs | jvm gc ccs | % | ComponentId |
jvm gc yGcT | jvm gc yGcT | % | ComponentId |
jvm gc FGCT | jvm gc FGCT | % | ComponentId |
jvm_gc_GCT | jvm_gc_GCT | % | ComponentId |
jvm_gc_YGC | jvm_gc_YGC | % | ComponentId |
jvm_gc_FGC | jvm_gc_FGC | % | ComponentId |
HiveMetastore
表十三 HIVE组件指标说明2
指标英文名称(metric name) | 指标中文名称 | 单位 | 维度 |
---|---|---|---|
hive_metastore_active_calls_drop_table | 当前活跃DropTable请求数 | 次 | ComponentId |
hive_metastore_api_alter_table | AlterTable请求平均时间 | ms | ComponentId |
hive_metastore_api_alter_table_with_environment_context | AlterTableWithEnvContext请求平均时间 | ms | ComponentId |
hive_metastore_api_create_table | CreateTable请求平均时间 | ms | ComponentId |
hive_metastore_api_create_table_with_environment_context | CreateTableWithEnvContext请求平均时间 | ms | ComponentId |
hive_metastore_api_drop_table | DropTable请求平均时间 | ms | ComponentId |
hive_metastore_api_drop_table_with_environment_context | DropTableWithEnvContext请求平均时间 | ms | ComponentId |
hive_metastore_api_get_table | GetTable请求平均时间 | ms | ComponentId |
hive_metastore_api_get_table_req | GetTableReq请求平均时间 | ms | ComponentId |
hive_metastore_api_get_table_objects_by_name_req | GetTableObjectsByName请求平均时间 | ms | ComponentId |
hive_metastore_api_get_tables | GetTables请求平均时间 | ms | ComponentId |
hive_metastore_api_get_tables_by_type | GetTablesByType请求平均时间 | ms | ComponentId |
hive_metastore_api_get_multi_table | GetMultiTable请求平均时间 | ms | ComponentId |
hive_metastore_api_get_table_statistics_req | GetTableStatistics请求平均时间 | ms | ComponentId |
hive_metastore_api_get_all_databases | GetAllDatabases请求平均时间 | ms | ComponentId |
hive_metastore_api_get_database | GetDatabase请求平均时间 | ms | ComponentId |
hive_metastore_api_get_databases | GetDatabases请求平均时间 | ms | ComponentId |
hive_metastore_api_get_all_functions | GetAllFunctions请求平均时间 | ms | ComponentId |
ZOOKEEPER
表十四 ZOOKEEPER组件指标说明
指标英文名称(metric name) | 指标中文名称 | 单位 | 维度 |
---|---|---|---|
zk_avg_latency | 平均响应延迟 | ms | ComponentId |
zk_max_latency | 最大响应延迟 | ms | ComponentId |
zk_min_latency | 最小响应延迟 | ms | ComponentId |
zk_packets_received | 收包数 | 个 | ComponentId |
zk_packets_sent | 发包数 | 个 | ComponentId |
zk_num_alive_connections | 活跃连接数 | 个 | ComponentId |
zk_outstanding_requests | 堆积请求数 | 个 | ComponentId |
zk_server_state | 主从状态 | 个 | ComponentId |
zk_znode_count | znode数 | 个 | ComponentId |
zk_watch_count | watch数 | 个 | ComponentId |
zk_ephemerals_count | 临时节点数 | 个 | ComponentId |
zk_approximate_data_size | 近似数据总和大小 | bytes | ComponentId |
zk_open_file_descriptor_count | 打开文件描述符数 | 个 | ComponentId |
zk_max_file_descriptor_count | 最大文件描述符数 | 个 | ComponentId |
status | 进程运行状态 | state | ComponentId |
proc cpu usage | 进程cpu利用率 | % | ComponentId |
proc mem usage | 进程内存利用率 | % | ComponentId |
jvm gc o | jvm gc o | % | ComponentId |
jvm_gc E | jvm_gc E | % | ComponentId |
jvm_gc M | jvm_gc M | % | ComponentId |
jvm gc ccs | jvm gc ccs | % | ComponentId |
jvm gc yGcT | jvm gc yGcT | % | ComponentId |
jvm gc FGCT | jvm gc FGCT | % | ComponentId |
jvm_gc_GCT | jvm_gc_GCT | % | ComponentId |
jvm_gc_YGC | jvm_gc_YGC | % | ComponentId |
jvm_gc_FGC | jvm_gc_FGC | % | ComponentId |
HBASE
表十五 HBASE服务指标说明
指标英文名称(metric name) | 指标中文名称 | 单位 | 维度 |
---|---|---|---|
hbase_ritCount | 处于RIT的Region个数 | 个 | ServiceId |
hbase_ritCountOverThreshold | 处于超时的RIT的Region个数 | 个 | ServiceId |
hbase_ritOldestAge | RIT的最长时间 | ms | ServiceId |
hbase_averageLoad | 平均负载 | 个 | ServiceId |
hbase_numRegionServers | 活动的RS数量 | 个 | ServiceId |
hbase_numDeadRegionServers | 停止的RS数量 | 个 | ServiceId |
hbase_clusterRequests | 集群总请求数量 | 个 | ServiceId |
hbase_mergePlanCount | Merge计划数 | 个 | ServiceId |
hbase_splitPlanCount | Split计划数 | 个 | ServiceId |
hbase_receivedBytes | 接受字节数 | Bytes | ServiceId |
hbase_sentBytes | 发送字节数 | Bytes | ServiceId |
hbase_queueSize | 排队队列大小 | 个 | ServiceId |
hbase_numCallsInGeneralQueue | 普通队列调用数 | 次 | ServiceId |
hbase_numCallsInReplicationQueue | 副本队列调用数 | 次 | ServiceId |
hbase_numCallsInPriorityQueue | 优先队列调用数 | 次 | ServiceId |
hbase_numOpenConnections | 保持的链接数的大小 | 个 | ServiceId |
hbase_numActiveHandler | 活跃的handler | 个 | ServiceId |
hbase_numGeneralCallsDropped | 丢失的普通请求数 | 次 | ServiceId |
hbase_numLifoModeSwitches | 栈模式切换数 | 次 | ServiceId |
hbase_authenticationSuccesses | 认证成功数 | 次 | ServiceId |
hbase_authenticationFailures | 认证失败次数 | 次 | ServiceId |
hbase_authenticationFallbacks | 认证退却次数 | 次 | ServiceId |
hbase_authorizationSuccesses | 授权成功次数 | 次 | ServiceId |
hbase_authorizationFailures | 授权失败数 | 次 | ServiceId |
hbase_exceptions_RegionMovedException | Region状态迁移错误数 | 次 | ServiceId |
hbase_exceptions_multiResponseTooLarge | 接收到多个相应超出限定阈值 | 次 | ServiceId |
hbase_exceptions_RegionTooBusyException | RegionServer任务过多导致错误的数量 | 次 | ServiceId |
hbase_exceptions_FailedSanityCheckException | FailedSanityCheckException | 次 | ServiceId |
hbase_exceptions_UnknownScannerException | 未知扫描错误 | 次 | ServiceId |
hbase_exceptions_OutOfOrderScannerNextException | 乱序扫描错误 | 次 | ServiceId |
hbase_exceptions_NotServingRegionException | NotServingRegionException | 次 | ServiceId |
hbase_exceptions_callQueueTooBig | 等待队列满错误 | 次 | ServiceId |
hbase_exceptions_ScannerResetException | 扫描器重置错误 | 次 | ServiceId |
hbase_exceptions | 总错误数 | 次 | ServiceId |
hbase_ProcessCallTime_num_ops | 总操作数 | 次 | ServiceId |
hbase_ProcessCallTime_min | 处理时间最小值 | ms | ServiceId |
hbase_ProcessCallTime_max | 处理时间最大值 | ms | ServiceId |
hbase_ProcessCallTime_mean | 处理时间平均值 | ms | ServiceId |
hbase_QueueCallTime_num_opsHBASE_REGIONSERVER | 队列调用次数 | 次 | ServiceId |
hbase_QueueCallTime_min | 调用最短时间 | ms | ServiceId |
hbase_QueueCallTime_max | 调用最长时间 | ms | ServiceId |
hbase_QueueCallTime_mean | 调用平均时间 | ms | ServiceId |
HBASE_REGIONSERVER
表十六 HBASE组件指标说明1
指标英文名称(metric name) | 指标中文名称 | 单位 | 维度 |
---|---|---|---|
hbase_rs_averageRegionSize | Region平均大小 | Bytes | ComponentId |
hbase_rs_regionCount | Region个数 | 个 | ComponentId |
hbase_rs_percentFilesLocalSecondaryRegions | Region副本本地化 | % | ComponentId |
hbase_rs_hlogFileCount | WAL文件数量 | 个 | ComponentId |
hbase_rs_hlogFileSize | WAL文件大小 | Bytes | ComponentId |
hbase_rs_memStoreSize | Memstore大小 | MB | ComponentId |
hbase_rs_storeCount | Store个数 | 个 | ComponentId |
hbase_rs_storeFileCount | Storefile个数 | 个 | ComponentId |
hbase_rs_storeFileSize | Storefile 大小 | MB | ComponentId |
hbase_rs_storeFileIndexSize | storeFileIndexSize | Bytes | ComponentId |
hbase_rs_staticIndexSize | staticIndexSize | Bytes | ComponentId |
hbase_rs_staticBloomSize | staticBloomSize | Bytes | ComponentId |
hbase_rs_flushedCellsSize | flush到磁盘的大小 | Bytes | ComponentId |
hbase_rs_Append_mean | Append_mean | ms | ComponentId |
hbase_rs_Replay_mean | Append_mean | ms | ComponentId |
hbase_rs_Get_mean | Append_mean | ms | ComponentId |
hbase_rs_updatesBlockedTime | updatesBlockedTime | ms | ComponentId |
hbase_rs_FlushTime_num_ops | RS写磁盘次数 | 次 | ComponentId |
hbase_rs_splitQueueLength | split操作队列请求数 | 个 | ComponentId |
hbase_rs_compactionQueueLength | compaction操作队列请求数 | 个 | ComponentId |
hbase_rs_totalRequestCount | 总请求数 | 次 | ComponentId |
hbase_rs_readRequestCount | 读请求数 | 次 | ComponentId |
hbase_rs_writeRequestCount | 写请求数 | 次 | ComponentId |
hbase_rs_compactedCellsCount | 合并cell个数 | 个 | ComponentId |
hbase_rs_majorCompactedCellsCount | 大合并cell个数 | 个 | ComponentId |
hbase_rs_splitRequestCount | region分裂请求次数 | 次 | ComponentId |
hbase_rs_splitSuccessCount | region分裂成功次数 | 次 | ComponentId |
hbase_rs_slowGetCount | 请求完成时间超过1000ms的次数 | 次 | ComponentId |
hbase_rs_authenticationFailures | RPC认证失败次数 | 次 | ComponentId |
hbase_rs_authenticationSuccesses | RPC认证成功次数 | 次 | ComponentId |
hbase_rs_numOpenConnections | RPC打开的连接数 | 个 | ComponentId |
hbase_rs_exceptions_FailedSanityCheckException | FailedSanityCheckException | 次 | ComponentId |
hbase_rs_exceptions_NotServingRegionException | NotServingRegionException | 次 | ComponentId |
hbase_rs_exceptions_OutOfOrderScannerNextException | OutOfOrderScannerNextException | 次 | ComponentId |
hbase_rs_exceptions_RegionMovedException | RegionMovedException | 次 | ComponentId |
hbase_rs_exceptions_RegionTooBusyException | RegionTooBusyException | 次 | ComponentId |
hbase_rs_exceptions_UnknownScannerException | UnknownScannerException | 次 | ComponentId |
hbase_rs_exceptions | Exceptions | 次 | ComponentId |
hbase_rs_numActiveHandler | RPC句柄数 | 个 | ComponentId |
hbase_rs_numCallsInPriorityQueue | numCallsInPriorityQueue | 个 | ComponentId |
hbase_rs_numCallsInReplicationQueue | numCallsInReplicationQueue | 个 | ComponentId |
hbase_rs_numCallsInGeneralQueue | numCallsInGeneralQueue | 个 | ComponentId |
hbase_rs_receivedBytes | 接受字节数 | Bytes | ComponentId |
hbase_rs_sentBytes | 发送字节数 | Bytes | ComponentId |
hbase_rs_queueSize | 排队队列大小 | 个 | ComponentId |
hbase_rs_blockCacheSize | block缓存大小 | Bytes | ComponentId |
hbase_rs_blockCacheFreeSize | block缓存剩余大小 | Bytes | ComponentId |
hbase_rs_blockCacheCount | block缓存命中次数 | Bytes | ComponentId |
hbase_rs_blockCacheCountHitPercent | block缓存命中率 | % | ComponentId |
hbase_rs_blockCacheExpressHitPercent | block缓存打开命中率 | % | ComponentId |
status | 进程运行状态 | state | ComponentId |
proc cpu usage | 进程cpu利用率 | % | ComponentId |
proc mem usage | 进程内存利用率 | % | ComponentId |
jvm gc o | jvm gc o | % | ComponentId |
jvm_gc E | jvm_gc E | % | ComponentId |
jvm_gc M | jvm_gc M | % | ComponentId |
jvm gc ccs | jvm gc ccs | % | ComponentId |
jvm gc yGcT | jvm gc yGcT | % | ComponentId |
jvm gc FGCT | jvm gc FGCT | % | ComponentId |
jvm_gc_GCT | jvm_gc_GCT | % | ComponentId |
jvm_gc_YGC | jvm_gc_YGC | % | ComponentId |
jvm_gc_FGC | jvm_gc_FGC | % | ComponentId |
HBASE_TABLE
表十七 HBASE组件指标说明2
指标英文名称(metric name) | 指标中文名称 | 单位 | 维度 |
---|---|---|---|
hbase_tb_tableSize | hbase_tableSize | Bytes | TopicId |
hbase_tb_storeFileSize | hbase_storeFileSize | Bytes | TopicId |
hbase_tb_readRequestCount | hbase_readRequestCount | 个 | TopicId |
hbase_tb_writeRequestCount | hbase_writeRequestCount | 个 | TopicId |
hbase_tb_totalRequestCount | hbase_totalRequestCount | 个 | TopicId |
hbase_tb_memstoreSize | hbase_memstoreSize | Bytes | TopicId |
CLICKHOUSE
CLICKHOUSE_SERVER
表十八 CLICKHOUSE组件监控说明
ck_server_event_InsertQuery | ck_event_InsertQuery | 次 | ComponentId |
ck_server_event_InsertedRows | ck_event_InsertedRows | 条 | ComponentId |
ck_server_event_DelayedInserts | ck_event_DelayedInserts | 条 | ComponentId |
ck_server_event_RejectedInserts | ck_event_RejectedInserts | 条 | ComponentId |
ck_server_event_MergedRows | ck_event_MergedRows | 行 | ComponentId |
ck_server_metrics_BackgroundPoolTask | ck_metrics_BackgroundPoolTask | 个 | ComponentId |
ck_server_metrics_Merge | ck_metrics_Merge | 次 | ComponentId |
ck_server_metrics_MemoryTrackingForMerges | ck_metrics_MemoryTrackingForMerges | bytes | ComponentId |
ck_server_metrics_PartMutation | ck_metrics_PartMutation | 个 | ComponentId |
ck_server_event_Query | ck_event_Query | 次 | ComponentId |
ck_server_event_SelectQuery | ck_event_SelectQuery | 次 | ComponentId |
ck_server_event_FailedQuery | ck_event_FailedQuery | 次 | ComponentId |
ck_server_event_SlowRead | ck_event_SlowRead | 个 | ComponentId |
ck_server_metrics_MemoryTracking | ck_metrics_MemoryTracking | bytes | ComponentId |
ck_server_event_MarkCacheHits | ck_event_MarkCacheHits | 个 | ComponentId |
ck_server_event_MarkCacheMisses | ck_event_MarkCacheMisses | 个 | ComponentId |
ck_server_metrics_ReadonlyReplica | ck_metrics_ReadonlyReplica | 个 | ComponentId |
ck_server_metrics_ReplicatedFetch | ck_metrics_ReplicatedFetch | 个 | ComponentId |
ck_server_metrics_ReplicatedSend | ck_metrics_ReplicatedSend | 个 | ComponentId |
ck_server_event_ZooKeeperTransactions | ck_event_ZooKeeperTransactions | 个 | ComponentId |
ck_server_metrics_ZooKeeperSession | ck_metrics_ZooKeeperSession | 个 | ComponentId |
ck_server_metrics_ZooKeeperWatch | ck_metrics_ZooKeeperWatch | 个 | ComponentId |
ck_server_metrics_Query | ck_metrics_Query | 次 | ComponentId |
ck_server_metrics_ReplicatedChecks | ck_metrics_ReplicatedChecks | 个 | ComponentId |
ck_server_metrics_BackgroundMovePoolTask | ck_metrics_BackgroundMovePoolTask | 个 | ComponentId |
ck_server_metrics_BackgroundSchedulePoolTask | ck_metrics_BackgroundSchedulePoolTask | 个 | ComponentId |
ck_server_metrics_BackgroundBufferFlushSchedulePoolTask | ck_metrics_BackgroundBufferFlushSchedulePoolTask | 个 | ComponentId |
ck_server_metrics_BackgroundDistributedSchedulePoolTask | ck_metrics_BackgroundDistributedSchedulePoolTask | 个 | ComponentId |
ck_server_metrics_CacheDictionaryUpdateQueueBatches | ck_metrics_CacheDictionaryUpdateQueueBatches | 个 | ComponentId |
ck_server_metrics_CacheDictionaryUpdateQueueKeys | ck_metrics_CacheDictionaryUpdateQueueKeys | 个 | ComponentId |
ck_server_metrics_DiskSpaceReservedForMerge | ck_metrics_DiskSpaceReservedForMerge | bytes | ComponentId |
ck_server_metrics_DistributedSend | ck_metrics_DistributedSend | 个 | ComponentId |
ck_server_metrics_QueryPreempted | ck_metrics_QueryPreempted | 个 | ComponentId |
ck_server_metrics_TCPConnection | ck_metrics_TCPConnection | 个 | ComponentId |
ck_server_metrics_MySQLConnection | ck_metrics_MySQLConnection | 个 | ComponentId |
ck_server_metrics_HTTPConnection | ck_metrics_HTTPConnection | 个 | ComponentId |
ck_server_metrics_InterserverConnection | ck_metrics_InterserverConnection | 个 | ComponentId |
ck_server_metrics_PostgreSQLConnection | ck_metrics_PostgreSQLConnection | 个 | ComponentId |
ck_server_metrics_OpenFileForRead | ck_metrics_OpenFileForRead | 个 | ComponentId |
ck_server_metrics_OpenFileForWrite | ck_metrics_OpenFileForWrite | 个 | ComponentId |
ck_server_metrics_Read | ck_metrics_Read | 个 | ComponentId |
ck_server_metrics_Write | ck_metrics_Write | 个 | ComponentId |
ck_server_metrics_SendScalars | ck_metrics_SendScalars | 个 | ComponentId |
ck_server_metrics_SendExternalTables | ck_metrics_SendExternalTables | 个 | ComponentId |
ck_server_metrics_QueryThread | ck_metrics_QueryThread | 个 | ComponentId |
ck_server_metrics_MemoryTrackingInBackgroundProcessingPool | ck_metrics_MemoryTrackingInBackgroundProcessingPool | bytes | ComponentId |
ck_server_metrics_MemoryTrackingInBackgroundMoveProcessingPool | ck_metrics_MemoryTrackingInBackgroundMoveProcessingPool | bytes | ComponentId |
ck_server_metrics_MemoryTrackingInBackgroundSchedulePool | ck_metrics_MemoryTrackingInBackgroundSchedulePool | bytes | ComponentId |
ck_server_metrics_MemoryTrackingInBackgroundBufferFlushSchedulePool | ck_metrics_MemoryTrackingInBackgroundBufferFlushSchedulePool | bytes | ComponentId |
ck_server_metrics_MemoryTrackingInBackgroundDistributedSchedulePool | ck_metrics_MemoryTrackingInBackgroundDistributedSchedulePool | bytes | ComponentId |
ck_server_metrics_EphemeralNode | ck_metrics_EphemeralNode | 个 | ComponentId |
ck_server_metrics_ZooKeeperRequest | ck_metrics_ZooKeeperRequest | 个 | ComponentId |
ck_server_metrics_DelayedInserts | ck_metrics_DelayedInserts | 个 | ComponentId |
ck_server_metrics_ContextLockWait | ck_metrics_ContextLockWait | 个 | ComponentId |
ck_server_metrics_StorageBufferRows | ck_metrics_StorageBufferRows | 个 | ComponentId |
ck_server_metrics_StorageBufferBytes | ck_metrics_StorageBufferBytes | bytes | ComponentId |
ck_server_metrics_DictCacheRequests | ck_metrics_DictCacheRequests | 个 | ComponentId |
ck_server_metrics_Revision | ck_metrics_Revision | 个 | ComponentId |
ck_server_metrics_VersionInteger | ck_metrics_VersionInteger | 版本 | ComponentId |
ck_server_metrics_RWLockWaitingReaders | ck_metrics_RWLockWaitingReaders | 个 | ComponentId |
ck_server_metrics_RWLockWaitingWriters | ck_metrics_RWLockWaitingWriters | 个 | ComponentId |
ck_server_metrics_RWLockActiveReaders | ck_metrics_RWLockActiveReaders | 个 | ComponentId |
ck_server_metrics_RWLockActiveWriters | ck_metrics_RWLockActiveWriters | 个 | ComponentId |
ck_server_metrics_GlobalThread | ck_metrics_GlobalThread | 个 | ComponentId |
ck_server_metrics_GlobalThreadActive | ck_metrics_GlobalThreadActive | 个 | ComponentId |
ck_server_metrics_LocalThread | ck_metrics_LocalThread | 个 | ComponentId |
ck_server_metrics_LocalThreadActive | ck_metrics_LocalThreadActive | 个 | ComponentId |
ck_server_metrics_DistributedFilesToInsert | ck_metrics_DistributedFilesToInsert | 个 | ComponentId |
ck_server_event_FailedSelectQuery | ck_event_FailedSelectQuery | 次 | ComponentId |
ck_server_event_FailedInsertQuery | ck_event_FailedInsertQuery | 次 | ComponentId |
ck_event_FileOpen | ck_event_FileOpen | 个 | ComponentId |
ck_server_event_Seek | ck_event_Seek | 次 | ComponentId |
ck_server_event_ReadBufferFromFileDescriptorRead | ck_event_ReadBufferFromFileDescriptorRead | 个 | ComponentId |
ck_server_event_ReadBufferFromFileDescriptorReadBytes | ck_event_ReadBufferFromFileDescriptorReadBytes | bytes | ComponentId |
ck_server_event_WriteBufferFromFileDescriptorWrite | ck_event_WriteBufferFromFileDescriptorWrite | 个 | ComponentId |
ck_server_event_WriteBufferFromFileDescriptorWriteFailed | ck_event_WriteBufferFromFileDescriptorWriteFailed | 个 | ComponentId |
ck_server_event_WriteBufferFromFileDescriptorWriteBytes | ck_event_WriteBufferFromFileDescriptorWriteBytes | bytes | ComponentId |
ck_server_event_ReadCompressedBytes | ck_event_ReadCompressedBytes | bytes | ComponentId |
ck_server_event_CompressedReadBufferBlocks | ck_event_CompressedReadBufferBlocks | 个 | ComponentId |
ck_server_event_CompressedReadBufferBytes | ck_event_CompressedReadBufferBytes | bytes | ComponentId |
ck_server_event_IOBufferAllocs | ck_event_IOBufferAllocs | 个 | ComponentId |
ck_server_event_IOBufferAllocBytes | ck_event_IOBufferAllocBytes | bytes | ComponentId |
ck_server_event_ArenaAllocChunks | ck_event_ArenaAllocChunks | 个 | ComponentId |
ck_server_event_ArenaAllocBytes | ck_event_ArenaAllocBytes | bytes | ComponentId |
ck_server_event_FunctionExecute | ck_event_FunctionExecute | 个 | ComponentId |
ck_server_event_TableFunctionExecute | ck_event_TableFunctionExecute | 个 | ComponentId |
ck_server_event_CreatedReadBufferOrdinary | ck_event_CreatedReadBufferOrdinary | 个 | ComponentId |
ck_server_event_DiskReadElapsedMicroseconds | ck_event_DiskReadElapsedMicroseconds | μs | ComponentId |
ck_server_event_DiskWriteElapsedMicroseconds | ck_event_DiskWriteElapsedMicroseconds | μs | ComponentId |
ck_server_event_NetworkReceiveElapsedMicroseconds | ck_event_NetworkReceiveElapsedMicroseconds | μs | ComponentId |
ck_server_event_NetworkSendElapsedMicroseconds | ck_event_NetworkSendElapsedMicroseconds | μs | ComponentId |
ck_server_event_ReplicatedPartFetches | ck_event_ReplicatedPartFetches | 个 | ComponentId |
ck_server_event_ReplicatedPartMerges | ck_event_ReplicatedPartMerges | 个 | ComponentId |
ck_server_event_InsertedBytes | ck_event_InsertedBytes | bytes | ComponentId |
ck_server_event_DelayedInsertsMilliseconds | ck_event_DelayedInsertsMilliseconds | ms | ComponentId |
ck_server_event_ZooKeeperInit | ck_event_ZooKeeperInit | 个 | ComponentId |
ck_server_event_ZooKeeperList | ck_event_ZooKeeperList | 个 | ComponentId |
ck_server_event_ZooKeeperCreate | ck_event_ZooKeeperCreate | 个 | ComponentId |
ck_server_event_ZooKeeperWaitMicroseconds | ck_event_ZooKeeperWaitMicroseconds | μs | ComponentId |
ck_server_event_ZooKeeperBytesSent | ck_event_ZooKeeperBytesSent | bytes | ComponentId |
ck_server_event_ZooKeeperBytesReceived | ck_event_ZooKeeperBytesReceived | bytes | ComponentId |
ck_server_event_ReadBackoff | ck_event_ReadBackoff | 个 | ComponentId |
ck_server_event_ReplicaPartialShutdown | ck_event_ReplicaPartialShutdown | 个 | ComponentId |
ck_server_event_SelectedParts | ck_event_SelectedParts | 个 | ComponentId |
ck_server_event_SelectedRanges | ck_event_SelectedRanges | 个 | ComponentId |
ck_server_event_SelectedMarks | ck_event_SelectedMarks | 个 | ComponentId |
ck_server_event_Merge | ck_event_Merge | 次 | ComponentId |
ck_server_event_MergedUncompressedBytes | ck_event_MergedUncompressedBytes | bytes | ComponentId |
ck_server_event_MergesTimeMilliseconds | ck_event_MergesTimeMilliseconds | ms | ComponentId |
ck_server_event_MergeTreeDataWriterRows | ck_event_MergeTreeDataWriterRows | 行 | ComponentId |
ck_server_event_MergeTreeDataWriterUncompressedBytes | ck_event_MergeTreeDataWriterUncompressedBytes | bytes | ComponentId |
ck_server_event_MergeTreeDataWriterCompressedBytes | ck_event_MergeTreeDataWriterCompressedBytes | bytes | ComponentId |
ck_server_event_MergeTreeDataWriterBlocks | ck_event_MergeTreeDataWriterBlocks | 个 | ComponentId |
ck_server_event_MergeTreeDataWriterBlocksAlreadySorted | ck_event_MergeTreeDataWriterBlocksAlreadySorted | 个 | ComponentId |
ck_server_event_CannotRemoveEphemeralNode | ck_event_CannotRemoveEphemeralNode | 个 | ComponentId |
ck_server_event_RegexpCreated | ck_event_RegexpCreated | 个 | ComponentId |
ck_server_event_ContextLock | ck_event_ContextLock | 个 | ComponentId |
ck_server_event_RWLockAcquiredReadLocks | ck_event_RWLockAcquiredReadLocks | 个 | ComponentId |
ck_server_event_RWLockAcquiredWriteLocks | ck_event_RWLockAcquiredWriteLocks | 个 | ComponentId |
ck_server_event_RWLockReadersWaitMilliseconds | ck_event_RWLockReadersWaitMilliseconds | ms | ComponentId |
ck_server_event_RealTimeMicroseconds | ck_event_RealTimeMicroseconds | μs | ComponentId |
ck_server_event_UserTimeMicroseconds | ck_event_UserTimeMicroseconds | μs | ComponentId |
ck_server_event_SystemTimeMicroseconds | ck_event_SystemTimeMicroseconds | μs | ComponentId |
ck_server_event_SoftPageFaults | ck_event_SoftPageFaults | 个 | ComponentId |
ck_server_event_OSIOWaitMicroseconds | ck_event_OSIOWaitMicroseconds | μs | ComponentId |
ck_server_event_OSCPUWaitMicroseconds | ck_event_OSCPUWaitMicroseconds | μs | ComponentId |
ck_server_event_OSCPUVirtualTimeMicroseconds | ck_event_OSCPUVirtualTimeMicroseconds | 个 | ComponentId |
ck_server_event_OSReadBytes | ck_event_OSReadBytes | bytes | ComponentId |
ck_server_event_OSWriteBytes | ck_event_OSWriteBytes | bytes | ComponentId |
ck_server_event_OSReadChars | ck_event_OSReadChars | 个 | ComponentId |
ck_server_event_OSWriteChars | ck_event_OSWriteChars | 个 | ComponentId |
ck_server_event_CreatedHTTPConnections | ck_event_CreatedHTTPConnections | 个 | ComponentId |
ck_server_event_QueryProfilerSignalOverruns | ck_event_QueryProfilerSignalOverruns | 个 | ComponentId |
ck_server_event_CreatedLogEntryForMerge | ck_event_CreatedLogEntryForMerge | 个 | ComponentId |
ck_server_async_metrics_NumberOfTables | ck_async_metrics_NumberOfTables | 个 | ComponentId |
ck_server_async_metrics_NumberOfDatabases | ck_async_metrics_NumberOfDatabases | 个 | ComponentId |
ck_server_async_metrics_MaxPartCountForPartition | ck_async_metrics_MaxPartCountForPartition | 个 | ComponentId |
ck_server_async_metrics_ReplicasSumQueueSize | ck_async_metrics_ReplicasSumQueueSize | 个 | ComponentId |
ck_server_async_metrics_ReplicasMaxMergesInQueue | ck_async_metrics_ReplicasMaxMergesInQueue | 个 | ComponentId |
ck_server_async_metrics_MemoryShared | ck_async_metrics_MemoryShared | bytes | ComponentId |
ck_server_async_metrics_MemoryCode | ck_async_metrics_MemoryCode | bytes | ComponentId |
ck_server_async_metrics_ReplicasMaxAbsoluteDelay | ck_async_metrics_ReplicasMaxAbsoluteDelay | 个 | ComponentId |
ck_server_async_metrics_ReplicasMaxQueueSize | ck_async_metrics_ReplicasMaxQueueSize | 个 | ComponentId |
ck_server_async_metrics_MemoryVirtual | ck_async_metrics_MemoryVirtual | bytes | ComponentId |
ck_server_async_metrics_MarkCacheBytes | ck_async_metrics_MarkCacheBytes | bytes | ComponentId |
ck_server_async_metrics_CompiledExpressionCacheCount | ck_async_metrics_CompiledExpressionCacheCount | 个 | ComponentId |
ck_server_async_metrics_ReplicasSumMergesInQueue | ck_async_metrics_ReplicasSumMergesInQueue | 个 | ComponentId |
ck_server_async_metrics_UncompressedCacheBytes | ck_async_metrics_UncompressedCacheBytes | 个 | ComponentId |
ck_async_metrics_ReplicasSumInsertsInQueue | ck_async_metrics_ReplicasSumInsertsInQueue | 个 | ComponentId |
ck_server_async_metrics_MarkCacheFiles | ck_async_metrics_MarkCacheFiles | 个 | ComponentId |
ck_server_async_metrics_MemoryDataAndStack | ck_async_metrics_MemoryDataAndStack | bytes | ComponentId |
ck_server_async_metrics_MemoryResident | ck_async_metrics_MemoryResident | bytes | ComponentId |
ck_server_async_metrics_ReplicasMaxInsertsInQueue | ck_async_metrics_ReplicasMaxInsertsInQueue | 个 | ComponentId |
ck_server_async_metrics_ReplicasMaxRelativeDelay | ck_async_metrics_ReplicasMaxRelativeDelay | 个 | ComponentId |
ck_server_async_metrics_UncompressedCacheCells | ck_async_metrics_UncompressedCacheCells | 个 | ComponentId |
IMPALA
IMPALA_CATALOG
表十九 IMPALA组件监控指标说明1
指标英文名称(metric name) | 指标中文名称 | 单位 | 维度 |
---|---|---|---|
impala_catalog_impala_thrift_server_CatalogService_connections_in_use | 当前活跃连接数 | 个 | ComponentId |
impala_catalog_thread_manager_total_threads_created | catalogd进程线程创建数量 | 个 | ComponentId |
impala_catalog_memory_total_used | catalogd进程内存总使用量 | byte | ComponentId |
impala_catalog_memory_rss | catalogd进程物理内存使用量 | byte | ComponentId |
IMPALA_STATE_STORE
表二十 IMPALA组件监控指标说明2
指标英文名称(metric name) | 指标中文名称 | 单位 | 维度 |
---|---|---|---|
impala_statestore_thread_manager_total_threads_created | statestored进程线程创建数量 | 个 | ComponentId |
impala_statestore_memory_total_used | statestored进程内存总使用量 | byte | ComponentId |
impala_statestore_memory_rss | statestored进程物理内存使用量 | byte | ComponentId |
IMPALA_IMPALAD
表二十一 IMPALA组件监控指标说明3
指标英文名称(metric name) | 指标中文名称 | 单位 | 维度 |
---|---|---|---|
impalad_metrics_impala_server_query_durations_ms_90th | 已完成查询操作耗时时间的90分位点 | ms | ComponentId |
impalad_metrics_impala_server_query_durations_ms_99_9th | 已完成查询操作耗时时间的99.9分位点 | ms | ComponentId |
impalad_metrics_impala_server_ddl_durations_ms_90th | 已完成DDL操作耗时时间的90分位点 | ms | ComponentId |
impalad_metrics_impala_server_ddl_durations_ms_99_9th | 已完成DDL操作耗时时间的99分位点 | ms | ComponentId |
impalad_metrics_impala_thrift_server_backend_connections_in_use | ThriftServer后端当前活跃连接数 | 个 | ComponentId |
impalad_metrics_thread_manager_total_threads_created | impalad进程线程创建数量 | 个 | ComponentId |
impalad_metrics_memory_total_used | impalad进程内存总使用量 | byte | ComponentId |
impalad_metrics_impala_server_num_fragments | 已完成fragment总数 | 个 | ComponentId |
KUDU
KUDU_TSERVER
表二十二 KUDU组件监控指标说明1
指标英文名称(metric name) | 指标中文名称 | 单位 | 维度 |
---|---|---|---|
kudu_tserver_inbound_connections_socket_stats_pacing_rate_max | tserver网络传入每毫秒流量最大值 | kps | ComponentId |
kudu_tserver_inbound_connections_socket_stats_pacing_rate_min | tserver网络传入每毫秒流量最小值 | kps | ComponentId |
kudu_tserver_inbound_connections_socket_stats_rtt_max | tserver网络传入往返时间最大值 | ms | ComponentId |
kudu_tserver_inbound_connections_socket_stats_rtt_min | tserver网络传入往返时间最小值 | ms | ComponentId |
kudu_tserver_inbound_connections_socket_stats_rttvar_max | tserver网络传入往返时间平均偏差最大值 | ms | ComponentId |
kudu_tserver_inbound_connections_socket_stats_rttvar_min | tserver网络传入往返时间平均偏差最小值 | ms | ComponentId |
kudu_tserver_outbound_connections_socket_stats_pacing_rate_max | tserver网络传出每毫秒流量最大值 | kps | ComponentId |
kudu_tserver_outbound_connections_socket_stats_pacing_rate_min | tserver网络传出每毫秒流量最小值 | kps | ComponentId |
kudu_tserver_outbound_connections_socket_stats_rtt_max | tserver网络传出往返时间最大值 | ms | ComponentId |
kudu_tserver_outbound_connections_socket_stats_rtt_min | tserver网络传出往返时间最小值 | ms | ComponentId |
kudu_tserver_outbound_connections_socket_stats_rttvar_max | tserver网络传出往返时间平均偏差最大值 | ms | ComponentId |
kudu_tserver_outbound_connections_socket_stats_rttvar_min | tserver网络传出往返时间平均偏差最小值 | ms | ComponentId |
kudu_tserver_active_scanners | 处于active状态的scanner数量 | 个 | ComponentId |
kudu_tserver_block_cache_usage | tserver进程块缓存占用的内存 | byte | ComponentId |
kudu_tserver_cpu_stime | tserver进程的总系统 CPU 时间 | s | ComponentId |
kudu_tserver_cpu_utime | tserver进程的用户 CPU 总时间 | s | ComponentId |
kudu_tserver_glog_error_messages | tserver进程中发出的 ERROR 级日志消息数 | 次 | ComponentId |
kudu_tserver_memrowset_size | 内存中存储行 | 行 | ComponentId |
kudu_tserver_num_rowsets_on_disk | 硬盘中存储行 | 行 | ComponentId |
kudu_tserver_op_apply_queue_length_percentile_99 | 操作队列长度的99分位数 | 个 | ComponentId |
kudu_tserver_op_apply_queue_time_percentile_99 | 操作在队列的等待时间的99分位数 | ms | ComponentId |
kudu_tserver_op_apply_run_time_percentile_99 | 操作执行时间的99分位数 | ms | ComponentId |
kudu_tserver_reactor_load_percent_percentile_99 | reactor线程负载的99分位数 | 个 | ComponentId |
kudu_tserver_rows_deleted | 节点删除 Row 的数量 | 行 | ComponentId |
kudu_tserver_rows_inserted | 节点插入 Row 的数量 | 行 | ComponentId |
kudu_tserver_rows_updated | 节点更新 Row 的数量 | 行 | ComponentId |
kudu_tserver_rows_upserted | 节点 Upserted Row 的数量 | 行 | ComponentId |
kudu_tserver_scanner_duration_percentile_99 | scanner耗费时间的99分位数 | ms | ComponentId |
kudu_tserver_tablets_num_failed | 失败的 tablet 个数 | 个 | ComponentId |
kudu_tserver_tablets_num_running | 当前正在运行的 tablet 个数 | 个 | ComponentId |
kudu_tserver_tablets_num_shutdown | 当前关闭的 tablet 个数 | 个 | ComponentId |
kudu_tserver_tablets_num_stopped | 当前停止的 tablet 个数 | 个 | ComponentId |
kudu_tserver_tcmalloc_current_total_thread_cache_bytes | tserver线程TCMalloc正在使用的内存 | byte | ComponentId |
kudu_tserver_threads_running | tablet server线程数 | 个 | ComponentId |
status | 进程运行状态 | 状态 | |
proc_cpu_usage | 进程cpu利用率 | % | |
proc_mem_usage | 进程内存利用率 | % |
KUDU_MASTER
表二十三 KUDU组件监控指标说明2
指标英文名称(metric name) | 指标中文名称 | 单位 | 维度 |
---|---|---|---|
kudu_master_data_dirs_failed | 失败的数据目录个数 | 个 | ComponentId |
kudu_master_data_dirs_full | full状态的数据目录个数 | 个 | ComponentId |
kudu_master_glog_error_messages | master进程中发出的 ERROR 级日志消息数 | 次 | ComponentId |
kudu_master_glog_warning_messages | master进程中发出的 WARNING 级日志消息数 | 次 | ComponentId |
kudu_master_rpc_connections_accepted | master进程RPC请求接收的数量 | 个 | ComponentId |
kudu_master_rpc_incoming_queue_time_percentile_99 | master进程RPC队列的等待时间的99分位数 | ms | ComponentId |
kudu_master_rpcs_queue_overflow | master进程RPC队列溢出次数 | 次 | ComponentId |
kudu_master_rpcs_timed_out_in_queue | master进程RPC等待超时 | ms | ComponentId |
kudu_master_threads_running | master 线程数 | 个 | ComponentId |
kudu_master_inbound_connections_socket_stats_pacing_rate_max | master进程网络传入每毫秒流量最大值 | kps | ComponentId |
kudu_master_inbound_connections_socket_stats_pacing_rate_min | master进程网络传入每毫秒流量最小值 | kps | ComponentId |
kudu_master_inbound_connections_socket_stats_rtt_max | master进程网络传入每毫秒流量最小值 | ms | ComponentId |
kudu_master_inbound_connections_socket_stats_rtt_min | master进程网络传入往返时间最小值 | ms | ComponentId |
kudu_master_inbound_connections_socket_stats_rttvar_max | master进程网络传入往返时间平均偏差最大值 | ms | ComponentId |
kudu_master_inbound_connections_socket_stats_rttvar_min | master进程网络传入往返时间平均偏差最小值 | ms | ComponentId |
kudu_master_outbound_connections_socket_stats_pacing_rate_max | master进程网络传出每毫秒流量最大值 | kps | ComponentId |
kudu_master_outbound_connections_socket_stats_pacing_rate_min | master进程网络传出每毫秒流量最小值 | kps | ComponentId |
kudu_master_outbound_connections_socket_stats_rtt_max | master进程网络传出往返时间最大值 | ms | ComponentId |
kudu_master_outbound_connections_socket_stats_rtt_min | master进程网络传出往返时间最小值 | ms | ComponentId |
kudu_master_outbound_connections_socket_stats_rttvar_max | master进程网络传出往返时间平均偏差最大值 | ms | ComponentId |
kudu_master_outbound_connections_socket_stats_rttvar_min | master进程网络传出往返时间平均偏差最小值 | ms | ComponentId |