采集python GC指标 背景 OTel Python Runtime Metrics 默认没有 GC 次数、平均 GC 耗时的指标。 因此需要通过 自定义采集 来补充。
支持自定义监控指标采集 百舸对接百度智能云 Prometheus监控服务(CProm),通过自定义端口的方式支持分布式训练自定义指标的采集,用户只需在代码中暴露相关指标,并且在创建任务时,显式申明指标的端口以及路径,平台可自动将该路径下的指标数据自动采集到资源池关联的 Cprom,后续用户在 Grafana配置监控大盘查询。
Dimension:BlbId、BlbPortType、BlbPort 服务器组监控维度Dimension:BlbId、sgId、sgPort IP组监控维度Dimension:BlbId、igId、igPolicyId 指标英文名称(Metric name) 指标中文名称 单位 维度 备注 ActiveConnCount 活跃连接数 个 BlbId、BlbPortType、BlbPort AverageResponseTime
聚合(默认) 消费者指标 应用 = 请求类型 遍历(默认),=,!=,聚合 接口 遍历(默认),=,!=,聚合 实例 遍历,=,!=,聚合(默认) 内部函数指标 应用 = 接口 遍历(默认),=,!=,包含,不包含,聚合 实例 遍历,=,!=,聚合(默认) JVM监控 应用 = 实例 遍历(默认),=,!=,聚合 异常监控 应用 = 请求类型 遍历,=,!
自定义监控及扩缩容指标 如果您需要根据业务逻辑来设置一些自定义的监控指标,只需在代码中配置定期上报自定义指标的逻辑,通过百度云监控服务配置采集任务收集监控数据,配置监控大盘后即可在平台查看自定义的监控指标。 准备工作 准备Cprom监控实例 在 百舸平台> 自运维资源池或全托管资源池 > 资源池详情中 ,为在线服务所属资源池关联接入Cprom监控实例。若资源池已关联监控实例,可跳过此步骤。
通过标签页选择查看集群监控、计算组监控或业务监控。支持按照时间进行筛选。 集群监控 集群监控指标支持按照性能指标和单行展示数就行筛选。
集群监控指标 类别 监控项 监控项一级分类(中英文) 监控项二级分类(中英文) 中文名称 单位中英文 含义中文 采集频率 集群监控 服务监控 集群连接数量 个 集群连接数量 60s Master节点宕机数量 个 Master节点宕机数量 60s Segment节点宕机数量 个 Segment节点宕机数量 60s 集群活跃连接数量 个 集群活跃连接数量 60s 负载均衡监控 负载均衡网络输入流量 Bytes
指标监控 概述 本章讲述如何查看集群指标监控和详细说明指标监控。 操作步骤 登录RocketMQ控制台,在侧边导航选择 集群>集群列表 。 单击集群名称后在侧边导航选择 集群监控 ,查看指标监控。 监控包括集群监控、节点监控、主题监控、消费组监控。
节点监控指标 Master节点监控 类别 监控项 监控项一级分类 监控项二级分类 中文名称 单位中英文 含义中文 采集频率 Master节点监控 CPU 监控 CPU 使用率 % CPU 使用率 60s CPU 空闲率 % CPU 空闲率 60s CPU 等待 IO 时长占比 % CPU 等待IO时长占比 60s CPU 用户使用时长占比 % CPU 用户使用时长占比 60s CPU 系统使用时长占比
查看实例监控指标 BCI支持自动采集实例的CPU、内存、网络和磁盘等相关监控指标,并可通过BCM(百度云监控)进行查看。 监控指标概述 BCI支持查看的监控指标如下: CPU CPU使用率:指标采集周期内,平均CPU使用率(单位:%)。CPU处于非IDLE状态即使用,CPU使用率上限为申请的CPU核数*100%。