使用Prometheus监控集群 概述 本文档介绍如何在 CCE 集群中启用百度智能云 Prometheus 监控服务(CProm),以实时监控集群和容器的健康状况,查看可视化的 Grafana 监控数据大盘,并按需配置联系人接收监控告警、配置采集任务抓取自定义监控指标。 百度智能云 Prometheus 监控介绍 百度智能云 Prometheus 监控服务致力于提供轻量、稳定、高可用的服务。
取消接入后,私有网络中的集群监控数据将无法上报到监控实例。 操作步骤 进入“产品服务>容器> Prometheus 监控服务”,在实例列表中选中需要接入网络的实例,点击实例名称进入“实例信息”页。 点击左侧“接入网络”,进入接入网络设置页。 在网络列表页中找到需要取消接入的网络,在操作列中点击【取消接入】,按照提示查看取消接入相关信息,点击确认。
在左侧导航栏中单击 监控管理 。 实例监控分为 集群监控 和 分片监控、代理监控、节点监控 页面。 6.可筛选特定时间周期、性能指标计算方式后查看指标监控数据。 目前PegaDB支持的 监控指标项 。 问题排查 针对CPU打满、内存打满、流量打满等常见性能问题,提供排查方案,可点击相关文档链接进行查看。
监控报警 查看监控 您可以进入 BCM 控制台查看磁盘监控数据,也可以进入 CDS 磁盘详情页面或 BCC 实例详情页面查看磁盘监控数据。
采集配置相关接口 创建自定义采集任务 描述 创建CProm监控实例的自定义采集任务。 请求结构 Plain Text 复制 1 POST /v2/scrape_job?
实例监控架构 BCM查看监控指标 进入BCM产品页面 进入BCM产品页面 点击展开左侧『云产品监控』 选择容器实例 BCI 展开『云产品监控』后,选择『容器实例 BCI』 选择容器实例所在的 Region 选择查看容器组粒度的监控指标,或者容器粒度监控指标 点击要查看的容器组/容器 更多信息,请参考 云监控BCM操作指南 。
查看实例监控指标 BCI支持自动采集实例的CPU、内存、网络和磁盘等相关监控指标,并可通过BCM(百度云监控)进行查看。 监控指标概述 BCI支持查看的监控指标如下: CPU CPU使用率:指标采集周期内,平均CPU使用率(单位:%)。CPU处于非IDLE状态即使用,CPU使用率上限为申请的CPU核数*100%。
查看实例监控指标 BCI支持自动采集实例的CPU、内存、网络和磁盘等相关监控指标,并可通过BCM(百度云监控)进行查看。 监控指标概述 BCI支持查看的监控指标如下: CPU CPU使用率:指标采集周期内,平均CPU使用率(单位:%)。CPU处于非IDLE状态即使用,CPU使用率上限为申请的CPU核数*100%。
百度通过跨地域实时监控和受众感知评估了解客户、帮助企业主。
服务监控 服务大盘展示服务性能指标,开发人员或者运维人员通过服务大盘了解推荐服务健康度。全方位的服务监控包含了接口调用、接口异常、服务健康度、用户交互等统计数据,保障核心指标数据监控无死角。 概述 服务调用监控展示了服务具体的指标数据,从调用统计刻画服务,如调用次数、调用成功次数、调用失败次数、调用失败率和QPS峰值等核心指标,并可以查询指标趋势。 前提条件 1应用已经创建完成。