使用Prometheus监控集群
概述
本文档介绍如何在 CCE 集群中启用百度智能云 Prometheus 监控服务(CProm),以实时监控集群和容器的健康状况,查看可视化的 Grafana 监控数据大盘,并按需配置联系人接收监控告警、配置采集任务抓取自定义监控指标。
百度智能云 Prometheus 监控介绍
百度智能云 Prometheus 监控服务致力于提供轻量、稳定、高可用的服务。保留原生 Prometheus 的特性,支持采集自定义指标,支持千万级指标上报,提供基于 Grafana 的优秀可视化能力和预置默认面板,提供稳定的告警能力。 与自建 Prometheus 环境相比,您无需手工下载、配置 Prometheus 环境,无需考虑维护海量数据的存储成本。同时,Prometheus 监控兼容开源 Prometheus 的接口以及社区 Exporter 生态,提供免搭建、免运维的 Prometheus 集成环境,减少开发及运维成本。
说明
- 百度智能云 Prometheus 的详细介绍,请参见什么是Prometheus监控。
- 启用 Prometheus 后,Prometheus 监控将采集集群中的容器监控指标。默认采集的指标均为百度智能云 Prometheus 基础指标,在默认情况下不会产生费用。但是,若您调整了指标存储时长,或上报了自定义指标,将会产生额外计费。关于百度智能云 Prometheus 的计费说明,请参见计费说明。
接入 Prometheus 监控实例
前提条件
- 已开通容器引擎 CCE、百度智能云 Prometheus 服务,您可以登录 Prometheus服务控制台 确认是否开通。
- 已成功创建 CCE 集群,详情请参见 创建CCE集群。
CCE 集群接入 CProm 监控实例
您可以通过 容器引擎控制台 进入集群的 Prometheus 监控页面,完成 CProm 监控实例接入。
导航路径:容器引擎 CCE->集群列表->目标集群->运维与管理->Prometheus 监控
步骤 1:进入目标集群
在 集群列表 页面,单击目标集群,进入集群管理页面。
步骤 2:打开 Prometheus 监控页面
选择 【运维与管理】 -> 【Prometheus 监控】。
步骤 3:接入监控实例
单击 【立即开启】,在接入 CProm 监控弹窗中,选择与 CCE 集群相同地域的已有监控实例,或新建监控实例,然后单击 【确认】 完成配置。
步骤 4:等待组件安装完成
接入 CProm 监控实例后,控制台会自动安装组件并检查监控大盘。安装完成后,您可以切换对应页签查看监控数据。

说明
- 接入 CProm 监控实例,系统会默认在 CCE 集群安装监控组件。该组件用于采集 CCE 集群的各项监控指标,安装该组件会占用 CCE 集群一定资源,建议集群预留0.2核200Mi以上的资源,防止因资源不足导致实例接入失败。
- 您也可以选择登录Prometheus服务控制台选择 CProm 监控实例关联 CCE 集群,详情参考CProm监控实例关联集群。
- 接入 CProm 监控实例后会默认开启采集规则,如果您想要采集自定义业务指标,支持通过创建自定义采集任务,来满足您采集自定义指标需求,详情请参见采集配置。
查看监控面板
在容器引擎控制台的 Prometheus 监控页面,切换页签选择需要查看系统预置的 Grafana 监控大盘,获取相应的监控数据。监控面板支持设置查询的时间段,并指定刷新方式(手动刷新、自动刷新)。

配置 Prometheus 监控告警
您可以为监控指标创建告警,在满足告警条件时通过邮件、短信、钉钉等渠道实时发送告警通知,主动帮助您发现异常。您可以在托管 Prometheus 的告警中心配置集群相关告警。
导航路径:Prometheus 监控服务->实例列表->目标实例->实例监控->告警配置
步骤 1:进入 Prometheus 告警中心
进入目标托管 Prometheus 实例后,选择 【实例监控】 -> 【告警配置】,进入告警中心。若您已在监控大盘中,也可以通过 设置监控告警 进入同一告警中心。
步骤 2:选择模板并配置告警策略
在 【告警配置】 页面单击 【创建告警】,根据业务需要填写以下配置项:
| 参数 | 必填 | 说明 |
|---|---|---|
| 告警模板 | 否 | 可选择 使用模板 或 不使用模板。 |
| 选择模板 | 否 | 选择 使用模板 时,从下拉列表中选择预置模板或已有模板。 |
| 告警名称 | 否 | 选择 不使用模板 时必填,用于标识当前告警策略。 |
| 告警规则(PromQL) | 否 | 选择 不使用模板 时必填,用于定义告警触发条件。 |
| 持续时间 | 否 | 选择 不使用模板 时必填,用于设置满足条件后持续多长时间触发告警。 |
| 告警等级 | 否 | 选择 不使用模板 时必填,用于设置告警严重程度。 |
| 告警内容 | 否 | 可按需填写告警描述,并配置标签和注解信息。 |
| 通知策略 | 是 | 可选择已有通知策略,或新建通知策略。 |
| 通知方式 | 否 | 新建通知策略时,可选择邮件、短信、电话、企业微信、钉钉、飞书或自定义 Webhook。 |
| 通知对象 | 否 | 新建通知策略时,选择对应的通知接收对象。 |
配置完成后,单击 【确定】 提交。字段说明可参考 告警配置。

评价此篇文章
