集群监控
更新时间:2026-03-28
集群监控为用户提供集群级性能指标可视化与健康状态管理,支持多时间范围查询、指标筛选、聚合计算与报警事件查看,帮助用户实时掌握集群运行状况,快速定位性能瓶颈与异常问题。
时间范围选择
| 操作项目 | 说明 |
|---|---|
| 快捷时间选项 | 支持『1 小时 / 1 天 / 7 天』快速切换。 |
| 自定义时间范围 | 通过时间选择器精确设置起止时间(示例:2026-01-12 00:19:13 – 2026-01-12 01:19:13),最长支持查询 40 天内数据。 |
| 数据刷新 | 切换时间范围后,监控图表自动刷新,展示对应时段指标数据。 |
集群健康状态提示
| 提示 | 说明 |
|---|---|
| 告警配置 | 报警策略配置参见:报警策略 |
| 健康状态条 | 顶部绿色提示条展示『当前集群状态健康,暂无报警事件』;若存在报警,将展示『当前集群存在 X 条报警事件』,并提供『报警详情』入口。 |
| 报警详情 | 点击后跳转至报警事件列表,展示报警时间、指标、等级与处理状态。 |
指标聚合与展示设置
| 设置 | 说明 |
|---|---|
| 性能指标聚合方式 | 下拉选择指标计算方式,支持『平均值 / 最大值 / 最小值』。 |
| 单行展示数 | 设置图表区域每行展示的指标卡片数量,可选 2/3/4,默认 2。 |
指标筛选与分类
- 指标筛选:点击『指标筛选』按钮,弹窗展示所有可监控指标,支持按类别勾选 / 取消,自定义需要展示的指标。
- 左侧指标分类树:
| 一级分类 | 二级分类 |
|---|---|
| 集群监控 | 服务监控 |
| 负载均衡监控 |
监控图表展示
集群监控指标详情参见:集群监控指标
核心操作流程
查看集群监控数据
- 进入『监控详情 → 集群监控』页面。
- 选择时间范围:点击『1 小时 / 1 天 / 7 天』或自定义时间范围。
- 选择聚合方式:在『性能指标』下拉框中选择平均值 / 最大值 / 最小值。
- 筛选指标:点击『指标筛选』,勾选需要查看的指标类别与具体指标。
- 查看图表:在右侧图表区域查看指标趋势曲线,悬浮查看具体数值,缩放分析细节。
处理报警事件
- 若顶部状态条提示存在报警事件,点击『报警详情』。
- 在报警列表中查看报警指标、等级、触发时间与当前状态。
- 结合监控图表定位异常时间点与指标变化,进行问题排查与处理。
- 处理完成后,报警状态将自动更新或由用户手动确认。
约束与注意事项
- 数据保存周期:监控数据默认保存 40 天,超过期限将自动清理。
- 指标延迟:监控数据存在约 1 分钟延迟,实时性为近似实时。
- 性能影响:频繁切换大时间范围(如 7 天)或大量指标,可能导致页面加载缓慢,建议按需筛选。
典型使用场景
| 使用场景 | 说明 |
|---|---|
| 故障排查 | 收到报警后,结合报警时间点与监控图表,分析异常指标关联关系,快速定位故障原因。 |
| 容量规划 | 查看磁盘空间使用率、连接数趋势,预测资源瓶颈,提前规划扩容。 |
常见问题(FAQ)
Q1:监控数据为什么看不到最新 1 分钟的数据?
A:监控数据存在约 1 分钟的采集与聚合延迟,属于正常现象,可稍后刷新查看。
Q2:可以自定义监控图表展示的指标顺序吗?
A:当前版本暂不支持自定义指标顺序,指标按类别默认展示,可通过『指标筛选』控制显示 / 隐藏。
Q3:如何导出监控数据?
A:当前版本暂不支持直接导出数据,可通过截图或复制图表数据进行分析。
评价此篇文章
