混部监控
更新时间:2022-03-30
名词解释
容器引擎(CCE)支持通过“监控日志 > 混部监控”查看集群混部大盘指标,主要指标包括节省量、实际利用率、驱逐率、压制率、离线可用量以及离线理论可用量。
名称 | 含义 |
---|---|
节省量 | 累计离线作业资源使用量(usage) |
实际利用率 | 实际利用率(actual-utilization)=使用量(usage)/分配量(request) |
驱逐率 | 驱逐率=被驱逐的Pod数/总离线Pod数 |
压制率 | 压制率=被压制的Pod数/总离线Pod数 |
离线可用量 | 离线可用量=离线总用量(total)-离线使用量(usage) |
离线理论可用量 | 假设集群节点全部开启混部的理想情况下:离线理论可用量=离线总用量(total)-离线使用量(usage) |
前提条件
- 已成功创建集群。
- 已安装CCE Hybrid Manager组件。
- 已为节点或节点组开启混部调度。
操作步骤
按以下步骤在控制台查看混部监控:
- 登录容器引擎CCE控制台。
- 在左侧导航栏中选择集群列表。
- 在“集群列表”页面单击目标集群。
- 在左侧导航栏中选择“监控日志 > 混部监控”。
可查看近1天、7天、15天、30天的累计资源节省量以及集群中开启混部的节点数量。
也可查看当前时刻资源节省量,即当前离线作业资源的总使用量。
节省量:累计离线作业资源使用量(usage)。
可查看集群资源的实际利用率、驱逐率和压制率,了解资源的使用效率以及离线作业的调度情况。
实际利用率(actual-utilization)=使用量(usage)/分配量(request)。
驱逐率=被驱逐的Pod数/总离线Pod数。
压制率=被压制的Pod数/总离线Pod数。
可查看集群资源的用量分布,包括资源的总量分布、可用量和使用量。
离线可用量=离线总用量(total)-离线使用量(usage)。
假设集群节点全部开启混部的理想情况下:
离线理论可用量=离线总用量(total)-离线使用量(usage)。
可查看集群资源的Pod数量分布。