监控展示
更新时间:2024-08-20
目前基于node-exporter、kube-state-metrics、dcgm-exporter、nvidia-exporter等基本采集agent,我们提供一系列基本的dashborad展示模板,用户可根据实际情况自行导入、使用和修改,若是客户自己agent采集的指标,需独自配置dashborad。
百舸相关dashboards已包含显卡监控,不需要导入gpu-dashboards,gpu-dashboards是执行了GPU监控采集才有用。一般k8s-dashboards均要导入,如果部署了百舸组件就导入baige-dashboards,如果未部署百舸组件且已部署GPU监控采集,则导入gpu-dashboards。
下面是dashborad导入说明:
1、下载模板
下载地址 https://aicp-public.bj.bcebos.com/cprom-monitor/dashboards.tar
2、创建文件夹
3、导入模板
两种方式,一是直接上传json文件,二是拷贝json文件内容
选择对应文件夹,然后点击导入