云虚拟主机 BCH 云虚拟主机(BCH)只包含实例监控(Instance)1种监控对象类型,实例监控包含的监控指标列表如下: 实例监控(Instance) 指标英文名称(Metric name) 指标中文名称 单位 维度 LatencyInMilliseconds 平均响应时间 毫秒 AppId ReadInBytes 磁盘读IO使用量 Bytes AppId RecvBytes 流入流量 Bytes
专属实例解绑标签 专属实例解绑标签 解绑专属服务器上的专属实例标签。 请求结构 PUT /v{version}/dedicatedHost/instance/{instanceId}/tag?
对于已经创建的专属实例,如果前期分配的计算资源不符合要求,可以执行调整配置操作,在专属服务器还存在可用的计算资源时,可以为专属实例分配更多资源。也可以将当前计算资源调低,但请注意本地磁盘资源不允许降配只能够升配。 对磁盘进行扩容后,可能出现的扩容结果包括: 对于Windows系统,扩容后,已分配磁盘数据不丢失,扩容部分会追加到已分配磁盘或者保持空白。
数据仓库 DORIS 数据仓库 DORIS 只包含实例监控(Instance)1种监控对象类型,实例监控包含的监控指标列表如下: 实例监控(Instance) 指标英文名称(metric name) 指标中文名称 单位 维度 备注 BackendDeadNum ComputeNode宕机节点数 个 ProductRegion,DeployId,InstanceId,ProductName BrokerDeadNum
监控趋势图 成功安装BCM-Agent后,BCM-Agent会自动采集监控数据,用户可以通过云服务器监控页来查看监控数据趋势图,也可以在BCM界面进行指标查看,具体操作请参考 查看云产品监控数据 。
监控项 说明 训练吞吐(tokens/卡/秒) 每张GPU卡每秒能够处理的tokens数量 训练吞吐(B tokens/台/天) 每台服务器每天能够处理的tokens数量(Billion) 训练分阶段耗时 提供训练过程中每次迭代中不同操作(计算时间/IO时间/通信时间等)的耗时统计(最小值以及最大值),便于对比分析,定位异常。
关联集群接口 CProm监控实例关联CCE集群 描述 CProm监控实例关联绑定CCE集群 请求结构 PUT /v2/instance/{instanceId}?
集群监控 概述 集群监控提供了集群监控、节点监控、主题监控以及消费监控四种维度的监控信息。 集群监控 登录 消息服务 for Kafka控制台 进入集群列表页面,点击需要操作的集群。 在左侧选择 集群监控 ,可以看到集群中的监控指标展示。 集群监控默认展示生产消息速率、生产消息流量、消费消息流量、主题总数等7项监控指标。如果需要查看更多的监控指标,点击右上角的 指标筛选 按钮进行指标的选择。
为您提供稳定可靠、简单易用的 Prometheus 监控服务,降低自建和维护成本,提高开发和运维效率。 说明: 关于开源Prometheus的更多信息可见 Prometheus 官方文档 。 核心概念 监控实例 监控实例(Prometheus监控实例)是托管 Prometheus 服务的管理单元。
监控接入 一、百度智能云官方进入 Prometheus 监控服务(cprom) 1、百度智能云搜索监控,找到Prometheus 监控服务 2、点击立即使用,进入服务主页 二、购买配置cprom 1、登录百度智能云【Prometheus 监控】服务界面,配置cprom实例 2、填写实例名称,实例类型选择【云产品型】,Grafana一个账户只有一个,若没有就点击【新建 grafana服务】创建即可,