千帆大模型平台 ModelBuilder 千帆大模型平台 ModelBuilder包含预置服务(System)、定制服务(Custom)2种监控对象类型,实例监控包含的监控指标列表如下: 预置服务(System) 指标英文名称(metric name) 指标中文名称 单位 维度 备注 SystemInternalErrorCode 系统内部错误 次 error_code,serviceId,appId
部分维度查询最新指标数据 接口描述 可根据多维度、多指标、多统计数据获取云产品指定时刻指标监控数据、站点监控数据或您推送的自定义监控数据。 接口限制 每次查询的维度组合数量不超过100个。 每次查询的指标名称数量不超过30个。
通用说明 API调用遵循HTTP协议,各Region采用不同的域名,具体域名为bcm.{region}.baidubce.com。 数据交换格式为JSON,所有request/response body内容均采用UTF-8编码。 API认证机制 所有API的安全认证一律采用Access Key与请求签名机制。 Acce
文件系统请连接集群虚机后使用df命令查看,其他维度可通过云监控BCM-云产品监控-MapReduce BMR中查看。服务名、组件名请使用大写字母表示。
步骤四:在 CProm 中创建告警策略 登陆百度智能云 Prometheus 监控控制台 。 在监控实例列表中选择目标实例名称进入实例详情页面,左侧导航栏选择告警配置,点击 创建告警 。 在创建告警页面中,根据业务需求进行相应配置,在配置策略模块中选择刚刚创建的通知策略名称。更多告警配置详情可参见 告警配置 。 点击 创建 按钮,完成告警配置。
获取BEC虚机服务监控 接口描述 本接口用于获取BEC虚机服务监控。 请求结构 Plain Text 复制 1 GET /v1/monitor/service/vm/{serviceId}?
云数据库 DocDB for MongoDB 云数据库 DocDB for MongoDB包含2种监控对象类型,分别是:副本集实例(Replica)和分片集实例(Shard),各个类型包含的监控指标列表如下: 副本集实例(Replica) 指标英文名称(metric name) 指标中文名称 单位 维度 备注 DeletedDocumentCount 删除文档数 个/秒 InstanceId、NodeId
1.术语和定义 1.1 Prometheus监控服务(CProm): 是指百度智能云为您提供的一个轻量、稳定、高可用的Prometheus监控服务,继承开源Prometheus监控能力的同时还提供高可用的Prometheus监控服务、自助数据源接入、开源可视化的Grafana以及云监控告警的能力,为您减少用户的开发及运维成本。 1.2 单实例: 单位数量为1的Prometheus实例。
监控指标说明 监控面板 指标 说明 集合通信带宽监控(通信组维度) 集合通信带宽(avg/max) 训练过程中,通信组维度的集合通信带宽平均值/最大值。
获取BEC虚机实例监控 接口描述 本接口用于获取BEC虚机实例监控。 请求结构 Plain Text 复制 1 GET /v1/monitor/vm/{vmId}?