附录-监控指标内置标签说明 百舸平台在监控指标体系中内置的标准标签(label) ,用于对训练任务与资源进行统一标识与多维度区分。平台会自动在系统级与自定义监控指标中附加这些标签,无需用户手动维护,主要用于任务溯源、按租户/队列/地域等维度进行统计与运维分析。
操作步骤 步骤一:获取Pushgateway地址及token 已创建百度 Prometheus 监控实例,具体操作参考: 创建实例 登录百度智能云控制台,选择“产品服务>容器> Prometheus 监控服务”。 单击对应监控实例跳转对应的实例信息页。 在监控实例页面复制 PushGateway 公网地址。 单击【生成 Token】 并复制或点击【更多 Token】 使用已有 Token。
设置AI识别任务的运行时间段 接口描述 为视频流绑定的AI识别任务,设置运行时间段,确保AI识别任务只在匹配的时间段运行,非运行时间段的AI识别任务会暂停。如果一个视频流上的所有AI识别任务都暂停,则对应的合成流也会暂停,当符合运行时间段时,AI识别任务和对应合成流(如果已经暂停)也会恢复运行。 请求结构 PUT /c
CProm采集方式支持Pod Monitor 概述 CProm采集方式现已支持Pod Monitor,旨在提供更为灵活和自动化的监控配置。通过Pod Monitor,您能够自动发现并配置Prometheus实例来监控Kubernetes集群中的服务。 注意事项 在CProm开启Pod Monitor的功能后,相关采集任务才会生效。
通过Terraform实现BLB关联监听器、后端服务器、安全组等 概览 本文介绍了通过Terraform实现BLB关联监听器、后端服务器、安全组等功能 需求场景 简化资源运维,通过编写Terraform相关代码文件来实现BLB关联监听器、后端服务器、安全组等功能 方案概述 下载Terraform工具,准备基础环境 编写.tf文件, 管理基础配置 通过Terraform相关命令完成BLB实例关联监听器
8.2 维护工具 维护服务器需要以下工具: 通过温湿度计监控服务器运行环境。 通过BMC 监控服务器运行状态。 8.3 维护操作 介绍服务器的日常维护任务操作和操作方法。 8.3.1 任务列表 日常维护任务如所示。
CProm采集方式支持Service Monitor 概述 CProm采集方式现已支持Service Monitor,旨在提供更为灵活和自动化的监控配置。通过Service Monitor,您能够自动发现并配置Prometheus实例来监控Kubernetes集群中的服务。 注意事项 在CProm开启Service Monitor的功能后,相关采集任务才会生效。
使用规则引擎将设备消息流转到业务服务器 概述 天工平台将设备上报的数据流转至百度kafka中,之后,业务应用服务器可以消费kafka中的数据进行业务处理。 应用场景 场景说明: 通过百度消息服务kafka削峰填谷,缓冲消息,减轻服务器同时接收大量设备消息的压力。 持久化设备上报的业务数据,防止业务处理应用故障导致消息丢失造成损失。 前提条件 已开通百度消息服务。
目前BLB提供哪些监控信息? 4层提供监听器级别的从外网进入的流量、流向外网的流量、实例数量、网络流量、网络数据包、活跃连接数。 7层还提供监听器级别的从外网进入的流量、流向外网的流量、实例数量、网络流量、网络数据包、活跃连接数、请求数。 健康检查是如何实现的? BLB通过健康检查自动屏蔽故障节点,实现业务高可用。 BLB的健康检查分为TCP协议健康检查和HTTP协议监控检查两种。
温度计/湿度计 用于监控机房温度、湿度,是否满足设备稳定运行环境 示波器 用于测量电压和时序 3.4 安装服务器 介绍安装服务器的操作方法。