当您为伸缩组绑定新的负载均衡时,伸缩组中所有节点将会自动加入新负载均衡。 绑定应用性负载均衡时,随可以绑定多个负载均衡,但同一个应用型负载均衡下只能绑定一个节点组。
调度实例的状态 healthCheckPort String 健康检查端口 adasIp String 高防实例IP adasId String 高防实例ID updateTime String 调度实例最新一次更新记录时间,配置状态更新或调度状态更新都会更新该时间 scheduleStartTime String 调度开始时间 ScheduleActionModel 参数名称 类型 描述 scheduleId
支持以自定义镜像的方式部署在线服务,提供可配置的健康检查、滚动更新策略,保证服务稳定性、细粒度的流量控制及版本管理。 训练任务消息通知,新增短信、电话、企业微信/钉钉、自定义webhook通知方式。 训练任务实时日志支持关键字检索。 提供CLI命令行,支持资源池/节点/训练任务的管理。 创建中、排队中的任务支持停止操作,新增记录停止人的功能。 训练任务使用PFS,支持指定PFS子目录挂载。
数据库内核版本管理 主动升级,快速修复缺陷,免去日常版本管理苦恼;优化 Redis 参数配置,最大化利用系统资源。
BEC可根据您的需求配置成负载均衡服务,在负载均衡页面中设置即可,负载均衡计费请参见“产品定价”。
调度实例的状态 healthCheckPort String 健康检查端口 adasIp String 高防实例IP adasId String 高防实例ID updateTime String 调度实例最新一次更新记录时间,配置状态更新或调度状态更新都会更新该时间 scheduleStartTime String 调度开始时间 区域编码定义 region 区域 描述 bj 公有云-北京 gz 公有云
自动故障隔离功能管理 自动故障隔离是百舸提供的节点故障检测&故障处理的能力,支持对节点的GPU/RDMA网卡/内存资源进行健康探测,针对于健康检查异常的节点进行故障上报以及自动隔离,并触发百度云运维系统的告警,由百度云运维团队介入处理。
确认集群中流量是否均匀分布在不同的 Proxy 上,如果负载不均衡,可配置连接池将流量分散在多个 Proxy 上。如果确认流量已经均匀分散在所有的 Proxy 上,则说明流量太高,客户端需要做流量控制,或者发起扩容。
HAS-agent组件安装与升级 介绍 硬件感知服务(Hardware-Aware Service,或称HAS)是一款线上硬件故障监控修复、功耗和资源管理工具,主要功能包括故障感知、功耗感知、资源感知、性能感知四大部分,提供了一系列的线上硬件的配置/状态监控,故障检测与修复,健康预警,功耗、擦除及相关硬件自动化管理功能,并提供统一的硬件资源状态查询、推送和管理接口。
巡检结果通过高风险、低风险、安全和失败,一共4种状态来展示各巡检项的结果: 高风险:表示集群已经出现了严重的问题或隐患,已经影响集群可用性,需要立即处理,否则会导致数据丢失、集群故障等问题 低风险:表示集群存在较严重的问题或隐患,可能会影响集群可用性,建议尽快处理 安全:表示集群健康 失败:表示巡检项巡检失败,建议用户检查对应索引或提工单咨询 操作步骤 登录百度智能云Elasticsearch控制台