配置自动伸缩策略
更新时间:2024-09-25
自动伸缩可以根据您配置的伸缩策略动态分配计算节点实例,实现根据实时负载自动增加或减少计算节点,以提高集群可用性,降低使用成本。
本文介绍如何配置自动伸缩策略。
功能优势
自动伸缩可以实现以下功能:
- 根据实时负载,自动增加计算节点,提高集群的可用性。
- 在保证集群可用性的前提下,自动减少计算节点,降低集群成本。
- 停止异常状态的节点,并创建相应的新节点,提高集群容错能力。
使用限制
- 仅支持调度器为SLURM或SGE的集群配置自动伸缩。
- 不支持基于内存维度的自动伸缩。建议在提交作业时指定作业所需的vCPU来实现自动伸缩,另外作业指定的内存使用大小不能超出BCC资源的内存规格。
注意事项
自动伸缩服务依赖于调度器服务和域账号服务运行正常。开启自动伸缩后,管控节点需要一直保持运行中。
说明
如果管控节点需要关机或者重启,请在计算节点没有作业运行,并且自动伸缩已经释放了空闲节点后再进行操作。此时,建议您先关闭自动伸缩,在管控节点重新启动后,再开启自动伸缩。
如果管控节点需要关机或者重启,请在计算节点没有作业运行,并且自动伸缩已经释放了空闲节点后再进行操作。此时,建议您先关闭自动伸缩,在管控节点重新启动后,再开启自动伸缩。
操作步骤
- 登录弹性高性能计算控制台:https://console.bce.baidu.com/chpc/#
- 在顶部菜单栏左上角处,选择地域。
- 在左侧导航栏,选择集群列表。
- 点击集群名称,进入集群概览页面。
- 点击队列管理,区域完成参数配置,在对应队列的操作栏,找到『配置扩缩容』按钮。
- 点击『配置扩缩容』,在弹出的页面中完成参数配置。
- 点击保存,操作成功。