分布式训练任务优先级管理
更新时间:2026-02-06
使用背景
为保障高优用户以及高优任务的资源需求,百舸平台针对训练任务新增了优先级规则配置功能,队列管理员可在队列详情中启用该功能,为不同用户或角色设定可使用的最高任务优先级,确保高优任务优先获得资源。
使用限制
仅支持全托管资源池
开启优先级规则配置
在资源池 - 【资源队列】- 【队列险情】-【队列配置】中可以开启优先级规则配置,该配置默认为关闭状态,关闭状态下所有队列成员创建任务不受管控
开启后,系统会自动为您创建默认规则:
- 针对队列成员:队列内算法开发人员仅能创建中优先级任务;队列管理员 支持创建高优先级任务
- 全局配置:若用户未匹配到任何规则,其可创建任务的最高优先级将受全局限制,默认为中优先级。
添加/编辑规则
您可以自定义配置规则名称,生效范围,以及针对该用户/用户组/队列角色配置最高优先级,例如您可以:
- 为指定用户创建高优先级规则
- 为指定用户组(高级 xx 员)创建高优先级规则
- 为指定用户/用户组创建低优先级规则(例如实习生等)
- 目前仅支持为训练任务配置规则
为了查询效率与使用体验,平台限制每个队列创建五条规则。
规则限制
受限制的角色仅能创建相应优先级的训练任务,在默认规则限制下,队列内算法开发成员只能创建中、低优先级的训练任务;同时复制高优先级任务时,系统会默认将优先级重置为中
队列管理员可将排队中的任务优先级调为高。
