升级节点组
更新时间:2025-02-24
节点组提供升级功能,支持对节点的Kubelet和容器运行时版本进行升级,针对GPU节点支持升级nvidia-container-toolkit版本。执行升级操作前,CCE集群会进行前置检查,节点组需要通过检查后才能进行升级。
注意事项
- 节点组升级过程中仅支持扩容操作,不支持缩容操作,升级过程中不会触发缩容节点。
- 节点组升级默认为原地升级,部分升级场景在升级节点前会先进行节点排水操作,如容器运行时由Docker升级为Containerd。
- 如果您的集群中存在游离节点,即未被节点组管理的Worker节点,可以参考添加外部已有节点将游离节点加入节点组中进行升级。
- 单账号最多支持10个节点组同时升级。
升级说明
节点组升级包含包含Kubelet、容器运行时和nvidia-container-toolkit版本升级。
- Kubelet升级:支持将节点组中的全部节点的Kubelet版本升级到与当前集群控制面相同的版本。
- 容器运行时升级:支持将节点组中的全部节点的容器运行时版本升级至集群发布支持的最新版本,同时支持从 Docker升级为Containerd。
- nvidia-container-toolkit升级:支持将节点组中的全部节点的nvidia-container-toolkit版本升级至所支持的最新版本。
操作步骤
- 登录容器引擎控制台。
- 在左侧导航栏,选择集群列表。
- 在“集群列表”页面单击目标集群,进入集群管理页面。
- 在集群管理页面左侧导航栏中选择节点管理 > 节点组。
-
在目标节点组操作列选择更多 > 升级进入节点组升级页面并完成升级配置。
配置项 必选/可选 配置说明 升级对象 必选 选择节点需要升级的对象。 升级范围 必选 选择升级的节点范围。全部节点:默认选择节点组中全部符合升级条件的节点进行升级;指定节点:支持选择节点组中的一个或多个节点进行升级,升级后可再次选择升级。 节点排水 可选 选择节点升级前是否进行排水操作,驱逐节点上的Pod。 每批次执行最多节点数 必选 节点组中的节点升级分批次进行,设置每批次最大并行升级的节点数,默认为1,最大可设置10。 自动暂停策略 必选 设置升级过程中的暂停策略。首批次暂停:仅第一批次升级完成后升级任务将会自动暂停,需要手动触发继续升级;每批次暂停:每完成一批次升级完成后升级任务都会自动暂停,需要手动触发继续升级;不暂停:升级任务不会暂停,一批次升级完成之后继续升级下一批次。 每批次间隔时间 必选 当自动暂停策略选择不暂停时,需要设置节点过程中每批次的间隔时间。不设置:表示直接升级下一批次;设置间隔时间:升级将在间隔时间结束后自动进行下一批次节点升级。 间隔时间 必选 当每次批间隔时间选择设置间隔时间时,需要设置升级过程中执行下一次批次升级的间隔时间,默认为5分钟,设置范围为5~120分钟。 - 单击前置检查,在升级检查全部通过后开始节点升级。
-
在升级过程中,您可以进行如下操作。
- 暂停:暂停升级。单击暂停,节点组将暂定升级,升级中的节点将继续升级直至完成。
- 继续:继续升级。单击继续,节点组将继续执行剩余节点的升级。
- 取消:取消升级,需要先暂停升级。单击取消,节点组将后续节点的升级。
- 升级完成后,您可以在节点页面单击节点名称,在基本信息页查看节点的kubelet版本、容器运行时版本等信息是否符合预期。
注意:
暂停状态为节点组升级的中间状态,建议您不要在此期间对集群进行操作,并尽快完成升级过程。集群会将处于中间状态的节点组在7日之后关闭升级过程,并清理一切升级相关的事件和日志信息。