资源池常见问题
更新时间:2026-06-18
本文为您介绍资源池的相关问题。
目录
名词说明:本文涉及以下缩写。
- 资源池:百舸 AI 计算平台中算力资源的组织单元,分为全托管资源池与自运维资源池。
- 全托管资源池:平台提供的免运维资源池,用户无需关注底层物理资源和算力插件的运维管理。
- 资源队列:算力分配调度的最小单元,工作负载(开发机、训练任务、推理服务)需提交到队列以获得算力。
- MIG:Multi-Instance GPU,NVIDIA 提供的硬件级 GPU 切分能力。
- 预留实例券:计费权益与资源锁,用于锁定库存资源并抵扣同规格按量付费节点的费用。
一、资源池创建 & 网络配置
Q:全托管资源池具有什么优势?
全托管资源池是百舸 AI 计算平台提供的免运维资源池。用户无需关注底层物理资源和算力插件的运维管理,由平台保障稳定性。
Q:创建资源池时,网络配置有哪些限制?
- 必须配置 VPC 网络、节点子网和容器子网。
- 容器子网不能与平台预留网段
11.0.0.0/12冲突。
Q:可以在资源池创建后添加不同可用区的百舸节点吗?
支持在存量资源池中跨可用区新建节点。如需添加不同可用区的节点,请先添加对应可用区的容器子网,再在该可用区新建节点。

二、节点管理
Q:百舸节点的"封锁"和"释放"有什么区别?
- 封锁:节点进入不可调度状态,新的 Pod 不会调度到该节点上,但存量业务不受影响。
- 释放:节点停止使用并停止计费。仅支持"按量付费"和"已到期"的包年包月节点。
三、资源队列与 GPU 虚拟化
Q:为什么创建了资源池还要创建资源队列?
资源队列是算力分配调度的最小单元。所有工作负载(开发机、训练任务、推理服务)必须提交到对应的队列中才能获得算力分配。
Q:什么是 GPU 虚拟化?创建后可以更改吗?
GPU 虚拟化支持将单张物理 GPU 切分给多个容器使用:
- 开启后支持按显存切分,允许给容器分配小数卡(如 0.5 卡)。
- 队列创建后,该设置不可修改。且节点和容器镜像需适配特定的 OS、驱动和 CUDA 版本。
Q:开启虚拟化后支持碎片治理吗?
开启 MIG 虚拟化的队列和节点不支持平台侧的自动碎片治理功能。
Q:可以在一个任务中同时使用 MIG 实例和普通物理 GPU 吗?
不可以。任务只能提交至单一类型的队列中,无法跨越开启了 MIG 的队列和普通队列进行联合计算。
四、预留实例券
Q:购买了预留实例券,还需要单独去开通机器吗?
需要。预留实例券是计费权益和资源锁,不是机器本身。购买实例券后,您需要前往计算页面创建按量付费的同规格节点,系统会自动将两者关联进行抵扣。
Q:对于预留实例券,如果把机器释放了,实例券还收费吗?
收费。即使您释放了实例,实例券依然在为您锁定库存资源,因此会正常计算有效期和费用。
Q:预留实例券可以随意变更 EHC 集群吗?
不支持变更。
Q:预留实例券支持跨地域(Region 级)抵扣吗?
暂不支持。目前仅支持可用区级(AZ 级)的严格匹配。
五、集群预安装组件
Q:百舸集群默认预安装了哪些组件?
百舸集群默认预安装以下组件,覆盖 GPU 调度、分布式训练、高性能网络、存储与日志等能力:
| 预安装组件名称 | 说明 |
|---|---|
| CCE GPU Manager | GPU 架构感知等高级调度,支持 GPU 算力和显存的共享与隔离。详见 https://cloud.baidu.com/doc/CCE/s/1kp80bcb4 |
| CCE AI Job Scheduler | 适配 AI 分布式训练场景,支持批量调度、队列管理等。详见 https://cloud.baidu.com/doc/CCE/s/akp81ro8j |
| CCE Deep Learning Frameworks Operator | 提供分布式模型训练、部署等功能,支持 TensorFlow、Pytorch、Mxnet、PaddlePaddle 框架。详见 https://cloud.baidu.com/doc/CCE/s/Dkp814hyo |
| CCE RDMA Device Plugin | 高性能实例之间的网络通信,提供高性能网络。详见 https://cloud.baidu.com/doc/CCE/s/Qkp81mtzj |
| CCE CSI PFS Plugin | 支持在 Pod 中以 PV/PVC 方式挂载百度云 PFS 存储,并支持动态创建 PV。详见 https://cloud.baidu.com/doc/CCE/s/slc792j5c |
| CCE Log Operator | 采集集群中的日志信息传输至日志服务(BLS)中进行持久化存储。详见 https://cloud.baidu.com/doc/CCE/s/Glc8zpk34 |
评价此篇文章
