如果auto检测不正确,可以强制指定版本号。更换版本只对新添加的模型有效 39 cudaVersion: auto 40 # AI服务启动时,额外配置的 LD_LIBRARY_PATH(linux) 或者 PATH(windows) 41 libPath: ./ 42 # AI服务启动时,额外配置的其他环境变量。
SINGLE表示单线节点、TRIPLE表示三线节点) networksList List< Networks > 主网卡详情,包含Networks Networks 参数名称 类型 描述 netType String 网卡类型 (INTERNAL_IP表示内网;单线节点使用PUBLIC_IP表示单线公网网卡;三线节点用TRIPLE_CT、TRIPLE_UN、TRIPLE_CM分别表示三线公网的电信
函数计算CFC节点 整体概述 该节点用于配置 百度云函数计算(CFC) 服务,以调用 CFC 中自定义的函数服务,从而支持集成更多算法库,并支持多种编程语言。 使用说明 使用该节点之前,需要先开通 百度智能云函数计算 服务,并根据指引,创建函数。创建成功后,可在工作流节点中使用该函数服务。 节点配置 : 在左侧配置面板中,选择函数服务的地域、目标函数及其版本。
函数计算CFC节点 整体概述 该节点用于配置 百度云函数计算(CFC) 服务,以调用 CFC 中自定义的函数服务,从而支持集成更多算法库,并支持多种编程语言。 使用说明 使用该节点之前,需要先开通 百度智能云函数计算 服务,并根据指引,创建函数。创建成功后,可在工作流节点中使用该函数服务。 节点配置 : 在左侧配置面板中,选择函数服务的地域、目标函数及其版本。
前置说明 全托管资源池 为了保证测试质量,建议创建一个专用于nccl-test的空队列,将需要进行nccl-test的节点移入该队列中,再在该队列上创建nccl-test分布式训练任务进行测试。 自运维资源池 对于新购入的节点,为了防止被自动归入默认队列被调用,需要在购入节点时开启封锁设置。 创建物理队列用于nccl-test,可指定节点加入该队列。
true array PurchaseInstance purchaseCount 购买数量 true integer regionId 节点ID true string snapShotId 快照ID,支持从快照创建磁盘。
无法释放处于保护状态的节点,您需要在伸缩组详情-节点管理中取消节点保护,就可以点击释放按钮了。节点是否能真正释放还依赖节点在BCC侧的保护状态。 为什么无法选择/看不到我需要的负载均衡BLB或数据库实例? 弹性伸缩组只能绑定同一网络下相同子网的负载均衡BLB和数据库实例,请确认区域、网络、子网是否相同。 一个弹性伸缩组可以绑定多少负载均衡BLB、数据库呢?
BLB”,进入 BLB 控制台查看负载均衡 BLB 的详细信息,具体操作步骤可以参考 负载均衡操作指南 注意: 符号 $ 代表输入的指令,其他行代表输入指令后显示的服务的信息其中106.13.134.33为发布到外网的服务网址。
配置自动伸缩策略 自动伸缩可以根据您配置的伸缩策略动态分配计算节点实例,实现根据实时负载自动增加或减少计算节点,以提高集群可用性,降低使用成本。 本文介绍如何配置自动伸缩策略。 功能优势 自动伸缩可以实现以下功能: 根据实时负载,自动增加计算节点,提高集群的可用性。 在保证集群可用性的前提下,自动减少计算节点,降低集群成本。 停止异常状态的节点,并创建相应的新节点,提高集群容错能力。
API Server 访问 自动创建负载均衡器 BLB: 系统将自动为集群 API Server 创建一个内网应用型负载均衡 BLB 实例,若删除该 BLB 实例会导致 API Server 无法访问。若选择自动创建负载均衡器 BLB,还需进行 API Server 子网和公网访问设置。