打开 自动缩容 开关(默认关闭)。 配置 CPU/内存缩容阈值 (默认 50%,范围 0%–100%):当节点的 CPU 或内存资源请求率持续低于该阈值时,触发自动缩容。 保存配置。未开启此开关时,系统仅支持自动扩容,不会自动释放节点。
对于无状态且可容错的业务负载,您可以使用抢占式实例。具体操作,请参见 创建抢占式实例 。 对于长时间运行的稳定业务负载,推荐使用预留实例券来抵扣BCI实例账单。 您可以根据使用的BCI实例情况选择合适的方式。具体操作,请参见 使用预留实例券 。
逻辑队列和物理队列使用说明 队列功能概述 队列是一个资源池中部分资源的集合,用于工作负载(训练任务、模型服务)的运行。用户可将资源池划分成若干个独立队列(逻辑队列、物理队列)来运行不同工作负载。资源池创建成功后会默认生成 default 队列。本文将介绍如何通过yaml模板创建、更新和使用队列。
注:标准直播默认只收取下行播放费用,针对上下行使用不均衡的业务场景(下行播放:上行推流 < 50:1),会按照实际推流用量额外收取推流费用。 增值服务费用:使用直播转码、录制、截图、审核、时移、拉流转推等直播增值功能产生的云服务费用,此类功能默认关闭,使用才收费。 其他云产品费用:结合百度智能云其他产品一起提供的增值功能,由其他云产品根据各自的计费规则分别收取相关费用。
背景信息 连接池用于复用数据库连接,减少频繁创建和释放连接带来的系统开销,从而降低数据库负载并提升短连接场景下的访问性能。GaiaDB 当前支持 会话级连接池 和 事务级连接池 两种模式。 会话级连接池 会话级连接池适用于客户端连接数量较少的场景,例如在 Proxy 之前已经存在应用侧连接池的情况下,用于减少在连接池频繁获取与归还带来的额外开销。
规格配置 可选 为组件中的工作负载设置容器配额,即指定组件部署 Pod 运行所分配的 CPU、内存 request 值和 limit 值。 调度策略 可选 为组件中的工作负载设置节点选择和污点容忍调度策略。 节点选择: 指定组件 Pod 部署节点;若不指定,则按集群默认调度策略执行。
该CFS 实例 仅用于 开发机系统盘持久化,不支持挂载到训练任务、推理服务等其他工作负载。 临时本地盘 当两种持久化方案均不适用时,可使用 临时本地盘 作为系统盘临时存储。 与同节点其他开发机 共享 存储资源。 开发机 停止或变更配置 后,环境数据将丢失。 不支持自定义申请容量。 使用临时本地盘时,请在停止开发机前及时 保存镜像 ,以保留环境配置。
default_workload_group :指定用户的默认工作负载组。 注:如果未设置 cpu_resource_limit 和 exec_mem_limit ,则默认使用会话变量中的值。 2. <value_n> 为指定键设置的值。 可选参数 1. <user_name> 要设置属性的用户名。如果省略,则为当前用户设置属性。
合业务生产、性能测试等场景,具体提供的规格和建议如下: ZK节点规格 ZK节点主要负责协调服务,它提供了配置管理、分布式锁、集群服务等功能,集群版ZK节点默认3个,规格要求较低,固定1核2GB即可满足。 Master节点规格 集群版Master节点默认2个,实现高可用,避免单点故障。
在负载比较高的集群,不建议调整这个参数,以免集群满载。 如果写入和构建向量索引偏慢,可以通过临时减少集群负载(减少其他写入和查询),并调大 bpack.knn.hnsw.index_thread_qty 的方式来加快构建 ,等到构建结束,再将 bpack.knn.hnsw.index_thread_qty 调整回1。