负载均衡

负载均衡BLB基于百度自研4/7层负载均衡设备，为客户提供高可用的流量分发服务，可以在多台云服务器之间进行均衡的应用流量分发，避免单点故障并能提升业务可用性。轻松应对海量访问请求，实现业务水平扩展。

立即购买管理控制台帮助文档价格计算器

k8s三部曲负载均衡内容精选

混合调度 - 容器实例BCI | 百度智能云文档
本地突发负载上云场景当工作负载扩容，本地资源不足或者达到设置的最大值时，将实例溢出到云端BCI容器实例，限制本地最多创建30个实例。工作负载缩容时，优先释放云端BCI容器实例。
查看更多>>
百度沈抖：云智一体，智能优先千帆社区
百舸实现了数据并行、专家并行的双重负载均衡，进一步提升了并行效率。另外，百舸首创了事件驱动的分布式KV Cache，有效规避重复计算，实现“用存储，换计算”。在百舸5.0的推理系统上，DeepSeek R1的推理吞吐可以再提升50%。也就是说，相同的时间、相同和成本，用了百舸，能让模型多做50%的思考、多干50%的活。刚才，我讲了网络、算力和推理。
查看更多>>

k8s三部曲负载均衡更多内容

碎片治理 - 百度百舸 · AI计算平台 | 百度智能云文档
不可治理的原因：关联分析任务已不存在任务关闭重调度预调度失败达到任务最低保障副本单负载的工作负载无工作负载管理的Pod 关联Pod已不存在错误的整理类型推理服务摘流失败推理服务终止失败该Pod已在重调度中，重复的重调度 Pod迁移失败该工作负载已达到最大pod迁移数碎片治理诊断完成后，可以基于诊断结果进行碎片治理：操作步骤登录百舸AI计算平台AIHC控制台。
查看更多>>
应用场景 - GPU云服务器 | 百度智能云文档
人工智能推理针对深度学习的在线推理场景，相比训练负载，推理负载对GPU性能的要求降低，但对运行稳定性要求更高，对服务器响应延时也有了更高要求。可选择NVIDIA Tesla A10、NVIDIA Tesla T4等GPU类型，在满足性能要求的同时，提供更具性价比的选择，同时支持GPU硬件级的解码功能并加速端到端的图片类推理性能。
查看更多>>
CCE Resource Recommender 用户文档 - 容器引擎CCE | 百度智能云文档
Kubernetes 集群的资源利用率不高的主要原因是根据 Kubernetes 的资源调度逻辑，在创建 Kubernetes 工作负载时，通常需要为工作负载配置合适的资源 Request，表示对资源的占用和限制，其中对利用率影响最大的是 Request。为防止自己的工作负载所用的资源被别的工作负载所占用，或者是为了应对高峰流量时的资源消耗诉求，用户习惯于为 Request 设置较大的数值。
查看更多>>
云原生数据库 GaiaDB 的核心技术演进和解析 - 云原生数据库 GaiaDB_关系型数据库_MySQL上云_数据库-帮助文档
该方案可根据实例规模、集群磁盘使用率、集群机器负载、集群机架位和集群机器所在交换机等因素进行管理，使存储资源得到充分利用，并满足高性能的存储需求。然而，随着时间的推移和集群的扩容或缩容等操作，存储系统中的副本分布可能会出现不均衡的现象。为了解决这一问题，GaiaDB 的分布式多租户存储方案能够提供统一的资源均衡策略。
查看更多>>
CCE Credential Controller 说明 - 容器引擎CCE | 百度智能云文档
使用免密组件提交工作负载免密组件安装成功以后，在免密组件生效的命名空间下使用ServiceAccount创建工作负载时，会自动注入CCR实例的镜像访问凭据。
查看更多>>
GPU资源池总览 - 百度百舸 · AI计算平台 | 百度智能云文档
当前集群占用GPU的工作负载名称类型当前集群占用GPU的工作负载类型命名空间当前集群占用GPU的工作负载所在命名空间开始时间当前集群占用GPU的工作负载开始时间运行时长当前集群占用GPU的工作负载运行时长 GPU配给卡数当前集群占用GPU的工作负载配给GPU卡数显存平均利用率当前集群占用GPU的工作负载内所有GPU卡显存平均利用率实时值 GPU平均利用率当前集群占用GPU的工作负载内
查看更多>>
昇腾资源池总览 - 容器引擎CCE | 百度智能云文档
当前集群占用NPU的工作负载类型负载名称当前集群占用NPU的工作负载名称命名空间当前集群占用NPU的工作负载所在命名空间 NPU配给卡数当前集群占用NPU的工作负载配给NPU卡数显存平均利用率当前集群占用NPU的工作负载内所有NPU卡显存平均利用率实时值 NPU平均利用率当前集群占用NPU的工作负载内NPU卡平均利用率实时值内存使用量当前集群占用NPU的工作负载的内存使用量 CPU
查看更多>>
GPU资源池总览 - 容器引擎CCE | 百度智能云文档
当前集群占用GPU的工作负载名称类型当前集群占用GPU的工作负载类型命名空间当前集群占用GPU的工作负载所在命名空间开始时间当前集群占用GPU的工作负载开始时间运行时长当前集群占用GPU的工作负载运行时长 GPU配给卡数当前集群占用GPU的工作负载配给GPU卡数显存平均利用率当前集群占用GPU的工作负载内所有GPU卡显存平均利用率实时值 GPU平均利用率当前集群占用GPU的工作负载内
查看更多>>

负载均衡

混合调度 - 容器实例BCI | 百度智能云文档

百度沈抖：云智一体，智能优先千帆社区

碎片治理 - 百度百舸 · AI计算平台 | 百度智能云文档

应用场景 - GPU云服务器 | 百度智能云文档

CCE Resource Recommender 用户文档 - 容器引擎CCE | 百度智能云文档

云原生数据库 GaiaDB 的核心技术演进和解析 - 云原生数据库 GaiaDB_关系型数据库_MySQL上云_数据库-帮助文档

CCE Credential Controller 说明 - 容器引擎CCE | 百度智能云文档

GPU资源池总览 - 百度百舸 · AI计算平台 | 百度智能云文档

昇腾资源池总览 - 容器引擎CCE | 百度智能云文档

GPU资源池总览 - 容器引擎CCE | 百度智能云文档

热门活动

新闻动态

最新活动

相关主题

热门产品

负载均衡

混合调度 - 容器实例BCI | 百度智能云文档

百度沈抖：云智一体，智能优先 千帆社区

碎片治理 - 百度百舸 · AI计算平台 | 百度智能云文档

应用场景 - GPU云服务器 | 百度智能云文档

CCE Resource Recommender 用户文档 - 容器引擎CCE | 百度智能云文档

云原生数据库 GaiaDB 的核心技术演进和解析 - 云原生数据库 GaiaDB_关系型数据库_MySQL上云_数据库-帮助文档

CCE Credential Controller 说明 - 容器引擎CCE | 百度智能云文档

GPU资源池总览 - 百度百舸 · AI计算平台 | 百度智能云文档

昇腾资源池总览 - 容器引擎CCE | 百度智能云文档

GPU资源池总览 - 容器引擎CCE | 百度智能云文档

热门活动

新闻动态

最新活动

相关主题

热门产品

百度沈抖：云智一体，智能优先千帆社区