k8s架构跨节点负载均衡  内容精选
  • AIAK推理加速引擎PD分离部署DeepSeek - 百度百舸 · AI计算平台 | 百度智能云文档

    需填写模型R1权重文件容器挂载的目标路径,以上图为例:/deepseek-nextn CUDA_GRAPH_MAX_BS 使用 CUDA Graph 时允许的最大Batch Size,推荐值为64 高级配置 共享内存建议设置为400G 流量接入 选择云原生网关,负载均衡策略设置为轮询

    查看更多>>

  • 创建热活实例组 - 云数据库 SCS_云缓存

    创建热活实例组 概述 百度云Redis提供创建热活实例架构管理的功能,用户可以管理热活实例组。 地域热活实例组是由多个Redis集群实例组成的高可用集群,并且允许以上实例分布在不同的地域和可用区,因此能够实现地域容灾。 为了便于管理,我们会以主实例为单位,进行热活实例组的相关操作。 热活组中的标准版实例不支持配置白名单。 使用限制 热活实例组功能目前为白名单开放,需要通过工单反馈加白后使用。

    查看更多>>

k8s架构跨节点负载均衡  更多内容