现在新推出应用型BLB实例,其在解决用户某一场景时的部署架构如下: 实例类型对比: 实例类型 说明 区别 普通型BLB实例 提供了负载均衡常规功能组件,能够满足用户对负载均衡的通用需求,可以将来自互联网或内网的IPv6和IPv4流量分发至多台IPv4后端服务器,具备轻量化、配置简单、价格便宜等特点。 按实例维度组织后端服务器,每个监听器下所有后端服务器监听端口相同。
删除负载均衡 接口描述 本接口用于删除负载均衡。 请求结构 DELETE /v1/blb/{blbId} HTTP/1.1 Host: bec.baidubce.com Content-Type: application/json; charset=utf-8 Authorization: authorization string 请求头域 除公共头域外,无其它特殊头域。
负载均衡专属集群LBDC 获取Endpoint 在确认您使用SDK配置的Endpoint时,可先阅读开发人员指南中关于 LBDC服务域名 的部分,理解Endpoint相关的概念。 百度智能云目前开放了多区域支持,请参考 区域选择说明 中网络产品LBDC的部分。 注意 : 负载均衡专属集群LBDC API支持HTTP和HTTPS两种调用方式。
如果用户发起请求是做七层的负载均衡,步骤2中的四层负载均衡会直接转给七层负载均衡设备,由它向后端云服务器发起TCP握手请求。七层负载均衡在功能上除了完全支持四层之外,还附带真实IP、会话保持等功能。 连接成功建立后,即完成了一个连接之间的映射变换,从而将前端请求转发到各个云服务器中去。并且在整个BLB工作期间,会不断根据配置对每个云服务器做健康检查,屏蔽不可用的云服务器。
int 健康检查间隔 unhealthyThreshold int 不健康阈值,即连续多少次健康检查失败后,屏蔽该后端服务器 healthyThreshold int 健康阈值,即连续多少次健康检查成功后,重新将该后端服务器置为可用 healthCheckString String 健康发送的请求字符串,后端服务器收到后需要进行应答,支持标准转义如\00、\xf2,方便配置二进制格式请求 udpSessionTimeout
对于7层监听器(HTTP、HTTPS协议),BLB支持两种会话保持方式: 植入Cookie:推荐使用,负载均衡服务会在用户的请求中插入标识后端服务器地址的cookie项。 重写Cookie:负载均衡服务会改写指定的cookie项来标识后端服务器地址。
配置负载均衡访问日志后,您可以在BOS中查看日志信息。
三、总结 在现有模型服务基础上,通过流式请求、切换模型和约束输出长度等三种方案,可以快速解决“大模型推理慢”的问题,成为常见的解决方案,可以根据业务场景按需使用。
扩展域名 负载均衡HTTPS监听支持挂载多个证书,通过配置扩展域名,实现将来自不同访问域名的请求转发至不同的后端服务器或者后端服务器组。 添加扩展域名 登录百度智能云平台,选择“产品服务>负载均衡BLB”,点击BLB名称进入实例详情页面。 点击左侧导航栏“监听设置”,选择HTTPS协议配置HTTPS监听。 添加服务器证书后点击开启“扩展域名”,配置扩展域名。
基本概念 百度负载均衡主要包含以下几个基本概念: 负载均衡实例:由百度负载均衡集群提供的虚拟服务。可以提供基于多种监听器(TCP、UDP、HTTP、HTTPS)的负载均衡服务。 监听器:监听器用于将用户请求转发至后端服务器,再把后端服务器的响应返回给用户。监听器配置有监听协议和监听端口,并按照转发规则将请求转发给后端服务器的端口。监听器还提供了后端服务器的健康检查功能。