API Server访问 自动创建负载均衡器 BLB:系统将自动为集群 API Server 创建一个内网应用型负载均衡 BLB 实例,若删除该 BLB 实例会导致 API Server 无法访问。若选择自动创建负载均衡器 BLB,还需进行 API Server 子网设置。
常用于蓝绿发布、灰度测试或多模型负载均衡。 产品优势 AI 原生,深度适配大模型场景 不同于传统 API 网关简单转发 HTTP 流量,AI 原生网关在设计上充分考虑大模型调用的特殊性。内置 Token 用量统计、基于模型名称的流量路由、多模型负载均衡等能力,让大模型 API 管理从 能用 升级为 好用 。无论是对接云端商业模型还是私有化部署的推理服务,均可统一纳管。
流量策略(仅多服务):按比例 / 按模型名称。 目标服务来源与服务名称、命名空间、端口。 负载均衡算法。 请求比例(仅多服务-按比例)。 模型名称(仅多服务-按模型名称)。 模型传递方式(仅单服务 + AI 模型代理):透传 / 指定模型名称。 认证授权 是否开启消费者认证、授权的消费者列表。 高级策略 Token 限流、超时、重试、跨域、自定义请求头、自定义响应头等策略的开关与具体参数。
LB Service 子网 是 选择用于负载均衡服务的子网。 节点替换修复漏洞 导航路径: 容器引擎 CCE->集群管理->集群列表 注意: 节点替换会触发容器漂移,请在业务低峰期操作,并提前评估业务流量风险。 当账号下已有可替换的存量集群时,可采用以下方式修复漏洞: 在目标集群中扩容新节点。 待工作负载稳定漂移到新节点后,缩容旧节点。
左侧指标分类树 : 一级分类 二级分类 集群监控 服务监控 负载均衡监控 监控图表展示 集群监控指标详情参见 :集群监控指标 核心操作流程 查看集群监控数据 进入『监控详情 → 集群监控』页面。 选择时间范围:点击『1 小时 / 1 天 / 7 天』或自定义时间范围。 选择聚合方式:在『性能指标』下拉框中选择平均值 / 最大值 / 最小值。
使用限制 精准自定义 CC 防护功能仅 SaaS WAF 支持,负载均衡型 WAF 暂不支持。 操作步骤 步骤一:进入 CC 防护 登录 百度云 Web 应用防火墙控制台 ,在顶部菜单栏选择资源对应的地域。 在左侧导航栏,选择 防护配置 -> Web 防护 ,点击 CC 防护 标签页。 在 CC 防护 页面,单击 添加规则 。
组合模式 仅接入点模式选择【高可靠模式】时,需配置组合类型,包括 最强容灾能力 、 强大容灾能力 、 开发和测试 和 大带宽负载均衡能力 四种。请根据您的实际业务需求选择: 最强容灾能力:您将申请2个接入点内的资源,建立4个独立的物理专线。
下钻参数在哪里看 对于下钻弹出的图表,最重要的就是如何知道下钻的参数有哪些?其实,在下钻弹出图表的右侧控制面板中「数据」下,单击「调试」,就能看到上层图表传递给本下钻图表的下钻参数。
配置了 Token 限流策略并已触达上限,请求被限流而非被拒绝鉴权(响应码会有差异,请关注网关返回的具体错误信息)。 Q:能否为同一消费者下的不同 API Key 配置不同的授权访问范围? 不可以。消费者是网关实例的最小授权维度,同一消费者下的所有 API Key 共享同一组授权范围 —— 任意一个 Key 都能访问被授权给该消费者的全部模型推理服务和 MCP 服务。
但通过函数计算就可以将其包装成新的技术服务,无需额外部署负载均衡的能力,服务端渲染采用的接受度更强,渲染速度也更快。其次是批量任务。通过在函数内编写批量处理逻辑,再通过函数工作流实现多个批量逻辑的组合。 以文本批量核对为例,通过函数计算实现文本核对资源弹性化,可以抽取共性的数据获取、数据加工等关键文本核对步骤为函数,实现弹性执行。另外,还能实现定时或Kafka消息触发的方式触文本核对任务执行等。