路由策略配置
更新时间:2025-08-11
概述
本文介绍云原生网关配置路由策略的相关操作。支持在云原生网关配置路由级 Token 限流、超时策略、重试策略、路径重写、服务负载均衡算法等,为您的服务提供更全面的保护和优化。
配置目标服务负载均衡算法
- 登陆百度智能云云原生网关控制台。
- 点击左侧导航栏【实例列表】,在实例列表中点击目标实例的实例名称进入实例详情。
- 选择左侧导航栏【路由配置】,在路由配置页面中找到目标路由名称,点击操作列【编辑】。
- 在目标服务模块中找到需要修改负载均衡算法的服务,点击操作列【负载均衡算法】。
- 在弹窗中变更当前服务的负载均衡算法,目前支持 轮询、最小连接数、随机、哈希一致性 4 种负载均衡算法,您可根据业务需求进行相应调整,点击确定按钮后,单击左下角【发布】后生效。
配置路径重写
对于路径(Path)重写,云原生网关支持标准重写模式:对于路径为精确匹配的路由,进行完整覆盖重写;对于路径为前缀匹配的路由,仅重写前缀匹配的部分。
- 登陆百度智能云云原生网关控制台。
- 点击左侧导航栏【实例列表】,在实例列表中点击目标实例的实例名称进入实例详情。
- 选择左侧导航栏【路由配置】,在路由配置页面中找到目标路由名称,点击操作列【编辑】。
- 在路由规则模块中开启路径重写,开启后需配置重写路径。
- 点击左下角【发布】后生效。
配置 Token 限流
Token 限流围绕 “Token 消耗” 这一大模型最核心的成本指标,实时累加每次请求的实际用量,专为大模型服务及高并发调用场景设计。该策略可按照消费者、请求头、请求参数灵活配置限流规则,根据单次路由请求消耗的 Token 总量进行实时计算和流量管控。这种以 Token 消耗为核心的限流模式能精准匹配大模型计算资源消耗特性,有效防止系统过载及恶意调用,同时保障核心业务在复杂场景下的稳定运行。
- 登陆百度智能云云原生网关控制台。
- 点击左侧导航栏【实例列表】,在实例列表中点击目标实例的实例名称进入实例详情。
- 选择左侧导航栏【路由配置】,在路由配置页面中找到目标路由名称,点击操作列【编辑】。
- 在高级策略模块中开启 Token 限流,开启后,可配置基于消费者、请求头或请求参数的 Token 限流策略,限制在指定时间窗口内的 Token 使用量。
- 点击左下角【发布】后生效。
说明:若配置按消费者限流,则当前路由需要先开启消费者认证并配置可访问消费者,否则无法生效。
配置超时策略
云原生网关提供路由级别的超时设置,您可以按需为指定路由配置网关等待请求响应结果的最大时间。如果在指定时间内,网关未收到后端服务的响应结果,请求将被终止。
- 登陆百度智能云云原生网关控制台。
- 点击左侧导航栏【实例列表】,在实例列表中点击目标实例的实例名称进入实例详情。
- 选择左侧导航栏【路由配置】,在路由配置页面中找到目标路由名称,点击操作列【编辑】。
- 在高级策略模块中开启超时策略,开启后需配置超时时间(秒),合法范围为 1-3600 秒。
- 点击左下角【发布】后生效。
配置重试策略
云原生网关提供路由级别的重试设置,可以对满足重试条件的请求进行自动重试,您可以根据自身业务需求配置重试条件。
- 登陆百度智能云云原生网关控制台。
- 点击左侧导航栏【实例列表】,在实例列表中点击目标实例的实例名称进入实例详情。
- 选择左侧导航栏【路由配置】,在路由配置页面中找到目标路由名称,点击操作列【编辑】。
- 在高级策略模块中开启重试策略,开启后需配置重试条件及重试次数,重试次数支持设置 1-100 次,建议不超过 2 次。重试条件说明如下:
- 5xx :后端服务返回任何 5xx 响应,或发生连接断开、重置、读取超时事件
- reset : 发生连接断开、重置、读取超时事件
- connect-failure : 请求连接断开
- refused-stream: 后端服务以 REFUSED_STREAM 错误代码来重置连接
- retriable-status-codes: 后端服务响应结果的 HTTP 状态码匹配上您指定的重试状态码
- cancelled :后端 gRPC 服务响应头中的 gRPC 状态码为 cancelled
- deadline-exceeded :后端 gRPC 服务响应头中的 gRPC 状态码为 deadline-exceeded
- internal :后端 gRPC 服务响应头中的 gRPC 状态码为 internal
- resource-exhausted: 后端 gRPC 服务响应头中的 gRPC 状态码为 resource-exhausted
- unavailable :后端 gRPC 服务响应头中的 gRPC 状态码为 unavailable