健康检查
更新时间:2026-05-19
功能概述
推理服务提供了健康检查功能,可以自动检测并恢复异常状态的容器,确保只有健康的实例接收流量并避免向不健康的实例分配资源。
探针策略
支持存活探针、就绪探针、启动探针策略配置。

| 探针类型 | 说明 |
|---|---|
| 存活探针 | 定期执行,用于检测容器是否处于不健康状态。 |
| 就绪探针 | 定期执行,检查容器是否准备好接收请求。 |
| 启动探针 | 用于判断容器何时开始启动,可以控制容器在启动成功后再进行存活性和就绪性检查。可以使用该探针对慢启动容器进行存活性检测,避免它们在启动运行之前被kill。 |
支持的健康检测方法
| 健康检测方法 | 说明 |
|---|---|
| HTTP请求检查 | 通过容器的IP地址、端口号及路径调用 HTTP Get方法,如果响应的状态码大于等于200且小于400,则容器健康。 |
| TCP连接检查 | 通过容器的 IP 地址和端口号执行 TCP 检查,如果能够建立 TCP 连接,则容器健康。 |
| 自定义执行命令 | 在容器中执行指定命令,如果执行成功后退出码为0则健康检查成功。 |
健康检查参数表
健康检查功能默认关闭,您可以在创建服务时,通过配置健康检查参数来开启健康检查功能。
| 参数 | 说明 |
|---|---|
| 调用路径 | 仅选择方法为 HTTP请求检查 时配置。 检查的 HTTP Server 访问地址,必填项,自定义,例如 /v1/check。 |
| 端口号 | 仅选择方法为 HTTP请求检查 或 TCP连接检查 时配置。 检查端口号,例如 8000。 |
| 运行命令 | 仅选择方法为 自定义执行命令 时配置。 用于检测服务运行状态的命令。系统将定期执行该命令,当命令执行成功时认为服务健康;执行失败则认为健康检查未通过。 |
| 初始化检查延时 | 服务启动后,延迟多长时间开始进行第一次健康检查,单位为秒。用于避免服务尚未完全启动时被误判为不健康,默认值为 0。 |
| 轮询检查时间间隔 | 两次健康检查之间的时间间隔,单位为秒,默认值为 10 秒。 检查频率过高可能增加服务运行开销,频率过低则可能无法及时发现服务异常。 |
| 检查超时时长 | 单次健康检查允许的最长执行时间,单位为秒,默认值为 1 秒。 超过该时间仍未返回检查结果,则本次健康检查视为失败。 |
| 检测成功认定次数 | 处于成功状态时,健康检查连续失败可被认定为失败的次数,就绪探针默认为 3 次,存活探针和启动探针默认为 1 次。 |
| 检测失败认定次数 | 处于失败状态时,健康检查连续成功可被认定为成功的次数,默认 1 次。 |
参数配置完成后,单击确定即可。
健康检测开启后界面:

评价此篇文章
