管理模型推理服务
更新时间:2026-05-06
概述
模型推理服务创建后,您可以在「实例详情 → AI 服务 → 模型推理服务」中查看服务的发布状态、关联域名、匹配路径、目标服务等信息,并对服务进行调用示例查看、编辑或删除操作。
重要
- 删除模型推理服务后无法恢复,请谨慎操作。
- 编辑后的配置在保存后立即生效,原有调用方将按新配置访问后端。
查看模型推理服务
服务创建成功后,您可以在「模型推理服务」列表中查看其基本信息。当服务较多时,可通过搜索快速定位目标服务。
- 登陆百度智能云 AI 原生网关控制台。
- 在顶部导航栏选择目标地域,并在实例列表中单击目标实例 ID,进入实例详情页。
-
在左侧导航栏选择 AI 服务 > 模型推理服务,进入列表页。

-
列表展示如下信息:
列 说明 模型推理服务名称 服务的唯一标识。单击名称可进入详情页,查看完整配置。 发布状态 展示服务当前的运行状态。 关联域名数 展示当前服务关联的自定义域名数量,鼠标悬停在数字上可查看具体域名列表。 匹配路径 展示路由匹配规则中的路径与匹配方式(前缀匹配 / 精确匹配 / 正则匹配)。 目标服务 展示目标服务的名称。鼠标悬停可查看服务来源、命名空间、端口等详细信息。当配置了多个目标服务时,会展示各服务的流量策略详情。 创建时间 服务的创建时间。 操作 提供「调用示例」「编辑」「删除」入口。具体说明详见下文。 - 在列表右上方的搜索框中输入路由名称关键字,按回车或单击搜索图标可快速过滤。
查看调用示例
当您完成服务创建并希望快速对接时,可通过「调用示例」获取可直接复制的调用地址与代码片段。
- 进入「模型推理服务」列表页。
- 在目标服务的操作列单击 调用示例,弹出「调用示例」对话框。

-
在对话框中按需配置以下信息后,复制示例使用:
配置项 说明 访问入口 选择本次调用使用的入口地址。 调用地址 展示完整调用地址,单击右侧复制图标可一键复制。 消费者身份 仅当服务开启了消费者认证时展示。可在已授权的消费者中选择本次调用的身份;示例中的凭证信息会按所选消费者明文展示。 调用示例 系统自动生成 curl 调用示例,可直接复制粘贴到终端使用。请将示例中的 <请求体>替换为实际请求参数。

编辑模型推理服务
创建后的模型推理服务,除「推理服务名称」外的所有配置项均可修改。
- 进入「模型推理服务」列表页。
- 在目标服务的操作列单击 编辑,进入编辑页面。

-
按需修改以下模块的配置项:
模块 可修改字段 基本信息 - 访问模式(API 接口访问 / Web 应用访问)。
- 关联域名(API 模式:不配置 / 自定义域名)。
- 独立子域名与服务标识(Web 模式:系统自动生成 / 自定义服务标识)。
路由规则(仅 API 模式) 路径与匹配方式、请求方法(Method)、大小写敏感、请求头匹配、请求参数匹配、路径重写。 目标服务 - 后端服务路径(仅 Web 模式)。
- 服务模式:单服务 / 多服务。
- 流量策略(仅多服务):按比例 / 按模型名称。
- 目标服务来源与服务名称、命名空间、端口。
- 负载均衡算法。
- 请求比例(仅多服务-按比例)。
- 模型名称(仅多服务-按模型名称)。
- 模型传递方式(仅单服务 + AI 模型代理):透传 / 指定模型名称。
认证授权 是否开启消费者认证、授权的消费者列表。 高级策略 Token 限流、超时、重试、跨域、自定义请求头、自定义响应头等策略的开关与具体参数。 - 修改完成后,单击页面底部的 发布,配置发布成功后即时生效。
删除模型推理服务
对于不再使用的模型推理服务,您可以将其从实例中删除。
重要
删除后无法恢复,且会立即停止该服务对外的请求处理,请确认后再操作。
- 进入「模型推理服务」列表页。
- 在目标服务的操作列单击 删除。
- 在弹出的确认框中单击 确定,完成删除。

评价此篇文章
