部署自定义推理服务
更新时间:2026-04-10
推理服务类型
一见平台提供两类推理服务:
| 服务类型 | 说明 | 操作权限 |
|---|---|---|
| 自定义服务 | 用户通过模型训练或模型导入创建的模型服务 | 可部署、卸载、查看、删除 |
| 预置服务 | 平台预置的场景模型服务 | 仅可查看,不可操作 |
平台支持将模型部署为自定义服务,作为租户的专属服务,供技能评测和API调用,支持服务进行详情查看和版本更新等操作。
选择选择“模型>推理服务>自定义服务”,进入「自定义服务」页面。

完整部署流程
Plain Text
1准备模型 → 创建推理服务 → 部署服务 → 服务运行 → 调用服务
2 ↓ ↓ ↓ ↓ ↓
3模型仓库 填写信息 等待部署 监控状态 技能/API
创建自定义服务
- 点击【创建推理服务】,金服创建推理服务弹窗。
- 填写服务名称、选择需要部署的模型,支持选择“场景模型”中的模型或“模型仓库”中的模型。

- 创建后,可查看服务状态。只有“运行中”的模型服务,该模型才能正常使用。
服务状态说明
| 服务状态 | 说明 | 可执行操作 |
|---|---|---|
| 待部署 | 模型已创建,尚未部署为推理服务 | 部署、查看、删除 |
| 运行中 | 模型已成功部署,正在提供推理服务 | 卸载、查看 |
| 部署中 | 正在部署模型服务 | 等待部署完成 |
| 卸载中 | 正在卸载模型服务 | 等待卸载完成 |
| 部署失败 | 模型部署失败 | 查看错误日志、重新部署、删除 |
查看推理服务详情
在「自定义服务」列表中,点击服务名称或【查看】按钮,进入「推理服务详情」页面。
服务监控展示推理服务的运行状态和性能指标:
| 监控项 | 说明 |
|---|---|
| 调用次数 | 服务被调用的总次数 |
| 成功率 | 成功调用的比例 |
| 平均响应时间 | 平均每次调用的响应时间 |
| QPS | 每秒查询率(Queries Per Second) |
| GPU使用率 | GPU资源使用情况 |
| 内存使用率 | 内存资源使用情况 |

操作记录展示服务的所有操作历史:
| 字段 | 说明 |
|---|---|
| 操作时间 | 执行操作的时间 |
| 操作类型 | 部署、卸载、删除等操作 |
| 操作人 | 执行操作的用户 |
| 操作结果 | 成功/失败 |
| 备注 | 操作的详细信息或错误信息 |

卸载服务
适用场景:
- 暂时不需要使用该模型服务
- 释放计算资源
- 降低运营成本
操作步骤:
- 在「自定义服务」列表中,找到状态为「运行中」的服务
- 点击操作栏的【卸载】按钮
- 在弹窗中确认卸载信息
- 点击【确定】,开始卸载
注意事项:
- 卸载后,技能编排中调用该模型的功能将无法使用
- 卸载后,API调用将返回错误
- 卸载不会删除服务,可以随时重新部署
- 如有技能正在使用该模型,请先修改技能编排
删除服务
适用场景:
- 不再需要该模型服务
- 清理无用的服务
操作步骤:
- 在「自定义服务」列表中,找到需要删除的服务
- 点击操作栏的【删除】按钮
- 在弹窗中输入服务名称进行确认
- 点击【确定】,删除服务
注意事项:
- 删除操作不可恢复,请谨慎操作
- “运行中”的服务需先卸载,才能删除
- 如有技能正在使用该模型,请先修改技能编排
常见问题
Q1:服务部署失败怎么办?
可能原因:
- 模型文件损坏或格式不正确
- 计算资源不足
- 网络问题
- 模型版本不兼容
解决方案:
- 查看「推理服务详情」中的错误日志
- 检查模型文件是否完整
- 检查模型格式是否符合要求
- 稍后重试部署
- 联系技术支持
Q2:服务状态一直是「部署中」怎么办?
可能原因:
- 模型较大,部署时间较长
- 系统资源紧张,排队等待
- 部署过程卡住
解决方案:
- 耐心等待(大型模型可能需要10-15分钟)
- 刷新页面查看最新状态
- 如超过30分钟仍未完成,联系技术支持
Q3:卸载服务后,之前创建的技能还能用吗?
回答:不能。卸载服务后:
- 技能编排中调用该模型的节点将无法执行
- 技能运行会报错:"模型服务不可用"
- 需要重新部署服务,或修改技能编排使用其他模型
评价此篇文章
