部署自定义推理服务

更新时间：2026-04-10

推理服务类型

一见平台提供两类推理服务：

服务类型	说明	操作权限
自定义服务	用户通过模型训练或模型导入创建的模型服务	可部署、卸载、查看、删除
预置服务	平台预置的场景模型服务	仅可查看，不可操作

平台支持将模型部署为自定义服务，作为租户的专属服务，供技能评测和API调用，支持服务进行详情查看和版本更新等操作。

选择选择“模型>推理服务>自定义服务”，进入「自定义服务」页面。

完整部署流程

Plain Text

1准备模型 → 创建推理服务 → 部署服务 → 服务运行 → 调用服务
2    ↓           ↓           ↓         ↓         ↓
3模型仓库      填写信息      等待部署   监控状态   技能/API

创建自定义服务

点击【创建推理服务】，金服创建推理服务弹窗。
填写服务名称、选择需要部署的模型，支持选择“场景模型”中的模型或“模型仓库”中的模型。

创建后，可查看服务状态。只有“运行中”的模型服务，该模型才能正常使用。

服务状态说明

服务状态	说明	可执行操作
待部署	模型已创建，尚未部署为推理服务	部署、查看、删除
运行中	模型已成功部署，正在提供推理服务	卸载、查看
部署中	正在部署模型服务	等待部署完成
卸载中	正在卸载模型服务	等待卸载完成
部署失败	模型部署失败	查看错误日志、重新部署、删除

查看推理服务详情

在「自定义服务」列表中，点击服务名称或【查看】按钮，进入「推理服务详情」页面。

服务监控展示推理服务的运行状态和性能指标：

监控项	说明
调用次数	服务被调用的总次数
成功率	成功调用的比例
平均响应时间	平均每次调用的响应时间
QPS	每秒查询率（Queries Per Second）
GPU使用率	GPU资源使用情况
内存使用率	内存资源使用情况

操作记录展示服务的所有操作历史：

字段	说明
操作时间	执行操作的时间
操作类型	部署、卸载、删除等操作
操作人	执行操作的用户
操作结果	成功/失败
备注	操作的详细信息或错误信息

卸载服务

适用场景：

暂时不需要使用该模型服务
释放计算资源
降低运营成本

操作步骤：

在「自定义服务」列表中，找到状态为「运行中」的服务
点击操作栏的【卸载】按钮
在弹窗中确认卸载信息
点击【确定】，开始卸载

注意事项：

卸载后，技能编排中调用该模型的功能将无法使用
卸载后，API调用将返回错误
卸载不会删除服务，可以随时重新部署
如有技能正在使用该模型，请先修改技能编排

删除服务

适用场景：

不再需要该模型服务
清理无用的服务

操作步骤：

在「自定义服务」列表中，找到需要删除的服务
点击操作栏的【删除】按钮
在弹窗中输入服务名称进行确认
点击【确定】，删除服务

注意事项：

删除操作不可恢复，请谨慎操作
“运行中”的服务需先卸载，才能删除
如有技能正在使用该模型，请先修改技能编排

常见问题

Q1：服务部署失败怎么办？

可能原因：

模型文件损坏或格式不正确
计算资源不足
网络问题
模型版本不兼容

解决方案：

查看「推理服务详情」中的错误日志
检查模型文件是否完整
检查模型格式是否符合要求
稍后重试部署
联系技术支持

Q2：服务状态一直是「部署中」怎么办？

可能原因：

模型较大，部署时间较长
系统资源紧张，排队等待
部署过程卡住

解决方案：

耐心等待（大型模型可能需要10-15分钟）
刷新页面查看最新状态
如超过30分钟仍未完成，联系技术支持

Q3：卸载服务后，之前创建的技能还能用吗？

回答：不能。卸载服务后：

技能编排中调用该模型的节点将无法执行
技能运行会报错："模型服务不可用"
需要重新部署服务，或修改技能编排使用其他模型

评价此篇文章

有帮助没帮助

模型版本管理

数据湖

百度智能云

百度一见视觉智能体平台

百度一见视觉智能体平台

部署自定义推理服务

推理服务类型

完整部署流程

创建自定义服务

服务状态说明

查看推理服务详情

卸载服务

删除服务

常见问题

Q1：服务部署失败怎么办？

Q2：服务状态一直是「部署中」怎么办？

Q3：卸载服务后，之前创建的技能还能用吗？

百度一见 视觉智能体平台

部署自定义推理服务

推理服务类型

完整部署流程

创建自定义服务

服务状态说明

查看推理服务详情

卸载服务

删除服务

常见问题

Q1：服务部署失败怎么办？

Q2：服务状态一直是「部署中」怎么办？

Q3：卸载服务后，之前创建的技能还能用吗？

百度一见视觉智能体平台