在开发机中将模型部署为在线服务
更新时间:2026-03-13
介绍
本功能允许您将开发机中调试完成的模型环境直接封装为镜像,并快速部署为在线推理服务(Inference Service)。通过此流程,无需复杂的Docker构建过程,即可将实验环境转化为可对外提供API调用的生产服务。
前置条件
- 已创建一个开发机实例,并在其中完成了模型代码的调试。
- 模型文件和推理代码(如 app.py)已保存在开发机环境中。
- 确认推理代码已配置好监听端口(例如 8080 或 8000)。
操作步骤
- 在开发机中制作镜像:详情参见在开发机中制作镜像。
- 进入镜像制作记录:点击该开发机实例名称,进入 实例详情 页面,进入 “镜像制作记录” 标签页

- 创建推理服务:在“镜像制作记录”列表中找到需要部署的镜像版本,在右侧“操作”列中,点击 “更多” 下拉菜单,选择 “创建推理服务” 选项。
-
填写服务配置信息:可参考在线服务部署。
- 备注:填写信息时您无需再填写镜像地址。若需更换镜像,可点击百舸预置镜像,或点击百舸预置镜像后回点镜像地址即可刷新。

- 配置完成后,点击确定提交,即可成功在开发机中将模型部署为在线服务。
