公有云部署
更新时间:2023-01-18
公有云部署简介
模型仓库中的表格数据预测模型,可以通过公有云部署为在线服务,并对外提供REST API,已有的业务系统可以通过API进行模型预测服务的集成。
模型部署流程
- 将训练完成的表格预测模型发布到模型仓库,在模型仓库中的『版本列表』中点击『公有云部署』或者点击左侧导航栏的公有云部署,进入公有云部署界面后点击『部署模型』。
- 在部署界面,首先进行服务配置:自定义服务名称、接口地址后缀,选择需要部署的模型,
- 对每个部署模型还需要进行资源配置,配置模型预测服务所需机器资源。目前仅支持CPU机型,支持按配额与实例进行灵活配置,计费说明请点击查看
-
配置完成后,点击开始部署,在完成部署后可以通过配置的API地址调用预测服务。
说明:
1、系统将运行公有云部署的机器资源1核cpu和4G内存折算为1配额,提高配额数量能提升QPS和降低推理时延
2、实例为cpu资源运行的实例数,为保证服务的稳定性,实例数至少需要配置为2。实例数与QPS成正比关系,提高实例数时,QPS能正比增加
3、表格预测模型的API可以在模型仓库中模型版本详情页面的“API参考”页签中查看。
接口赋权
- 正式使用还需要对接口进行赋权,在已发布的服务的详情界面,点击『控制台』进入BML控制台。
- 在控制台中创建一个应用,获得由一串数字组成的appid、AK、SK,然后就可以参考接口文档正式使用了
- 如需为第三方用户配置调用接口的权限,可以前往BML控制台-公有云服务管理-权限管理配置
公有云部署列表
公有云部署列表信息由历史提交公有云服务组成,显示服务的基本信息。
如图,在预测服务列表页支持以下操作:
查看详情:点击进入该公有云服务的详情界面
重启:对已停止或部署失败的服务进行重新创建,恢复对应的服务为可用状态
停止:停止该公有云服务,用户不再使用相关服务后可进行这一操作,停止后将不进行计费
编辑模型:对于已经部署为公有云服务,但尚未配置机器资源的模型,点击可以配置机器资源
请求说明
请求示例
HTTP 方法:POST
请求URL: 请首先进行自定义模型训练,完成训练后可在服务列表中查看并获取url。
URL参数:
参数 | 值 |
---|---|
access_token | 通过API Key和Secret Key获取的access_token,参考“Access Token获取” |
Header如下:
参数 | 值 |
---|---|
Content-Type | application/json |
注意:如果出现336001的错误码很可能是因为请求方式错误,与其他图像识别服务不同的是定制化图像识别服务以json方式请求。
Body请求接口:
{
"include_req": false,
"data": <待预测数组>
}
具体示例如下:
{
"include_req": false,
"data": [{
"sepal_length": 5.1,
"sepal_width": 3.5,
"petal_length": 1.4,
"petal_width": 0.2
},
{
"sepal_length": 5.3,
"sepal_width": 3.4,
"petal_length": 1.2,
"petal_width": 0.3
}
]
}
Body中放置请求参数,参数详情如下:
请求参数
参数 | 是否必选 | 类型 | 可选值范围 | 说明 |
---|---|---|---|---|
data | 是 | array | - | 待预测数据,每条待预测数据是由各个特征及其取值构成的键值对的集合 |
返回说明
返回参数
字段 | 是否必选 | 类型 | 说明 |
---|---|---|---|
log_id | 是 | number | 唯一的log id,用于问题定位 |
error_code | 否 | number | 错误码,当请求错误时返回 |
error_msg | 否 | string | 错误描述信息,当请求错误时返回 |
batch_results | 否 | array(object) | 预测结果数组 |
错误码
若请求错误,服务器将返回的JSON文本包含以下参数:
- error_code:错误码。
- error_msg:错误描述信息,帮助理解和解决发生的错误。
例如Access Token失效返回:
{
"error_code": 110,
"error_msg": "Access token invalid or no longer valid"
}
需要重新获取新的Access Token再次请求即可。
错误码 | 错误信息 | 描述 |
---|---|---|
1 | Unknown error | 服务器内部错误,请再次请求, 如果持续出现此类错误,请在百度云控制台内提交工单反馈。 |
2 | Service temporarily unavailable | 服务暂不可用,请再次请求, 如果持续出现此类错误,请在百度云控制台内提交工单反馈。 |
3 | Unsupported openapi method | 调用的API不存在,请检查后重新尝试 |
4 | Open api request limit reached | 集群超限额 |
6 | No permission to access data | 无权限访问该用户数据 |
13 | Get service token failed | 获取token失败 |
14 | IAM Certification failed | IAM鉴权失败 |
15 | app not exists or create failed | 应用不存在或者创建失败 |
17 | Open api daily request limit reached | 每天请求量超限额,已上线计费的接口,请直接在控制台开通计费,调用量不受限制,按调用量阶梯计费;未上线计费的接口,请在百度云控制台内提交工单反馈 |
18 | Open api qps request limit reached | QPS超限额,已上线计费的接口,请直接在控制台开通计费,调用量不受限制,按调用量阶梯计费;未上线计费的接口,请在百度云控制台内提交工单反馈 |
19 | Open api total request limit reached | 请求总量超限额,已上线计费的接口,请直接在控制台开通计费,调用量不受限制,按调用量阶梯计费;未上线计费的接口,请在百度云控制台内提交工单反馈 |
100 | Invalid parameter | 无效的access_token参数,请检查后重新尝试 |
110 | Access token invalid or no longer valid | access_token无效 |
111 | Access token expired | access token过期 |
336000 | Internal error | 服务器内部错误,请再次请求, 如果持续出现此类错误,请在百度云控制台内提交工单反馈 |
336001 | Invalid Argument | 入参格式有误,比如缺少必要参数、data格式错误等等,可检查下请求数据格式是否有误。有疑问请在百度云控制台内提交工单反馈 |
336002 | JSON不合法 | 入参格式或调用方式有误,比如缺少必要参数或者代码格式有误。有疑问请在百度云控制台内提交工单反馈 |
336100 | model temporarily unavailable | 遇到该错误码请等待1分钟后再次请求,可恢复正常,若反复重试依然报错或有疑问请在百度云控制台内提交工单反馈 |