创建定制服务
本接口用于创建服务。
权限说明
调用本文API,需符合以下权限要求,权限介绍及分配,请查看角色与权限控制列表、账号创建与权限分配。需具有以下任一权限:
- 完全控制千帆大模型平台的权限:QianfanFullControlAccessPolicy
- 运维操作千帆大模型平台预测服务的权限:QianfanServiceOperateAccessPolicy
鉴权说明
调用本文API,使用“基于安全认证AK/SK”进行签名计算鉴权,即使用安全认证中的Access Key ID 和 Secret Access Key进行鉴权,具体鉴权认证机制参考HTTP调用鉴权说明。
请求参数
方法名称,固定值CreateService
服务名称,说明:取值范围:字符串长度为 [2, 20]
服务描述,说明:取值范围:字符串长度为 [0, 500]
服务URL后缀,说明:(1)取值范围:字符串长度为 [2, 20](2)字符规则:支持小写英文字母、数字、下划线(_)、短横线(-),首尾必须为字母或数字
表示使用已有资源部署,说明:当新购资源部署时,必须同时填写 resourceConfig 和 billing参数
显示子属性
隐藏子属性
部署使用算力单元列表,说明:(1)填写用于部署该模型的算力单元实例ID (2)列表为空时,按照新购资源部署模型处理
显示子属性
隐藏子属性
显示子属性
隐藏子属性
资源实例ID
资源申请副本数量
资源申请副本数量
单副本QPS,不填系统默认使用模型预估QPS取值范围:(0, 50],精确到0.01
单副本算力单元,仅对HF模型有效
资源配置,说明:(1)当新购资源,该参数必填 (2)付费资源类型为Tokens,即chargeType=Tokens时,该字段非必填
显示子属性
隐藏子属性
资源地域,说明:(1)如果不填写该字段,系统默认获取满足资源的region (2)如果填写该字段,可选值如下:· bj:北京 · bd:保定。
资源类型,说明:(1)可选值如下:· CPU I型:CPU-1-1 · 加速卡I型:GPU-1-1、GPU-1-2、GPU-1-4、GPU-1-8 · 加速卡V型:GPU-5-1、GPU-5-2 · 加速卡VI型:GPU-6-1、GPU-6-2 · 加速卡VII型:GPU-7-1、GPU-7-2 (2)付费资源类型为ComputingUnit,即chargeType=ComputingUnit时,该字段必填。
单副本QPS,说明:(1)不填此字段,默认使用模型预估QPS(2)取值范围:(0, 50],精确到0.01
购买副本数量
订单、计费相关参数,说明:当新购资源,该参数必填
显示子属性
隐藏子属性
付费类型。可选值: Prepaid, Postpaid
保留信息,说明:(1)只有当付费类型为预付费,即paymentTiming值为Prepaid时,该字段必填 (2)付费类型为后付费,无需填写此参数
显示子属性
隐藏子属性
时间单位。可选值: Month
购买时长,说明:时间单位为月,取值范围 [1-12]
是否自动续费,可选值:· true:是 · false:否,默认值为false。默认值: false
自动续费周期时间单位,默认值为Month。可选值: Month。默认值: Month
自动续费时长,说明:(1)单位:月 (2)默认值为1,取值范围:[1,6]。默认值: 1
付费资源类型,说明:(1)只有当付费类型为后付费,即paymentTiming值为Postpaid时,该字段必填,可选值如下:· ComputingUnit:算力单元,默认值为ComputingUnit · Tokens:Tokens消耗量 (2)付费类型为预付费,无需填写此参数。
定时释放时间,说明:(1)只有当付费类型为后付费,即paymentTiming值为Postpaid时,该字段有效(2)支持RFC3339格式和标准格式,如2030-01-25T12:30:30+08:00、2030-01-25 12:30:30
服务版本。可选值: 1, 2。默认值: 1
POST /v2/service?Action=CreateService HTTP/1.1
Host: qianfan.baidubce.com
Authorization: authorization string
Content-Type: application/json
{
"modelSetId": "am-3aa2***5c9",
"modelId": "amv-ur1u1***722s",
"name": "apitest_1226_3",
"urlSuffix": "apitest_1226_3",
"deploymentConfig": {
"qps": 1,
"replicaComputeUnitCount": 1,
"replicasCount":1,
"deploymentComputeUnitList": [
{
"instanceId": "unit-gdqb1Fot",
"deploymentReplicasCount": 2
}
]
},
"protocolVersion": 1
}
示例代码
curl --location 'https://qianfan.baidubce.com/v2/service?Action=CreateService' \
--header 'Authorization: bce-auth-v1/047ab***3e28b1ac/2024-01-10T08:39:09Z/180000/host;x-bce-date/817d842c4243xx***304cb01' \
--header 'Content-Type: application/json' \
--data '{
"modelSetId": "am-3aa2***5c9",
"modelId": "amv-ur1u1***722s",
"name": "apitest_1226_3",
"urlSuffix": "apitest_1226_3",
"deploymentConfig": {
"qps": 1,
"replicaComputeUnitCount": 1,
"replicasCount":1,
"deploymentComputeUnitList": [
{
"instanceId": "unit-gdqb1Fot",
"deploymentReplicasCount": 2
}
]
},
"protocolVersion": 1
}'
curl --location 'https://qianfan.baidubce.com/v2/service?Action=CreateService' \
--header 'Authorization: bce-auth-v1/047ab***3e28b1ac/2024-01-10T08:39:09Z/180000/host;x-bce-date/817d842c4243xx***304cb01' \
--header 'Content-Type: application/json' \
--data '{
"modelSetId": "am-3aa232bah5c9",
"modelId": "amv-ur1u1bez722s",
"name": "apitest_1226_7",
"urlSuffix": "apitest_1226_7",
"resourceConfig": {
"region": "bj",
"type": "GPU-1-1",
"qps": 1,
"replicasCount": 1
},
"billing": {
"paymentTiming": "Postpaid"
},
"protocolVersion": 1
}'
返回响应
请求ID
显示子属性
隐藏子属性
服务ID
实例ID,说明:只有新购资源,返回该字段
订单ID,说明:只有新购资源,返回该字段
{
"requestId": "18a7c588-7157-4184-b911-e4ccfe5f719b",
"result": {
"serviceId": "svco-juw***j1"
}
}
{
"requestId": "34cee53b-7064-418c-843b-fd0594536c3d",
"result": {
"instanceId": "unit-zO***0Ck",
"orderId": "98cd9fb0e1524db6854ff05c471e6d62",
"serviceId": "svco-hc5***jumb"
}
}
错误码
若请求错误,服务器将返回的JSON文本包含以下参数:
| 名称 | 描述 |
|---|---|
requestId |
请求ID |
code |
错误码 |
message |
错误描述信息,帮助理解和解决发生的错误 |
例如错误返回:
{
"requestId":"6ba7b810-xxxc04fd430c8",
"code":"AccessDenied",
"message":"Access denied."
}
更多其他错误码,也可以查看错误码说明。


