创建定制服务
更新时间:2025-05-13
接口描述
本接口用于创建服务。
权限说明
调用本文API,需符合以下权限要求,权限介绍及分配,请查看角色与权限控制列表、账号创建与权限分配。需具有以下任一权限:
- 完全控制千帆大模型平台的权限:QianfanFullControlAccessPolicy
- 运维操作千帆大模型平台预测服务的权限:QianfanServiceOperateAccessPolicy
鉴权说明
调用本文API,使用“基于安全认证AK/SK”进行签名计算鉴权,即使用安全认证中的Access Key ID 和 Secret Access Key进行鉴权,具体鉴权认证机制参考HTTP调用鉴权说明。
请求结构
Bash
1POST /v2/service?Action=CreateService HTTP/1.1
2Host: qianfan.baidubce.com
3Authorization: authorization string
4Content-Type: application/json
5
6{
7 "modelSetId": "am-3aa2***5c9",
8 "modelId": "amv-ur1u1***722s",
9 "name": "apitest_1226_3",
10 "urlSuffix": "apitest_1226_3",
11 "deploymentConfig": {
12 "qps": 1,
13 "replicaComputeUnitCount": 1,
14 "replicasCount":1,
15 "deploymentComputeUnitList": [
16 {
17 "instanceId": "unit-gdqb1Fot",
18 "deploymentReplicasCount": 2
19 }
20 ]
21 },
22 "protocolVersion": 1
23}
请求头域
除公共头域外,无其它特殊头域。
请求参数
- Query参数
名称 | 类型 | 必填 | 描述 |
---|---|---|---|
Action | string | 是 | 方法名称,固定值CreateService |
- Body参数
名称 | 类型 | 必填 | 描述 |
---|---|---|---|
modelSetId | string | 是 | 模型ID,示例:am-gh0azfeb9adu,说明: 通过以下方法获取该字段值:在控制台-我的模型查看,如下图所示 ![]() |
modelId | string | 是 | 模型版本ID,示例:amv-g73j3faikzpz,说明: 通过以下方式获取该字段值: · 方式一,通过调用获取模型详情接口,返回的modelVersionIdStr字段获取 · 方式二,在控制台-我的模型-点击某模型详情,在版本列表中查看 ![]() |
name | string | 是 | 服务名称,说明: 取值范围:字符串长度为 [2, 20] |
description | string | 否 | 服务描述,说明: 取值范围:字符串长度为 [0, 500] |
urlSuffix | string | 是 | 服务URL后缀,说明: (1)取值范围:字符串长度为 [2, 20] (2)字符规则:支持小写英文字母、数字、下划线(_)、短横线(-),首尾必须为字母或数字 |
deploymentConfig | object | 否 | 表示使用已有资源部署,说明:当新购资源部署时,必须同时填写 resourceConfig 和 billing参数 |
resourceConfig | object | 否 | 资源配置,说明: (1)当新购资源,该参数必填 (2)付费资源类型为Tokens,即chargeType=Tokens时,该字段非必填 |
billing | object | 否 | 订单、计费相关参数,说明:当新购资源,该参数必填 |
protocolVersion | int | 否 | 服务版本,可选值如下: · 1,默认1 · 2 |
deploymentConfig说明
名称 | 类型 | 必填 | 描述 |
---|---|---|---|
deploymentComputeUnitList | List<object> | 是 | 部署使用算力单元列表,说明: (1)填写用于部署该模型的算力单元实例ID (2)列表为空时,按照新购资源部署模型处理 |
replicasCount | int | 是 | 资源申请副本数量 |
qps | float | 否 | 单副本QPS,不填系统默认使用模型预估QPS取值范围:(0, 50],精确到0.01 |
replicaComputeUnitCount | int | 否 | 单副本算力单元,仅对HF模型有效 |
deploymentComputeUnitList说明
名称 | 类型 | 必填 | 描述 |
---|---|---|---|
instanceId | string | 是 | 资源实例ID |
deploymentReplicasCount | int | 是 | 资源申请副本数量 |
resourceConfig说明
名称 | 类型 | 必填 | 描述 |
---|---|---|---|
region | string | 否 | 资源地域,说明: (1)如果不填写该字段,系统默认获取满足资源的region (2)如果填写该字段,可选值如下: · bj:北京 · bd:保定 |
type | string | 否 | 资源类型,说明: (1)可选值如下: · CPU I型:CPU-1-1 · 加速卡I型:GPU-1-1、GPU-1-2、GPU-1-4、GPU-1-8 · 加速卡V型:GPU-5-1、GPU-5-2 · 加速卡VI型:GPU-6-1、GPU-6-2 · 加速卡VII型:GPU-7-1、GPU-7-2 (2)付费资源类型为ComputingUnit,即chargeType=ComputingUnit时,该字段必填 |
qps | float | 否 | 单副本QPS,说明: (1)不填此字段,默认使用模型预估QPS (2)取值范围:(0, 50],精确到0.01 |
replicasCount | int | 是 | 购买副本数量 |
billing说明
名称 | 类型 | 必填 | 描述 |
---|---|---|---|
paymentTiming | string | 是 | 付费类型,可选值: · Prepaid:预付费 · Postpaid: 后付费 |
reservation | object | 否 | 保留信息,说明: (1)只有当付费类型为预付费,即paymentTiming值为Prepaid时,该字段必填 (2)付费类型为后付费,无需填写此参数 |
chargeType | string | 否 | 付费资源类型,说明: (1)只有当付费类型为后付费,即paymentTiming值为Postpaid时,该字段必填,可选值如下: · ComputingUnit:算力单元,默认值为ComputingUnit · Tokens:Tokens消耗量 (2)付费类型为预付费,无需填写此参数 |
releaseTime | string | 否 | 定时释放时间,说明: (1)只有当付费类型为后付费,即paymentTiming值为Postpaid时,该字段有效 (2)支持RFC3339格式和标准格式,如 2030-01-25T12:30:30+08:00 、2030-01-25 12:30:30 |
reservation说明
名称 | 类型 | 必填 | 描述 |
---|---|---|---|
reservationTimeUnit | string | 是 | 时间单位,可选值: · Month: 月 |
reservationLength | int | 是 | 购买时长,说明: · 时间单位为月,取值范围 [1-12] |
autoRenew | boolean | 否 | 是否自动续费,可选值: · true:是 · false:否,默认值为false |
autoRenewTimeUnit | string | 否 | 自动续费周期时间单位,默认值为Month,可选值: · Month:月 |
autoRenewTime | int | 否 | 自动续费时长,说明: (1)单位:月 (2)默认值为1,取值范围:[1,6] |
响应头域
除公共头域外,无其它特殊头域。
响应参数
名称 | 类型 | 描述 |
---|---|---|
requestId | string | 请求ID |
result | object | 请求结果 |
result说明
名称 | 类型 | 描述 |
---|---|---|
serviceId | string | 服务ID |
instanceId | string | 实例ID,说明:只有新购资源,返回该字段 |
orderId | string | 订单ID,说明:只有新购资源,返回该字段 |
请求示例
- 已购资源创建服务
Bash
1curl --location 'https://qianfan.baidubce.com/v2/service?Action=CreateService' \
2--header 'Authorization: bce-auth-v1/047ab***3e28b1ac/2024-01-10T08:39:09Z/180000/host;x-bce-date/817d842c4243xx***304cb01' \
3--header 'Content-Type: application/json' \
4--data '{
5 "modelSetId": "am-3aa2***5c9",
6 "modelId": "amv-ur1u1***722s",
7 "name": "apitest_1226_3",
8 "urlSuffix": "apitest_1226_3",
9 "deploymentConfig": {
10 "qps": 1,
11 "replicaComputeUnitCount": 1,
12 "replicasCount":1,
13 "deploymentComputeUnitList": [
14 {
15 "instanceId": "unit-gdqb1Fot",
16 "deploymentReplicasCount": 2
17 }
18 ]
19 },
20 "protocolVersion": 1
21}'
- 新购资源创建服务
Bash
1curl --location 'https://qianfan.baidubce.com/v2/service?Action=CreateService' \
2--header 'Authorization: bce-auth-v1/047ab***3e28b1ac/2024-01-10T08:39:09Z/180000/host;x-bce-date/817d842c4243xx***304cb01' \
3--header 'Content-Type: application/json' \
4--data '{
5 "modelSetId": "am-3aa232bah5c9",
6 "modelId": "amv-ur1u1bez722s",
7 "name": "apitest_1226_7",
8 "urlSuffix": "apitest_1226_7",
9 "resourceConfig": {
10 "region": "bj",
11 "type": "GPU-1-1",
12 "qps": 1,
13 "replicasCount": 1
14 },
15 "billing": {
16 "paymentTiming": "Postpaid"
17
18 },
19 "protocolVersion": 1
20}'
响应示例
- 已购资源创建服务
JSON
1{
2 "requestId": "18a7c588-7157-4184-b911-e4ccfe5f719b",
3 "result": {
4 "serviceId": "svco-juw***j1"
5 }
6}
- 新购资源创建服务
JSON
1{
2 "requestId": "34cee53b-7064-418c-843b-fd0594536c3d",
3 "result": {
4 "instanceId": "unit-zO***0Ck",
5 "orderId": "98cd9fb0e1524db6854ff05c471e6d62",
6 "serviceId": "svco-hc5***jumb"
7 }
8}
错误码
若请求错误,服务器将返回的JSON文本包含以下参数:
名称 | 描述 |
---|---|
requestId | 请求ID |
code | 错误码 |
message | 错误描述信息,帮助理解和解决发生的错误 |
例如错误返回:
Plain Text
1{
2 "requestId":"6ba7b810-xxxc04fd430c8",
3 "code":"AccessDenied",
4 "message":"Access denied."
5}
更多相关错误码,请查看错误码说明。