获取定制服务详情
本接口用于获取服务详情。
本接口用于获取服务详情。
权限说明
调用本文API,需符合以下权限要求,权限介绍及分配,请查看角色与权限控制列表、账号创建与权限分配。需具有以下任一权限:
* 完全控制千帆大模型平台的权限:QianfanFullControlAccessPolicy
* 运维操作千帆大模型平台预测服务的权限:QianfanServiceOperateAccessPolicy
* 只读访问千帆大模型平台预测服务的权限:QianfanServiceReadAccessPolicy
鉴权说明
调用本文API,使用"基于安全认证AK/SK"进行签名计算鉴权,即使用安全认证中的Access Key ID 和 Secret Access Key进行鉴权,具体鉴权认证机制参考HTTP调用鉴权说明。
请求参数
方法名称,固定值DescribeService
POST /v2/service?Action=DescribeService HTTP/1.1
Host: qianfan.baidubce.com
Authorization: authorization string
Content-Type: application/json
{
"serviceId":"svco-nzxxxxx4h"
}
示例代码
curl --location 'https://qianfan.baidubce.com/v2/service?Action=DescribeService' \
--header 'Authorization: bce-auth-v1/047ab241bad24166b42a4d2e3e28b1ac/2024-01-10T08:39:09Z/180000/host;x-bce-date/eae9855604c2e3xxxxxa3f0a7318bb94f17f7e03cfcbaff' \
--header 'Content-Type: application/json' \
--data '{
"serviceId":"svco-nzxxxxx4h"
}'
返回响应
多选一且必需“只能”符合其中一个
显示子属性
隐藏子属性
成功响应
显示子属性
隐藏子属性
请求ID
显示子属性
隐藏子属性
服务ID
基础模型版本
模型ID
模型版本ID
服务名称
服务描述
服务URL
接入点
服务类型
服务状态,说明:New:待发布;Deploying:发布中;Serving:已发布;Failed:发布失败;Stopped:暂停服务。可选值: New, Deploying, Serving, Failed, Stopped
更新状态,说明:None:无更新
付费类型,说明:ComputingUnit: 算力单元使用时长;Tokens: Tokens调用量。可选值: ComputingUnit, Tokens
付费方式,说明:Prepay: 预付费;Postpay: 后付费;Prepay,Postpay: 预付费+后付费。可选值: Prepay, Postpay, Prepay,Postpay
付费状态。可选值: NotOpen, Opened, Free
显示子属性
隐藏子属性
资源类型,说明:GPU-I-2:AI加速卡-I型-2算力单元;GPU-I-4:AI加速卡-I型-4算力单元;CPU-I-2:CPU-I型-2算力单元。可选值: GPU-I-2, GPU-I-4, CPU-I-2
单副本QPS
购买副本数量
资源地域,说明:bj:北京;bd:保定;gz:广州;su:苏州;nj:南京。可选值: bj, bd, gz, su, nj
显示子属性
隐藏子属性
资源类型,说明:GPU-I-2:AI加速卡-I型-2算力单元;GPU-I-4:AI加速卡-I型-4算力单元;CPU-I-2:CPU-I型-2算力单元。可选值: GPU-I-2, GPU-I-4, CPU-I-2
资源地域,说明:bj:北京;bd:保定;gz:广州;su:苏州;nj:南京。可选值: bj, bd, gz, su, nj
单副本QPS
单副本算力单元数
部署副本总数
显示子属性
隐藏子属性
显示子属性
隐藏子属性
算力单元实例ID
部署副本数
部署使用算力单元数,等于单副本算力单元数*部署副本数
资源状态
付费类型,Prepaid:预付费;Postpaid:表示后付费。可选值: Prepaid, Postpaid
算力单元实例的到期时间
模型版本是否更新中
是否绑定日志投递
显示子属性
隐藏子属性
日志集所在地域。当enableLogs为true,显示logRegion
日志组名称。当enableLogs为true,显示logProject
日志集名称。当enableLogs为true,显示logStoreName
创建人
创建时间(格式: ISO 8601)
服务版本
url后缀,说明:(1)只有在请求参数protocolVersion=2时,返回该参数(2)该参数用在调用推理服务V2接口,针对平台训练调用API,此参数为model值
错误响应
显示子属性
隐藏子属性
请求ID
错误码
错误描述信息,帮助理解和解决发生的错误
{
"requestId": "93c46f79-525a-45af-9d1d-b59c70f3ebcd",
"result": {
"serviceId": "svco-nzxxxx4h",
"baseModel": "CodeLlama-7B",
"modelSetId": "am-gbxxxxpvb",
"modelId": "amv-9jxxxxx5m4",
"name": "lf_postp***",
"description": "lf_postpay",
"url": "http://as***",
"endpoint":"lq8z6*****",
"serviceType": "chat",
"runStatus": "New",
"scaleStatus": "None",
"updateStatus": "None",
"chargeType": "",
"payType": "",
"chargeStatus": "NotOpen",
"resourceConfig": {
"region": "bd",
"type": "GPU-1-1",
"replicasCount": 0,
"qps": 3
},
"isModelUpdating": false,
"enableLogs": false,
"logStoreConfig": {},
"creator": "百里**",
"createTime": "2024-12-24T09:32:54Z",
"deploymentConfig": {
"type": "GPU-1-1",
"region": "bd",
"qps": 3,
"replicasComputeUnitCount": 0,
"replicasCount": 0
},
"protocolVersion": 1
}
}
错误码
若请求错误,服务器将返回的JSON文本包含以下参数:
| 名称 | 描述 |
|---|---|
requestId |
请求ID |
code |
错误码 |
message |
错误描述信息,帮助理解和解决发生的错误 |
例如错误返回:
{
"requestId":"6ba7b810-xxxc04fd430c8",
"code":"AccessDenied",
"message":"Access denied."
}
更多其他错误码,也可以查看错误码说明。
