获取模型版本详情
本接口用于获取模型版本详情,如模型版本名称、描述、创建时间、输入输出模式、输入输出模式限制等。
权限说明
调用本文API,需符合以下权限要求,权限介绍及分配,请查看角色与权限控制列表、账号创建与权限分配。需具有以下任一权限:
- 完全控制千帆大模型平台的权限:QianfanFullControlAccessPolicy
- 只读访问千帆大模型平台的权限:QianfanReadAccessPolicy
- 完全控制千帆大模型平台模型调优的权限:QianfanModelTuningFullControlAccessPolicy
- 只读访问千帆大模型平台模型调优的权限:QianfanModelTuningReadAccessPolicy
鉴权说明
调用本文API,使用“基于安全认证AK/SK”进行签名计算鉴权,即使用安全认证中的Access Key ID 和 Secret Access Key进行鉴权,具体鉴权认证机制参考HTTP调用鉴权说明。
请求参数
方法名称,固定值DescribeModel
POST /v2/model?Action=DescribeModel HTTP/1.1
HOST: qianfan.baidubce.com
Authorization: authorization string
Content-Type: application/json
{
"modelId": "amv-xxxxatka4jk0"
}
示例代码
curl -i --location 'https://qianfan.baidubce.com/v2/model?Action=DescribeModel' \
--header 'Authorization: bce-auth-v1/f0ee7axxxx/2025-09-22T06:27:25Z/180000/host;x-bce-date/9a8cfb8eexxxxxxxxcae374525543' \
--header 'x-bce-date: 2025-09-22T06:27:25Z' \
--header 'Content-Type: application/json' \
--data '{
"modelId":"amv-xxxxatka4jk0"
}'
返回响应
请求ID
模型版本相关信息
显示子属性
隐藏子属性
模型ID
模型版本ID
状态,说明:
· Ready:已就绪
· Creating:创建中
· Fail:创建失败。
模型版本名称
基础模型版本名称
模型版本来源回溯信息
显示子属性
隐藏子属性
模型版本来源类型,不同类型对应不同的数据结构,说明:
· Train:大模型训练产生
· Acceleration:模型加速产生
· Import:外部导入模型
· PlatformPreset:平台预置模型版本。
大模型训练任务ID
模型版本加速任务ID
导入模型版本BOS地址
模型版本描述,说明:
· 当有模型版本描述时,才返回该字段;
· 如果无模型版本描述,不返回此字段
模型版本创建时间
模型版本修改时间
输入输出模式,说明:
· chat:对话模式
· completion:续写模式
· embedding:向量模式
· reranker:重排序模式
· Text-to-Image:文生图模式
· Image-to-Text:图生文模式
· video:视频生成模式
· voice:语音生成。
输入输出长度限制
显示子属性
隐藏子属性
modelApplicationType非reranker类型的模型上下文限制
显示子属性
隐藏子属性
输入tokens限制
输出tokens限制
字符数限制
modelApplicationType为reranker类型的模型上下文限制
显示子属性
隐藏子属性
query的tokens限制
query的字符数限制
document的tokens限制
document的字符数限制
是否支持部署
是否支持压缩
是否支持评估
资源类型,返回如下:
· CPU I型:CPU-1-1
· 加速卡I型:GPU-1-1、GPU-1-2、GPU-1-4、GPU-1-8
· 加速卡II型:GPU-2-1
· 加速卡III型:GPU-3-1
· 加速卡VI型:GPU-4-1、GPU-4-2
· 加速卡V型:GPU-5-1、GPU-5-2
· 加速卡VI型:GPU-6-1、GPU-6-2
· 加速卡VII型:GPU-7-1、GPU-7-2、GPU-7-4、GPU-7-8
显示子属性
隐藏子属性
量化压缩配置
显示子属性
隐藏子属性
硬件类型
压缩时的采样策略,说明:
(1)当导入HuggingFace模型,且推理引擎为vLLM,该参数有效,
(2)可选值如下:
· 多项式采样:multinomialSampling
· 束搜索:beamSearch
· 贪心搜索:greedySearch。
是否精度优先
束数量,说明:
(1)当导入HuggingFace模型,该参数有效
(2)取值范围为2-15
logits中topk的值,范围为1~20
模型压缩可选配置列表
显示子属性
隐藏子属性
显示子属性
隐藏子属性
模型压缩策略,说明:
· Quantization:量化压缩策略
· Sparsity:稀疏化压缩策略。
稀疏比例,strategy为Sparsity时返回
量化压缩配置,说明:
(1)只有当strategy为Quantization时返回该字段
(2)说明:
· W8A8C4:EB模型
· W8A8C8:EB模型
· W8A8C16:EB模型
· W8A16C16:HF模型
· W4A16C16:HF模型。
HTTP/1.1 200 OK
{
"requestId": "6ba7b810-xxxx-11d1-80b4-00c04fd430c8",
"result": {
"modelSetId": "am-xxxxtnsfq9sb",
"modelId": "amv-xxxxatka4jk0",
"modelName": "V2",
"description": "clc_test_publish_chatglm32k_v10",
"sourceInfo": {
"sourceType": "Train",
"trainTaskId": "task-xxxx"
},
"status": "Ready",
"modelApplicationType": "chat",
"tokenLimitations": {},
"createTime": "2025-09-22T14:47:25+08:00",
"modifyTime": "2025-09-22T14:47:27+08:00",
"isSupportDeploy": true,
"isSupportModelComp": false,
"isSupportEvaluation": true,
"model": "Qwen2.5-14B-Instruct",
"resourceType": [
"GPU-1-1"
],
"advancedSettings": {
"hardwareType": "nvidia-gpu",
"samplingStrategy": "greedySearch",
"isPrecisionPrior": false
},
"modelCompConfigs": [
{
"strategy": "Quantization",
"weight": "W8A8C16"
},
{
"strategy": "Quantization",
"weight": "W8A16"
},
{
"strategy": "Quantization",
"weight": "W4A16"
},
{
"strategy": "Quantization",
"weight": "W8A8C16"
}
]
}
}
错误码
若请求错误,服务器将返回的JSON文本包含以下参数:
| 名称 | 描述 |
|---|---|
requestId |
请求ID |
code |
错误码 |
message |
错误描述信息,帮助理解和解决发生的错误 |
例如错误返回:
{
"requestId":"6ba7b810-xxxc04fd430c8",
"code":"AccessDenied",
"message":"Access denied."
}
更多其他错误码,也可以查看错误码说明。
评价此篇文章
