获取模型版本详情

获取模型版本详情

更新时间：2026-05-11

POST

https://qianfan.baidubce.com/v2/model?Action=DescribeModel

本接口用于获取模型版本详情，如模型版本名称、描述、创建时间、输入输出模式、输入输出模式限制等。

权限说明

调用本文API，需符合以下权限要求，权限介绍及分配，请查看角色与权限控制列表、账号创建与权限分配。需具有以下任一权限：

完全控制千帆大模型平台的权限：QianfanFullControlAccessPolicy
只读访问千帆大模型平台的权限：QianfanReadAccessPolicy
完全控制千帆大模型平台模型调优的权限：QianfanModelTuningFullControlAccessPolicy
只读访问千帆大模型平台模型调优的权限：QianfanModelTuningReadAccessPolicy

鉴权说明

调用本文API，使用“基于安全认证AK/SK”进行签名计算鉴权，即使用安全认证中的Access Key ID 和 Secret Access Key进行鉴权，具体鉴权认证机制参考HTTP调用鉴权说明。

请求参数

Headers 参数

除公共头域外，无其它特殊头域

Query 参数

Action string

方法名称，固定值DescribeModel

必选

Body 参数

modelId string

模型版本ID，通过以下方式获取该字段值：
· 方式一，通过调用新建我的模型版本接口，返回的modelId字段获取
· 方式二，在控制台-我的模型中查看。

必选

请求结构

POST /v2/model?Action=DescribeModel HTTP/1.1
HOST: qianfan.baidubce.com
Authorization: authorization string
Content-Type: application/json
{
    "modelId": "amv-xxxxatka4jk0"
}

示例代码

请求示例


curl -i --location 'https://qianfan.baidubce.com/v2/model?Action=DescribeModel' \
--header 'Authorization: bce-auth-v1/f0ee7axxxx/2025-09-22T06:27:25Z/180000/host;x-bce-date/9a8cfb8eexxxxxxxxcae374525543' \ 
--header 'x-bce-date: 2025-09-22T06:27:25Z' \
--header 'Content-Type: application/json' \ 
--data '{
    "modelId":"amv-xxxxatka4jk0"
}'

返回响应

Headers 参数

除公共头域外，无其它特殊头域

返回参数

requestId string

请求ID

可选

result object {17}

模型版本相关信息

可选

显示子属性隐藏子属性

modelSetId string

模型ID

可选

modelId string

模型版本ID

可选

status string

状态，说明：
· Ready：已就绪
· Creating：创建中
· Fail：创建失败。

可选

modelName string

模型版本名称

可选

model string

基础模型版本名称

可选

sourceInfo object {4}

模型版本来源回溯信息

可选

显示子属性隐藏子属性

sourceType string

模型版本来源类型，不同类型对应不同的数据结构，说明：
· Train：大模型训练产生
· Acceleration：模型加速产生
· Import：外部导入模型
· PlatformPreset：平台预置模型版本。

可选

trainTaskId string

大模型训练任务ID

可选

accelerationTaskId string

模型版本加速任务ID

可选

importModelVersionBosUrl string

导入模型版本BOS地址

可选

description string

模型版本描述，说明：
· 当有模型版本描述时，才返回该字段；
· 如果无模型版本描述，不返回此字段

可选

createTime string

模型版本创建时间

可选

modifyTime string

模型版本修改时间

可选

modelApplicationType string

输入输出模式，说明：
· chat：对话模式
· completion：续写模式
· embedding：向量模式
· reranker：重排序模式
· Text-to-Image：文生图模式
· Image-to-Text：图生文模式
· video：视频生成模式
· voice：语音生成。

可选

tokenLimitations object {2}

输入输出长度限制

可选

显示子属性隐藏子属性

trivial object {3}

modelApplicationType非reranker类型的模型上下文限制

可选

显示子属性隐藏子属性

inputTokens integer

输入tokens限制

可选

outputTokens integer

输出tokens限制

可选

characterLimit integer

字符数限制

可选

reranker object {4}

modelApplicationType为reranker类型的模型上下文限制

可选

显示子属性隐藏子属性

queryTokens integer

query的tokens限制

可选

queryCharacterLimit integer

query的字符数限制

可选

documentTokens integer

document的tokens限制

可选

documentCharacterLimit integer

document的字符数限制

可选

isSupportDeploy boolean

是否支持部署

可选

isSupportModelComp boolean

是否支持压缩

可选

isSupportEvaluation boolean

是否支持评估

可选

resourceType array

资源类型，返回如下：
· CPU I型：CPU-1-1
· 加速卡I型：GPU-1-1、GPU-1-2、GPU-1-4、GPU-1-8
· 加速卡II型：GPU-2-1
· 加速卡III型：GPU-3-1
· 加速卡VI型：GPU-4-1、GPU-4-2
· 加速卡V型：GPU-5-1、GPU-5-2
· 加速卡VI型：GPU-6-1、GPU-6-2
· 加速卡VII型：GPU-7-1、GPU-7-2、GPU-7-4、GPU-7-8

可选

显示子属性隐藏子属性

items string

advancedSettings object {5}

量化压缩配置

可选

显示子属性隐藏子属性

hardwareType string

硬件类型

可选

samplingStrategy string

压缩时的采样策略，说明：
（1）当导入HuggingFace模型，且推理引擎为vLLM，该参数有效，
（2）可选值如下：
· 多项式采样：multinomialSampling
· 束搜索：beamSearch
· 贪心搜索：greedySearch。

可选

isPrecisionPrior boolean

是否精度优先

可选

numBeams integer

束数量，说明：
（1）当导入HuggingFace模型，该参数有效
（2）取值范围为2-15

可选

topLogprobs integer

logits中topk的值，范围为1～20

可选

modelCompConfigs array

模型压缩可选配置列表

可选

显示子属性隐藏子属性

items object {3}

显示子属性隐藏子属性

strategy string

模型压缩策略，说明：
· Quantization：量化压缩策略
· Sparsity：稀疏化压缩策略。

可选

sparsityRatio float

稀疏比例，strategy为Sparsity时返回

可选

weight string

量化压缩配置，说明：
（1）只有当strategy为Quantization时返回该字段
（2）说明：
· W8A8C4：EB模型
· W8A8C8：EB模型
· W8A8C16：EB模型
· W8A16C16：HF模型
· W4A16C16：HF模型。

可选

成功示例

HTTP/1.1 200 OK
{
    "requestId": "6ba7b810-xxxx-11d1-80b4-00c04fd430c8",
    "result": {
        "modelSetId": "am-xxxxtnsfq9sb",
        "modelId": "amv-xxxxatka4jk0",
        "modelName": "V2",
        "description": "clc_test_publish_chatglm32k_v10",
        "sourceInfo": {
            "sourceType": "Train",
            "trainTaskId": "task-xxxx"
        },
        "status": "Ready",
        "modelApplicationType": "chat",
        "tokenLimitations": {},
        "createTime": "2025-09-22T14:47:25+08:00",
        "modifyTime": "2025-09-22T14:47:27+08:00",
        "isSupportDeploy": true,
        "isSupportModelComp": false,
        "isSupportEvaluation": true,
        "model": "Qwen2.5-14B-Instruct",
        "resourceType": [
            "GPU-1-1"
        ],
        "advancedSettings": {
            "hardwareType": "nvidia-gpu",
            "samplingStrategy": "greedySearch",
            "isPrecisionPrior": false
        },
        "modelCompConfigs": [
            {
                "strategy": "Quantization",
                "weight": "W8A8C16"
            },
            {
                "strategy": "Quantization",
                "weight": "W8A16"
            },
            {
                "strategy": "Quantization",
                "weight": "W4A16"
            },
            {
                "strategy": "Quantization",
                "weight": "W8A8C16"
            }
        ]
    }
}

错误码

若请求错误，服务器将返回的JSON文本包含以下参数：

名称	描述
`requestId`	请求ID
`code`	错误码
`message`	错误描述信息，帮助理解和解决发生的错误

例如错误返回：

text

{
    "requestId":"6ba7b810-xxxc04fd430c8",
    "code":"AccessDenied",
    "message":"Access denied."
}

更多其他错误码，也可以查看错误码说明。

评价此篇文章

有帮助没帮助

百度智能云

千帆AI应用开发者中心-API参考 qianfan-api

千帆AI应用开发者中心-API参考 qianfan-api

权限说明

鉴权说明

请求参数

示例代码

返回响应

错误码