创建模型压缩任务
更新时间:2026-02-26
POST
https://qianfan.baidubce.com/v2/model?Action=CreateModelCompTask
本接口用于创建模型压缩任务。
权限说明
调用本文API,需符合以下权限要求,权限介绍及分配,请查看角色与权限控制列表、账号创建与权限分配。需具有以下任一权限:
- 完全控制千帆大模型平台的权限:QianfanFullControlAccessPolicy
- 完全控制千帆大模型平台模型调优的权限:QianfanModelTuningFullControlAccessPolicy
鉴权说明
调用本文API,使用"基于安全认证AK/SK"进行签名计算鉴权,即使用安全认证中的Access Key ID 和 Secret Access Key进行鉴权,具体鉴权认证机制参考HTTP调用鉴权说明。
请求参数
Headers 参数
除公共头域外,无其它特殊头域
Query 参数
Action
string
方法名称,固定值CreateModelCompTask
必选
Body 参数
name
string
模型压缩任务名称
必选
description
string
模型压缩任务描述
可选
sourceModelId
string
待加速模型版本ID,模型版本ID需满足以下要求:根据模型版本ID,调用获取模型版本详情接口,查看返回字段isSupportModelComp值,必须为true,对应的模型版本ID可以为该字段sourceModelId的值;如果为false,对应的模型版本ID不能为该字段sourceModelId的值
必选
modelSetId
string
压缩后的模型版本所属模型id,可以通过以下任一方式获取该字段值:
· 方式一:通过调用获取我的模型列表接口,返回的modelSetId字段获取
· 方式二:通过调用新建我的模型接口,创建不带版本的空模型,返回的result字段获取
必选
config
object {2}
模型压缩策略配置信息
必选
显示子属性
隐藏子属性
strategy
string
模型压缩策略,可选值如下:
· Quantization:量化压缩策略
· Sparsity:稀疏化压缩策略
必选
weight
string
量化压缩配置,说明:
(1)当strategy为Quantization时,该字段必填
(2)可选值:
· INT8-PTQ
· W8A16C16
· W4A16C16
可选
请求结构
POST /v2/model?Action=CreateModelCompTask HTTP/1.1
Host: qianfan.baidubce.com
Content-Type: application/json
{
"name": "demo",
"description": "test",
"sourceModelId": "amv-d1zx1iwdarfr",
"modelSetId": "am-adbuasyfaf",
"config": {
"strategy": "Quantization",
"weight": "INT8-PTQ"
}
}
示例代码
请求示例
curl -X POST "https://qianfan.baidubce.com/v2/model?Action=CreateModelCompTask" \
-H "Content-Type: application/json" \
-d '{
"name": "demo",
"description": "test",
"sourceModelId": "amv-d1zx1iwdarfr",
"modelSetId": "am-adbuasyfaf",
"config": {
"strategy": "Quantization",
"weight": "INT8-PTQ"
}
}'
返回响应
Headers 参数
除公共头域外,无其它特殊头域
返回参数
requestId
string
请求ID
可选
result
string
模型压缩任务id
可选
成功响应示例
{
"requestId": "6ba7b810-9dad-11d1-80b4-00c04fd430c8",
"result": "amva-abcxxxx15t"
}
错误码
若请求错误,服务器将返回的JSON文本包含以下参数:
| 名称 | 描述 |
|---|---|
requestId |
请求ID |
code |
错误码 |
message |
错误描述信息,帮助理解和解决发生的错误 |
例如错误返回:
