创建模型压缩任务
更新时间:2025-04-16
功能介绍
用于创建模型压缩任务。
使用说明
本文API支持通过千帆Python SDK、Go SDK、Java SDK 和 Node.js SDK调用,调用流程请参考SDK安装及使用流程。
权限说明
调用本文API,需符合以下权限要求,权限介绍及分配,请查看角色与权限控制列表、账号创建与权限分配。需具有以下任一权限:
- 完全控制千帆大模型平台的权限:QianfanFullControlAccessPolicy
- 完全控制千帆大模型平台模型调优的权限:QianfanModelTuningFullControlAccessPolicy
SDK调用
调用示例
1import os
2from qianfan import resources
3
4# 通过环境变量初始化认证信息
5# 使用安全认证AK/SK调用,替换下列示例中参数,安全认证Access Key替换your_iam_ak,Secret Key替换your_iam_sk,如何获取请查看https://cloud.baidu.com/doc/Reference/s/9jwvz2egb
6os.environ["QIANFAN_ACCESS_KEY"] = "your_iam_ak"
7os.environ["QIANFAN_SECRET_KEY"] = "your_iam_sk"
8
9
10
11resp = resources.console.utils.call_action(
12 # 调用本文API,该参数值为固定值,无需修改;对应API调用文档-请求结构-请求地址的后缀
13 "/v2/model",
14 # 调用本文API,该参数值为固定值,无需修改;对应API调用文档-请求参数-Query参数的Action
15 "CreateModelCompTask",
16 # 请查看本文请求参数说明,根据实际使用选择参数;对应API调用文档-请求参数-Body参数
17 {
18 "name":"demo",
19 "description": "test",
20 "sourceModelId": "amv-d1zx1iwdarfr",
21 "modelSetId": "am-adbuasyfaf",
22 "config": {
23 "strategy": "Quantization",
24 "weight": "int8-ptq"
25 }
26 }
27)
28
29print(resp.body)
1import com.baidubce.qianfan.Qianfan;
2import com.baidubce.qianfan.model.console.ConsoleResponse;
3import com.baidubce.qianfan.util.CollUtils;
4import com.baidubce.qianfan.util.Json;
5import java.util.Map;
6
7public class Dome {
8 public static void main(String args[]){
9 // 使用安全认证AK/SK鉴权,替换下列示例中参数,安全认证Access Key替换your_iam_ak,Secret Key替换your_iam_sk
10 Qianfan qianfan = new Qianfan("your_iam_ak", "your_iam_sk");
11
12 ConsoleResponse<Map<String, Object>> response = qianfan.console()
13 // 调用本文API,该参数值为固定值,无需修改;对应API调用文档-请求结构-请求地址的后缀
14 .route("/v2/model")
15 // 调用本文API,该参数值为固定值,无需修改;对应API调用文档-请求参数-Query参数的Action
16 .action("CreateModelCompTask")
17 // 需要传入参数的场景,可以自行封装请求类,或者使用Map.of()来构建请求Body
18 // Java 8可以使用SDK提供的CollUtils.mapOf()来替代Map.of()
19 // 请查看本文请求参数说明,根据实际使用选择参数;对应API调用文档-请求参数-Body参数
20 .body(CollUtils.mapOf(
21 "name","demo",
22 "description", "test",
23 "sourceModelId", "amv-d1zx1iwdarfr",
24 "modelSetId", "am-adbuasyfaf",
25 "config", CollUtils.mapOf(
26 "strategy", "Quantization",
27 "weight", "int8-ptq"
28 )
29 ))
30 .execute();
31
32 System.out.println(Json.serialize(response));
33 }
34}
1import {consoleAction, setEnvVariable} from "@baiducloud/qianfan";
2
3// 使用安全认证AK/SK鉴权,通过环境变量初始化;替换下列示例中参数,安全认证Access Key替换your_iam_ak,Secret Key替换your_iam_sk
4setEnvVariable('QIANFAN_ACCESS_KEY','your_iam_ak');
5setEnvVariable('QIANFAN_SECRET_KEY','your_iam_sk');
6
7async function main() {
8 //base_api_route:调用本文API,该参数值为固定值,无需修改;对应API调用文档-请求结构-请求地址的后缀
9 //action:调用本文API,该参数值为固定值,无需修改;对应API调用文档-请求参数-Query参数的Action
10 //data:请查看本文请求参数说明,根据实际使用选择参数;对应API调用文档-请求参数-Body参数
11 const res = await consoleAction({base_api_route: '/v2/model', action: 'CreateModelCompTask', data: {
12 "name":"demo",
13 "description": "test",
14 "sourceModelId": "amv-d1zx1iwdarfr",
15 "modelSetId": "am-adbuasyfaf",
16 "config": {
17 "strategy": "Quantization",
18 "weight": "int8-ptq"
19 }
20 }
21 });
22
23 console.log(res);
24}
25main();
返回示例
1{
2 'requestId': 'f6626bb8-ccec-4991-9b09-a2641cd098d5',
3 'result': 'amva-5v3zbk9wi8rp'
4}
1{
2 'requestId': 'f6626bb8-ccec-4991-9b09-a2641cd098d5',
3 'result': 'amva-5v3zbk9wi8rp'
4}
1{
2 "requestId": "6ba7b810-9dad-11d1-80b4-00c04fd430c8",
3 "result": "amva-abcxxxx15t"
4}
1{
2 requestId: '6ba7b810-9dad-11d1-80b4-00c04fd430c8',
3 result: 'amva-abcxxxx15t'
4}
请求参数
名称 | 类型 | 必填 | 描述 |
---|---|---|---|
name | string | 是 | 模型压缩任务名称 |
description | string | 否 | 模型压缩任务描述 |
sourceModelId | string | 是 | 待加速模型版本ID, 模型版本ID需满足以下要求: 根据模型版本ID,调用获取模型版本详情接口,查看返回字段isSupportModelComp值,必须为true,对应的模型版本ID可以为该字段sourceModelId的值;如果为false,对应的模型版本ID不能为该字段sourceModelId的值 |
config | object | 是 | 模型压缩策略配置信息 |
modelSetId | string | 是 | 压缩后的模型版本所属模型id,可以通过以下任一方式获取该字段值: · 方式一:通过调用获取我的模型列表接口,返回的modelSetId字段获取 · 方式二:通过调用新建我的模型接口,创建不带版本的空模型,返回的result字段获取 |
config说明
名称 | 类型 | 必填 | 描述 |
---|---|---|---|
strategy | string | 是 | 模型压缩策略,可选值如下: · Quantization:量化压缩策略 · Sparsity:稀疏化压缩策略 |
weight | string | 否 | 量化压缩配置,说明: (1)当strategy为Quantization时,该字段必填 (2)可选值: · INT8-PTQ · W8A16C16 · W4A16C16 |
返回参数
名称 | 类型 | 描述 |
---|---|---|
requestId | string | 请求ID |
result | string | 模型压缩任务id |