创建模型精调任务

创建模型精调任务

更新时间：2026-04-17

POST

https://qianfan.baidubce.com/v2/finetuning?Action=CreateFineTuningTask

本接口用于创建模型精调任务。

权限说明

调用本文API，需符合以下权限要求，权限介绍及分配，请查看角色与权限控制列表、账号创建与权限分配。需具有以下任一权限：

完全控制千帆大模型平台的权限：QianfanFullControlAccessPolicy
完全控制千帆大模型平台模型调优的权限：QianfanModelTuningFullControlAccessPolicy

鉴权说明

调用本文API，使用"基于安全认证AK/SK"进行签名计算鉴权，即使用安全认证中的Access Key ID 和 Secret Access Key进行鉴权，具体鉴权认证机制参考HTTP调用鉴权说明。

请求参数

Headers 参数

除公共头域外，无其它特殊头域

Query 参数

Action string

方法名称，固定值CreateFineTuningTask

必选

Body 参数

jobId string

作业ID，可以通过以下方式获取该参数值，以SFT为例说明：在控制台-模型精调页面，查看ID

必选

incrementTaskId string

基础任务ID，说明：（1）如果是增量训练，该字段必传（2）传了该字段，默认走增量训练（3）基础任务的模型类型要和作业一致（4）自定义模型作业不支持增量训练

可选

incrementCheckpointStep integer

基础任务Step，说明：如果基础任务是多checkpoint任务，该字段必传

可选

parameterScale string

调优的参数规模，该字段取值详情参考模型支持情况

可选

hyperParameterConfig object {58}

超参数配置，说明：该字段请查看本文hyperParameterConfig说明，也可以参考模型支持情况

必选

显示子属性隐藏子属性

epoch integer

迭代轮次，说明：该字段取值详情参考模型支持情况

可选

learningRate number

学习率，说明：该字段取值详情参考模型支持情况

可选

batchSize integer

批处理大小，说明：该字段取值更多详情参考模型支持情况

可选

maxSeqLen integer

序列长度，说明：该字段取值更多详情参考模型支持情况

可选

loggingSteps integer

保存日志间隔，说明：该字段取值更多详情参考模型支持情况

可选

warmupRatio number

预热比例，说明：该字段取值更多详情参考模型支持情况

可选

weightDecay number

正则化系数，说明：该字段取值更多详情参考模型支持情况

可选

loraRank integer

LoRA 策略中的秩，说明：该字段取值更多详情参考模型支持情况

可选

loraAlpha integer

说明：该字段取值更多详情参考模型支持情况

可选

loraAllLinear boolean

LoRA 所有线性层，说明：该字段取值更多详情参考模型支持情况

可选

loraTargetModules string

说明：该字段取值更多详情参考模型支持情况

可选

loraDropout number

说明：该字段取值更多详情参考模型支持情况

可选

schedulerName string

说明：该字段取值更多详情参考模型支持情况

可选

Packing string

可选值：true、false 或 auto，默认值auto，说明：该字段取值更多详情参考模型支持情况

可选

globalBatchSize integer

说明：该字段取值更多详情参考模型支持情况

可选

pseudoSamplingProb number

说明：该字段取值更多详情参考模型支持情况

可选

checkpointCount integer

说明：该字段取值更多详情参考模型支持情况

可选

saveStep integer

说明：该字段取值更多详情参考模型支持情况

可选

dpoBeta number

说明：该字段取值更多详情参考模型支持情况

可选

seed integer

说明：该字段取值更多详情参考模型支持情况

可选

lrSchedulerType string

说明：该字段取值更多详情参考模型支持情况

可选

lrEnd number

说明：该字段取值更多详情参考模型支持情况

可选

power integer

说明：该字段取值更多详情参考模型支持情况

可选

validationStep integer

说明：该字段取值更多详情参考模型支持情况

可选

earlyStopping boolean

说明：该字段取值更多详情参考模型支持情况

可选

earlyStopMetric string

说明：该字段取值更多详情参考模型支持情况

可选

early_stopping_threshold integer

说明：该字段取值更多详情参考模型支持情况

可选

early_stopping_patience integer

说明：该字段取值更多详情参考模型支持情况

可选

tensorParallelDegree integer

说明：该字段取值更多详情参考模型支持情况

可选

shardingParallelDegree integer

说明：该字段取值更多详情参考模型支持情况

可选

sharding string

说明：该字段取值更多详情参考模型支持情况

可选

recompute integer

说明：该字段取值更多详情参考模型支持情况

可选

critic_learning_rate number

说明：该字段取值更多详情参考模型支持情况

可选

clip_range_score integer

说明：该字段取值更多详情参考模型支持情况

可选

clip_range_value integer

说明：该字段取值更多详情参考模型支持情况

可选

clip_range_ratio number

说明：该字段取值更多详情参考模型支持情况

可选

top_p number

说明：该字段取值更多详情参考模型支持情况

可选

repetition_penalty number

说明：该字段取值更多详情参考模型支持情况

可选

temperature number

说明：该字段取值更多详情参考模型支持情况

可选

kl_coeff number

说明：该字段取值更多详情参考模型支持情况

可选

checkpointSaveStrategy string

说明：该字段取值更多详情参考模型支持情况

可选

perDeviceTrainBatchSize integer

说明：该字段取值更多详情参考模型支持情况

可选

maxPromptLen integer

说明：该字段取值更多详情参考模型支持情况

可选

maxSteps integer

说明：该字段取值更多详情参考模型支持情况

可选

freezeViT boolean

说明：该字段取值更多详情参考模型支持情况

可选

criticLearningRate number

说明：该字段取值更多详情参考模型支持情况

可选

actorLearningRate number

说明：该字段取值更多详情参考模型支持情况

可选

klCoeff number

说明：该字段取值更多详情参考模型支持情况

可选

rolloutBatchSize integer

说明：该字段取值更多详情参考模型支持情况

可选

numSamplesPerPrompt integer

说明：该字段取值更多详情参考模型支持情况

可选

maxPromptLen4k integer

说明：该字段取值更多详情参考模型支持情况

可选

maxPromptLen8k integer

说明：该字段取值更多详情参考模型支持情况

可选

maxPromptLen16k integer

说明：该字段取值更多详情参考模型支持情况

可选

maxPromptLen32k integer

说明：该字段取值更多详情参考模型支持情况

可选

maxLength4k integer

说明：该字段取值更多详情参考模型支持情况

可选

maxLength8k integer

说明：该字段取值更多详情参考模型支持情况

可选

maxLength16k integer

说明：该字段取值更多详情参考模型支持情况

可选

maxLength32k integer

说明：该字段取值更多详情参考模型支持情况

可选

datasetConfig object {5}

数据集配置

必选

显示子属性隐藏子属性

sourceType string

数据来源。可选值：Platform、Bos

必选

versions array

数据集版本列表，说明：可以通过以下方法获取该数据版本值：在控制台-数据集管理页面查看某数据集版本

必选

显示子属性隐藏子属性

items object {3}

显示子属性隐藏子属性

versionId string

数据集版本ID，说明：（1）当sourceType为Platform时，该字段必传（2）数据集必须是已发布的数据集（3）可以通过以下方法获取该字段值，在控制台-数据集管理页面，查看某数据集版本ID

可选

samplingRate number

数据集采样率，说明：（1）sourceType为Platform时，该字段有效（2）取值范围：[0.01-10]，默认值1

可选

versionBosUri string

数据集版本bos地址，说明：当sourceType为Bos时，该字段必传

可选

splitRatio number

数据拆分比例，取值范围：[0,20]

必选

validationDatasetSourceType string

验证集数据来源。可选值：Platform

可选

validationDatasetVersions array

验证集数据版本列表

可选

显示子属性隐藏子属性

items object {3}

显示子属性隐藏子属性

versionId string

可选

samplingRate number

数据集采样率，说明：（1）sourceType为Platform时，该字段有效（2）取值范围：[0.01-10]，默认值1

可选

versionBosUri string

数据集版本bos地址，说明：当sourceType为Bos时，该字段必传

可选

corpusConfig object {6}

混合语料配置

可选

显示子属性隐藏子属性

generalCorpusProportion number

通用语料混入比例，说明：（1）取值范围：大于0。默认为0，不混入此语料（2）仅支持ERNIE系列模型使用此参数

可选

verticalCorpusProportion number

垂直语料混入比例，说明：（1）取值范围：大于0。默认为0，不混入此语料（2）仅支持ERNIE系列模型使用此参数

可选

defaultCorpusProportion number

默认语料混入比例，说明：（1）取值范围：[0-100]。默认为0，不混入此语料（2）仅支持开源系列模型使用此参数

可选

copyData boolean

是否数据拷贝，说明：（1）如果在配置的混合比例下，需要混合的数据量超出了平台混合数据的总量（2）此参数作用于通用语料和垂直语料（3）可选值如下：false：不重复，选择数据训练，默认为false；true：重复选择数据

可选

labels array

混入语料任务类型，说明：
（1）仅支持垂直混合语料使用此参数
（2）SFT和Post-pretrain支持的任务类型不同。
（3）SFT支持以下任务类型：
· 知识问答：可分为两类，主观知识问答侧重获取个人见解、经验和观点，答案因人而异；客观知识问答则涉及可验证的事实和数据，答案基于可靠资料和逻辑推理，强调客观性和真实性。
· 文本创作：各类的文案、文学、创意等写作任务，可以涉及多种体裁，包括但不限于小说、诗歌、散文、剧本、广告文案、新闻报道、科技文档等。
· 表格问答：根据给定的表格信息进行问答的任务，要求模型能够从表格中提取信息，并回答相关问题。
· 信息抽取：从非结构化或半结构化的文本中抽取特定信息的任务，要求模型能够准确地找到并提取出需要的信息。
· 指令理解：理解用户给出的指令或命令的任务，并作出相应的合理动作或回答。包含了多种指令理解任务的组合。
· 标题生成：根据给定的内容生成相应的标题的任务，要求模型能够准确抓住文本的核心信息，并生成简洁而具有概括性的标题。
· 问题生成：根据给定的内容生成相应的问题的任务，要求模型能够从文本中提取出问题的关键信息，并生成符合规范的问题。
· 示例学习：通过给定的示例来理解任务的要求，要求模型能够从示例中学习到通用的模式或规律，并应用到类似的任务中。
· 文本属性分析：分析文本中的属性或特征的任务，要求模型能够识别文本中的各种属性，如观点、主题、意图等。
· 摘要：对文本进行概括性提取的任务，要求模型能够从文本中提取出最重要或最具代表性的信息，生成简洁而完整的摘要。
· 语言推理：理解和推断文本中的逻辑关系和语义关系的任务，要求模型能够根据文本内容进行推理和判断。
· 阅读理解：理解和回答与给定文本相关的问题的任务，要求模型能够从文本中获取必要的信息，并作出准确的回答。
· 文本分类：将文本分类到预定义类别的任务，要求模型能够根据文本内容确定其所属的类别或标签。
· Json转文本：将结构化的json数据转换为可读的自然语言文本。这项任务在很多应用场景中都很有用，比如生成报告、用户界面展示、自然语言接口等。
· 代码生成：代码生成指根据给定的要求生成相应的代码的任务，要求模型能够理解代码的要求，并生成符合要求的代码。
· 代码纠错：检测和修正代码中的错误的任务，要求模型能够识别代码中的错误，并提供正确的修正建议。
· 代码解释：解释代码功能和逻辑的任务，要求模型能够理解代码的功能和实现方式，并用易于理解的语言进行解释。
· 理科试题：涉及自然科学知识的试题，要求模型能够理解科学知识，并回答相关问题。例如各学段的数学题目。
· 多轮对话：进行多轮交互的对话任务，要求模型能够理解上下文，并进行连贯和合理的对话。
· 角色扮演（多轮）：使用大型语言模型进行角色扮演对话。在这个任务中，用户可以与大模型进行各类对话交互，大模型根据对话的内容和扮演的角色特点来生成回复，该任务经常被用于娱乐、教育等场景。
· 角色扮演（括号文学）：是模型在对话中扮演文学作品中的角色，利用括号添加细腻的心理和动作描述，以丰富故事情节，打造沉浸式互动体验。
· 风格定制（多轮）：通过特定风格类描述定制，使得大模型在生成文本时符合特定的风格要求。通过这种方式，可以定制语言模型的回复风格，使其更符合特定应用场景或个人喜好。
· 翻译：将一种语言的文字内容转换成另一种语言的任务。
· 专业考试：涉及专业知识的考试题目（主要为文科类），要求模型能够理解专业知识，并作出准确的回答或解释。
· Agent：智能助手根据用户请求执行特定任务，如查询信息或执行服务。
· NL2SQL：将自然语言转换成结构化查询语言的任务，要求模型能够理解自然语言的意图，并将其转换成能够执行的SQL查询语句。
· 记忆增强：AI助手根据用户个人信息和偏好，提供个性化服务和提醒。
（4）Post-pretrain支持以下任务类型：
· 金融
· 医疗
· 广告传媒
· 电商
· 旅游
· 教育
· 交通物流
· 地产家装
· 法律
· 党政
· 游戏
· 科技
· 化工
· 能源
· 机械

可选

显示子属性隐藏子属性

items string

languages array

混合通用/垂直语料的语言类型，说明：（1）仅支持Post-pretrain使用此参数（2）可选值如下：en：英文；cn：中文；code：代码，仅支持通用语料

可选

显示子属性隐藏子属性

items string

modelConfig object {2}

模型配置，说明：只支持自定义模型作业，此时该参数必传

可选

显示子属性隐藏子属性

modelId string

模型ID

必选

modelVersionId string

模型版本ID

必选

resourceConfig object {1}

资源池配置

可选

显示子属性隐藏子属性

idleResource boolean

是否开启潮汐调度任务，说明：目前只有SFT的任务，支持潮汐任务调度

可选

rewardRule object {2}

奖励规则

可选

显示子属性隐藏子属性

rewardFunc string

奖励函数，可选值：check（字符串比较）、matching（字符串匹配）、similarity（字符串相似度对比）、math（数学答案匹配）

必选

cfcTriggerHttpUrl string

自定义规则下，CFC函数触发器地址

可选

rlMethod string

只有当创建RFT任务，此参数有效。可选值：PPO、GRPO

可选

rlhfConfig object {1}

强化学习类型任务配置，说明：当创建强化学习类型任务时，此参数必填

可选

显示子属性隐藏子属性

rewardModelConfig object {1}

奖励模型的配置

必选

显示子属性隐藏子属性

taskId string

任务ID

必选

请求结构

POST /v2/finetuning?Action=CreateFineTuningTask HTTP/1.1
HOST: qianfan.baidubce.com
Authorization: authorization string
Content-Type: application/json

{
   "jobId": "job-1xzycis4jm3b",
   "parameterScale": "FullFineTuning",
   "hyperParameterConfig": {
      "epoch": 1,
      "learningRate": 3.0E-5,
      "maxSeqLen": 4096
   },
   "datasetConfig": {
      "sourceType": "Platform",
      "versions": [
         {
            "versionId": "ds-he8srs01ym0b8fh7"
         }
      ],
      "splitRatio": 20
   }
}

示例代码

基础调用

curl --location 'https://qianfan.baidubce.com/v2/finetuning?Action=CreateFineTuningTask' \
--header 'Authorization: bce-auth-v1/f0ee7xxx8079702c13/2023-09-19T13:42:13Z/180000/host;x-bce-date/9a8cfb8ee58a8f44xxx' \
--header 'x-bce-date: 2023-09-19T13:37:10Z' \
--header 'Content-Type: application/json' \
--data '{
    "jobId": "job-1xzycis4jm3b",
    "parameterScale": "FullFineTuning",
    "hyperParameterConfig": {
        "epoch": 1,
        "learningRate": 0.00003,
        "maxSeqLen": 4096
    },
    "datasetConfig": {
        "sourceType": "Platform",
        "versions": [{
            "versionId": "ds-he8srs01ym0b8fh7"
        }],
        "splitRatio": 20
    }
}'

返回响应

Headers 参数

除公共头域外，无其它特殊头域

返回参数

requestId string

请求ID

可选

result object {2}

可选

显示子属性隐藏子属性

jobId string

作业ID

可选

taskId string

任务ID

可选

成功响应

{
   "requestId": "1bef3f87-c5b2-4419-936b-50f9884f10d4",
   "result": {
      "jobId": "job-n50985crhqq3",
      "taskId": "task-nycp7bycjjn7"
   }
}

错误码

若请求错误，服务器将返回的JSON文本包含以下参数：

名称	描述
requestId	请求ID
code	错误码
message	错误描述信息，帮助理解和解决发生的错误

例如错误返回：

Plain Text

{
    "requestId":"6ba7b810-xxxc04fd430c8",
    "code":"AccessDenied",
    "message":"Access denied."
}

更多其他错误码，也可以查看错误码说明。

评价此篇文章

有帮助没帮助

百度智能云

千帆AI应用开发者中心-API参考 qianfan-api

千帆AI应用开发者中心-API参考 qianfan-api

权限说明

鉴权说明

请求参数

示例代码

返回响应

错误码