创建批量预测任务before
创建批量预测任务,用于异步处理大规模推理请求。任务完成后可通过文件ID获取处理结果。
权限说明
调用本文API,需使用API Key鉴权方式。使用API Key鉴权调用API流程,具体调用流程,请查看认证鉴权。
请求参数
最大运行时间,支持1-672h可选值。
格式为数字+h,如24h表示24小时。
API端点路径,需与输入文件中的url字段保持一致。
chat与视觉理解模型为:/v2/chat/completions,图像生成为:/v2/images/generations,图像编辑为:/v2/images/edits。
已上传文件的唯一标识,用于指定批量任务的输入数据源。
文件需通过files接口上传,格式需为jsonl,最大1G,最多5000个请求。
存储附加信息的键值对集合,最多支持16个键值对。
显示子属性
隐藏子属性
替换文件中model参数的配置对象。
用于统一指定模型版本,如{"model":"deepseek-v3"}或{"model":"amv-bwmjp1ujiuyp"}。
显示子属性
隐藏子属性
POST /v2/batches HTTP/1.1
HOST: qianfan.baidubce.com
Authorization: Bearer <API Key>
Content-Type: application/json
{
"completion_window": "24h",
"endpoint": "/v2/chat/completions",
"input_file_id": "file-0ymqje89qb",
"metadata": {
"a": 8,
"b": "value"
},
"replace": {
"model": "amv-5keddir3d9z6"
}
}
示例代码
curl -X POST "https://qianfan.baidubce.com/v2/batches" \
-H "Authorization: Bearer bce-v3/ALTAK-******ZftZDTn7/125eeb1c5e9ddc8cf3edf18ef6d03f1517ec9408" \
-H "Content-Type: application/json" \
-d '{
"completion_window": "24h",
"endpoint": "/v2/chat/completions",
"input_file_id": "file-0ymqje89qb",
"metadata": {
"a": 8,
"b": "value"
},
"replace": {
"model": "amv-5keddir3d9z6"
}
}'
返回响应
多选一且必需“只能”符合其中一个
显示子属性
隐藏子属性
批量任务创建成功时的响应格式。
显示子属性
隐藏子属性
批量任务的唯一标识。
对象类型,固定返回"batch"。
API端点路径,与创建时指定的endpoint一致。
模型标识,与创建时指定的model参数一致。
任务级别的错误信息,正常时为null。
显示子属性
隐藏子属性
输入文件的唯一标识。
任务处理时间窗口。
批量任务的当前状态。
可能值:Queuing(排队中)Running(运行中)Done(运行完成)Stopped(运行中止)Failed(运行失败)Expired(运行超时)
成功处理后的输出文件ID,初始为null。
错误请求的文件ID,初始为null。
批量任务被创建的时间,格式为Unix时间戳。
批量任务开始处理的时间,初始为null。
批量任务将会过期的时间点,格式为Unix时间戳。
批量任务开始完成的时间,初始为null。
批量任务完成的时间,初始为null。
批量任务失败的时间,初始为null。
批量任务已过期的时间点,初始为null。
批量任务取消完成时间,初始为null。
批量任务真正开始取消的时间,初始为null。
请求统计信息。
显示子属性
隐藏子属性
总请求数量。
已完成请求数量。
失败请求数量。
Token使用统计。
显示子属性
隐藏子属性
输入Tokens数量。
输入Tokens详细信息。
显示子属性
隐藏子属性
命中缓存Tokens数量。
输出Tokens数量。
输出Tokens详细信息。
显示子属性
隐藏子属性
深度思考Tokens数量。
总Tokens数量。
扩展元数据,与创建时指定的metadata一致。
显示子属性
隐藏子属性
请求参数错误或业务逻辑错误时的响应格式。
显示子属性
隐藏子属性
请求的唯一标识。
错误码。
错误信息。
{
"id": "infer-8mt22g6d7fgj",
"object": "batch",
"endpoint": "/v2/chat/completions",
"model": "amv-5keddir3d9z6",
"errors": null,
"input_file_id": "file-0ymqje89qb",
"completion_window": "24h",
"status": "Queuing",
"output_file_id": null,
"error_file_id": null,
"created_at": 1763710144,
"in_progress_at": null,
"expires_at": 1763796544,
"finalizing_at": null,
"completed_at": null,
"failed_at": null,
"expired_at": null,
"cancelled_at": null,
"cancelling_at": null,
"request_counts": {
"total": 0,
"completed": 0,
"failed": 0
},
"usage": {
"input_tokens": 0,
"input_tokens_details": {
"cached_tokens": 0
},
"output_tokens": 0,
"output_tokens_details": {
"reasoning_tokens": 0
},
"total_tokens": 0
},
"metadata": {
"a": 8,
"b": "value"
}
}
{
"requestId": "4befb43e-1326-404c-85bd-6b91778b27a5",
"code": "NoRealNameAuthentication",
"message": "The current account has not completed real name authentication."
}
