创建视频生成任务
调用本接口,使用视频生成模型百度蒸汽机(MuseSteamer)创建一个视频生成任务。如需了解更多百度蒸汽机系列视频生成模型服务Prompt编写技巧,请查看说明文档。
权限说明
调用本文API,需使用API Key鉴权方式。使用API Key鉴权调用API流程,具体调用流程,请查看认证鉴权。
请求参数
用于生成视频的模型。
图生视频:musesteamer-2.0-turbo-i2v-audio、musesteamer-2.0-turbo-i2v、musesteamer-2.0-lite-i2v、musesteamer-2.0-pro-i2v
视频特效:musesteamer-2.0-turbo-i2v-effect
输入给模型,生成视频的信息,支持文本信息和图片信息。
显示子属性
隐藏子属性
多选一,只需要符合下列任意一组子节点
支持文本信息和图片信息,图片信息为必填信息,文本信息为选填信息。
显示子属性
隐藏子属性
文本信息(选填)
显示子属性
隐藏子属性
输入内容的类型,此处应为 text。
输入给模型的文本内容,描述期望生成的视频内容。
支持中英文,中文效果更佳,中文内容建议500字以内。
注:
1、使用有声模型musesteamer-2.0-turbo-i2v-audio时,可在Prompt中输入单个或多个主体台词,实现角色对口型以及角色声音生成。
2、使用特效模型musesteamer-2.0-turbo-i2v-effect时,text不生效。
图像信息(必填)
显示子属性
隐藏子属性
输入内容的类型,此处应为 image_url。
输入给模型的图片信息,限制条件如下:
图片格式:JPEG、JPG、PNG、WEBP
图片大小:不超过10MB
图片尺寸:不小于300px
显示子属性
隐藏子属性
图片信息,支持图片 URL 或图片 Base64 编码。
图片URL:请确保图片URL可被访问。
Base64编码:目前支持带前缀和不带前缀两种格式的Base64编码,以下为具体示例:
1、不带前缀的Base64编码参数:iVBORw0KGgoA...IAXDIBKE0DHxrk
2、前缀的Base64编码:data:image/png;base64,iVB...E0DHxgljNBAA
图片的位置或用途。默认值为first_frame,不填代表图片为首帧。可选值包括:
首帧图:first_frame
尾帧图:last_frame
生成视频的时长,单位:秒,不同模型可选时间范围不同:
musesteamer-2.0-turbo-i2v-audio 默认为 5,可选:5,10
musesteamer-2.0-turbo-i2v 默认为 5,可选:5
musesteamer-2.0-pro-i2v 默认为 5,可选:5
musesteamer-2.0-lite-i2v 默认为 5,可选:5
musesteamer-2.0-turbo-i2v-effect 默认为 5,可选:5
生成视频是否包含水印。默认值为false,可选值包括:
false:不含水印。
true:含有水印。
模型特定参数
显示子属性
隐藏子属性
视频特效类型,仅对特效模型musesteamer-2.0-turbo-i2v-effect生效,默认值为squeeze(捏捏乐),已支持特效类型包括:
squeeze:捏捏乐
figure_show:手办秀场
ice_cream:万物冰淇淋
expansion:膨胀气球
plush:万物毛绒
icyicy:冰爽一夏
ancient-costume:古风换装
flowers:收到花花
jellyjelly:一键果冻
papercut:剪纸世界
fire:火焰变身
背景音乐,仅对有声模型musesteamer-2.0-turbo-i2v-audio生效,默认使用使用背景音乐。
可选值:true-使用背景音乐,false-不使用背景音乐
自定义音色/音频信息,仅对有声模型musesteamer-2.0-turbo-i2v-audio生效。对话按照顺序从数组中依次取音色生成,即首位对话人使用voice_list[0]音色,第二位使用voice_list[1]音色。
目前最多支持两组voice_list,且需要您在prompt中描述需要对话的角色。
当prompt描述有2个角色讲话,提供了两个voice_list,则会按顺序进行分配。
当prompt描述有2个角色讲话,提供了1个voice_list,则会仅生效第一个角色的声音指定。
当prompt描述有1个角色讲话,提供了1个voice_list,则会直接生效该角色的声音指定。
当prompt描述有1个角色讲话,提供了2个voice_list,则会生效第一个voice_list的声音指定。
显示子属性
隐藏子属性
枚举值:“ref_url”、“usr_url”,含义如下:
ref_url:使用用户参考音色音频,模型复刻音频音色
usr_url:使用用户自定义台词音频内容,该类型不可与其他类型混合使用
根据 voice_type 提供具体内容
ref_url:
音频链接仅支持 mp3、wav 格式
文件大小不超过 5M
音频时长:5-15s
usr_url:
音频链接仅支持 mp3、wav 格式
文件大小不超过 5M
所有 usr_url 音频链接时长总和需小于duration
语速自适应,仅对有声模型musesteamer-2.0-turbo-i2v-audio生效。默认为true,仅voice_type=usr_url时生效,可选false。
true:语速自适应,模型智能调配音频语速,保证内容完整
false:若音频时长超过视频时长,音频会自动截断
POST /video/generations HTTP/1.1
Host: qianfan.baidubce.com
Authorization: authorization string
{
"model": "musesteamer-2.0-turbo-i2v-audio",
"content": [
{
"type": "text",
"text": "一位身穿古代盔甲的武士坐在开阔场地的木桌两侧,手持麻将牌进行牌局对战,两人嘴唇微动进行对话。麻将牌整齐排列在桌面的深色棋盘纹布上,背景可见随风飘动的军队旗帜。左边人物说话:\"将军,大棚外战火纷飞,咱们在这打麻将不太好吧?\" 右边人物说话:\"松弛一点!你是不是输钱输怕了?!\""
},
{
"type": "image_url",
"image_url": {
"url": "https://qianfan-document.bj.bcebos.com/images/itv-input-image.png"
}
}
]
}
示例代码
curl --location 'https://qianfan.baidubce.com/video/generations' \
-H "Content-Type: application/json" \
-H "Authorization: Bearer $QIANFAN_API_KEY"
-d '{
"model": "musesteamer-2.0-turbo-i2v-audio",
"content": [
{
"type": "text",
"text": "一位身穿古代盔甲的武士坐在开阔场地的木桌两侧,手持麻将牌进行牌局对战,两人嘴唇微动进行对话。麻将牌整齐排列在桌面的深色棋盘纹布上,背景可见随风飘动的军队旗帜。左边人物说话:\"将军,大棚外战火纷飞,咱们在这打麻将不太好吧?\" 右边人物说话:\"松弛一点!你是不是输钱输怕了?!\""
},
{
"type": "image_url",
"image_url": {
"url": "https://qianfan-document.bj.bcebos.com/images/itv-input-image.png"
}
}
],
"duration": 10
}
'
返回响应
本次请求的唯一标识,可用于排查问题。
视频生成任务ID,用于查询视频生成任务进展或问题排查。
{
"id": "as-***",
"task_id": "67c999d***8e8c05a4"
}
错误码
如果调用失败并返回报错信息,请参见错误码进行解决。
公共错误码:查看公共错误码
本接口专有错误码如下:
| http状态码 | type | code | message |
|---|---|---|---|
| 500 | internal_error | video_generation_internal_error | video generation service internal error |
| 400 | invalid_request_error | invalid_video_generation_argument | xxx |
| 429 | rate_limit_exceeded | video_generation_concurrency_exceeded | Rate limit reached for Concurrency |
| 403 | unsafe_request | video_generation_prompt_unsafe | The input image/prompt is unsafe. |
| 403 | unsafe_request | video_generation_output_unsafe | The output is unsafe. |
| 501 | internal_error | video_generation_risk_system_error | risk control system internal error |
