数据结构

更新时间：2026-04-27

已下线模型

V10
V15
VE3.1P
VE3.1FP

AIGCAudioConfig

视频信息，传参 videoUrl 和 mediaId 有且仅需有一个

参数	类型	描述
audioItem	LipSyncAudioItem	音频信息

AIGCVideoItem

视频信息，传参 videoUrl, mediaId 有且仅需有一个

参数	类型	描述
videoUrl	string	视频链接
mediaId	string	媒资 ID

CallbackConfig

事件回调设置

名称	类型	说明
callbackUrl	string	HTTP 回调地址
enableSign	boolean	是否开启签名
signKey	string	签名 key
enableMediaUploadCompleteEvent	boolean	是否开启媒资上传完成事件通知
enableMediaFetchCompleteEvent	boolean	是否开启媒资拉取完成事件通知
enableMediaTranscodeCompleteEvent	boolean	是否开启媒资转码完成事件通知
enableMediaThumbnailCompleteEvent	boolean	是否开启媒资截图完成事件通知
enableMediaAnalysisCompleteEvent	boolean	是否开启媒资分析完成事件通知
enableMediaRegulationCompleteEvent	boolean	是否开启媒资审核完成事件通知
enableComposeTaskStatusChangeEvent	boolean	是否开启视频云剪辑任务状态变更事件通知
enableMediaRestoreCompleteEvent	boolean	是否开启媒资取回完成事件通知
enableVideoGenerateCompleteEvent	boolean	是否开启视频生成完成事件通知

CallbackEvent

事件回调消息

名称	类型	说明
eventId	string	事件 ID
eventType	string	事件类型
eventTime	string	事件时间戳
mediaUploadCompleteEvent	MediaUploadCompleteEvent	媒资上传完成回调事件内容
mediaFetchCompleteEvent	MediaFetchCompleteEvent	媒资拉取完成回调事件内容
mediaTranscodeCompleteEvent	MediaTranscodeCompleteEvent	媒资转码完成回调事件内容
mediaThumbnailCompleteEvent	MediaThumbnailCompleteEvent	媒资截图完成回调事件内容
mediaAnalysisCompleteEvent	MediaAnalysisCompleteEvent	媒资分析完成回调事件内容
mediaRegulationCompleteEvent	MediaRegulationCompleteEvent	媒资审核完成回调事件内容
composeTaskStatusChangeEvent	ComposeTaskStatusChangeEvent	视频云剪辑任务状态变更回调事件内容
videoGenerateCompleteEvent	VideoGenerateCompleteEvent	视频生成完成回调事件内容

ComposeOutput

字段	类型	必要性	默认值	说明
fileName	string	是		导出视频保存到媒资库的文件名
videoCodec	string（枚举）		h264	导出视频编码，取值：h264, h265
audioCodec	string（枚举）		aac	导出音频编码，取值：aac, mp3
width	int		1920	导出分辨率宽度
height	int		1080	导出分辨率高度
frameRate	float		30	导出帧率
audioSampleRateInHz	int		44100	导出音频采样率。各编码支持的采样率： mp3: 44100, 48000, 32000, 22050, 24000, 16000, 11025, 12000, 8000. aac: 96000, 88200, 64000, 48000, 44100, 32000, 24000, 22050, 16000, 12000, 11025, 8000, 7350.
audioChannels	int		2	导出音频声道数，取值范围 [1,7]
compressionType	string（枚举）		mid	导出视频压缩质量，取值：high（高）, mid（中）, low（低）
gop	int		125	导出视频 i 帧最大间隔

注意：导出配置将影响任务处理耗时，例如较高的分辨率、帧率、质量等都将增加任务耗时，请合理配置。

ComposeTaskInfo

视频云剪辑任务信息

名称	类型	说明
errMsg	string	错误信息
output	ComposeTaskOutput	视频云剪辑任务输出参数

ComposeTaskOutput

视频云剪辑任务输出信息

名称	类型	说明
mediaId	string	视频云剪辑视频导入媒资库的媒资 ID
url	string	视频云剪辑视频播放地址

ComposeTaskStatusChangeEvent

视频云剪辑任务状态变更回调事件内容

名称	类型	说明
taskId	string	任务 ID
status	string	运行状态，包括 READY RUNNING SUCCESS FAILED
createTime	string	任务创建时间，例如 2024-10-11T13:48:01Z
finishTime	string	任务完成时间
beginProcessTime	string	任务开始时间
composeTaskInfo	ComposeTaskInfo	视频云剪辑任务信息

ComposeTimeline

字段	类型	必要性	轨道数范围	素材结点总数范围	说明
audioTracks	ComposeTimelineAudioTrack[]		[0,10]	[0,1000]	音频多轨道
videoTracks	ComposeTimelineVideoTrack[]	是	[1,10]	[1,1000]	视频多轨道（包括视频、图片）
subtitleTracks	ComposeTimelineSubtitleTrack[]		[0,10]	[0,1000]	字幕多轨道

ComposeTimelineAudioItem

字段	类型	必要性	默认值	说明
mediaId	string	与 sourceUrl 二选一		媒资库的媒资 id
sourceUrl	string			文件链接。当 `mediaId` 为空时必须提供 `sourceUrl`，发起任务后将自动保存到 VOD 媒资库
start	float	是		视频片段取自素材文件的起始时间，单位为秒，支持 3 位小数，默认为 0。
duration	float	是		视频片段时长，单位为秒。默认取视频素材本身长度，表示截取全部素材。必须大于 0
showStart	float	是		截取片段在作品中的播放起点，单位秒
showDuration	float	是		截取片段在作品中的播放时长，单位秒。必须大于 0
durationPaddingType	string（枚举）		loop	当 `duration < showDuration` 时，不足部分的填充方式。 `loop`：循环播放截取的片段 `last_frame`：静止播放截取片段的最后一帧
audioOperations	ComposeTimelineAudioOperation[]			对截取的音频片段进行的操作，如音量调节等。列表元素最多 1 个。

注意事项

优先使用mediaId而不是sourceUrl，因为提供sourceUrl会在处理之前先将其存储到媒资库，有一定的时间消耗。

ComposeTimelineAudioOperation

字段	类型	必要性	默认值	说明
volume	float		1.0	音量调节倍数，0 表示静音，取值范围 [0, 16]
speed	float		1.0	播放倍速，仅音频节点生效，取值范围 [0.01, 16]

ComposeTimelineAudioTrack

字段	类型	必要性	说明
audioItems	ComposeTimelineAudioItem[]	是	素材结点列表（音频文件）

ComposeTimelineImageOperation

字段	类型	默认值	说明
speed	float	1.0	播放倍速，精确到小数点后 2 位，取值范围为 [0.01,16]
crop	object		裁剪区域
[+] xpos	float	0	裁剪区域的左上角横坐标比例，取值范围为 [0.0~1.0]
[+] ypos	float	0	裁剪区域的左上角纵坐标比例，取值范围为 [0.0~1.0]
[+] width	float	1	裁剪区域的宽度比例，取值范围为 [0.0~1.0]。要求 `xpos + width <= 1.0`
[+] height	float	1	裁剪区域的高度比例，取值范围为 [0.0~1.0]。要求 `ypos + height <= 1.0`
rotate	int	0	顺时针旋转角度，取值 [0,359]
mirror	string（枚举）		镜像效果，取值：`hori`（左右镜像），`vert`（上下镜像），`full`（旋转 180 度）
posMovement	object		运动效果
[+] viewBox	string（枚举）	fixed	画布上用于展示运动效果的区域。取值： `fixed`：素材运动效果的展示区域固定在 `VideoItem.{xpos, ypos, width, height}`（默认全屏），输入视频会提前放大到适当比例再运动，保证运动过程中视频边缘不进入该区域。
[+] type	string（枚举）		运动方式。取值：`left` （向左）, `right` （向右）, `up` （向上）, `down` （向下）, `leftUp` （向左上）, `leftDown` （向左下）, `rightUp` （向右上）, `rightDown` （向右下）, `zoomIn` （放大）, `zoomOut` （缩小）
[+] speed	float	0	运动速度，单位“比例/秒”（每秒相对于输入画面的变化比例）。例如 `speed=0.1`，则 `x` 方向每秒可变化 `0.1VideoItem.width`，`y` 方向每秒可变化 `0.1VideoItem.height`。

注意事项

由于裁剪、旋转、镜像等操作的顺序不同则效果不同，请放置到列表VideoItem.imageOperations不同元素内以确保执行顺序；

在同一个 ImageOperation 内若共存以下多个字段，将按该参数表中的顺序执行。

ComposeTimelineSubtitleItem

字段	类型	必要性	默认值	说明
showStart	float	是		在作品中的播放起点，单位秒
showDuration	float	是		在作品中的播放时长，单位秒。必须大于 0
position	string(枚举)		custom	字幕位置设置方式： - `custom`绝对定位，严格按xpos,ypos坐标放置； - `relative`相对定位，采用marginL,marginR,marginV定位，如遇多个字幕位置重叠将会自动排版避开重叠
xpos	float		0.5	放置到作品中的水平横坐标
ypos	float		0.9	放置到作品中的竖直纵坐标。xpos, ypos 是字幕锚点的坐标
text	string	是		文本内容。仅支持可见文字及其标点符号（不支持 emoji 表情、特殊字符等），如需换行请使用 Unix 换行符 \n。不能超过 600 个 UTF-8 字符数。注意字数过多或字体过大可能会导致文字超出屏幕而不可见。
textAlign	string（枚举）		center	文本对齐方式，即字幕锚点，取值：`left`, `center`, `right`, `bottomLeft`, `bottomCenter`, `bottomRight`, `topLeft`, `topCenter`, `topRight`。注意，若position=relative，则不可选center
marginL	int			postion=relative时，代表屏幕左边缘到字幕的留空
marginR	int			postion=relative时，代表屏幕右边缘到字幕的留空
marginV	int			postion=relative时，若textAlign=bottomLeft,bottomCenter,bottomRight则代表屏幕底部到字幕的留空；若textAlign=topLeft,topCenter,topRight则代表屏幕顶部到字幕的留空；textAlign=其它值无效
fontFamily	string（枚举）		方正黑体简体	字体名称。取值：`方正黑体简体`, `楷体`, `思源宋体 CN`, `Noto Sans SC Black`, `Noto Sans SC SemiBold`, `Noto Sans SC Medium`, `Noto Sans SC Thin`；全部字体名称列表及示例请参考文末附录
fontSize	int		40	字体大小，即字体高度的像素点数。无大小限制，注意过大会超出屏幕范围，过小会难以看到。
fontSpacing	int		0	字间距，单位为像素。无大小限制，注意过大会超出屏幕范围，过小会难以看到。
fontBold	bool		false	字体是否加粗
fontItalic	bool		false	斜体
fontUnderline	bool		false	下划线
fontStrikeOut	bool		false	删除线
fontColor	string		#FFFFFF	文字颜色，默认白色。取值范围 #000000, #FFFFFF
fontAlpha	float		0	文字透明度，取值 [0.0,1.0]，默认不透明
fontOutlineColor	string		#000000	字体描边颜色，默认黑色。取值范围 #000000, #FFFFFF
fontOutlineAlpha	float		0	字体描边透明度，取值范围 [0.9,1.0]，默认不透明
fontOutlineWidth	int		2	每个字的描边厚度，单位为像素。取值最小为 0，注意值过大会导致文字难以观看。

ComposeTimelineSubtitleTrack

字段	类型	必要性	说明
subtitleItems	ComposeTimelineSubtitleItem[]	是	素材结点列表

ComposeTimelineVideoItem

字段	类型	必要性	默认值	说明
mediaId	string	与 sourceUrl 二选一		媒资库的媒资 id
sourceUrl	string			文件链接。当 `mediaId` 为空时必须提供 `sourceUrl`，发起任务后将自动保存到 VOD 媒资库
type	string（枚举）	是	video	素材类型，取值：`video`, `image`, `mosaic`。注意 gif 动图请填 `video` 类型。
start	float	type=video 时必需	0	视频片段取自素材文件的起始时间，单位为秒
duration	float	type=video 时必需		视频片段时长，单位为秒。默认取视频素材本身长度，表示截取全部素材。必须大于 0
showStart	float	是	0	截取片段在作品中的播放起点，单位秒
showDuration	float	是		截取片段在作品中的播放时长，单位秒。必须大于 0
durationPaddingType	string（枚举）		loop	当 `duration < showDuration` 时，不足部分的填充方式。 `loop`：循环播放截取的片段 `last_frame`：静止播放截取片段的最后一帧
audioOperations	ComposeTimelineAudioOperation[]			对输入音频的操作。列表元素最多 1 个。
imageOperations	ComposeTimelineImageOperation[]			对输入图像的操作（包括视频、图片、马赛克）。列表元素最多 5 个，且裁剪/旋转/镜像三种不允许放在同一个元素内。
position	string（枚举）		custom	处理后的画面放置到作品中的位置，取值： `custom`自定义`xpos`,`ypos`,`width`,`height`; `fill`保持宽高比不变，缩放至填充满整个屏幕，并居中，多余部分裁剪掉； `fit`保持宽高比不变，完整显示整个图像，缩放至最大并居中，可能会留下黑边； `stretch`自动拉伸宽高与屏幕重合，注意图像可能会变形； `center`保持原图像尺寸不变，居中
xpos	float		0.0	素材放置到作品中的水平横坐标，允许超出屏幕范围，超出部分在屏幕外自然不可见
ypos	float		0.0	素材放置到作品中的竖直纵坐标
width	float		1.0	素材放置到作品中的宽度，取值大于 0。允许超出屏幕范围
height	float		1.0	素材放置到作品中的高度，取值大于 0。允许超出屏幕范围

温馨提示

ComposeTimelineVideoItem.{xpos,ypos,width,height}表示素材经过imageOperations 一系列操作之后得到的结果放置到作品中的位置，允许超出作品画面范围，超出部分在屏幕外自然不可见。

ComposeTimlineImageOperation.crop.{xpos,ypos,width,height}表示对输入画面进行裁剪之后所保留的区域，裁剪区域不能超出输入画面范围。

ComposeTimelineVideoTrack

字段	类型	必要性	说明
videoItems	ComposeTimelineVideoItem[]	是	素材结点列表（视频文件或图片）

EffectBeastCompanionInput

与兽为伍特效特定输入参数

参数	类型	描述
beast	string	伴侣类型，非必填，默认：auto，包括： auto：随机一种 bear：熊首男友 tiger：虎首男友 elk：鹿首男友 snake：蛇首男友 lion：狮首男友 wolf：狼首男友

EffectCoveredLiquidMetalInput

液态金属熔化特效特定输入参数

参数	类型	描述
metallicColor	string	颜色，非必填，默认：random，包括： blue：蓝色 silver：银色 green：绿色 pink：粉色 rose_gold：玫瑰金 purple：紫色 gold：金色 random：随机

EffectExoticPrincessInput

异域公主特效特定输入参数

参数	类型	描述
area	string	伴侣类型，非必填，默认：auto，包括： auto：随机一种 denmark：丹麦公主 uk：英国公主 africa：非洲公主 china：中国公主 mexico：墨西哥公主 switzerland：瑞士公主 russia：俄罗斯公主 italy：意大利公主 korea：韩国公主 thailand：泰国公主 india：印度公主 japan：日本公主

EffectHairSwapInput

AI 换发特效特定输入参数

参数	类型	描述
hairColor	string	头发颜色，非必填，默认：Original Hair Color，包括： Original Hair Color：原发色 Raspberry Purple：树莓紫 Milk Tea Goldr：奶茶金 Dirty Orange：脏橘色 Sweet Cherry Pink：甜樱粉 Linen Brown：亚麻棕 Hatsune Color：初音色

EffectLaduduMeInput

Ladudu 大变身特效特定输入参数

参数	类型	描述
color	string	颜色，非必填，默认：brown，包括： brown：棕色 beige：米色 green：绿色 yellow：黄色 pink：粉色 blue：紫色 purple：紫色

EffectRelaxCutInput

治愈切切特效特定输入参数

参数	类型	描述
object	string	切割对象，如橘子

EffectVideoLTaskInput

特效视频 L 任务输入参数

参数	类型	描述
effect	string	特效类型，包括： image_cutout: 抠图
image	ImageToVideoImageItem	图片信息
prompt	string	提示词，不超过2000字符, 必填

EffectVideoPTaskInput

特效视频 P 任务输入参数

参数	类型	描述
effect	string	特效类型，包括： warmth_of_jesus: 温暖耶稣 hug_your_love: 拥抱爱人 muscle_surge: 肌肉激增 the_tigers_touch: 虎之触 kiss_kiss: 亲亲 leggy_run: 长腿奔跑 alive_art: 活灵活现的艺术 squish_it: 挤压它 sheep_curls: 羊毛卷 long_hair_magic: 长发魔法 chinese_new_year_dress: 春节服装 chinese_god_of_wealth: 财神 lego_blast: 乐高爆炸 anything_robot：万物皆可变形金刚 baby_face：秒变娃娃脸 holy_wings：长出天使翅膀 red_carpet_time：万物皆可走红毯 kungfu_club：不打不相识 360_microwave：360°旋转微波炉 jellycat_everything：万物皆可毛绒玩具 kiss_me_ai：AI 发对象咯 gender_swap_tool：性别转换器 night_night：随地大小睡 huge_cutie：巨大的小可爱 carnival_queen：狂欢节女王 money_tornado：金钱风暴 subject_3_fever：科目三复兴 lets_dance：一起摇摆 suit_swagger：西装诱惑 sakura_flood：樱花乌托邦 retro_anime_pop：复古漫画热潮 emergency_beat：紧急热舞 mega_dive：超级跳水秀 mint_in_box：玩具收藏家 ghibli_live：日式动漫风 ghibli_magic：吉卜力魔法 vroom_step：摩托舞者 jiggle_jiggle：jiggle jiggle 跳舞 born_to_barbie：天生芭比 cry_me_a_river：泪流成河 clay_fool：黏土憨憨 pixel_world：风格化-我的世界小人爆破 pubg_winner_hit：胜利之舞 pubg werewolf_rage：狼人变身 skeleton_dance：火柴人跳舞 boom_drop：身后爆炸 BOOMDROP love_punch：爱心暴击 creepy_devil_smile：吸血鬼邪笑 punch_face：重拳出击 honey_bee_magic：小蜜蜂变装 eye_zoom_challenge：瞳孔挑战 trippy_lilies：邪恶百合花 fin-tastic_mermaid：变身美人鱼 paw_princess：宠物公主裙 polar_bear_shock：巨型北极熊抱抱你 fire_roar：喷火咆哮 balloon_belly：大肚弹弹 baby_shroom：还童蘑菇 thunder_god：雷神电眼 bald_swipe：猴子摘头发变秃头 fish_dreamcore：鱼群梦境 pride_parade：全世界彩虹 liquid_metal：液态金属 sharking_summer：鲨鱼游来 somber_embrace：黯然之拥 arrested_by_surprise：谁被逮捕 fairy_wings：精灵之翼 hi_five_emoji_twin：Emoji 小人同框 ruin_your_vow：浪漫终结者 drunk_pole_dance：跳个钢管舞 emoji_check：变身 Emoji 小人 i_believe_i_can_fly：原地起飞 beam_me_up：蓝光消失 bodybuilder_champion：肌肉加强版 alien_kidnap：被外星人绑架了 smell_the_lens：鱼眼镜头 my_boyfriendsssss：很多帅哥来亲我 my_girlfriendssss：很多美女来亲我 welcome_to_my_house：欢迎来到我的豪宅 private_airplane：登上豪华飞机 ride_my_porsche：坐上豪车 us_yearbook_flash：美式证件照 problems_solution：班味退散 old_photo_revival：老照片复活 neymar_dj_dance：内马尔胜利之舞 gabu_dance：Gabu Gabu hands_up：Hands Up passo_bem_solto：PASSO 甩手舞 rat_dance_killer：出圈老鼠舞 shake_shake_disco：摇摇迪斯科 shake_it_to_the_max：Shake It to the Max li_xi_cheng_merch：李羲承进行曲 red_or_white：换发色 hitchcock_dolly_zoom：希区柯克运镜模板 rain_of_redemption：肖申克人间 dust_me_away：粒子消散 sharksnap：深海巨齿鲨 cleopatra_reborn：埃及艳后变妆 baby_arrived：喜提贵子 meme_smash_x3：暴走三连 kill_bill：挥刀转场 2025_oscar_winner：喜获奥斯卡 pomba_gira：Pomba Gira Slay smoking_vibe：抽烟 evil_trigger：名画人物打机关枪 monster_invades：怪兽入侵 wizard_hat：万圣-戴上巫师帽 zombie_hand：万圣-长出僵尸手
image	ImageToVideoImageItem	图片信息
prompt	string	提示词
negativePrompt	string	负面提示词，非比填
duration	int	视频时长，单位 s，支持： {5,8}
resolution	string	视频分辨率，支持： 360p,540p,720p,1080p
motionMode	string	生成模式，非必填，默认 normal，支持： normal fast (normal, fast, --fast only available when duration=5; --resolution=1080p does not support fast)
style	string	风格，非必填，支持： anime 3d_animation clay comic cyberpunk
seed	integer	随机种子，非必填
soundEffectSwitch	boolean	是否开启背景音乐，非必填，默认 false
soundEffectContent	string	背景音乐类型，非必填，默认自动匹配，支持字符串传入，如鸟鸣

EffectVideoRequest

特效视频任务输入参数

参数	类型	描述
model	string	模型名称，包括： V P L
modelVTaskInput	EffectVideoVTaskInput	特效任务 V 特定输入参数，非必填
modelPTaskInput	EffectVideoPTaskInput	特效任务 P 特定输入参数 , 非必填
modelLTaskInput	EffectVideoLTaskInput	特效任务 L 特定输入参数 , 非必填

EffectVideoVTaskInput

特效视频 V 任务输入参数

参数	类型	描述
effect	string	特效类型，包括： hug：拥抱 kiss：亲吻 christmas_santa_transformation：变身为圣诞老人 christmas_santa_gift_delivery：圣诞老人来送礼 christmas_toast_celebration：圣诞节举杯庆祝 christmas_santa_hug：圣诞老人来拥抱 expansion_deformation：膨胀 bomb_effect_deformation：爆炸 melt_deformation：融化 sweet_smile_live_photo：甜美微笑 wind_live_photo：风动 camera_motion_live_photo：镜头动 walk_live_photo：走路 terror_emotion：恐惧 smile_emotion：微笑 laugh_emotion：狂笑 surprise_emotion：惊讶 old_photo_animation：老照片动起来 hair_swap_wool_curls：换羊毛卷发型 hair_swap_twin_tails：换双马尾发型 hair_swap_long_hair：换长发 interaction_heart_gesture：比心 interaction_give_rose：送玫瑰花 lunar_newyear_2025_fireworks： 2025 新年烟花 lunar_newyear_dual_toast：双人举杯 lunar_newyear_red_envelope_rain：红包雨 youth_rewind_memory：童年回忆 dynasty_dress_swap：古风换装 love_pose_family_heart：全家福比心 wish_sender_heart_with_god_of_wealth：和财神比心 wish_sender_coin_rain：财神发金币 dreamy_wedding：梦幻婚礼 romantic_lift：浪漫公主抱 sweet_proposal：甜蜜求婚 couple_flower_presentation：情侣送花 couple_hug：情侣拥抱 couple_kiss：情侣接吻 couple_wave：情侣挥手 cupid_arrow：丘比特之箭 pet_lovers：萌宠恋人 captain_america：变身美队 hulk：绿巨人 cap_walk：美队同行 hulk_dive：浩克俯冲 balloon_flyaway：变成气球飞走了 cartoon_doll：变身 Q 版玩偶 flying：飞行 paperman：纸片人特效 pinch： 2.0 捏捏 sakura_season：樱花飘落 muscling：变身肌肉男 french_kiss：法式热吻 bloom_magic：万物生花 golden_epoch：流金岁月 slice_therapy：解压切切 beast_companion：与兽为伍 oscar_gala：金像盛典 fashion_stride：时尚 T 台 star_carpet：星光红毯 flame_carpet：烈焰红毯 frost_carpet：风雪红毯 exotic_princess：异域公主 bloom_doorobear：万物生萌芽熊 live_memory：老照片动起来 orbit：镜头环绕 zoom_in：镜头推进 ai_outfit：虚拟试衣 mecha_x：万物变身机器人 gender_swap：性别转换 nap_me：随地大小睡 sexy_me：变身比基尼/肌肉男 ghibli：吉卜力风 style_me：西装暴徒 bodyshake：转身热舞 spin360： 360 度转转转 spin180： 180 度转身 minecraft：我的世界风 smooth_shift：丝滑转场 box_me：部落盒子 tap_me：胶带写真 paper_fall：瘫软在地 claw_me：抓娃娃 saber_warrior：星战光剑 rain_kiss：雨中热吻 orbit_dolly：环绕推进 orbit_dolly_fast：快速环绕推进 couple_walk：一起走走 sweet_dreams：好梦相伴 flower_receive：收花时刻 love_drop：爱从天降 pet2human：宠物变真人 clayshot：粘土风拍立得 manga_meme：漫画表情包 auto_spin：旋转 dragonboat_shot：龙舟拍立得 graduation：毕业盛典 soul_depart：灵魂出窍 cheek_kiss：亲吻脸颊 punch_hit：吃我一拳 watermelon_hit：吃我一瓜 pixel_me：像素风 fishermen：变身美人鱼 simpsons_comic：辛普森漫画风 fairy_me：小精灵变身 shake_it_down：深蹲扭扭 split_stance_pet：萌宠一字马 happy_birthday：生日派对 irasutoya：日式漫画风-irasutoya american_comic：美式漫画风 carry_me：爱的背背 zongzi_drop：天降巨粽 walk_forward：稳步向前 relax_cut：治愈切切 covered_liquid_metal：液态金属熔化 ladudu_me： Ladudu 大变身 ladudu_me_random： Ladudu 大变身（盲盒版）
images	ImageToVideoImageItem[]	图片信息
hairSwapInput	EffectHairSwapInput	AI 换发特效特定输入参数，非必填
beastCompanionInput	EffectBeastCompanionInput	与兽为伍特效特定输入参数，非必填
exoticPrincessInput	EffectExoticPrincessInput	异域公主特效特定输入参数，非必填
relaxCutInput	EffectRelaxCutInput	治愈切切特效特定输入参数，非必填
coveredLiquidMetalInput	EffectCoveredLiquidMetalInput	液态金属熔化特效特定输入参数，非必填
laduduMeInput	EffectLaduduMeInput	Ladudu 大变身特效特定输入参数，非必填
aspectRatio	string	比例，非必填，默认 9:16，部分特效支持 9:16 16:9 1:1
bgm	boolean	是否开启背景音乐，非必填，默认 false

ExtendVideoKTaskInput

视频延长 K 任务输入参数

参数	类型	描述
videoItem	MediaVideoItem	视频信息
prompt	string	提示词
negativePrompt	string	负面提示词
cfgScale	float	自由度，非必填，默认 0.5，取值范围：[0, 1]，值越大，模型自由度越小，与用户输入的提示词相关性越强

ExtendVideoPTaskInput

视频延长 P35、P40、P45、P50、P55 任务输入参数

参数	类型	描述
videoItem	AIGCVideoItem	视频信息
prompt	string	提示词
negativePrompt	string	负面提示词，非必填
duration	int	视频时长，单位 s，支持： {5,8}
resolution	string	视频分辨率，支持： 360p,540p,720p,1080p
motionMode	string	生成模式，非必填，默认 normal，支持： normal fast (normal, fast, --fast only available when duration=5; --resolution=1080p does not support fast)（P50和P55只支持normal）
style	string	风格，非必填，支持： anime 3d_animation clay comic cyberpunk
seed	integer	随机种子，非必填

ExtendVideoVQ2TTaskInput

视频延长 VQ2T (viduq2-turbo) 任务输入参数

参数	类型	是否必填	描述
videoItem	AIGCVideoItem	是	源视频，支持 mediaId 或 videoUrl；视频时长限制：不能低于4秒，不能超过1分钟
tailImage	ImageItem	否	尾帧参考图，模型将以此图片为尾帧画面来引导视频延长方向；只支持传入1张图片
prompt	string	否	延长提示词，用来控制延长的视频内容，最大1500字符
duration	int	否	延长时长，单位 s，默认5秒，支持： [1,7]
resolution	string	否	视频分辨率，默认720p，支持： 540p 720p 1080p

ExtendVideoVQ2PTaskInput

视频延长 VQ2P (viduq2-pro) 任务输入参数

参数	类型	是否必填	描述
videoItem	AIGCVideoItem	是	源视频，支持 mediaId 或 videoUrl；视频时长限制：不能低于4秒，不能超过1分钟
tailImage	ImageItem	否	尾帧参考图，模型将以此图片为尾帧画面来引导视频延长方向；只支持传入1张图片
prompt	string	否	延长提示词，用来控制延长的视频内容，最大1500字符
duration	int	否	延长时长，单位 s，默认5秒，支持： [1,7]
resolution	string	否	视频分辨率，默认720p，支持： 540p 720p 1080p

ExtendVideoVE31TaskInput

视频延长 VE3.1 任务输入参数

参数	类型	是否必填	描述
videoItem	AIGCVideoItem	是	源视频，支持 mediaId 或 videoUrl;
prompt	string	是	提示词，最大 2000 字符
n	int	否	生成数量，默认 1，支持： 1 2 3 4
aspectRatio	string	否	宽高比，默认 16:9，支持： 16:9 9:16
negativePrompt	string	否	负面提示词，用于描述不希望在画面中出现的内容，最大 1000 字符
generateAudio	boolean	否	是否生成音频，默认 false
personGeneration	string	否	人物生成策略，默认 allow_adult，支持： allow_adult disallow
seed	long	否	随机种子，取值范围：0-4294967295
resolution	string	否	分辨率，默认 720p，支持： 720p 1080p 4K

ExtendVideoVE31FTaskInput

视频延长 VE3.1F 任务输入参数

参数	类型	是否必填	描述
videoItem	AIGCVideoItem	是	源视频，支持 mediaId 或 videoUrl;
prompt	string	是	提示词，最大 2000 字符
n	int	否	生成数量，默认 1，支持： 1 2 3 4
aspectRatio	string	否	宽高比，默认 16:9，支持： 16:9 9:16
negativePrompt	string	否	负面提示词，用于描述不希望在画面中出现的内容，最大 1000 字符
generateAudio	boolean	否	是否生成音频，默认 false
personGeneration	string	否	人物生成策略，默认 allow_adult，支持： allow_adult disallow
seed	long	否	随机种子，取值范围：0-4294967295
resolution	string	否	分辨率，默认 720p，支持： 720p 1080p 4K

ExtendVideoVE31LTaskInput

视频延长 VE3.1L 任务输入参数

参数	类型	是否必填	描述
videoItem	AIGCVideoItem	是	源视频，支持 mediaId 或 videoUrl;
prompt	string	是	提示词，最大 2000 字符
n	int	否	生成数量，默认 1，支持： 1 2 3 4
aspectRatio	string	否	宽高比，默认 16:9，支持： 16:9 9:16
negativePrompt	string	否	负面提示词，用于描述不希望在画面中出现的内容，最大 1000 字符
generateAudio	boolean	否	是否生成音频，默认 false
personGeneration	string	否	人物生成策略，默认 allow_adult，支持： allow_adult disallow
seed	long	否	随机种子，取值范围：0-4294967295
resolution	string	否	分辨率，默认 720p，支持： 720p 1080p

ImageToImageLTaskInput

图生图 L 任务输入参数。

参数	类型	描述
model	string	生成模式，默认 max，支持： max pro , 注意 pro: 暂不支持多图参考
images	ImageToVideoImageItem[]	参考图，图片数量支持 1～4
prompt	string	生成的提示文本，不超过2000字符, 必填
aspectRatio	String	图片宽高比，默认 1:1，支持： 1:1 2:3 3:2 3:4 4:3 9:16 16:9 9:21 21:9
guidanceScale	string	提示词引导系数，默认 3.5，支持：1.0～20.0
imgCount	integer	单次生图张数，默认 1，支持：1～4

ImageToImageVTaskInput

图生图 V 任务输入参数。

参数	类型	描述
model	string	模型名称, 必填, 支持： VQ1 VQ2
images	ImageToVideoImageItem[]	参考图，图片数量：VQ1 支持 1～7 ， VQ2 支持 0～7
prompt	string	生成的提示文本, 必填，不超过2000字符
seed	integer	随机种子参数，当默认不传或者传0时，会使用随机数替代
aspectRatio	string	图片宽高比，默认 16:9， VQ1支持：16:9、9:16、1:1、3:4、4:3； VQ2支持：16:9、9:16、1:1、3:4、4:3、21:9、2:3、3:2；
resolution	string	图片分辨率，默认 1080p， VQ1支持：1080p； VQ2支持：1080p、2K、4K
payload	string	透传参数

ImageToImageRequest

图生图任务输入参数

参数	类型	是否必需	描述
model	string	是	模型名称, 支持： L V
modelLTaskInput	ImageToImageLTaskInput	否	L 模型的特定输入参数
modelVTaskInput	ImageToImageVTaskInput	否	V 模型的特定输入参数

参数

类型

是否必需

描述

model

string

是

模型名称, 支持：

modelLTaskInput

ImageToImageLTaskInput

否

L 模型的特定输入参数

modelVTaskInput

ImageToImageVTaskInput

否

V 模型的特定输入参数

ImageToVideoDynamicMask

动态笔刷配置列表可配置多组（最多 6 组），每组包含“涂抹区域 mask”与“运动轨迹 trajectories”序列

参数	类型	描述
mask	ImageToVideoHeadtailImages	动态笔刷涂抹区域（用户通过运动笔刷涂抹的 mask 图片）
trajectories	ImageToVideoTrajectory[]	运动轨迹坐标序列生成 5s 的视频，轨迹长度不超过 77，即坐标个数取值范围：[2, 77] 轨迹坐标系，以图片左下角为坐标原点

ImageToVideoHeadtailImages

首尾帧图片信息

参数	类型	描述
headImage	ImageToVideoImageItem	首帧图片信息
tailImage	ImageToVideoImageItem	尾帧图片信息

ImageToVideoImageItem

图片信息

参数	类型	描述
imageUrl	string	图片链接

ImageFrameSettings

智能多帧单帧配置，用于配置每个关键帧的图片、提示词和持续时长

参数	类型	是否必填	描述
keyImage	ImageToVideoImageItem	是	关键帧图片，作为该段视频的尾帧/下一段的首帧
prompt	string	否	延长提示词，用于控制延长的视频内容，最大长度 1500 字符
duration	integer	否	多帧时长，不同关键帧之间的视频时长，默认 5 秒，可选项为 2～7 秒

PCharacterToVideoImageItem

P 模型参考生图片信息

参数	类型	描述
imageUrl	string	图片链接
type	string	必须是"subject"（主体）, "background" （背景）之一
refName	string	主体/背景名称，参考生提示词中可以用{}框住，例子：{person1} talking to {person2}

KCharacterToVideoImageItem

K 模型参考生图片信息

参数	类型	描述
elementId	string	主体id，需调用查询K模型预设主体接口后获得

ImageToVideoK10TaskInput

图生视频 K10 任务输入参数，传参 headtailImages，image 有且仅需有一个

参数	类型	描述
headtailImages	ImageToVideoHeadtailImages	首尾帧图片信息，首尾生必填
image	ImageToVideoImageItem	图片信息，图生必填
prompt	string	提示词
negativePrompt	string	负面提示词
cfgScale	float	自由度，非必填，默认 0.5，取值范围：[0, 1]，值越大，模型自由度越小，与用户输入的提示词相关性越强
duration	int	视频时长，单位 s，支持： {5,10}
motionMode	string	生成模式，非必填，默认 std，支持： std pro
staticMask	ImageToVideoImageItem	静态笔刷涂抹区域（用户通过运动笔刷涂抹的 mask 图片）图片长宽比必须与输入图片相同，否则任务失败 staticMask 和 dynamicMasks.mask 这两张图片的分辨率必须一致，否则任务失败
dynamicMasks	ImageToVideoDynamicMask[]	动态笔刷配置列表，非必填，默认 std，支持： std pro

ImageToVideoK15TaskInput

图生视频 K15 任务输入参数，传参 headtailImages，image 有且仅需有一个

参数	类型	描述
headtailImages	ImageToVideoHeadtailImages	首尾帧图片信息，首尾生必填
image	ImageToVideoImageItem	图片信息，图生必填
prompt	string	提示词
negativePrompt	string	负面提示词
cfgScale	float	自由度，非必填，默认 0.5，取值范围：[0, 1]，值越大，模型自由度越小，与用户输入的提示词相关性越强
duration	int	视频时长，单位 s，支持： {5,10}
motionMode	string	生成模式，非必填，默认 std，支持： std pro
staticMask	ImageToVideoImageItem	静态笔刷涂抹区域（用户通过运动笔刷涂抹的 mask 图片）图片长宽比必须与输入图片相同，否则任务失败 staticMask 和 dynamicMasks.mask 这两张图片的分辨率必须一致，否则任务失败
dynamicMasks	ImageToVideoDynamicMask[]	动态笔刷配置列表，非必填，默认 std，支持： std pro
cameraControl	VideoGenerateCameraControl[]	动态笔刷配置列表，非必填，默认 std，支持： std pro

ImageToVideoK16TaskInput

图生视频 K16 任务输入参数，传参 headtailImages，image, characterImages 有且仅需有一个

参数	类型	描述
headtailImages	ImageToVideoHeadtailImages	首尾帧图片信息，首尾生必填
image	ImageToVideoImageItem	图片信息，图生必填
characterImages	ImageToVideoImageItem[]	参考图片信息，参考生必填。最大支持4张图片。
prompt	string	提示词
negativePrompt	string	负面提示词
cfgScale	float	自由度，非必填，默认 0.5，取值范围：[0, 1]，值越大，模型自由度越小，与用户输入的提示词相关性越强
duration	int	视频时长，单位 s，支持： 5 10
motionMode	string	生成模式，非必填，默认 std，支持： std pro
aspectRatio	string	比例，仅参考生支持，非必填，默认 16:9 , 支持： 16:9 9:16 1:1

ImageToVideoK20TaskInput

图生视频 K20 任务输入参数

参数	类型	描述
image	ImageToVideoImageItem	图片信息，图生必填
prompt	string	提示词
negativePrompt	string	负面提示词
cfgScale	float	自由度，非必填，默认 0.5，取值范围：[0, 1]，值越大，模型自由度越小，与用户输入的提示词相关性越强
duration	int	视频时长，单位 s，支持： 5 10

ImageToVideoK21MTaskInput

图生视频 K21M 任务输入参数

参数	类型	描述
image	ImageToVideoImageItem	图片信息，图生必填
prompt	string	提示词
negativePrompt	string	负面提示词
cfgScale	float	自由度，非必填，默认 0.5，取值范围：[0, 1]，值越大，模型自由度越小，与用户输入的提示词相关性越强
duration	int	视频时长，单位 s，支持： 5 10

ImageToVideoK21TaskInput

图生视频 K21 任务输入参数

参数	类型	描述
image	ImageToVideoImageItem	图片信息，图生必填
prompt	string	提示词
negativePrompt	string	负面提示词
cfgScale	float	自由度，非必填，默认 0.5，取值范围：[0, 1]，值越大，模型自由度越小，与用户输入的提示词相关性越强
duration	int	视频时长，单位 s，支持： 5 10

ImageToVideoK25TTaskInput

图生视频 K25T 任务输入参数

参数	类型	描述
image	ImageToVideoImageItem	图片信息，单图生视频时必填
headtailImages	ImageToVideoHeadtailImages	首尾帧图片信息，首尾帧生视频时必填
prompt	string	提示词
negativePrompt	string	负面提示词
cfgScale	float	自由度，非必填，默认 0.5，取值范围：[0, 1]，值越大，模型自由度越小，与用户输入的提示词相关性越强
duration	int	视频时长，单位 s，支持： 5 10
mode	string	模式，非必填，默认 std，支持： std pro（首尾帧生视频仅支持 pro 模式）

ImageToVideoK26TaskInput

图生视频 K26 任务输入参数

参数	类型	描述
image	ImageToVideoImageItem	图片信息，单图生视频时必填
headtailImages	ImageToVideoHeadtailImages	首尾帧图片信息，首尾帧生视频时必填
prompt	string	提示词
negativePrompt	string	负面提示词
sound	string	声音，非必填，默认 off，支持： off on 仅K26及后续版本模型支持当前参数
voice	string	音色，非必填，默认 off，支持： off on 仅K26及后续版本模型支持当前参数
voiceList	list<Map<String, String>>	音色列表，非必填，一次视频生成任务至多引用2个音色， "voice_list":[ {"voice_id":"voice_id_1"}, {"voice_id":"voice_id_2"}] 仅K26及后续版本模型支持当前参数
cfgScale	float	自由度，非必填，默认 0.5，取值范围：[0, 1]，值越大，模型自由度越小，与用户输入的提示词相关性越强
duration	int	视频时长，单位 s，支持： 5 10
mode	string	模式，非必填，默认 pro，支持： pro

ImageToVideoKO1TaskInput

图生视频 KO1 任务输入参数

参数	类型	描述
prompt	string	提示词，必输。可包含正向描述和负向描述。不能超过2500个字符。可通过<<<>>>的格式来指定某个主体或图片，如：<<<element_1>>>、<<<image_1>>>
headtailImages	ImageToVideoHeadtailImages	首尾帧图片信息，首帧生视频、首尾帧生视频必填。暂时不支持仅尾帧，即有尾帧图时必须有首帧图。首尾帧都有时，不能传参考图或主体。使用<<<>>>的格式指定时，若headtailImages非空，编号应位于refImages之前，即首帧为<<<image_1>>>，尾帧（如有）为<<<image_2>>>。
refImages	ImageToVideoImageItem[]	参考图片信息列表，图片参考生必填。包括场景、风格等参考图片，最大支持7张图片。
elements	KCharacterToVideoImageItem[]	主体列表，主体参考生必填。首帧图、参考图和主体数量之和不得超过7
mode	string	模式，非必填，默认 pro，枚举值：pro, std 其中std：标准模式（标准），基础模式，性价比高其中pro：专家模式（高品质），高表现模式，生成视频质量更佳
aspectRatio	string	生成视频的画面纵横比（宽:高）枚举值：16:9, 9:16, 1:1 未使用首帧生时，当前参数必填
duration	string	视频时长，单位 s，默认5。枚举值：3，4，5，6，7，8，9，10，其中：使用首帧图生视频时，仅支持5和10s

ImageToVideoP35TaskInput

图生视频 P35 任务输入参数，传参 headtailImages，image 有且仅需有一个

参数	类型	描述
image	ImageToVideoImageItem	图片信息
headtailImages	ImageToVideoHeadtailImages	首尾帧图片信息，首尾生必填
prompt	string	提示词
negativePrompt	string	负面提示词，非必填
duration	int	视频时长，单位 s，支持： 5 8
resolution	string	视频分辨率，支持： 360p 540p 720p 1080p
motionMode	string	生成模式，非必填，默认 normal，支持： normal fast (normal, fast, --fast only available when duration=5; --resolution=1080p does not support fast)
style	string	风格，非必填，支持： anime 3d_animation clay comic cyberpunk （首尾生不支持配置）
seed	integer	随机种子，非必填
soundEffectSwitch	boolean	是否开启背景音乐，非必填，默认 false
soundEffectContent	string	背景音乐类型，非必填，默认自动匹配，支持字符串传入，如鸟鸣

ImageToVideoP40TaskInput

图生视频 P40 任务输入参数，传参 headtailImages，image 有且仅需有一个

参数	类型	描述
image	ImageToVideoImageItem	图片信息
headtailImages	ImageToVideoHeadtailImages	首尾帧图片信息，首尾生必填
prompt	string	提示词
negativePrompt	string	负面提示词，非必填
duration	int	视频时长，单位 s，支持： 5 8
resolution	string	视频分辨率，支持： 360p 540p 720p 1080p
motionMode	string	生成模式，非必填，默认 normal，支持： normal fast (normal, fast, --fast only available when duration=5; --resolution=1080p does not support fast)
style	string	风格，非必填，支持： anime 3d_animation clay comic cyberpunk （首尾生不支持配置）
seed	integer	随机种子，非必填
soundEffectSwitch	boolean	是否开启背景音乐，非必填，默认 false
soundEffectContent	string	背景音乐类型，非必填，默认自动匹配，支持字符串传入，如鸟鸣
cameraMovement	string	运镜参数，非必填，支持 horizontal_left: 向左水平移动 horizontal_right: 向右水平移动 vertical_up: 垂直向上移动 vertical_down: 垂直向下移动 zoom_in: 镜头拉近，画面放大 zoom_out: 镜头拉远，画面缩小 crane_up: 从低处上升 quickly_zoom_in: 快速拉近 quickly_zoom_out: 快速拉远 smooth_zoom_in: 平滑地拉近 camera_rotation: 围绕轴旋转 robo_arm: 使用机械臂进行复杂移动 super_dolly_out: 快速向后移动 whip_pan: 快速水平摇动，产生模糊 hitchcock: 同时变焦和推拉，改变背景关系 left_follow: 跟随主体向左 right_follow: 跟随主体向右 pan_left: 固定位置水平向左摇动 pan_right: 固定位置水平向右摇动 fix_bg: 移动时保持背景不变

ImageToVideoP45TaskInput

图生视频 P45 任务输入参数，传参 headtailImages，image，characterImages 有且仅需有一个

参数	类型	描述
image	ImageToVideoImageItem	图片信息
headtailImages	ImageToVideoHeadtailImages	首尾帧图片信息，首尾生必填
characterImages	PCharacterToVideoImageItem[]	参考图片信息，参考生必填
prompt	string	提示词
negativePrompt	string	负面提示词，非必填
duration	int	视频时长，单位 s，支持： 5 8
resolution	string	视频分辨率，支持： 360p 540p 720p 1080p
motionMode	string	生成模式，非必填，默认 normal，支持： normal fast (normal, fast, --fast only available when duration=5; --resolution=1080p does not support fast)
style	string	风格，非必填，支持： anime 3d_animation clay comic cyberpunk （首尾生不支持配置）
seed	integer	随机种子，非必填
soundEffectSwitch	boolean	是否开启背景音乐，非必填，默认 false
soundEffectContent	string	背景音乐类型，非必填，默认自动匹配，支持字符串传入，如鸟鸣
cameraMovement	string	运镜参数，非必填，支持 horizontal_left: 向左水平移动 horizontal_right: 向右水平移动 vertical_up: 垂直向上移动 vertical_down: 垂直向下移动 zoom_in: 镜头拉近，画面放大 zoom_out: 镜头拉远，画面缩小 crane_up: 从低处上升 quickly_zoom_in: 快速拉近 quickly_zoom_out: 快速拉远 smooth_zoom_in: 平滑地拉近 camera_rotation: 围绕轴旋转 robo_arm: 使用机械臂进行复杂移动 super_dolly_out: 快速向后移动 whip_pan: 快速水平摇动，产生模糊 hitchcock: 同时变焦和推拉，改变背景关系 left_follow: 跟随主体向左 right_follow: 跟随主体向右 pan_left: 固定位置水平向左摇动 pan_right: 固定位置水平向右摇动 fix_bg: 移动时保持背景不变

ImageToVideoP50TaskInput

图生视频 P50 任务输入参数，传参 headtailImages，image 有且仅需有一个

参数	类型	描述
image	ImageToVideoImageItem	图片信息
headtailImages	ImageToVideoHeadtailImages	首尾帧图片信息，首尾生必填
characterImages	PCharacterToVideoImageItem[]	参考图片信息，参考生必填。最大支持7张图片。
prompt	string	提示词
negativePrompt	string	负面提示词，非必填
duration	int	视频时长，单位 s，支持： 5 8
resolution	string	视频分辨率，支持： 360p 540p 720p 1080p
motionMode	string	生成模式，非必填，默认 normal，支持： normal
style	string	风格，非必填，支持： anime 3d_animation clay comic cyberpunk （首尾生不支持配置）
seed	integer	随机种子，非必填
soundEffectSwitch	boolean	是否开启背景音乐，非必填，默认 false
soundEffectContent	string	背景音乐类型，非必填，默认自动匹配，支持字符串传入，如鸟鸣

ImageToVideoP55TaskInput

图生视频 P55 任务输入参数，传参 image，headtailImages 有且仅需有一个

参数	类型	描述
image	ImageToVideoImageItem	图片信息
headtailImages	ImageToVideoHeadtailImages	首尾帧图片信息，首尾生必填
prompt	string	提示词
negativePrompt	string	负面提示词，非必填
duration	int	视频时长，单位 s，支持： 5 8 10
resolution	string	视频分辨率，支持： 360p 540p 720p 1080p
motionMode	string	生成模式，非必填，默认 normal，支持： normal
style	string	风格，非必填，支持： anime 3d_animation clay comic cyberpunk （首尾生不支持配置）
seed	integer	随机种子，非必填
generateAudioSwitch	boolean	控制开关Audio，非必填. true: Audio on , false: Audio off
generateMultiClipSwitch	boolean	控制单镜头, 多镜头，非必填. true: 多镜头 , false: 单镜头
thinkingType	string	是否使用系统优化提示词功能，非必填. "enabled" : 打开 "disabled" : 关闭. "auto" or 忽略: 让模型自动决定

ImageToVideoH20TaskInput

首尾图生视频 H20 任务输入参数，传参 headtailImages，image 有且仅需有一个

参数	类型	描述
headtailImages	ImageToVideoHeadtailImages	首尾帧图片信息，其中尾帧图必填。
image	ImageToVideoImageItem	图片信息，传单图首帧必填。
prompt	string	提示词，不超过2000字符，非必填
promptOptimizer	boolean	是否自动优化 prompt，默认为 true。
fastPretreatment	boolean	是否缩短 prompt_optimizer 的优化耗时，默认为 false。该参数仅传image参数时生效。
duration	int	视频时长，单位 s，其可用值与模型和分辨率相关。支持： 6（默认） 10
resolution	string	视频分辨率，支持： 768p（默认） 1080p（仅支持6s）
aigcWatermark	boolean	是否在生成的视频中添加水印，默认为 false

ImageToVideoH23TaskInput

图生视频 H23 任务输入参数

参数	类型	描述
image	ImageToVideoImageItem	图片信息
prompt	string	提示词，不超过2000字符，非必填
promptOptimizer	boolean	是否自动优化 prompt，默认为 true。
fastPretreatment	boolean	是否缩短 promptOptimizer 的优化耗时，默认为 false
duration	int	视频时长，单位 s，其可用值与模型和分辨率相关。支持： 6（默认） 10
resolution	string	视频分辨率，支持： 768p 1080p（仅支持6s）
aigcWatermark	boolean	是否在生成的视频中添加水印，默认为 false

ImageToVideoH23FTaskInput

图生视频 H23F 任务输入参数

参数	类型	描述
image	ImageToVideoImageItem	图片信息
prompt	string	提示词，不超过2000字符，非必填
promptOptimizer	boolean	是否自动优化 prompt，默认为 true。
fastPretreatment	boolean	是否缩短 promptOptimizer 的优化耗时，默认为 false
duration	int	视频时长，单位 s，其可用值与模型和分辨率相关。支持： 6（默认） 10
resolution	string	视频分辨率，支持： 768p 1080p（仅支持6s）
aigcWatermark	boolean	是否在生成的视频中添加水印，默认为 false

ImageToVideoRequest

图生视频任务输入参数

参数	类型	是否必需	描述
model	string	是	模型名称, 支持： V20 VQ1 VQ1C VQ2T VQ2P VQ2PF VQ2 VQ3P VQ3T P35 P40 P45 P50 P55 K16 K20 K21 K21M K25T K26 H23 H23F VE3.1 VE3.1F VE3.1L
modelV20TaskInput	ImageToVideoV20TaskInput	否	V20 模型的特定输入参数
modelVQ1TaskInput	ImageToVideoVQ1TaskInput	否	VQ1 模型的特定输入参数
modelVQ1CTaskInput	ImageToVideoVQ1CTaskInput	否	VQ1C 模型的特定输入参数
modelVQ2TTaskInput	ImageToVideoVQ2TTaskInput	否	VQ2T 模型的特定输入参数
modelVQ2PTaskInput	ImageToVideoVQ2PTaskInput	否	VQ2P 模型的特定输入参数
modelVQ2PFTaskInput	ImageToVideoVQ2PFTaskInput	否	VQ2PF 模型的特定输入参数
modelVQ2TaskInput	ImageToVideoVQ2TaskInput	否	VQ2 模型的特定输入参数
modelVQ3PTaskInput	ImageToVideoVQ3PTaskInput	否	VQ3P 模型的特定输入参数
modelVQ3TTaskInput	ImageToVideoVQ3TTaskInput	否	VQ3T 模型的特定输入参数
modelP35TaskInput	ImageToVideoP35TaskInput	否	P35 模型的特定输入参数
modelP40TaskInput	ImageToVideoP40TaskInput	否	P40 模型的特定输入参数
modelP45TaskInput	ImageToVideoP45TaskInput	否	P45 模型的特定输入参数
modelP50TaskInput	ImageToVideoP50TaskInput	否	P50 模型的特定输入参数
modelP55TaskInput	ImageToVideoP55TaskInput	否	P55 模型的特定输入参数
modelK16TaskInput	ImageToVideoK16TaskInput	否	K16 模型的特定输入参数
modelK20TaskInput	ImageToVideoK20TaskInput	否	K20 模型的特定输入参数
modelK21TaskInput	ImageToVideoK21TaskInput	否	K21 模型的特定输入参数
modelK21MTaskInput	ImageToVideoK21MTaskInput	否	K21M 模型的特定输入参数
modelK25TTaskInput	ImageToVideoK25TTaskInput	否	K25T 模型的特定输入参数
modelK26TaskInput	ImageToVideoK26TaskInput	否	K26 模型的特定输入参数
modelKO1TaskInput	ImageToVideoKO1TaskInput	否	KO1 模型的特定输入参数
modelH20TaskInput	ImageToVideoH20TTaskInput	否	H20 模型的特定输入参数
modelH23TaskInput	ImageToVideoH23TTaskInput	否	H23 模型的特定输入参数
modelH23FTaskInput	ImageToVideoH23FTaskInput	否	H23F 模型的特定输入参数
modelVE31TaskInput	ImageToVideoVE31TaskInput	否	VE3.1 模型的特定输入参数（支持单图生视频、首尾帧生视频、参考生视频）
modelVE31FTaskInput	ImageToVideoVE31FTaskInput	否	VE3.1F 模型的特定输入参数（支持单图生视频、首尾帧生视频、参考生视频）
modelVE31LTaskInput	ImageToVideoVE31LTaskInput	否	VE3.1L 模型的特定输入参数（支持单图生视频、首尾帧生视频）

ImageToVideoTrajectory

运动轨迹坐标序列

生成 5s 的视频，轨迹长度不超过 77，即坐标个数取值范围：[2, 77]
轨迹坐标系，以图片左下角为坐标原点
坐标点个数越多轨迹刻画越准确，如只有 2 个轨迹点则为这两点连接的直线
轨迹方向以传入顺序为指向，以最先传入的坐标为轨迹起点，依次链接后续坐标形成运动轨迹

参数	类型	描述
x	integer	轨迹点横坐标（在像素二维坐标系下，以输入图片 image 左下为原点的像素坐标）
y	integer	轨迹点纵坐标（在像素二维坐标系下，以输入图片 image 左下为原点的像素坐标）

ImageToVideoV20TaskInput

图生视频 V20 任务输入参数

参数	类型	描述
image	ImageToVideoImageItem	图片信息，图生必填
prompt	string	生成的提示文本，必填
duration	integer	视频时长，单位 s，支持： 4
resolution	string	分辨率，支持： 360p 720p 1080p
seed	integer	随机种子，非必填
aspectRatio	string	比例，非必填，默认 16:9 , 支持： 16:9 9:16 1:1
movementAmplitude	string	运动幅度，非必填，默认 auto, 支持： auto small medium large
audio	boolean	是否开启声音，非必填，默认 false
bgm	boolean	是否开启背景音乐，非必填，默认 false
offPeak	boolean	是否使用错峰模式，非必填。错峰模式下任务优先级较低，生成时间可能较长（最长18小时），但价格更优惠

首尾帧生视频 V20 任务输入参数

参数	类型	描述
headtailImages	ImageToVideoHeadtailImages	首尾帧图片信息
prompt	string	生成的提示文本，必填
duration	integer	视频时长，单位 s，支持： 4
resolution	string	分辨率，支持： 360p 720p 1080p
seed	integer	随机种子，非必填
aspectRatio	string	比例，非必填，默认 16:9 , 支持： 16:9 9:16 1:1
movementAmplitude	string	运动幅度，非必填，默认 auto, 支持： auto small medium large
bgm	boolean	是否开启背景音乐，非必填，默认 false
offPeak	boolean	是否使用错峰模式，非必填。错峰模式下任务优先级较低，生成时间可能较长（最长18小时），但价格更优惠

参考生视频 V20 任务输入参数（视频直出，无主体，单图，无声音）

参数	类型	描述
characterImages	ImageToVideoImageItem[]	参考图片信息，最大支持三张图片
prompt	string	生成的提示文本，必填
duration	integer	视频时长，单位 s，支持： 4
resolution	string	分辨率，支持： 360p 720p 1080p
seed	integer	随机种子，非必填
aspectRatio	string	比例，非必填，默认 16:9 , 支持： 16:9 9:16 1:1
movementAmplitude	string	运动幅度，非必填，默认 auto, 支持： auto small medium large
bgm	boolean	是否开启背景音乐，非必填，默认 false
offPeak	boolean	是否使用错峰模式，非必填。错峰模式下任务优先级较低，生成时间可能较长（最长18小时），但价格更优惠

参考生视频 V20 任务输入参数（音视频直出，有主体，可以有声音）

参数	类型	描述
subjects	SubjectItem[]	参考主体信息（每个主体最多三张图，最大支持三张图片）。 serverId模式：主体接口返回的id，最大支持7个
prompt	string	生成的提示文本，必填
duration	integer	视频时长，单位 s，支持： 4
audio	boolean	是否开启声音，支持： true false
resolution	string	分辨率，支持： 360p 720p 1080p
seed	integer	随机种子，非必填
aspectRatio	string	比例，非必填，默认 16:9 , 支持： 16:9 9:16 1:1
movementAmplitude	string	运动幅度，非必填，默认 auto, 支持： auto small medium large
bgm	boolean	是否开启背景音乐，非必填，默认 false
offPeak	boolean	是否使用错峰模式，非必填。错峰模式下任务优先级较低，生成时间可能较长（最长18小时），但价格更优惠

ImageToVideoVQ1CTaskInput

图生视频 VQ1C 任务输入参数

参数	类型	描述
headtailImages	ImageToVideoHeadtailImages	首尾帧图片信息，首尾生必填
prompt	string	生成的提示文本，必填
duration	integer	视频时长，单位 s，支持： 5
resolution	string	分辨率，支持： 1080p
seed	integer	随机种子，非必填
aspectRatio	string	比例，非必填，默认 16:9 , 支持： 16:9 9:16 1:1
movementAmplitude	string	运动幅度，非必填，默认 auto, 支持： auto small medium large
offPeak	boolean	是否使用错峰模式，非必填。错峰模式下任务优先级较低，生成时间可能较长（最长18小时），但价格更优惠

ImageToVideoVQ1TaskInput

图生视频 VQ1 任务输入参数

参数	类型	描述
image	ImageToVideoImageItem	图片信息
prompt	string	生成的提示文本，必填
duration	integer	视频时长，单位 s，支持： 5
resolution	string	分辨率，支持： 1080p
seed	integer	随机种子，非必填
aspectRatio	string	比例，非必填，默认 16:9 , 支持： 16:9 9:16 1:1
movementAmplitude	string	运动幅度，非必填，默认 auto, 支持： auto small medium large
audio	boolean	是否开启声音，非必填，默认 false false：不需要音视频直出，输出静音视频 true：需要音视频直出，输出带台词以及背景音的视频注1：该参数为true时，voice_id参数才生效注2：该参数为true时，不支持错峰模式
bgm	boolean	是否开启背景音乐，非必填，默认 false
offPeak	boolean	是否使用错峰模式，非必填。错峰模式下任务优先级较低，生成时间可能较长（最长18小时），但价格更优惠

首尾帧生视频 VQ1 任务输入参数

参数	类型	描述
headtailImages	ImageToVideoHeadtailImages	首尾帧图片信息
prompt	string	生成的提示文本，必填
duration	integer	视频时长，单位 s，支持： 5
resolution	string	分辨率，支持： 1080p
seed	integer	随机种子，非必填
aspectRatio	string	比例，非必填，默认 16:9 , 支持： 16:9 9:16 1:1
movementAmplitude	string	运动幅度，非必填，默认 auto, 支持： auto small medium large
bgm	boolean	是否开启背景音乐，非必填，默认 false
offPeak	boolean	是否使用错峰模式，非必填。错峰模式下任务优先级较低，生成时间可能较长（最长18小时），但价格更优惠

参考生视频 VQ1 任务输入参数（视频直出，无主体，单图，无声音）

参数	类型	描述
characterImages	ImageToVideoImageItem[]	参考图片信息，最大支持七张图片
prompt	string	生成的提示文本，必填
duration	integer	视频时长，单位 s，支持： 5
resolution	string	分辨率，支持： 1080p
seed	integer	随机种子，非必填
aspectRatio	string	比例，非必填，默认 16:9 , 支持： 16:9 9:16 1:1
movementAmplitude	string	运动幅度，非必填，默认 auto, 支持： auto small medium large
bgm	boolean	是否开启背景音乐，非必填，默认 false
offPeak	boolean	是否使用错峰模式，非必填。错峰模式下任务优先级较低，生成时间可能较长（最长18小时），但价格更优惠

参考生视频 VQ1 任务输入参数（音视频直出，有主体，可以有声音）

参数	类型	描述
subjects	SubjectItem[]	参考主体信息图片模式：每个主体最多三张图，最大支持七张图片。 serverId模式：主体接口返回的id，最大支持7个
prompt	string	生成的提示文本，必填
duration	integer	视频时长，单位 s，支持： 5
resolution	string	分辨率，支持： 1080p
seed	integer	随机种子，非必填
audio	boolean	是否开启声音 false：不需要音视频直出，输出静音视频 true：需要音视频直出，输出带台词以及背景音的视频注1：该参数为true时，voice_id参数才生效注2：该参数为true时，不支持错峰模式
aspectRatio	string	比例，非必填，默认 16:9 , 支持： 16:9 9:16 1:1
movementAmplitude	string	运动幅度，非必填，默认 auto, 支持： auto small medium large
bgm	boolean	是否开启背景音乐，非必填，默认 false
offPeak	boolean	是否使用错峰模式，非必填。错峰模式下任务优先级较低，生成时间可能较长（最长18小时），但价格更优惠

ImageToVideoVQ2TTaskInput

图生视频 VQ2T 任务输入参数

支持三种模式：

单图生视频模式：传参 image
首尾帧生视频模式：传参 headtailImages
智能多帧生视频模式：传参 startImage + imageSettings

三种模式有且仅需选择一种。

通用参数

参数	类型	是否必填	描述
resolution	string	是	分辨率，支持： 540p 720p 1080p
seed	integer	否	随机种子
bgm	boolean	否	是否开启背景音乐，默认 false
offPeak	boolean	否	是否使用错峰模式。错峰模式下任务优先级较低，生成时间可能较长（最长18小时），但价格更优惠

单图生视频模式参数

参数	类型	是否必填	描述
image	ImageToVideoImageItem	是	图片信息
prompt	string	是	生成的提示文本
duration	integer	是	视频时长，单位 s，支持：[1,10]

首尾帧生视频模式参数

参数	类型	是否必填	描述
headtailImages	ImageToVideoHeadtailImages	是	首尾帧图片信息
prompt	string	是	生成的提示文本
duration	integer	是	视频时长，单位 s，支持：[1,8]

智能多帧生视频模式参数

参数	类型	是否必填	描述
startImage	ImageToVideoImageItem	是	首帧图像，支持 png、jpeg、jpg、webp 格式，图片大小不超过 50 MB，图片比例需要小于 1:4 或者 4:1
imageSettings	ImageFrameSettings[]	是	智能多帧配置，每个任务最少 2 帧，最多 9 帧
metaData	string	否	元数据标识，JSON 格式字符串，透传字段
callbackUrl	string	否	回调地址
payload	string	否	透传参数，不做任何处理，仅数据传输，最多 1048576 个字符

ImageToVideoVQ2PTaskInput

图生视频 VQ2P 任务输入参数

支持五种模式：

单图生视频模式：传参 image
首尾帧生视频模式：传参 headtailImages
参考生视频非主体调用模式：传参 characterImages
参考生视频主体调用模式：传参 subjects
智能多帧生视频模式：传参 startImage + imageSettings

五种模式有且仅需选择一种。

通用参数

参数	类型	是否必填	描述
resolution	string	是	分辨率，支持： 540p 720p 1080p
seed	integer	否	随机种子
bgm	boolean	否	是否开启背景音乐，默认 false
offPeak	boolean	否	是否使用错峰模式。错峰模式下任务优先级较低，生成时间可能较长（最长18小时），但价格更优惠

单图生视频模式参数

参数	类型	是否必填	描述
image	ImageToVideoImageItem	是	图片信息
prompt	string	是	生成的提示文本
duration	integer	是	视频时长，单位 s，支持：[1,10]
voiceId	string	否	音色id

首尾帧生视频模式参数

参数	类型	是否必填	描述
headtailImages	ImageToVideoHeadtailImages	是	首尾帧图片信息
prompt	string	是	生成的提示文本
duration	integer	是	视频时长，单位 s，支持：[1,8]

参考生视频非主体调用模式参数

参数	类型	描述
characterImages	ImageToVideoImageItem[]	参考图片信息，必填，如果不上传视频，则支持上传1-7张图，如果上传视频则支持1-4张图
videos	AIGCVideoItem[]	视频信息，必填，支持上传1～2个视频
prompt	string	生成的提示文本，必填
duration	integer	视频时长，单位 s，默认5秒，支持：[1,10]
resolution	string	分辨率，默认720p，支持： 540p,720p,1080p
seed	integer	随机种子，非必填
aspectRatio	string	比例，非必填，默认 16:9 , 支持： 16:9 9:16 3:4 4:3 1:1
bgm	boolean	是否开启背景音乐，非必填，默认 false, 9秒和10秒不生效
offPeak	boolean	是否使用错峰模式，非必填。错峰模式下任务优先级较低，生成时间可能较长（最长18小时），但价格更优惠

参考生视频主体调用模式参数

参数	类型	描述
subjects	SubjectItem[]	参考主体信息 serverId模式：主体接口返回的id，可以使用视频主体、文字主体和图片主体。图片或文字主体最多不超过4个。视频主体最多不超过2个
prompt	string	生成的提示文本，必填
duration	integer	视频时长，单位 s，默认5秒，可选：0-10（0秒时为自动推荐）
resolution	string	分辨率，默认720p，支持：540p,720p,1080p
seed	integer	随机种子，非必填
audio	boolean	是否开启声音 false：不需要音视频直出，输出静音视频 true：需要音视频直出，输出带台词以及背景音的视频注1：该参数为true时，voice_id参数才生效注2：该参数为true时，不支持错峰模式
aspectRatio	string	比例，非必填，默认 16:9 , 支持： 16:9 9:16 1:1
movementAmplitude	string	运动幅度，非必填，默认 auto, 支持： auto small medium large
bgm	boolean	是否开启背景音乐，非必填，默认 false
offPeak	boolean	是否使用错峰模式，非必填。错峰模式下任务优先级较低，生成时间可能较长（最长18小时），但价格更优惠

智能多帧生视频模式参数

参数	类型	是否必填	描述
prompt	string	是	占位文本，输入文字占位即可（后续调整）
startImage	ImageToVideoImageItem	是	首帧图像，支持 png、jpeg、jpg、webp 格式，图片大小不超过 50 MB，图片比例需要小于 1:4 或者 4:1
imageSettings	ImageFrameSettings[]	是	智能多帧配置，每个任务最少 2 帧，最多 9 帧
metaData	string	否	元数据标识，JSON 格式字符串，透传字段
callbackUrl	string	否	回调地址
payload	string	否	透传参数，不做任何处理，仅数据传输，最多 1048576 个字符

ImageToVideoVQ2PFTaskInput

图生视频 VQ2PF 任务输入参数

支持两种模式：

单图生视频模式：传参 image
首尾帧生视频模式：传参 headtailImages

不同模式有且仅需选择一种。

通用参数

参数	类型	是否必填	描述
resolution	string	是	分辨率，支持： 720p 1080p
seed	integer	否	随机种子
isRec	boolean	否	是否使用推荐提示词 true：是，由系统自动推荐提示词，并使用提示词内容生成视频，推荐提示词数量=1 false：否，根据输入的prompt生成视频注意：启用推荐提示词后，每个任务多消耗10积分
bgm	boolean	否	是否开启背景音乐，默认 false
offPeak	boolean	否	是否使用错峰模式。错峰模式下任务优先级较低，生成时间可能较长（最长18小时），但价格更优惠

单图生视频模式参数

参数	类型	是否必填	描述
image	ImageToVideoImageItem	是	图片信息
prompt	string	是	生成的提示文本
duration	integer	是	视频时长，单位 s，支持：[1,10]
audio	boolean	否	是否使用音视频直出能力，默认为false 该参数为true时，不支持错峰模式
voiceId	string	否	音色id

首尾帧生视频模式参数

参数	类型	是否必填	描述
headtailImages	ImageToVideoHeadtailImages	是	首尾帧图片信息
prompt	string	是	生成的提示文本
duration	integer	是	视频时长，单位 s，支持：[1,8]

ImageToVideoVQ2TaskInput

参考生视频 VQ2 任务输入参数（视频直出，无主体，单图，无声音）

参数	类型	描述
characterImages	ImageToVideoImageItem[]	参考图片信息，最大支持七张图片
prompt	string	生成的提示文本，必填
duration	integer	视频时长，单位 s，支持：[1,10]
resolution	string	分辨率，支持： 360p,540p,720p,1080p
seed	integer	随机种子，非必填
aspectRatio	string	比例，（默认16:9，可选值如下：16:9、9:16、3:4、4:3、1:1
bgm	boolean	是否开启背景音乐，非必填，默认 false
offPeak	boolean	是否使用错峰模式，非必填。错峰模式下任务优先级较低，生成时间可能较长（最长18小时），但价格更优惠

参考生视频 VQ2 任务输入参数（音视频直出，有主体，可以有声音）

参数	类型	描述
subjects	SubjectItem[]	参考主体信息（每个主体最多三张图，最大支持七张图片）。 serverId模式：主体接口返回的id，最大支持7个
prompt	string	生成的提示文本，必填
audio	boolean	是否开启声音 false：不需要音视频直出，输出静音视频 true：需要音视频直出，输出带台词以及背景音的视频注1：该参数为true时，voice_id参数才生效注2：该参数为true时，不支持错峰模式
duration	integer	视频时长，单位 s，支持：[1,10]
resolution	string	分辨率，支持： 360p,540p,720p,1080p
seed	integer	随机种子，非必填
aspectRatio	string	比例，（默认16:9，可选值如下：16:9、9:16、3:4、4:3、1:1
bgm	boolean	是否开启背景音乐，非必填，默认 false
offPeak	boolean	是否使用错峰模式，非必填。错峰模式下任务优先级较低，生成时间可能较长（最长18小时），但价格更优惠

ImageToVideoVQ3PTaskInput

图生视频 VQ3P 任务输入参数

支持一种模式：

支持两种模式：

单图生视频模式：传参 image
首尾帧生视频模式：传参 headtailImages

不同模式有且仅需选择一种。

单图生视频模式参数

参数	类型	是否必填	描述
image	ImageToVideoImageItem	是	图片信息
prompt	string	是	生成的提示文本
duration	integer	否	视频时长，单位 s，默认5秒，支持：[1-16]
seed	integer	否	随机种子
resolution	string	否	分辨率，默认720p，支持： 540p 720p 1080p
audio	boolean	否	是否使用音视频直出能力，默认为true
isRec	boolean	否	是否使用推荐提示词，默认为false，启用推荐提示词后，每个任务多消耗10积分且prompt失效
offPeak	boolean	否	是否使用错峰模式。仅audio为true支持错峰模式。错峰模式下任务优先级较低，生成时间可能较长（最长18小时），但价格更优惠

首尾帧生视频模式参数

参数	类型	是否必填	描述
headtailImages	ImageToVideoHeadtailImages	是	首尾帧图片信息
prompt	string	是	生成的提示文本
duration	integer	否	视频时长，单位 s，默认5秒，支持：[1-16]
seed	integer	否	随机种子
resolution	string	否	分辨率，默认720p，支持： 540p 720p 1080p
audio	boolean	否	是否使用音视频直出能力，默认为true
isRec	boolean	否	是否使用推荐提示词，默认为false，启用推荐提示词后，每个任务多消耗10积分且prompt失效
offPeak	boolean	否	是否使用错峰模式。仅audio为true支持错峰模式。错峰模式下任务优先级较低，生成时间可能较长（最长18小时），但价格更优惠

ImageToVideoVQ3TTaskInput

图生视频 VQ3T 任务输入参数

支持一种模式：

支持两种模式：

单图生视频模式：传参 image
首尾帧生视频模式：传参 headtailImages

不同模式有且仅需选择一种。

单图生视频模式参数

参数	类型	是否必填	描述
image	ImageToVideoImageItem	是	图片信息
prompt	string	是	生成的提示文本
duration	integer	否	视频时长，单位 s，默认5秒，支持：[1-16]
seed	integer	否	随机种子
resolution	string	否	分辨率，默认720p，支持： 540p 720p 1080p
audio	boolean	否	是否使用音视频直出能力，默认为true
isRec	boolean	否	是否使用推荐提示词，默认为false，启用推荐提示词后，每个任务多消耗10积分且prompt失效
offPeak	boolean	否	是否使用错峰模式。仅audio为true支持错峰模式。错峰模式下任务优先级较低，生成时间可能较长（最长18小时），但价格更优惠

首尾帧生视频模式参数

参数	类型	是否必填	描述
headtailImages	ImageToVideoHeadtailImages	是	首尾帧图片信息
prompt	string	是	生成的提示文本
duration	integer	否	视频时长，单位 s，默认5秒，支持：[1-16]
seed	integer	否	随机种子
resolution	string	否	分辨率，默认720p，支持： 540p 720p 1080p
audio	boolean	否	是否使用音视频直出能力，默认为true
isRec	boolean	否	是否使用推荐提示词，默认为false，启用推荐提示词后，每个任务多消耗10积分且prompt失效
offPeak	boolean	否	是否使用错峰模式。仅audio为true支持错峰模式。错峰模式下任务优先级较低，生成时间可能较长（最长18小时），但价格更优惠

SubjectItem

主体信息，传参images和serverId有且仅有一个

参数	类型	描述
images	ImageItem[]	参考主体图片信息
serverId	string	参考主体标识信息，需调用创建主体接口生成
id	string	prompt的标识信息，@xxx 在prompt使用。传入serverId时，该参数值需设置为主体的elementName。
voiceId	string	参考主体音色，非必填

ImageItem

图片信息

参数	类型	描述
imageUrl	string	图片url地址

LipSyncAudioItem

音频信息，传参 audioUrl, audioFile 有且仅需有一个

参数	类型	描述
audioUrl	string	视频链接
audioFile	string	视频文件，Base64 编码

LipSyncKRequest

对口型 K 任务输入参数， textConfig，audioConfig 有且仅需有一个

参数	类型	描述
videoItem	AIGCVideoItem	视频信息
textConfig	LipSyncKTextConfig	文本生成对口型视频配置
audioConfig	AIGCAudioConfig	音频文件生成对口型视频配置

LipSyncKTextConfig

K 模型对口型文本输入参数

参数	类型	描述
text	string	生成对口型视频的文本内容，最大长度 120
voiceId	string	音色 ID
voiceLanguage	string	音色语种，与音色 id 对应
voiceSpeed	string	语速，有效范围：0.8~2.0

LipSyncPRequest

对口型 P 任务输入参数， textConfig，audioConfig 有且仅需有一个

参数	类型	描述
videoItem	AIGCVideoItem	视频信息
textConfig	LipSyncPTextConfig	文本生成对口型视频配置
audioConfig	AIGCAudioConfig	音频文件生成对口型视频配置

LipSyncPTextConfig

P 模型对口型文本输入参数

参数	类型	描述
text	string	生成对口型视频的文本内容，最大支持约 200 字符
voiceId	string	音色 ID，支持： Auto：随机 14：呆萌王小拍 6：李解 13：钱多多 2：詹有鱼 4：外国阿利 12：李杰克 11：老森 10：姜姜好 16：屯里大嗓 18：豫语汉子 19：宝岛囡囡 20：陕西掌柜 21：港风阿 sir

LipSyncVRequest

对口型 V 任务输入参数， textConfig，audioConfig 有且仅需有一个

参数	类型	描述
videoItem	AIGCVideoItem	视频信息
textConfig	LipSyncPTextConfig	文本生成对口型视频配置
audioConfig	AIGCAudioConfig	音频文件生成对口型视频配置

LipSyncVTextConfig

V 模型对口型文本输入参数

参数	类型	描述
text	string	生成对口型视频的文本内容，支持 4 ~ 2000 字符
voiceId	string	音色 ID
speed	float	语速，默认为1.0，1.0为正常语速，范围[0.5, 2]，值为0.5时播报语速最慢，值为2时播报语速最快；
volume	integer	音量大小，范围 0 - 10，默认为0，代表正常音量，值越大音量越高

文本或音频通用参数

参数	类型	描述
refPhoto	AIGCImageItem	用户上传的人脸参考图 URL

LipSyncRequest

对口型视频任务输入参数

参数	类型	描述
model	string	模型名称，支持： K P V
modelKTaskInput	LipSyncKRequest	K 模型的特定输入参数
modelPTaskInput	LipSyncPRequest	P 模型的特定输入参数
modelVTaskInput	LipSyncPRequest	V 模型的特定输入参数

MediaAnalysisCompleteEvent

媒资 AI 分析完成回调事件内容

名称	类型	说明
taskId	string	任务 ID
status	string	运行状态，包括 READY RUNNING SUCCESS FAILED
createTime	string	任务创建时间
finishTime	string	任务完成时间
beginProcessTime	string	任务开始时间
analysisTaskInfo	MediaAnalysisTaskInfo	拉取任务信息

MediaAnalysisOutputInfo

媒资 AI 分析结果信息

名称	类型	说明
id	string	AI 分析模板 ID
results	MediaAnalysisOutputTypeResult[]	分析场景列表

MediaAnalysisOutputTypeEnum

媒资 AI 分析结果的场景类型枚举

分析场景	描述
figure	人脸
keyword	关键字
scenario	场景
entity	实体
logo	logo
knowledge_graph	知识图谱

MediaAnalysisOutputTypeResult

媒资 AI 分析结果场景列表。AI 分析结果一般有多个场景分类，这是一个场景结果的数据结构

名称	类型	说明
type	string(MediaAnalysisOutputTypeEnum)	分析场景，枚举
result	MediaAnalysisOutputTypeResultItem[]	分析结果项

MediaAnalysisOutputTypeResultItem

媒资 AI 分析结果分类中的某一个类型的结果。

名称	类型	说明
attribute	string	分析结果标签
source	string	标签来源

MediaAnalysisTaskInfo

媒资 AI 分析任务信息

名称	类型	说明
mediaId	string	媒资 ID
errMsg	string	错误信息
analysisInput	MediaAnalysisTaskInput	分析任务输入参数
analysisOutput	MediaAnalysisOutputInfo	分析任务输出参数

MediaAnalysisTaskInput

媒资 AI 分析任务输入参数

名称	类型	说明
presetId	string	AI 分析模板 ID

MediaAudioCodec

媒资音频编码信息

名称	类型	说明
codec	string	音频编码规格
channels	int	音频文件的声道信息
sampleRateInHz	int	音频文件的采样率，单位：Hz
bitRateInBps	int	音频文件的码率，单位：bps

MediaBasicInfo

媒资基本信息

名称	类型	说明
mediaId	string	媒资 ID
name	string	媒资名称
description	string	媒资描述
mediaType	string	媒资类型，video/image/audio
banStatus	string	媒资封禁状态， NORMAL：未封禁 BAN：已封禁
createTime	string	创建时间
categoryId	string	媒资分类 ID
tags	string[]	媒资标签列表
source	MediaSource	媒资源信息
sourceMetadata	MediaSourceMetadata	媒资源文件元信息

MediaBlackBorderArea

媒资视频黑边信息

名称	类型	说明
x	int	去黑边后的视频左偏移位置，单位：像素
y	int	去黑边后的视频上偏移位置，单位：像素
width	int	去黑边后的视频宽度，单位：像素
height	int	去黑白后的视频高度，单位：像素

MediaBlackBorderDetectOutputInfo

媒资视频黑边检测输出信息

名称	类型	说明
borderArea	MediaBlackBorderArea	去黑边区域信息
meta	MediaBlackBorderVideoMetaInfo	视频信息

MediaBlackBorderDetectTaskInfo

媒资视频黑边检测任务信息

名称	类型	说明
mediaId	string	媒资 ID
status	string	运行状态，包括 READY RUNNING SUCCESS FAILED
errMsg	string	错误信息
blackBorderOutput	MediaBlackBorderDetectOutputInfo	黑边检测输出信息

MediaBlackBorderDetectTaskInput

媒资视频黑边检测任务的输入参数

名称	类型	说明
presetId	string	转码模板 ID，使用去黑边时必填

MediaBlackBorderVideoMetaInfo

黑边视频信息

名称	类型	说明
width	int	视频宽度，单位：像素
height	int	视频高度，单位：像素
rotate	int	视频旋转角度，单位：度

MediaComposeNodeTaskInfo

视频合成任务信息

名称	类型	说明
jobId	string	节点任务 ID
mediaId	string	媒资 ID
status	string	任务状态
composeOutput	MediaComposeOutput	视频合成任务输出信息

MediaComposeNodeTaskInfos

工作流视频合成任务信息

名称	类型	说明
nodeId	string	节点 ID
nodeName	string	节点名称
ComposeNodeTaskInfos	MediaComposeNodeTaskInfo	视频合成任务信息

MediaComposeOutput

视频翻译任务输出信息

名称	类型	说明
targetLanguage	string	目标翻译语言
url	string	合成结果链接

MediaDetail

媒资详细信息，继承自 MediaBasicInfo，还包含以下参数

名称	类型	说明
transcodeOutputs	MediaTranscodeOutputInfo[]	转码输出信息
thumbnailOutputs	MediaThumbnailOutputInfo[]	抽帧输出信息
subtitleOutputs	MediaSubtitleOutputInfo[]	字幕输出信息
analysisOutputs	MediaAnalysisOutputInfo[]	AI 分析输出信息
regulationOutputs	MediaRegulationOutputInfo[]	AI 审核输出信息

MediaDwmDetectTaskInfo

视频数字水印提取任务信息

名称	类型	说明
mediaId	string	媒资 ID
transcodeOutputId	string	转码输出 ID，即转码模板 ID，用于指定媒资的某个转码输出视频
status	string	运行状态，包括 READY RUNNING SUCCESS FAILED
errMsg	string	错误信息
digitalWmAlgVersion	int	数字水印算法版本，支持 1、2
detectedText	string	提取的文字信息，当 status 为 SUCCESS 时返回

MediaFetchCompleteEvent

媒资拉取完成回调事件内容

名称	类型	说明
taskId	string	任务 ID
status	string	运行状态，包括 READY RUNNING SUCCESS FAILED
createTime	string	任务创建时间
finishTime	string	任务完成时间
fetchTaskInfo	MediaFetchTaskInfo	拉取任务信息

MediaFetchTaskInfo

拉取任务信息

名称	类型	说明
errMsg	string	错误信息
url	string	拉取任务源文件地址。与拉取任务 bucket/key 二选一
bucket	string	拉取任务源文件 bucket
key	string	拉取任务源文件 key
coverUrl	string	拉取任务源文件封面图地址
highlightProjectId	string	拉取任务生成的媒资，需要导入的集锦项目 ID
mediaBasicInfo	MediaBasicInfo	媒资基本信息
presetTaskId	string	任务类型为模板处理的任务 ID。若拉取上传时指定了媒资后续模版处理操作，当该模板处理时会生成一个新任务
workflowTaskId	string	任务类型为工作流处理的任务 ID。若拉取上传时指定了媒资后续工作流处理操作，当该工作流处理时会生成一个新任务

MediaPresetTaskInfo

媒资模板处理任务信息

名称	类型	说明
mediaId	string	媒资 ID
transcodeTasks	MediaTranscodeTaskInfo[]	转码任务信息列表，当 presetIds 中包含转码模板时返回
thumbnailTasks	MediaThumbnailTaskInfo[]	抽帧任务信息列表，当 presetIds 中包含抽帧模板时返回

MediaPresetTaskInput

媒资进行模板处理任务的输入参数

名称	类型	说明
presetIds	string[]	模版 ID 列表，支持转码、抽帧模板，使用模板处理时必填
watermarkIds	string[]	明水印模版 ID 列表，当 presetIds 是转码模板时，watermarkIds 会在每一个转码处理中生效，使用模版处理时选填
digitalWatermark	MediaTranscodeDigitalWatermark	数字水印嵌入信息，使用模版处理时选填

MediaRegulationCompleteEvent

媒资 AI 审核完成回调事件内容

名称	类型	说明
taskId	string	任务 ID
status	string	运行状态，包括 READY RUNNING SUCCESS FAILED
createTime	string	任务创建时间
finishTime	string	任务完成时间
beginProcessTime	string	任务开始转码时间
regulationTaskInfo	MediaRegulationTaskInfo	AI 审核任务信息

MediaRegulationOutputInfo

AI 审核结果信息

名称	类型	说明
id	string	AI 审核模板 ID
label	string	AI 审核整体结果， NORMAL：正常 REVIEW：疑似违规 REJECT：确认违规
results	MediaRegulationOutputTypeResult[]	审核类型结果列表

MediaRegulationOutputSubTypeEnum

审核结果中的 subType 表示”审核项”。每种审核类型下细分了不同审核项

审核场景	审核类型	审核项	审核项描述
涉黄审核	sexual_porn	behavior, sm, products, children, art	性行为及露点及招嫖，SM, 性用品及性玩具，儿童，艺术品色情
涉黄审核	sexual_sexy	male, female	男性衣着暴露，女性衣着暴露
涉黄审核	sexual_intimacy	intimacy	亲密行为
涉黄审核	sexual_vulgar	vulgar	低俗行为
涉黄审核	sexual_special	pregnant	孕肚裸露
暴恐审核	terrorist_group	terrorist_group	恐怖组织
暴恐审核	terrorist	terrorist	暴恐人物
暴恐审核	terror_event	blood, corpse, murder, explosion, riot, weapon, police, traffic	血腥，尸体，绑架及杀人，爆炸火灾，暴乱，军事武器，警察部队，车祸
涉政审核	politician	politician_positive, politician_negative, bad_artist	涉政正面人物，涉政负面人物，劣迹艺人
涉政审核	political_event	political_event_positive, political_event_negative	涉政正面事件，涉政负面事件
涉政审核	political_group	political_group_positive, political_group_negative	涉政正面组织，涉政负面组织
广告审核	ad_brand	brand	品牌标识
广告审核	ad_marketing	qrcode, contact, website, commercial, watermark	二维码，联系方式，网址，软文推广，水印
广告审核	ad_brand_negative	brand_negative_comment	品牌负面评论
违禁审核	bad_behavior	smoke, drink, bad_behavior_gamble, drug	吸烟，喝酒，赌博，毒品
违禁审核	illegal_gamble	gamble	赌博
违禁审核	illegal_forgery	forgery	假冒伪劣及造假盗窃
违禁审核	illegal_trade	trade	非法交易
违禁审核	illegal_privacy	privacy	非法获取私人信息
质量审核	disgust	disgust_image	恶心图
官方文本黑库	official_text_black_lib	baidu_illegal_textlib	违禁词库
官方图片黑库	image_black_lib	default_image_black_lib	百度云风控

MediaRegulationOutputTypeEnum

审核结果中的 type 表示”审核类型”。每类审核场景下包含着多种审核类型，不同审核类型支持的审核物料也不一样

审核场景	审核类型	描述
涉黄审核	sexual_porn	色情审核
涉黄审核	sexual_sexy	性感审核
涉黄审核	sexual_intimacy	亲密行为审核
涉黄审核	sexual_vulgar	低俗行为
涉黄审核	sexual_special	特殊行为
暴恐审核	terrorist_group	暴恐组织审核
暴恐审核	terrorist	暴恐人物审核
暴恐审核	terror_event	暴力事件审核
涉政审核	politician	涉政人物审核
涉政审核	political_event	涉政事件审核
涉政审核	political_group	涉政组织审核
广告审核	ad_brand	品牌广告审核
广告审核	ad_marketing	欺诈及营销广告审核
广告审核	ad_brand_negative	品牌负面评论审核
违禁审核	bad_behavior	不良行为审核
违禁审核	illegal_gamble	赌博审核
违禁审核	illegal_forgery	假冒伪劣及造假盗窃审核
违禁审核	illegal_trade	非法交易审核
违禁审核	illegal_privacy	非法获取私人信息审核
质量审核	disgust	恶心

MediaRegulationOutputTypeResult

AI 审核类型结果

名称	类型	说明
type	string(MediaRegulationOutputTypeEnum)	审核类型
items	MediaRegulationOutputTypeResultItem[]	审核类型结果列表

MediaRegulationOutputTypeResultItem

AI 审核类型结果项

名称	类型	说明
subType	string(MediaRegulationOutputSubTypeEnum)	审核项
timeInSeconds	int	物料在视频中的秒数
startTimeInSeconds	int	物料在视频中的起始秒数，和 endTimeInSeconds 同时存在
endTimeInSeconds	int	物料在视频中的结束秒数，和 startTimeInSeconds 同时存在
confidence	double	审核结果项的置信度，0~100 的浮点数
label	string	审核结果项标记
extra	string	额外信息，如有；例如政治敏感人物识别出来的人名
evidence	MediaRegulationOutputTypeResultItemEvidence[]	审核项证据列表

MediaRegulationOutputTypeResultItemEvidence

AI 审核类型结果项证据

名称	类型	说明
location	MediaRegulationOutputTypeResultItemEvidenceLocation	证据位置信息

MediaRegulationOutputTypeResultItemEvidenceLocation

AI 审核类型结果项证据位置信息

名称	类型	说明
leftOffsetInPixel	int	左偏移
topOffsetInPixel	int	上偏移
widthInPixel	int	宽度
heightInPixel	int	高度

MediaRegulationTaskInfo

AI 审核任务信息

名称	类型	说明
mediaId	string	媒资 ID
errMsg	string	错误信息
regulationInput	MediaRegulationTaskInput	AI 审核任务输入信息
regulationOutput	MediaRegulationOutputInfo	AI 审核任务输出信息

MediaRegulationTaskInput

AI 审核任务输入信息

名称	类型	说明
presetId	string	审核模板 ID

MediaSource

媒资源信息

名称	类型	说明
sourceType	string	媒资来源，支持： UPLOAD：上传 COMPOSE：云剪辑 FETCH：拉取 GENERATE：视频生成
sourceUrl	string	媒资源文件播放地址
coverUrl	string	媒资封面图地址

MediaSourceMetadata

媒资源文件元信息

名称	类型	说明
etag	string	文件 ETag，可用于校验文件是否被修改过
fileSizeInByte	int	文件大小，单位：字节
type	string	文件类型， video：视频或图片 audio：音频
container	string	音视频文件的容器类型
durationInSecond	int	音视频文件时长，单位：秒
durationInMillisecond	int	音视频文件时长，单位：毫秒
video	MediaVideoCodec	视频元信息
audio	MediaAudioCodec	音频元信息
blackBorderArea	MediaBlackBorderArea	视频黑边信息

MediaSubtitleOcrRegion

字幕任务的 ocr 识别区域

名称	类型	说明
ocrRegionX	int	字幕区域左上角 x 坐标，相对于视频左上角的偏移量，单位：像素
ocrRegionY	int	字幕区域左上角 y 坐标，相对于视频左上角的偏移量，单位：像素
ocrRegionWidth	int	字幕区域宽度，单位：像素
ocrRegionHeight	int	字幕区域高度，单位：像素

MediaSubtitleOutputInfo

字幕任务输出信息

名称	类型	说明
id	string	字幕任务 ID（工作流节点 ID）
urls	string[]	字幕文件播放地址列表
formats	string[]	字幕文件格式列表，与 urls 顺序对应，类型支持： srt json

MediaSubtitleTaskInfo

字幕任务信息

名称	类型	说明
mediaId	string	媒资 ID
status	string	任务状态，包括 READY RUNNING SUCCESS FAILED
errMsg	string	任务失败时的错误信息
subtitleInput	MediaSubtitleTaskInput	字幕任务输入信息
subtitleOutput	MediaSubtitleOutputInfo	字幕任务输出信息

MediaSubtitleTaskInput

字幕任务输入信息

名称	类型	说明
startTimeInSecond	int	提取字幕开始时间
durationTimeInSecond	int	提取字幕时长
formats	string[]	字幕格式，支持： srt json
subtitleType	string	提取字幕类型，支持： asr：音频提取字幕 ocr：图像识别提取字幕
ocrRegion	MediaSubtitleOcrRegion	文字识别区域，仅当字幕类型为 AUTO 时有效

MediaTaskBasicInfo

任务基本信息

名称	类型	说明
taskId	string	任务 ID
mediaId	string	媒资 ID
type	string	任务类型，包括 WORKFLOW：工作流处理任务 PRESET：模板处理任务 COMPOSE：视频云剪辑任务 FETCH：媒资拉取任务 HIGHLIGHT_UNDERSTAND：精彩集锦视频理解任务 DWM_DETECT：数字水印提取任务 VIDEO_GENERATE：视频生成任务
status	string	任务状态，包括 READY RUNNING SUCCESS FAILED FINISHED 其中 FINISHED 包含 SUCCESS 和 FAILED 两种可能，工作流和模版处理任务的终态均为 FINISHED
createTime	string	任务创建时间
finishTime	string	任务完成时间

MediaTaskDetail

任务详细信息

名称	类型	说明
taskId	string	任务 ID
type	string	任务类型，包括 WORKFLOW：工作流处理任务 PRESET：模板处理任务 COMPOSE：视频云剪辑任务 FETCH：媒资拉取任务 HIGHLIGHT_UNDERSTAND：精彩集锦视频理解任务 DWM_DETECT：数字水印提取任务 VIDEO_GENERATE：视频生成
status	string	任务状态，包括 READY RUNNING SUCCESS FAILED FINISHED 其中 FINISHED 包含 SUCCESS 和 FAILED 两种可能，工作流和模版处理任务的终态均为 FINISHED
createTime	string	任务创建时间
finishTime	string	任务完成时间
mediaWorkflowTaskInfo	MediaWorkflowTaskInfo	工作流任务信息，仅当 type 为 WORKFLOW 时有效
mediaPresetTaskInfo	MediaPresetTaskInfo	模板任务信息，仅当 type 为 PRESET 时有效
composeTaskInfo	ComposeTaskInfo	视频云剪辑任务信息，仅当 type 为 COMPOSE 时有效
mediaFetchTaskInfo	MediaFetchTaskInfo	媒资拉取任务信息，仅当 type 为 FETCH 时有效
mediaDwmDetectTaskInfo	MediaDwmDetectTaskInfo	数字水印提取任务信息，仅当 type 为 DWM_DETECT 时有效
videoGenerateTaskInfo	VideoGenerateTaskInfo	视频生成任务信息，仅当 type 为 VIDEO_GENERATE 时有效

MediaThumbnailCompleteEvent

媒资截图完成回调事件内容

名称	类型	说明
taskId	string	任务 ID
status	string	运行状态，包括 READY RUNNING SUCCESS FAILED
createTime	string	任务创建时间
finishTime	string	任务完成时间
beginProcessTime	string	任务开始转码时间
thumbnailTaskInfo	MediaThumbnailTaskInfo	抽帧任务信息

MediaThumbnailOutputInfo

抽帧任务结果信息

名称	类型	说明
id	string	抽帧模板 ID
urls	string[]	抽帧结果播放地址列表

MediaThumbnailTaskInfo

抽帧任务信息

名称	类型	说明
mediaId	string	媒资 ID
errMsg	string	错误信息
thumbnailInput	MediaThumbnailTaskInput	抽帧任务输入信息
thumbnailOutput	MediaThumbnailOutputInfo	抽帧任务输出信息

MediaThumbnailTaskInput

抽帧任务输入信息

名称	类型	说明
presetId	string	抽帧模板 ID

MediaTranscodeCompleteEvent

媒资转码完成回调事件内容

名称	类型	说明
taskId	string	任务 ID
status	string	运行状态，包括 READY RUNNING SUCCESS FAILED
createTime	string	任务创建时间
finishTime	string	任务完成时间
beginProcessTime	string	任务开始转码时间
transcodeTaskInfo	MediaTranscodeTaskInfo	转码任务信息

MediaTranscodeDigitalWatermark

转码嵌入数字水印的参数

名称	类型	说明
digitalWmTextContent	string	需嵌入的文字内容，长度<=100 字符
digitalWmAlgVersion	int	算法版本号，支持 1、2
digitalWmStrength	float	数字水印嵌入强度，对同一算法，强度越高则抗攻击能力越强，隐蔽性越差。范围 0 ～ 1，默认值 0.5

MediaTranscodeOutputAudioCodec

转码结果音频编码信息

名称	类型	说明
channels	int	音频文件的声道信息
sampleRateInHz	int	音频文件的采样率，单位：Hz

MediaTranscodeOutputInfo

转码结果信息

名称	类型	说明
id	string	转码模板 ID
url	string	转码结果播放地址
meta	MediaTranscodeOutputMeta	转码结果元信息
watermarkIds	string[]	明水印 ID 列表
digitalWatermark	MediaTranscodeDigitalWatermark	数字水印信息

MediaTranscodeOutputMeta

转码结果元信息

名称	类型	说明
video	MediaTranscodeOutputVideoCodec	转码结果视频编码信息
audio	MediaTranscodeOutputAudioCodec	转码结果音频编码信息

MediaTranscodeOutputVideoCodec

转码结果视频编码信息

名称	类型	说明
durationInSeconds	int	音视频文件时长，单位：秒
durationInMilliSeconds	int	音视频文件时长，单位：毫秒
sizeInKiloByte	double	音视频文件大小，单位：KB
widthInPixel	int	视频宽度
heightInPixel	int	视频高度
frameRate	int	视频媒体的帧率
gopAlign	bool	是否开启 gop 对齐
mp4MoovSize	int	mp4 文件 moov 块大小，单位：Byte

MediaTranscodeTaskInfo

转码任务信息

名称	类型	说明
mediaId	string	媒资 ID
errMsg	string	错误信息
transcodeInput	MediaTranscodeTaskInput	转码任务输入信息
transcodeOutput	MediaTranscodeOutputInfo	转码任务输出信息

MediaTranscodeTaskInput

转码任务输入信息

名称	类型	说明
presetId	string	转码模板 ID
watermarkIds	string[]	明水印 ID 列表

MediaTranslationNodeTaskInfo

视频翻译任务信息

名称	类型	说明
jobId	string	节点任务 ID
mediaId	string	媒资 ID
status	string	任务状态
translationOutput	MediaTranslationOutput	视频翻译任务输出信息

MediaTranslationNodeTaskInfos

工作流视频翻译任务信息

名称	类型	说明
nodeId	string	节点 ID
nodeName	string	节点名称
translationTaskInfo	MediaTranslationNodeTaskInfo	视频翻译任务信息

MediaTranslationOutput

视频翻译任务输出信息

名称	类型	说明
targetLanguage	string	目标翻译语言
url	string	字幕SRT链接

MediaUnderstandingNodeTaskInfos

工作流视频理解任务信息

名称	类型	说明
nodeId	string	节点 ID
nodeName	string	节点名称
understandingTaskInfo	MediaUnderstandingTaskInfo	视频理解任务信息

MediaUnderstandingOutput

视频理解任务输出信息

名称	类型	说明
url	string	字幕SRT链接

MediaUnderstandingTaskInfo

视频理解任务信息

名称	类型	说明
jobId	string	节点任务 ID
mediaId	string	媒资 ID
status	string	任务状态
projectId	string	任务所属项目
understandingOutput	MediaUnderstandingOutput	视频理解任务输出信息

MediaUploadCompleteEvent

媒资上传完成回调事件内容，结构与 MediaBasicInfo 一致

MediaVideoCodec

媒资视频编码信息

名称	类型	说明
codec	string	视频文件的编码规格
heightInPixel	int	视频高度
widthInPixel	int	视频宽度
bitRateInBps	int	视频媒体的码率
frameRate	int	视频媒体的帧率
rotate	int	旋转角度（部分视频包含该参数）
dar	string	视频显示宽高比，如 "16:9" （部分视频包含该参数）

MediaVideoItem

视频信息

参数	类型	描述
mediaId	string	媒资 id

MediaWorkflowAnalysisNodeTaskInfo

工作流视频分析节点信息

名称	类型	说明
nodeId	string	节点 ID
nodeName	string	节点名称
analysisTaskInfo	MediaAnalysisTaskInfo	视频分析任务信息

MediaWorkflowBlackBorderDetectNodeTaskInfo

工作流黑边检测节点信息

名称	类型	说明
nodeId	string	节点 ID
nodeName	string	节点名称
blackBorderDetectTaskInfo	MediaBlackBorderDetectTaskInfo	黑边检测任务信息

MediaWorkflowPublishNodeTaskInfo

工作流发布节点信息

名称	类型	说明
nodeId	string	节点 ID
nodeName	string	节点名称
status	string	运行状态，包括 READY RUNNING SUCCESS FAILED
errMsg	string	错误信息

MediaWorkflowRegulationNodeTaskInfo

工作流视频审核节点信息

名称	类型	说明
nodeId	string	节点 ID
nodeName	string	节点名称
regulationTaskInfo	MediaRegulationTaskInfo	视频审核任务信息

MediaWorkflowStartNodeTaskInfo

工作流开始节点信息

名称	类型	说明
nodeId	string	节点 ID
nodeName	string	节点名称
status	string	运行状态，包括 READY RUNNING SUCCESS FAILED
errMsg	string	错误信息

MediaWorkflowSubtitleNodeTaskInfo

工作流字幕提取节点信息

名称	类型	说明
nodeId	string	节点 ID
nodeName	string	节点名称
subtitleTaskInfo	MediaSubtitleTaskInfo	字幕任务信息

MediaWorkflowTaskInfo

工作流任务信息

名称	类型	说明
mediaId	string	媒资 ID
workflowId	string	工作流 ID
startNodeTaskInfo	MediaWorkflowStartNodeTaskInfo	开始节点任务信息
transcodeNodeTaskInfos	MediaWorkflowTranscodeNodeTaskInfo[]	转码节点任务信息
thumbnailNodeTaskInfos	MediaWorkflowThumbnailNodeTaskInfo[]	截图节点任务信息
blackBorderDetectNodeTaskInfos	MediaWorkflowBlackBorderDetectNodeTaskInfo[]	黑边检测节点任务信息
subtitleNodeTaskInfos	MediaWorkflowSubtitleNodeTaskInfo[]	字幕提取节点任务信息
analysisNodeTaskInfos	MediaWorkflowAnalysisNodeTaskInfo[]	分析节点任务信息
regulationNodeTaskInfos	MediaWorkflowRegulationNodeTaskInfo[]	审核节点任务信息
understandingNodeTaskInfos	MediaUnderstandingNodeTaskInfos[]	视频理解节点任务信息
translationNodeTaskInfos	MediaTranslationNodeTaskInfos[]	视频翻译节点任务信息
composeNodeTaskInfos	MediaComposeNodeTaskInfos[]	视频合成节点任务信息
publishNodeTaskInfo	MediaWorkflowPublishNodeTaskInfo	发布节点任务信息

MediaWorkflowTaskInput

媒资进行工作流处理任务的输入参数

名称	类型	说明
workflowId	string	工作流 id

MediaWorkflowThumbnailNodeTaskInfo

工作流截图节点信息

名称	类型	说明
nodeId	string	节点 ID
nodeName	string	节点名称
thumbnailTaskInfos	MediaThumbnailTaskInfo	截图任务信息

MediaWorkflowTranscodeNodeTaskInfo

工作流转码节点信息

名称	类型	说明
nodeId	string	节点 ID
nodeName	string	节点名称
transcodeTaskInfo	MediaTranscodeTaskInfo	转码任务信息

TextToImageLTaskInput

文生图 L 任务输入参数。

参数	类型	描述
model	string	生成模式，默认 max，支持： max pro
prompt	string	生成的提示文本，不超过2000字符, 必填
aspectRatio	String	图片宽高比，默认 1:1，支持： 1:1 2:3 3:2 3:4 4:3 9:16 16:9 9:21 21:9
guidanceScale	string	提示词引导系数，默认 3.5，支持：1.0～20.0
imgCount	integer	单次生图张数，默认 1，支持：1～4

TextToImageRequest

文生图任务输入参数

参数	类型	是否必需	描述
model	string	是	模型名称, 支持： L
modelLTaskInput	TextToImageLTaskInput	否	L 模型的特定输入参数

TextToVideoK10TaskInput

文生视频 K10 任务输入参数

参数	类型	描述
prompt	string	提示词
negativePrompt	string	负面提示词
cfgScale	float	自由度，非必填，默认 0.5，取值范围：[0, 1]，值越大，模型自由度越小，与用户输入的提示词相关性越强
duration	int	视频时长，单位 s，支持： 5 10
motionMode	string	生成模式，非必填，默认 std，支持： std pro
aspectRatio	string	比例，非必填，默认 16:9，支持 9:16 16:9 1:1
cameraControl	VideoGenerateCameraControl	控制摄像机运动的协议，非必填

TextToVideoK16TaskInput

文生视频 K16 任务输入参数

参数	类型	描述
prompt	string	提示词
negativePrompt	string	负面提示词
cfgScale	float	自由度，非必填，默认 0.5，取值范围：[0, 1]，值越大，模型自由度越小，与用户输入的提示词相关性越强
duration	int	视频时长，单位 s，支持： 5 10
motionMode	string	生成模式，非必填，默认 std，支持： std pro
aspectRatio	string	比例，非必填，默认 16:9，支持 9:16 16:9 1:1

TextToVideoK20TaskInput

文生视频 K20 任务输入参数

参数	类型	描述
prompt	string	提示词
negativePrompt	string	负面提示词
cfgScale	float	自由度，非必填，默认 0.5，取值范围：[0, 1]，值越大，模型自由度越小，与用户输入的提示词相关性越强
duration	int	视频时长，单位 s，支持： 5 10
motionMode	string	生成模式，非必填，默认 std，支持： std pro
aspectRatio	string	比例，非必填，默认 16:9，支持 9:16 16:9 1:1

TextToVideoK21MTaskInput

文生视频 K21M 任务输入参数

参数	类型	描述
prompt	string	提示词
negativePrompt	string	负面提示词
cfgScale	float	自由度，非必填，默认 0.5，取值范围：[0, 1]，值越大，模型自由度越小，与用户输入的提示词相关性越强
duration	int	视频时长，单位 s，支持： 5 10
aspectRatio	string	比例，非必填，默认 16:9，支持 9:16 16:9 1:1

TextToVideoK25TTaskInput

文生视频 K25T 任务输入参数

参数	类型	描述
prompt	string	提示词
negativePrompt	string	负面提示词
cfgScale	float	自由度，非必填，默认 0.5，取值范围：[0, 1]，值越大，模型自由度越小，与用户输入的提示词相关性越强
duration	int	视频时长，单位 s，支持： 5 10
aspectRatio	string	比例，非必填，默认 16:9，支持 9:16 16:9 1:1
mode	string	模式，非必填，默认 pro，支持： pro

TextToVideoK26TaskInput

文生视频 K26 任务输入参数

参数	类型	描述
prompt	string	提示词
negativePrompt	string	负面提示词
sound	string	声音，非必填，默认 off，支持： off on 仅K26及后续版本模型支持当前参数
cfgScale	float	自由度，非必填，默认 0.5，取值范围：[0, 1]，值越大，模型自由度越小，与用户输入的提示词相关性越强
duration	int	视频时长，单位 s，支持： 5 10
aspectRatio	string	比例，非必填，默认 16:9，支持 9:16 16:9 1:1
mode	string	模式，非必填，默认 pro，支持： pro

TextToVideoP35TaskInput

文生视频 P35 任务输入参数

参数	类型	描述
prompt	string	提示词
negativePrompt	string	负面提示词
duration	int	视频时长，单位 s，支持： 5 8
resolution	string	视频质量，支持： 360p 540p 720p 1080p
aspectRatio	string	比例，支持： 16:9 9:16 1:1 4:3 3:4
motionMode	string	生成模式，非必填，默认 normal，支持： normal fast (normal, fast, --fast only available when duration=5; --resolution=1080p does not support fast)
style	string	风格，非必填，支持： anime 3d_animation clay comic cyberpunk
seed	integer	随机种子，非必填
soundEffectSwitch	boolean	是否开启背景音乐，非必填，默认 false
soundEffectContent	string	背景音乐类型，非必填，默认自动匹配，支持字符串传入，如鸟鸣

TextToVideoP40TaskInput

文生视频 P40 任务输入参数

参数	类型	描述
prompt	string	提示词
negativePrompt	string	负面提示词
duration	int	视频时长，单位 s，支持： 5 8
resolution	string	视频质量，支持： 360p 540p 720p 1080p
aspectRatio	string	比例，支持： 16:9 9:16 1:1 4:3 3:4
motionMode	string	生成模式，非必填，默认 normal，支持： normal fast (normal, fast, --fast only available when duration=5; --resolution=1080p does not support fast)
style	string	风格，非必填，支持： anime 3d_animation clay comic cyberpunk
seed	integer	随机种子，非必填
soundEffectSwitch	boolean	是否开启背景音乐，非必填，默认 false
soundEffectContent	string	背景音乐类型，非必填，默认自动匹配，支持字符串传入，如鸟鸣
cameraMovement	string	运镜参数，非必填，支持 horizontal_left: 向左水平移动 horizontal_right: 向右水平移动 vertical_up: 垂直向上移动 vertical_down: 垂直向下移动 zoom_in: 镜头拉近，画面放大 zoom_out: 镜头拉远，画面缩小 crane_up: 从低处上升 quickly_zoom_in: 快速拉近 quickly_zoom_out: 快速拉远 smooth_zoom_in: 平滑地拉近 camera_rotation: 围绕轴旋转 robo_arm: 使用机械臂进行复杂移动 super_dolly_out: 快速向后移动 whip_pan: 快速水平摇动，产生模糊 hitchcock: 同时变焦和推拉，改变背景关系 left_follow: 跟随主体向左 right_follow: 跟随主体向右 pan_left: 固定位置水平向左摇动 pan_right: 固定位置水平向右摇动 fix_bg: 移动时保持背景不变

TextToVideoP45TaskInput

文生视频 P45 任务输入参数

参数	类型	描述
prompt	string	提示词
negativePrompt	string	负面提示词
duration	int	视频时长，单位 s，支持： 5 8
resolution	string	视频质量，支持： 360p 540p 720p 1080p
aspectRatio	string	比例，支持： 16:9 9:16 1:1 4:3 3:4
motionMode	string	生成模式，非必填，默认 normal，支持： normal fast (normal, fast, --fast only available when duration=5; --resolution=1080p does not support fast)
style	string	风格，非必填，支持： anime 3d_animation clay comic cyberpunk
seed	integer	随机种子，非必填
soundEffectSwitch	boolean	是否开启背景音乐，非必填，默认 false
soundEffectContent	string	背景音乐类型，非必填，默认自动匹配，支持字符串传入，如鸟鸣
cameraMovement	string	运镜参数，非必填，支持 horizontal_left: 向左水平移动 horizontal_right: 向右水平移动 vertical_up: 垂直向上移动 vertical_down: 垂直向下移动 zoom_in: 镜头拉近，画面放大 zoom_out: 镜头拉远，画面缩小 crane_up: 从低处上升 quickly_zoom_in: 快速拉近 quickly_zoom_out: 快速拉远 smooth_zoom_in: 平滑地拉近 camera_rotation: 围绕轴旋转 robo_arm: 使用机械臂进行复杂移动 super_dolly_out: 快速向后移动 whip_pan: 快速水平摇动，产生模糊 hitchcock: 同时变焦和推拉，改变背景关系 left_follow: 跟随主体向左 right_follow: 跟随主体向右 pan_left: 固定位置水平向左摇动 pan_right: 固定位置水平向右摇动 fix_bg: 移动时保持背景不变

TextToVideoP50TaskInput

文生视频 P50 任务输入参数

参数	类型	描述
prompt	string	提示词
negativePrompt	string	负面提示词
duration	int	视频时长，单位 s，支持： 5 8
resolution	string	视频质量，支持： 360p 540p 720p 1080p
aspectRatio	string	比例，支持： 16:9 9:16 1:1 4:3 3:4
motionMode	string	生成模式，非必填，默认 normal，支持： normal
style	string	风格，非必填，支持： anime 3d_animation clay comic cyberpunk
seed	integer	随机种子，非必填
soundEffectSwitch	boolean	是否开启背景音乐，非必填，默认 false
soundEffectContent	string	背景音乐类型，非必填，默认自动匹配，支持字符串传入，如鸟鸣

TextToVideoP55TaskInput

文生视频 P55 任务输入参数

参数	类型	描述
prompt	string	提示词
negativePrompt	string	负面提示词
duration	int	视频时长，单位 s，支持： 5 8 10
resolution	string	视频质量，支持： 360p 540p 720p 1080p
aspectRatio	string	比例，支持： 16:9 9:16 1:1 4:3 3:4
motionMode	string	生成模式，非必填，默认 normal，支持： normal
style	string	风格，非必填，支持： anime 3d_animation clay comic cyberpunk
seed	integer	随机种子，非必填
generateAudioSwitch	boolean	控制开关Audio，非必填. true: Audio on , false: Audio off
generateMultiClipSwitch	boolean	控制单镜头, 多镜头，非必填. true: 多镜头 , false: 单镜头
thinkingType	string	是否使用系统优化提示词功能，非必填. "enabled" : 打开 "disabled" : 关闭. "auto" or 忽略: 让模型自动决定

TextToVideoRequest

文生视频任务输入参数

参数	类型	是否必需	描述
model	string	是	模型名称, 支持： VQ1 VQ2 VQ3P VQ3T P35 P40 P45 P50 P55 K16 K20 K21M K25T K26 H20 H23 VE3.1 VE3.1F VE3.1L
modelVQ1TaskInput	TextToVideoVQ1TaskInput	否	VQ1 模型的特定输入参数
modelVQ2TaskInput	TextToVideoVQ2TaskInput	否	VQ2 模型的特定输入参数
modelVQ3PTaskInput	TextToVideoVQ3PTaskInput	否	VQ3P 模型的特定输入参数
modelVQ3TTaskInput	TextToVideoVQ3TTaskInput	否	VQ3T 模型的特定输入参数
modelP35TaskInput	TextToVideoP35TaskInput	否	P35 模型的特定输入参数
modelP40TaskInput	TextToVideoP40TaskInput	否	P40 模型的特定输入参数
modelP45TaskInput	TextToVideoP45TaskInput	否	P45 模型的特定输入参数
modelP50TaskInput	TextToVideoP50TaskInput	否	P50 模型的特定输入参数
modelP55TaskInput	TextToVideoP55TaskInput	否	P55 模型的特定输入参数
modelK16TaskInput	TextToVideoK16TaskInput	否	K16 模型的特定输入参数
modelK20TaskInput	TextToVideoK20TaskInput	否	K20 模型的特定输入参数
modelK21MTaskInput	TextToVideoK21MTaskInput	否	K21M 模型的特定输入参数
modelK25TTaskInput	TextToVideoK25TTaskInput	否	K25T 模型的特定输入参数
modelK26TaskInput	TextToVideoK26TaskInput	否	K26 模型的特定输入参数
modelH20TaskInput	TextToVideoH20TaskInput	否	H20 模型的特定输入参数
modelH23TaskInput	TextToVideoH23TaskInput	否	H23 模型的特定输入参数
modelVE31TaskInput	TextToVideoVE31TaskInput	否	VE3.1 模型的特定输入参数
modelVE31FTaskInput	TextToVideoVE31FTaskInput	否	VE3.1F 模型的特定输入参数
modelVE31LTaskInput	TextToVideoVE31LTaskInput	否	VE3.1L 模型的特定输入参数

TextToVideoVQ1TaskInput

文生视频 VQ1 任务输入参数

参数	类型	描述
prompt	string	生成的提示文本
duration	integer	视频时长，单位 s，支持： 5
resolution	string	分辨率，支持： 1080p
style	string	风格，非必填，默认 general，支持： general anime
movementAmplitude	string	运动幅度，非必填，默认 auto, 支持： auto small medium large
seed	integer	随机种子，非必填
aspectRatio	string	比例，非必填，默认 16:9 , 支持： 16:9 9:16 1:1
bgm	boolean	是否开启背景音乐，非必填，默认 false
offPeak	boolean	是否使用错峰模式，非必填。错峰模式下任务优先级较低，生成时间可能较长（最长18小时），但价格更优惠

TextToVideoVQ2TaskInput

文生视频 VQ2 任务输入参数

参数	类型	描述
prompt	string	生成的提示文本
duration	integer	视频时长，单位 s，支持： [1,8]
resolution	string	分辨率，支持： 360p 540p 720p 1080p
seed	integer	随机种子，非必填
aspectRatio	string	比例，非必填，默认 16:9 , 支持： 16:9 9:16 3:4 4:3 1:1
bgm	boolean	是否开启背景音乐，非必填，默认 false
offPeak	boolean	是否使用错峰模式，非必填。错峰模式下任务优先级较低，生成时间可能较长（最长18小时），但价格更优惠

TextToVideoVQ3PTaskInput

文生视频 VQ3P 任务输入参数

参数	类型	描述
prompt	string	生成的提示文本
duration	integer	视频时长，单位 s，非必填，默认 5 ,支持：[1-16]
seed	integer	随机种子，非必填
resolution	string	分辨率，非必填，默认 720p ,支持： 540p 720p 1080p
aspectRatio	string	比例，非必填，默认 16:9 , 支持： 16:9 9:16 3:4 4:3 1:1
audio	boolean	是否使用音视频直出能力，非必填，默认 true
bgm	boolean	是否开启背景音乐，非必填，默认 false
offPeak	boolean	是否使用错峰模式，非必填，默认 false。(仅audio为true可开启错峰模式)错峰模式下任务优先级较低，生成时间可能较长（最长18小时），但价格更优惠

TextToVideoVQ3TTaskInput

文生视频 VQ3T 任务输入参数

参数	类型	描述
prompt	string	生成的提示文本
duration	integer	视频时长，单位 s，非必填，默认 5 ,支持：[1-16]
seed	integer	随机种子，非必填
resolution	string	分辨率，非必填，默认 720p ,支持： 540p 720p 1080p
aspectRatio	string	比例，非必填，默认 16:9 , 支持： 16:9 9:16 3:4 4:3 1:1
audio	boolean	是否使用音视频直出能力，非必填，默认 true
bgm	boolean	是否开启背景音乐，非必填，默认 false
offPeak	boolean	是否使用错峰模式，非必填，默认 false。(仅audio为true可开启错峰模式)错峰模式下任务优先级较低，生成时间可能较长（最长18小时），但价格更优惠

TextToVideoH20TaskInput

文生视频 H20 任务输入参数

参数	类型	描述
prompt	string	生成的提示文本，必输
promptOptimizer	boolean	是否自动优化 prompt，默认为 true。
fastPretreatment	boolean	是否缩短 prompt_optimizer 的优化耗时，默认为 false。
duration	integer	视频时长，单位 s，其可用值与分辨率相关。支持： 6（默认） 10
resolution	string	分辨率，支持： 768p（默认） 1080p（仅支持6s）
aigcWatermark	boolean	是否在生成的视频中添加水印，默认为 false

TextToVideoH23TaskInput

文生视频 H23 任务输入参数

参数	类型	描述
prompt	string	生成的提示文本，必输
promptOptimizer	boolean	是否自动优化 prompt，默认为 true。
fastPretreatment	boolean	是否缩短 prompt_optimizer 的优化耗时，默认为 false。
duration	integer	视频时长，单位 s，其可用值与分辨率相关。支持： 6（默认） 10
resolution	string	分辨率，支持： 768p（默认） 1080p（仅支持6s）
aigcWatermark	boolean	是否在生成的视频中添加水印，默认为 false

TextToVideoVE31TaskInput

文生视频 VE3.1 任务输入参数

参数	类型	是否必填	描述
prompt	string	是	提示词，最大 2000 字符
n	int	否	生成数量，默认 1，支持： 1 2 3 4
aspectRatio	string	否	宽高比，默认 16:9，支持： 16:9 9:16
durationSeconds	int	否	视频时长，单位 s，默认 8，支持： 4 6 8
resolution	string	否	分辨率，默认 720p，支持： 720p 1080p 4K
negativePrompt	string	否	负面提示词，用于描述不希望在画面中出现的内容，最大 1000 字符
generateAudio	boolean	否	是否生成音频，默认 false
personGeneration	string	否	人物生成策略，默认 allow_adult，支持： allow_adult disallow
seed	long	否	随机种子，取值范围：0-4294967295

TextToVideoVE31FTaskInput

文生视频 VE3.1F 任务输入参数

参数	类型	是否必填	描述
prompt	string	是	提示词，最大 2000 字符
n	int	否	生成数量，默认 1，支持： 1 2 3 4
aspectRatio	string	否	宽高比，默认 16:9，支持： 16:9 9:16
durationSeconds	int	否	视频时长，单位 s，默认 8，支持： 4 6 8
resolution	string	否	分辨率，默认 720p，支持： 720p 1080p 4K
negativePrompt	string	否	负面提示词，用于描述不希望在画面中出现的内容，最大 1000 字符
generateAudio	boolean	否	是否生成音频，默认 false
personGeneration	string	否	人物生成策略，默认 allow_adult，支持： allow_adult disallow
seed	long	否	随机种子，取值范围：0-4294967295

ImageToVideoVE31TaskInput

图生视频 VE3.1 任务输入参数，支持单图生视频、首尾帧生视频、参考生视频

参数	类型	是否必填	描述
prompt	string	是	提示词，最大 2000 字符
image	ImageItem	条件必填	首帧图片，与 lastFrame 配合使用可实现首尾帧生视频
lastFrame	ImageItem	否	尾帧图片，需同时提供首帧图片
referenceImages	ImageItem	否	参考生图片，参考生视频时提供
n	int	否	生成数量，默认 1，支持： 1 2 3 4
aspectRatio	string	否	宽高比，默认 16:9，支持： 16:9 9:16
durationSeconds	int	否	视频时长，单位 s，默认 8，支持： 4 6 8
resolution	string	否	分辨率，默认 720p，支持： 720p 1080p 4k
negativePrompt	string	否	负面提示词，用于描述不希望在画面中出现的内容，最大 1000 字符
generateAudio	boolean	否	是否生成音频，默认 false
personGeneration	string	否	人物生成策略，默认 allow_adult，支持： allow_adult disallow
seed	long	否	随机种子，取值范围：0-4294967295

ImageToVideoVE31FTaskInput

图生视频 VE3.1F 任务输入参数，支持单图生视频、首尾帧生视频、参考生视频

参数	类型	是否必填	描述
prompt	string	是	提示词，最大 2000 字符
image	ImageItem	条件必填	首帧图片，与 lastFrame 配合使用可实现首尾帧生视频
lastFrame	ImageItem	否	尾帧图片，需同时提供首帧图片
referenceImages	ImageItem	否	参考生图片，参考生视频时提供
n	int	否	生成数量，默认 1，支持： 1 2 3 4
aspectRatio	string	否	宽高比，默认 16:9，支持： 16:9 9:16
durationSeconds	int	否	视频时长，单位 s，默认 8，支持： 4 6 8
resolution	string	否	分辨率，默认 720p，支持： 720p 1080p 4k
negativePrompt	string	否	负面提示词，用于描述不希望在画面中出现的内容，最大 1000 字符
generateAudio	boolean	否	是否生成音频，默认 false
personGeneration	string	否	人物生成策略，默认 allow_adult，支持： allow_adult disallow
seed	long	否	随机种子，取值范围：0-4294967295

ImageToVideoVE31LTaskInput

图生视频 VE3.1L 任务输入参数，支持单图生视频、首尾帧生视频

参数	类型	是否必填	描述
prompt	string	是	提示词，最大 2000 字符
image	ImageItem	条件必填	首帧图片，与 lastFrame 配合使用可实现首尾帧生视频
lastFrame	ImageItem	否	尾帧图片，需同时提供首帧图片
n	int	否	生成数量，默认 1，支持： 1 2 3 4
aspectRatio	string	否	宽高比，默认 16:9，支持： 16:9 9:16
durationSeconds	int	否	视频时长，单位 s，默认 8，支持： 4 6 8
resolution	string	否	分辨率，默认 720p，支持： 720p 1080p 4k
negativePrompt	string	否	负面提示词，用于描述不希望在画面中出现的内容，最大 1000 字符
generateAudio	boolean	否	是否生成音频，默认 false
personGeneration	string	否	人物生成策略，默认 allow_adult，支持： allow_adult disallow
seed	long	否	随机种子，取值范围：0-4294967295

VideoExtendRequest

视频延长任务输入参数

参数	类型	是否必需	描述
model	string	是	模型名称, 支持： P35 P40 P45 P50 P55 K VQ2T VQ2P VE3.1 VE3.1F
modelP35TaskInput	ExtendVideoP35TaskInput	否	P35 模型的特定输入参数
modelP40TaskInput	ExtendVideoP40TaskInput	否	P40 模型的特定输入参数
modelP45TaskInput	ExtendVideoP45TaskInput	否	P45 模型的特定输入参数
modelP50TaskInput	ExtendVideoP50TaskInput	否	P50 模型的特定输入参数
modelP55TaskInput	ExtendVideoP55TaskInput	否	P55 模型的特定输入参数
modelKTaskInput	ExtendVideoKTaskInput	否	K 模型的特定输入参数
modelVQ2TTaskInput	ExtendVideoVQ2TTaskInput	否	VQ2T 模型的特定输入参数
modelVQ2PTaskInput	ExtendVideoVQ2PTaskInput	否	VQ2P 模型的特定输入参数
modelVE31TaskInput	ExtendVideoVE31TaskInput	否	VE3.1 模型的特定输入参数
modelVE31FTaskInput	ExtendVideoVE31FTaskInput	否	VE3.1F 模型的特定输入参数
modelVE31LTaskInput	ExtendVideoVE31LTaskInput	否	VE3.1L 模型的特定输入参数

VideoToVideoKO1TaskInput

视频生视频 KO1 任务输入参数

参数	类型	描述
prompt	string	提示词，必输。可包含正向描述和负向描述。不能超过2500个字符。可通过<<<>>>的格式来指定某个主体或图片，如：<<<element_1>>>、<<<image_1>>>
videoList	KO1VideoItem[]	视频列表，当前仅支持上传1段视频。可作为待编辑视频（默认），也可作为特征参考视频。
headtailImages	VideoToVideoHeadtailImages	首尾帧图片信息，当前仅支持首帧图。其中：首帧生视频时，不能使用视频编辑（“type”:“base”）功能。图片格式支持.jpg / .jpeg / .png 图片文件大小不能超过10MB，图片宽高尺寸不小于300px，图片宽高比要在1:2.5 ~ 2.5:1之间
refImages	VideoToVideoImageItem[]	参考图片信息列表，包括场景、风格等参考图片，最大支持4张图片
elements	KCharacterToVideoImageItem[]	主体列表，其中：首帧图、参考图和主体数量之和不得超过4
mode	string	模式，非必填，默认 pro，枚举值：pro, std 其中std：标准模式（标准），基础模式，性价比高其中pro：专家模式（高品质），高表现模式，生成视频质量更佳
aspectRatio	string	生成视频的画面纵横比（宽:高）枚举值：16:9, 9:16, 1:1 未使用首帧生成或视频编辑功能（“type”:“base”）时，当前参数必填
duration	string	视频时长，单位 s，默认5。枚举值：3，4，5，6，7，8，9，10 使用视频编辑功能（“type”:“base”）时，输出结果与传入视频时长相同，此时当前参数无效；此时，按输入视频时长四舍五入取整计量计费。传首帧图发起视频生视频任务时，仅支持5和10s

KO1VideoItem

KO1 模型参考视频信息

参数	类型	描述
videoUrl	string	视频链接，必输。
type	string（枚举）	视频类型。取值：base（待编辑-默认值）, feature （参考）取值为base时，不能定义视频首尾帧
keepSound	string（枚举）	是否保留视频原声，取值：yes（保留），no（不保留）。当前参数对feature 类型视频也生效

VideoToVideoHeadtailImages

视频生视频的首尾帧图片信息，目前 KO1 模型仅支持首帧

参数	类型	描述
headImage	VideoToVideoImageItem	首帧图片信息
tailImage	VideoToVideoImageItem	尾帧图片信息

VideoToVideoImageItem

视频生视频的图片信息

参数	类型	描述
imageUrl	string	图片链接

KCharacterToVideoImageItem

视频生视频的主体信息

参数	类型	描述
elementId	string	主体id，需调用查询预设主体接口后获得

VideoGenerateCameraControl

控制摄像机运动的协议（如未指定，模型将根据输入的文本/图片进行智能匹配）

参数	类型	描述
type	string	预定义的运镜类型枚举值："simple", "down_back", "forward_up", "right_turn_forward", "left_turn_forward" simple：简单运镜，此类型下可在"config"中六选一进行运镜 down_back：镜头下压并后退右下移拉远，此类型下 config 参数无需填写 forward_up：镜头前进并上仰右推进上移，此类型下 config 参数无需填写 right_turn_forward：先右旋转后前进右右旋推进，此类型下 config 参数无需填写 left_turn_forward：先左旋并前进右左旋推进，此类型下 config 参数无需填写
config	VideoGenerateCameraControlConfig	图片信息，图生必填

VideoGenerateCameraControlConfig

包含六个字段，用于指定摄像机在不同方向上的运动或变化

当运镜类型指定 simple 时必填，指定其他类型时不填
以下参数 6 选 1，即指定一个即可

参数	类型	描述
horizontal	float	水平运镜，控制摄像机在水平方向上的移动量（沿 x 轴平移）取值范围：[-10, 10]，负值表示向左平移，正值表示向右平移
vertical	float	垂直运镜，控制摄像机在垂直方向上的移动量（沿 y 轴平移）取值范围：[-10, 10]，负值表示向下平移，正值表示向上平移
pan	float	水平摇镜，控制摄像机在水平面上的旋转量（绕 y 轴旋转）取值范围：[-10, 10]，负值表示绕 y 轴向左旋转，正值表示绕 y 轴向右旋转
tilt	float	垂直摇镜，控制摄像机在垂直面上的旋转量（沿 x 轴旋转）取值范围：[-10, 10]，负值表示绕 x 轴向下旋转，正值表示绕 x 轴向上旋转
roll	float	旋转运镜，控制摄像机的滚动量（绕 z 轴旋转）取值范围：[-10, 10]，负值表示绕 z 轴逆时针旋转，正值表示绕 z 轴顺时针旋转
zoom	float	变焦，控制摄像机的焦距变化，影响视野的远近取值范围：[-10, 10]，负值表示焦距变长、视野范围变小，正值表示焦距变短、视野范围变大

VideoGenerateCompleteEvent

视频生成完成回调事件内容

名称	类型	说明
taskId	string	任务 ID
status	string	运行状态，包括 READY RUNNING SUCCESS FAILED
createTime	string	任务创建时间
finishTime	string	任务完成时间
videoGenerateCompleteEvent	VideoGenerateTaskInfo	视频生成任务输入参数

VideoGenerateTaskInfo

视频生成任务信息

名称	类型	说明
errMsg	string	错误信息
unitPrice	float	任务消耗积分
videoGenerateTaskInput	VideoGenerateTaskInput	视频生成任务输入参数
videoGenerateTaskOutput	VideoGenerateTaskOutput	视频生成任务输出参数

VideoGenerateTaskInput

视频生成任务输入参数

名称	类型	说明
type	string	任务请求类型，包括：参考生视频文生视频图生视频视频延长拥抱亲吻圣诞特效变形特效实况照片情绪特效复活老照片 AI 换发双人互动春节特效童年回忆古风换装全家福比心财神特效梦幻婚礼浪漫公主抱甜蜜求婚情侣降临丘比特之箭萌宠恋人变身美队绿巨人美队同行浩克俯冲我们是毒液温暖耶稣拥抱爱人肌肉激增虎之触亲亲长腿奔跑活灵活现的艺术挤压它绿巨人黑神话悟空美少女战士羊毛卷长发魔法疯狂猫女神奇女侠小丑重生蝙蝠侠多彩毒液钢铁侠春节服装财神火辣哈莉奎因谁是毒液获得毒液伙伴邪恶镜头乐高爆炸怪物入侵巫师帽子僵尸模式僵尸手
imageToVideoRequest	ImageToVideoRequest	图生视频任务输入参数
textToVideoRequest	TextToVideoRequest	文生视频任务输入参数
effectVideoRequest	EffectVideoRequest	特效视频任务输入参数
lipSyncRequest	LipSyncRequest	对口型任务输入参数
videoExtendRequest	VideoExtendRequest	视频延长任务输入参数
imageToImageRequest	ImageToImageRequest	图生图任务输入参数
textToImageRequest	TextToImageRequest	文生图任务输入参数

VideoGenerateTaskOutput

视频生成任务输出参数

参数	类型	描述
mediaBasicInfos	MediaBasicInfo[]	生成媒资基本信息列表

AIGCImageMessage

AIGC 图片生成消息

参数	类型	是否必需	描述
role	string	是	消息角色，固定值：user
content	Array<AIGCImageContent>	是	内容列表

AIGCImageContent

AIGC 图片生成内容

参数	类型	是否必需	描述
type	string	是	内容类型：text 或 image_url
text	string	条件必需	文本内容（type=text 时必填）
image_item	AIGCImageItem	条件必需	图片信息（type=image_url 时必填）

AIGCImageItem

AIGC 图片信息

参数	类型	是否必需	描述
image_url	string	是	图片 URL

AIGCImageTool

AIGC 图片生成工具定义（仅 NBP 模型支持）

参数	类型	是否必需	描述
type	string	是	工具类型，固定值：function
function	AIGCImageToolFunction	是	函数定义

AIGCImageToolFunction

AIGC 图片生成工具函数定义

参数	类型	是否必需	描述
name	string	是	函数名，如 GWebSearch（网页搜索）

VideoCloneVRequest

视频克隆（视频复刻）任务输入参数具体参数限制请参考视频克隆（视频复刻）模型介绍

参数	类型	是否必需	描述
videoItem	AIGCVideoItem	是	需要复刻的原视频
images	ImageItem[]	否	用户需要复刻的商品图、模特图（可选），1-7张
prompt	string	否	用户提示词，字符长度不能超过 2000 个字符
aspectRatio	string	否	宽高比，默认16:9 , 支持： 16:9 9:16 4:3 3:4 1:1
resolution	string	否	分辨率，默认 1080p，支持： 540p 720p 1080p
removeAudio	boolean	否	是否去除原视频声音，默认不去除，支持： true：去除原视频声音 false：保留原视频声音
callbackUrl	string	否	回调地址

VideoCloneK26Request

视频克隆（动作控制）任务输入参数具体参数限制请参考视频克隆（视频复刻）模型介绍

参数	类型	是否必需	描述
prompt	string	是	用户提示词，字符长度不能超过 2500 个字符
image	ImageItem	是	图片
video	AIGCVideoItem	是	视频
mode	string	否	模式，默认std , 支持： std pro
keepOriginalSound	string	否	是否保留视频原声，默认 yes，支持： yes no
characterOrientation	string	是	生成视频中人物的朝向，可选择与图片一致或与视频一致，支持： image video
callbackUrl	string	否	回调地址

OneClickVGeneralRequest

一键生成通用成片-创建任务输入参数

参数	类型	是否必需	描述
images	ImageItem[]	是	图片
prompt	string	否	用户提示词，字符长度不能超过 3000 个字符
aspectRatio	string	否	宽高比，默认16:9 , 支持： 16:9 9:16 4:3 3:4 1:1
duration	integer	是	视频时长，单位 s，支持： [10,180]
callbackUrl	string	否	回调地址
payload	string	否	透传参数

OneClickVGeneralEditRequest

一键生成通用成片-编辑任务输入参数

参数	类型	是否必需	描述
taskId	string	是	创建或上次编辑的任务id
jobId	string	是	要编辑的分镜id
prompt	string	否	用户提示词，字符长度不能超过 3000 个字符，不同类型效果不同
callbackUrl	string	否	回调地址

OneClickVGeneralComposeRequest

一键生成通用成片-合成任务输入参数

参数	类型	是否必需	描述
taskId	string	是	最后一次编辑的任务id
jobIds	string[]	是	要编辑的分镜id列表
callbackUrl	string	否	回调地址

评价此篇文章

有帮助没帮助

AI智能处理

API在线调试

智能点播平台 VOD

数据结构

已下线模型

AIGCAudioConfig

AIGCVideoItem

CallbackConfig

CallbackEvent

ComposeOutput

ComposeTaskInfo

ComposeTaskOutput

ComposeTaskStatusChangeEvent

ComposeTimeline

ComposeTimelineAudioItem

ComposeTimelineAudioOperation

ComposeTimelineAudioTrack

ComposeTimelineImageOperation

ComposeTimelineSubtitleItem

ComposeTimelineSubtitleTrack

ComposeTimelineVideoItem

ComposeTimelineVideoTrack

EffectBeastCompanionInput

EffectCoveredLiquidMetalInput

EffectExoticPrincessInput

EffectHairSwapInput

EffectLaduduMeInput

EffectRelaxCutInput

EffectVideoLTaskInput

EffectVideoPTaskInput

EffectVideoRequest

EffectVideoVTaskInput

ExtendVideoKTaskInput

ExtendVideoPTaskInput

ExtendVideoVQ2TTaskInput

ExtendVideoVQ2PTaskInput

ExtendVideoVE31TaskInput

ExtendVideoVE31FTaskInput

ExtendVideoVE31LTaskInput

ImageToImageLTaskInput

ImageToImageVTaskInput

ImageToImageRequest

ImageToVideoDynamicMask

ImageToVideoHeadtailImages

ImageToVideoImageItem

ImageFrameSettings

PCharacterToVideoImageItem

KCharacterToVideoImageItem

ImageToVideoK10TaskInput

ImageToVideoK15TaskInput

ImageToVideoK16TaskInput

ImageToVideoK20TaskInput

ImageToVideoK21MTaskInput

ImageToVideoK21TaskInput

ImageToVideoK25TTaskInput

ImageToVideoK26TaskInput

ImageToVideoKO1TaskInput

ImageToVideoP35TaskInput

ImageToVideoP40TaskInput

ImageToVideoP45TaskInput

ImageToVideoP50TaskInput

ImageToVideoP55TaskInput

ImageToVideoH20TaskInput

ImageToVideoH23TaskInput

ImageToVideoH23FTaskInput

ImageToVideoRequest

ImageToVideoTrajectory

ImageToVideoV20TaskInput

ImageToVideoVQ1CTaskInput

ImageToVideoVQ1TaskInput

ImageToVideoVQ2TTaskInput

通用参数

单图生视频模式参数

首尾帧生视频模式参数

智能多帧生视频模式参数

ImageToVideoVQ2PTaskInput

通用参数

单图生视频模式参数

首尾帧生视频模式参数

参考生视频非主体调用模式参数

参考生视频主体调用模式参数

智能多帧生视频模式参数