123数字人视频合成接口
更新时间:2025-06-27
接口说明
只需对着镜头说十秒123,即可快速输出口播成片
支持输入文本或音频驱动数字人生成视频,该功能仅支持固定背景视频
1、调用视频合成任务接口,提交数字人底板视频和驱动文本、音频,返回任务ID
2、接收任务结束的回调通知,或使用任务ID轮询任务状态(不建议)
接口调用域名:https://open.xiling.baidu.com
接口鉴权和通用字段说明请查阅:接口通用说明
接口列表
提交视频合成任务
接口说明
提交视频合成任务,返回任务ID和底板ID
接口协议
POST /api/digitalhuman/open/v1/video/submit/fast
Header Content-Type: application/json;charset=utf-8
请求参数
参数 | 类型 | 必填 | 说明 |
---|---|---|---|
templateVideoId | string | 是 | 底板视频素材文件 ID 素材文件ID支持两种方式: 1. 使用文件上传接口上传视频文件获取文件ID,其中 providerType 参数填写:OPEN_VIDEO_123_DURATION_VIDEO 2. 支持上传公网URL 视频要求: 1. 数量:1个 2. 大小:3GB以内 3. 时长:10秒 - 4分钟 4. 格式:mp4、mov 5. 分辨率:最大支持4K 7. 帧率:建议大于24fps(低帧率会转成25fps) 8. 色彩标准:SDR-Rec.709(非HDR) |
driveType | string | 否 | 驱动数字人的数据类型,枚举值,默认 TEXT。 1、TEXT:文本驱动,系统会调用 TTS 合成音频后驱动数字人 2、VOICE:音频驱动,使用输入音频驱动数字人 |
text | string | 否 | 驱动数字人播报的文本,当 driveType 为 TEXT 时必填 1、字符长度不超过 20000 2、支持 SSML 标签,使用说明见 SSML使用说明 |
ttsParams | object | 否 | TTS 参数,当 driveType 为 TEXT 时必填 |
-- person | string | 否 | 发音人ID,可用发音人列表参考:公共音色库 |
-- lan | string | 否 | 注:仅有LITE版克隆音色及公共音色库中的支持多语言的音色支持该参数。 • 支持参数列表:'Chinese', 'Chinese,Yue', 'English', 'Russian', 'Spanish', 'French', 'Portuguese', 'German', 'Turkish', 'Dutch', 'Ukrainian', 'Vietnamese', 'Indonesian', 'Japanese', 'Italian', 'Korean', 'Thai', 'Polish', 'Romanian', 'Greek', 'Czech', 'Finnish', 'Hindi', 'auto' |
-- speed | string | 否 | 语速:5是正常值,0-15的取值范围。越大语速越快,默认值5 (字面量需要是整数) |
-- volume | string | 否 | 音量:5是正常值,0-15的取值范围,越大音量越大,默认值5 (字面量需要是整数) |
-- pitch | string | 否 | 语调:5是正常值,0-15的取值范围,越大声音越尖,默认值5 (字面量需要是整数) |
inputAudioUrl | string | 否 | 驱动数字人播报的音频 url,url 字符长度不超过 1000。当 driveType 为 VOICE 时必填。音频要求: 1.时长不超过 90 分钟 2.文件大小不超过2G 3.支持的音频格式为wav、mp3、wma、m4a |
callbackUrl | string | 否 | 接口调用方接受任务回调通知的url,规则和接口说明参考接口通用说明,回调消息定义如下表。 |
回调参数
- type: VIDEO_FAST_GENERATE
- data:
参数名 | 类型 | 是否必填 | 描述 |
---|---|---|---|
taskId | string | 是 | 任务ID |
status | string | 是 | 状态 1. WAIT(排队中) 2. GENERATING(开始训练) 3. SUCCESS(成功) 4. FAILED(失败) |
failedCode | int | 否 | 失败错误码 |
failedMessage | string | 否 | 失败错误信息 |
videoUrl | string | 否 | 视频文件地址,文件会保存 7 天 |
duration | int | 否 | 视频时长,单位 ms |
返回参数
参数 | 类型 | 必填 | 说明 |
---|---|---|---|
taskId | string | 是 | 任务ID,用于调用查询接口查询任务状态 |
请求示例
JSON
1{
2 "templateVideoId": "30085e2d-b343-4b09-af25-a28430598230",
3 "text": "有人说家是温馨的港湾。有人说家是心灵的寄托。如果您正在为家装而发愁,不妨考虑与我们合作。",
4 "ttsParams": {
5 "person": "20000000",
6 "speed": "5",
7 "volume": "5",
8 "pitch": "5"
9 },
返回示例
JSON
1{
2 "code": 0,
3 "message": {
4 "global": "success"
5 },
6 "result": {
7 "taskId": "vf3-rais2u9129541i0v"
8 },
9 "requestId": "bd15906f-ba35-4471-a3c2-b2cbf048189d",
10 "success": true
11}
错误码
错误码 | 描述 |
---|---|
10006 | 参数校验不通过 |
10011 | 没有购买视频时长或并发 |
21001 | 视频任务提交异常 |
21002 | 找不到底板ID |
21003 | 数字人查询异常 |
50001 | 额度预扣除失败 |
50002 | 余额不足 |
查询任务
接口说明
使用任务ID查询任务状态
接口协议
GET /api/digitalhuman/open/v1/video/task
GET 请求参数
参数 | 类型 | 必填 | 说明 |
---|---|---|---|
taskId | string | 是 | 视频任务ID |
返回参数
参数 | 类型 | 必填 | 说明 |
---|---|---|---|
taskId | string | 否 | 视频任务ID |
videoUrl | string | 否 | 视频文件地址,文件会保存 7 天 |
duration | int | 否 | 视频时长,单位 ms |
createTime | string | 是 | 创建时间,示例:2024-04-29T20:28:06 |
updateTime | string | 是 | 更新时间,示例:2024-04-29T20:28:06 |
status | string | 是 | 状态 1. SUBMIT(已提交) 2. LINE_UP(排队中) 3. GENERATING(合成中) 4. SUCCESS(合成成功) 5. FAILED(合成失败) |
failedCode | int | 否 | 失败错误码 |
failedMessage | string | 否 | 制作失败原因 |
请求示例
Plain
1GET /api/digitalhuman/open/v1/video/task?taskId=vf3-rajqt8jue9aiqu0p
返回示例
JSON
1{
2 "code": 0,
3 "message": {
4 "global": "success"
5 },
6 "result": {
7 "taskId": "vf3-rajqt8jue9aiqu0p",
8 "status": "SUCCESS",
9 "failedCode": 0,
10 "failedMessage": "",
11 "videoUrl": "https://digital-human-pipeline-output.cdn.bcebos.com/6780b9fde6929f677f3bb7cc_165.webm",
12 "duration": 9167,
13 "createTime": "2025-01-10T14:06:07",
14 "updateTime": "2025-01-10T14:11:24",
15 "startTrainTime": "2025-01-10T14:11:09+08:00"
16 },
17 "requestId": "d2a9e2c6-d751-4566-beb8-bda4bad97b7f",
18 "success": true
19}