长文本语音合成-提交任务
将10万字以内文本一次性合成,异步返回音频。适用文本量大的场景,例如阅读听书、视频配音生成等。
如您需要合成的语音较短,且对时效性有较高要求,请使用短文本语音合成接口。
- 本接口异步返回结果,整体调用分为两个步骤:1、创建语音合成任务,获取task_id 参数 2、根据task_id查询语音合成任务的结果。
- 单次请求的总字数不超过10万个字符,1个中文字、英文字母、数字或符号均算作1个字符。
权限说明
调用本能力需要使用API Key进行鉴权认证。获取及使用API Key的流程请参考:APIKey鉴权说明文档
请求参数
application/json
使用API Key鉴权方式时,将API Key或短期API Key放在此处。注意需要在API Key信息前加上Bearer
。示例: Bearer bce-v3/ALTAK-DaIdq27UJ9Y2UEDIWx1EF/1c511d0576aee39sd59fd73983749109qq8ciq37
待合成的文本,需要为UTF-8编码。总字数不超过10万个字符,1个中文字、英文字母、数字或符号均算作1个字符
显示子属性
隐藏子属性
具体的段落。输入多个段落时,文本间会插入1s长度的空白间隔
待合成的音频格式,包括"mp3-16k","mp3-48k","wav","pcm-8k","pcm-16k",默认为mp3-16k
基础音库:度小宇=1,度小美=0,度逍遥(基础)=3,度丫丫=4。
精品音库:度逍遥(精品)=5003,度小鹿=5118,度博文=106,度小童=110,度小萌=111,度米朵=103,度小娇=5。默认为度小美
臻品音库:度逍遥(臻品)=4003,度博文=4106,度小贤=4115,度小鹿=4119,度灵儿=4105,度小乔=4117,度小雯=4100,度米朵=4103,度姗姗=4144,度小贝=4278,度清风=4143,度小新=4140,度小彦=4129,度星河=4149,度小清=4254,度博文=4206,南方=4226。
大模型发音人:度涵竹=4189,度嫣然=4194,度泽言=4193,度怀安=4195,度清影=4196,度沁遥=4197,度小粤=20100,度晓芸=20101,四川小哥=4257,度阿闽=4132,度小蓉=4139,台媒女声=5977,度小台=4007,度湘玉=4150,度阿锦=4134,度筱林=4172
填入固定值zh
语速,取值0-15,默认为5中语速
是否开启字幕时间戳。取值范围0, 1, 2,默认为0。0表示不开启字幕时间戳,1表示开启句级别字幕时间戳,2表示开启词级别字幕时间戳
段落间隔,取值 0-5000,单位ms,用于合成文本分段传入时设置段落间间隔。
音调,取值0-15,默认为5中语调
音量,基础音库取值0-9,精品音库取值0-15,默认为5中音量(取值为0时为音量最小值,并非为无声)
POST https://aip.baidubce.com/rpc/2.0/tts/v1/create
Authorization: API Key String
Content-Type: application/json
{
"text": [
"段落1",
"段落2",
"段落3"
],
"format": "mp3-16k",
"voice": 3,
"lang": "zh",
"speed": 5,
"enable_subtitle": 2,
"break": 0
}
示例代码
curl --location --request POST 'https://aip.baidubce.com/rpc/2.0/tts/v1/create' \
--header 'Authorization: Bearer bce-v3/ALTAK-*********/614fb**********' \
--header 'Content-Type: application/json' \
--data-raw '{
"text": [
"今年上半年我国工业行业面临的内外部环境还是比较严峻复杂的",
"段落2",
"段落3"
],
"format": "mp3-16k",
"voice": 4193,
"lang": "zh",
"speed": 5,
"enable_subtitle": 2,
"break": 0
}'
返回响应
用于排查问题用,一般可忽略
用于查询合成结果的id。注意保存该id,用于后续请求结果
任务状态
错误码
错误信息
创建成功
{
"log_id": 1234567890,
"task_id": "234acb234acb234acb234acb", #注意保存该id,用于后续请求结果
"task_status": "Running"
}
创建失败,缺少参数
{
"error_code": 100000,
"error_msg": "missing param: xxx",
"log_id": 5414433131138366128
}
查询任务状态task_status
取值 | 对应状态 |
---|---|
Running | 音频合成中 |
Success | 音频合成成功 |
Failure | 音频合成失败 |
接口错误码
error_code | error_msg | 对应接口 | 描述 |
---|---|---|---|
336200 | internal error | 创建、查询 | 内部错误 |
336201 | unknown task id | 查询 | 未知task id |
336202 | invalid param: task_ids | 创建、查询 | 无效参数值 |
336203 | missing param: 'param_name' | 创建、查询 | 缺少必要参数 |
336204 | Open api total request limit reached | 创建、查询 | 请开通付费,购买调用字符数资源 |
336212 | invalid json | 创建、查询 | 请求数据为非法json |
336213 | missing header: 'header_name' | 创建、查询 | 缺少必要header |