简介

简介

百度语音合成服务,基于HTTP请求的REST API接口,将文本转换为可以播放的音频文件

合成的文件格式为 mp3,pcm(8k及16k),wav(16k),具体见aue参数。
若您需要其它格式,音频文件的转换方法请参考“语音识别工具”=>“音频文件转码”一节

本文档描述了使用语音合成服务REST API的方法。

  • 多音字可以通过标注自行定义发音。格式如:重(chong2)报集团。
  • 目前只有中英文混合这一种语言,优先中文发音。示例:
    " I bought 3 books” 发音 “three”;
    “ 3 books are bought” 发音 “三”;
    “我们买了 3 books” 发音“三”

语音合成示例代码: https://github.com/Baidu-AIP/speech-demo/tree/master/rest-api-tts

接口更新说明

日期 更新内容 更新前的历史状态
2018-07-14 添加 aue 参数,可以下载wav和pcm格式 只能下载mp3格式
2018-07-14 tex参数兼容一次urlencode, 推荐两次urlencode tex参数 urlencode一次,会出现如“+”等特殊字符不能正确发音
2018-07-14 使用POST方式提交,合成限制2048个汉字。使用GET方式提交(不推荐),拼接的url长度不超过1000个字符。注意:过长的文本将需要更多的请求耗时。如果对时间敏感,请请自行按照标点切割,可以采用多次请求的方式。 tex参数限制512个汉字

浏览器跨域

目前合成接口支持浏览器跨域。
跨域demo示例: https://github.com/Baidu-AIP/SPEECH-TTS-CORS
由于获取token的接口不支持浏览器跨域。因此需要您从服务端获取或者每隔30天手动输入更新。