简介
所有文档

          语音技术

          简介

          简介

          百度语音合成服务,基于HTTP请求的REST API接口,将文本转换为可以播放的音频文件

          合成的文件格式为 mp3,pcm(8k及16k),wav(16k),具体见aue参数。 若您需要其它格式,音频文件的转换方法请参考“语音识别工具”=>“音频文件转码”一节

          本文档描述了使用语音合成服务REST API的方法。

          • 多音字可以通过标注自行定义发音。格式如:重(chong2)报集团。
          • 目前只有中英文混合这一种语言,优先中文发音。示例: " I bought 3 books” 发音 “three”; “ 3 books are bought” 发音 “three”; “我们买了 3 books” 发音“三”

          语音合成示例代码: https://github.com/Baidu-AIP/speech-demo/tree/master/rest-api-tts

          接口更新说明

          日期 更新内容 更新前的历史状态
          2020-07-21 新增2个精品音库,在线合成音库总数扩充到11个,满足更多应用场景 在线合成音库总数为11个
          2019-07-12 增加精品音库per接口,在线合成音库总数扩充到9个,满足更多应用场景 只有基础音库per接口
          2018-07-14 添加 aue 参数,可以下载wav和pcm格式
          只能下载mp3格式
          2018-07-14 tex参数兼容一次urlencode, 推荐两次urlencode
          tex参数 urlencode一次,会出现如“+”等特殊字符不能正确发音
          2018-07-14 使用POST方式提交,合成限制2048个汉字。使用GET方式提交(不推荐),
          拼接的url长度不超过1000个字符。注意:过长的文本将需要更多的请求耗时。
          如果对时间敏感,请请自行按照标点切割,可以采用多次请求的方式。
          tex参数限制512个汉字

          浏览器跨域

          目前合成接口支持浏览器跨域。 跨域demo示例: https://github.com/Baidu-AIP/SPEECH-TTS-CORS 由于获取token的接口不支持浏览器跨域。因此需要您从服务端获取或者每隔30天手动输入更新。

          上一篇
          产品定价
          下一篇
          调用流程示例