关于SSML标签的用法问题和经验(背景音乐开发指南)
k****0 · k****0 发布于2018-11-13 14:24 浏览:3042 回复:8

dueros要求的是:“在合成语音中引入外部的音频,音频以服务器可以访问的地址给出,目前仅支持16K采样,16bit,单声道,44字节头的wav文件格式。”

--------------------------------------------

2019年1月24号更新

技能管理台的资源管理页已支持把用户上传的其他音频自动转换为SSML标准音频的功能

上传原始音频文件后,点击文件后面的刷新按钮,即可获得永久可以使用的wav文件地址,点赞!

--------------------------------------------

总结下经验:

1.亲测wav文件不开通对象存储存在技能的资源管理中也可以,因为域名都是bcebos.com,这种方式免费,强烈推荐;

2.wav文件修改可以下载FFmpeg后在cmd使用以下命令:

转换格式命令

ffmpeg -i 111.mp3 -acodec pcm_s16le -f s16le 1.pcm -ar 8000 -ac 1 -y 2.wav

音频截取命令

ffmpeg -i 20181127_084346.mp3 -ss 01:58:00 -t 03:01:46 -ar 8000 -ac 1 -y 4.wav

输出音频信息命令

ffprobe -i hhg16k1.wav

-ar音频采样率
-ab码率
-ac声道

点赞  ( 2 )
收藏
评论(8)
共8条回复 最后由n****8回复于2019-01-02 10:46
#2回复于2018-11-13 21:35:54

我试了下别的采样也可以播放的。

0
#3k****0回复于2018-11-14 09:13:31
#2 回复
我试了下别的采样也可以播放的。

我都不知道我的mp3文件的这些参数如何查看

0
#4g****t回复于2018-11-15 09:45:17

我有个技能动物声音,我是通过  格式工厂 把mp3准换成wav格式的,注释声道配置成单声道。

0
#5k****0回复于2018-11-15 13:56:32
#4 g****t回复
我有个技能动物声音,我是通过 格式工厂 把mp3准换成wav格式的,注释声道配置成单声道。

格式工厂只能设置声道,其他参数改不了,5兆的mp3在格式工程转成30兆的wav了。。。

0
#6k****0回复于2018-11-28 17:54:05

棒棒哒

0
#7n****8回复于2018-12-31 15:07:57

谢了~

0
#8D****s回复于2018-12-31 21:00:27
#7 n****8回复
谢了~

已上线SSML音频转换功能,不需要手动转换。具体可体验技能平台SSML功能

0
#9n****8回复于2019-01-02 10:46:18
#8 D****s回复
已上线SSML音频转换功能,不需要手动转换。具体可体验技能平台SSML功能

好的,多谢!

0
TOP