SSML使用说明
更新时间:2024-12-24
语音合成(TTS)时一般输入纯文本即可,引擎内部会进行文本分析,预测合理的注音和韵律等。当需要能够更精确地控制合成效果时,比如指定人名中多音字读法、指定停顿时长等,可以使用对应 SSML (Speech Synthesis Markup Language,语音合成标记语言)标签来实现。
这是一个 SSML 示例,所有文本包在 speak 顶层标签中,speak 标签可以不写,系统会补齐。
<speak>这是一个<say-as interpret-as="as-character">SSML</say-as>示例,我可以念多音字,<phoneme py="shan4">单</phoneme>老师说,<phoneme py="chan2">单</phoneme>于不会骑<phoneme py="dan1">单</phoneme>车。</speak>
支持的 SSML 标签:
分类 | 功能 | 示例 | 说明 |
---|---|---|---|
多音字 | 多音字 | <phoneme py='shan4'>单</phoneme> | 通过拼音标注期望的发音 |
数字 | 整数 | <say-as type="number:ordinal">123</say-as> | 读作:一百二十三 |
数字 | 数字串 | <say-as type="number:digits">123</say-as> | 读作:一二三 |
数字 | 比分 | <say-as type="number:score">12:123</say-as> | 读作:十二比一百二十三 |
数字 | 分数 | <say-as type="number:fraction">12/123</say-as> | 读作:一百二十三分之十二 |
数字 | 电话号码 | <say-as type="telephone">110</say-as> | 读作:幺幺零 |
英文 | 字母 | <say-as interpret-as="as-character">BAT</say-as> | |
英文 | 单词 | <say-as interpret-as="as-word">BAT</say-as> | |
停顿 | 停顿 | <silence time="0.5s"></silence> | 最大值10秒 |