请注意计费统计依据:120个GBK字节以内(含120个)记为1次计费调用;每超过120个GBK字节则多记1次计费调用。
语音合成 基于业内领先的深度学习技术,提供高度拟人、流畅自然的语音合成服务,支持在线、离线多种调用方式,满足泛阅读、订单播报、智能硬件等场景的语音播报需求。 短文本在线合成 基于HTTP请求的REST API接口,将文本转换为可以播放的音频文件。 支持自动预测/参数控制合成语音情感,支持添加元数据标识,最长可支持1024GBK字节的文本合成语音。
请注意计费统计依据:120个GBK字节以内(含120个)记为1次计费调用;每超过120个GBK字节则多记1次计费调用。
流式合成相比普通合成具有以下优势: 实时性更强:边合成边播放,减少等待时间 内存占用更小:无需等待全部合成完毕再获取音频 用户体验更好:可以更快听到第一段语音内容 功能说明 建议文本不超过2000 GBK字节,即1000个汉字或者字母数字 输入的文本必须采用UTF-8编码 支持多音字通过标注自行定义发音。
热词文本格式要求 :热词训练支持上传热词txt文件进行训练,每个词之间需要换行,txt格式要求gbk编码,大小不超过5M 句篇文本格式要求 :句篇训练支持上传多行单句或一整段篇章(一段文字且需要符号)txt文件进行训练,txt格式要求gbk编码,大小不超过5M 建议您上传与您所需模型内容相关度较高的文本或关键词, 以便最大程度提高您的模型识别率 上传训练文本成功之后点击【开始训练】,后台进入模型训练状态
在Eclipse右键“工程 -> Properties -> Java Build Path -> Add JARs”。 添加SDK工具包 lib/bce-java-sdk-version.jar 和第三方依赖工具包 third-party/*.jar。其中version为版本号。
注意需要合成的每个文本text不超过120的GBK字节,即60个汉字或英文字母数字。
每次请求合成的文本建议 120GBK 以内,如需更长文本转换可使用长文本在线合成。 合成的文件格式为 mp3,pcm(8k及16k),wav(16k),具体见aue参数。 若您需要其它格式,音频文件的转换方法请参考 “语音识别工具”=>“音频文件转码” 一节 本文档描述了使用语音合成服务REST API的方法。 多音字可以通过标注自行定义发音。格式如:重(chong2)报集团。
在Eclipse右键“工程 -> Properties -> Java Build Path -> Add JARs”。 添加SDK工具包 lib/bce-java-sdk-version.jar 和第三方依赖工具包 third-party/*.jar 。 其中, version 为版本号。
云原生 函数计算 CFC 容器实例BCI 容器镜像服务CCR 安全 DDoS防护服务 应用防火墙 WAF 密钥管理服务 SSL证书 云堡垒机 应用加固与安全检测 人工智能 人脸识别 人体分析 语音技术 文字识别 语言处理技术 图像识别 图像搜索 图像增强 全功能AI开发平台 BML 零门槛AI开发平台 EasyDL 知识理解 内容审核平台 智能大数据 MapReduce 流式计算 BSC 数据可视化