在线合成REST-API-C#-SDK
快速入门
安装语音合成 C# SDK
C# SDK 现已开源! https://github.com/Baidu-AIP/dotnet-sdk
支持平台:.Net Framework 3.5 4.0 4.5, .Net Core 2.0
方法一:使用Nuget管理依赖 (推荐)
在NuGet中搜索 Baidu.AI
,安装最新版即可。
packet地址 https://www.nuget.org/packages/Baidu.AI/
方法二:下载安装
语音合成 C# SDK目录结构
Baidu.Aip
├── net35
│ ├── AipSdk.dll // 百度AI服务 windows 动态库
│ ├── AipSdk.xml // 注释文件
│ └── Newtonsoft.Json.dll // 第三方依赖
├── net40
├── net45
└── netstandard2.0
├── AipSdk.deps.json
└── AipSdk.dll
如果需要在 Unity 平台使用,可引用工程源码自行编译。
安装
1.在官方网站下载识别、合成 RESTful API C# SDK压缩工具包。
2.解压后,将 AipSdk.dll
和 Newtonsoft.Json.dll
中添加为引用。
新建交互类
Baidu.Aip.Speech.Tts是语音合成的交互类,为使用语音合成的开发人员提供了一系列的交互方法。
用户可以参考如下代码新建一个交互类:
// 设置APPID/AK/SK
var APP_ID = "你的 App ID";
var API_KEY = "你的 Api Key";
var SECRET_KEY = "你的 Secret Key";
var client = new Baidu.Aip.Speech.Tts(API_KEY, SECRET_KEY);
client.Timeout = 60000; // 修改超时时间
在上面代码中,常量APP_ID
在百度云控制台中创建,常量API_KEY
与SECRET_KEY
是在创建完毕应用后,系统分配给用户的,均为字符串,用于标识用户,为访问做签名验证,可在AI服务控制台中的应用列表中查看。
接口说明
语音合成
接口描述
基于该接口,开发者可以轻松的获取语音合成能力
请求说明
- 合成文本长度必须小于1024字节,如果本文长度较长,可以采用多次请求的方式。文本长度不可超过限制
举例,要把一段文字合成为语音文件:
// 合成
public void Tts()
{
// 可选参数
var option = new Dictionary<string, object>()
{
{"spd", 5}, // 语速
{"vol", 7}, // 音量
{"per", 4} // 发音人,4:情感度丫丫童声
};
var result = client.Synthesis("众里寻他千百度", option);
if (result.ErrorCode == 0) // 或 result.Success
{
File.WriteAllBytes("合成的语音文件本地存储地址.mp3", result.Data);
}
}
参数 | 类型 | 描述 | 是否必须 |
---|---|---|---|
tex | String | 合成的文本,文本长度必须小于1024GBK字节,建议每次请求文本不超过120字节,约为60个汉字或者字母数字。 请注意计费统计依据:120个GBK字节以内(含120个)记为1次计费调用;每超过120个GBK字节则多记1次计费调用。 |
是 |
cuid | String | 用户唯一标识,用来区分用户, 填写机器 MAC 地址或 IMEI 码,长度为60以内 |
否 |
spd | String | 语速,取值0-9,默认为5中语速 | 否 |
pit | String | 音调,取值0-9,默认为5中语调 | 否 |
vol | String | 音量,取值0-15,默认为5中音量 | 否 |
per | String | 普通发音人选择:度小美=0(默认),度小宇=1,,度逍遥(基础)=3,度丫丫=4 | 否 |
per | String | 精品发音人选择:度逍遥(精品)=5003,度小鹿=5118,度博文=106,度小童=110,度小萌=111,度米朵=103,度小娇=5 | 否 |
tex字段2次urlencode
由于urlencode有两个标准 RFC 1738和RFC 3986. 百度为了更好地兼容,支持1次及2次urlencode, 其中2次urlencode可以覆盖全部的特殊字符。SDK内部加了1次urlencode,因而推荐传递tex 参数时再做1次urlencode编码。
测试用例:“1+1=2”。 依靠SDK内的1次urlencode时,“+”可能会没有合成。
返回样例:
返回TtsResponse类。 如果合成成功,ErrorCode=0, 二进制语音文件,包含在data中。 如果合成出现错误,则会填充除data属性外的其它属性。 如果出现网络错误或者权限验证错误,会抛出相应异常,