不支持AI开放能力之外的产品 仅使用AI开放能力的客户 API Key鉴权机制 AI开放能力的公有云接口,暂不支持离线SDK 同时支持大模型服务与开发平台ModelBuilder、大模型应用开发平台AppBuilder的接口调用 要同时使用AI开放能力、ModelBuilder和AppBuilder的客户;或此前在其他平台使用过大模型服务,现在迁移到百度智能云的客户,使用API Key可无缝迁移 需要注意
20 在线合成连接失败 -21 在线合成 socket 异常 -24 在线合成请求主机名为空 -25 在线合成发送数据失败 -29 在线合成接收前缀数据长度错误 -30 在线合成接收数据长度错误 -31 在线合成合成数据包速度过快 -32 在线合成网络未知类型错误 -39 在线服务临时错误 -100 离线引擎授权失败 -102 离线授权下载License失败 -105 离线授权中断异常 -106
删除句末标点 3 在线 将所有标点替换为空格 ACCEPT_AUDIO_DATA boolean 全部 高级 是否需要语音音频数据回调,开启后有CALLBACK_EVENT_ASR_AUDIO事件 true 需要音频数据回调 false (默认) 不需要音频数据回调
nd nil 本地声音采集结束结束,等待识别结果返回并结束录音 EVoiceRecognitionClientWorkStatusNewRecordData NSData-原始音频数据 录音数据回调 EVoiceRecognitionClientWorkStatusFlushData
t.println(res.getErrorCode()); 13 JSONObject result = res.getResult(); //服务器返回的内容,合成成功时为null,失败时包含error_no等信息 14 byte[] data = res.getData(); //生成的音频数据
语音合成服务接口 Python 上线日期 版本号 更新内容 2022.2.26 4.15.4 接口统一升级 2017.5.11 1.0.0 语音合成服务上线 C++ 上线日期 版本号 更新内容 2022.2.26 4.15.4 接口统一升级 2017.12.21 0.4.0 更新了语音合成返回数据逻辑
流式文本在线合成 基于websocket协议,在用户输入文本的同时就能接近同步返回合成音频数据,实现“边合成边播放”。支持多种优质音库与多种参数,适用于语音助手、在线教育、语音播报等场景。 离线语音合成 在无网或弱网环境下,可在手机APP或故事机、机器人等智能硬件设备终端进行语音播报,将文字合成为声音,提供稳定一致、流畅自然的合成体验 。
AipSpeech之后调用接口设置参数,目前只支持以下参数: 接口 说明 setConnectionTimeoutInMillis 建立连接的超时时间(单位:毫秒 setSocketTimeoutInMillis 通过打开的连接传输数据的超时时间(单位:毫秒) 接口说明 语音合成 接口描述 基于该接口
如何用代码调用 编写一个示例程序 有 准备工作 的 API KEY 以及 Secret KEY ,的数据,并且领取了免费测试额度,我们就可以写一个示例代码调用百度AI开放平台的语音合成能力 准备开发环境 大姚选择用python来快速搭建一个原型,那我们就安装以下python。可以参考下表列出的不同操作系统的安装方法进行安装。
语音识别 短语音识别标准版 短语音识别标准版按调用次数计费,支持“按次数包预付费”和“按调用量阶梯后付费”两种付费方式,并基于中文普通话、粤语、英语、四川话等模型购买。 “按次数包预付费”的付费方式更适合业务中对语音识别服务需求量较明确的用户选择,用户可同时购买多个次数包叠加使用; “按调用量阶梯后付费”的付费方式更适