您可以在 控制台概览页 服务列表 处开通付费并购买所需的资源。具体购买方式如下: 开通按量后付费 支持随开随停,适用于需灵活付费,或前期小规模测试的企业。 在服务列表找到需要开通的服务接口,点击开通付费 或点击“资源管理”,打开“按量后付费状态”即可完成开通 如您希望批量开通其他接口,可点击“购买资源包”,在购买页里选择“按量后付费”,后在 接口名称 处批量勾选接口。
使用了唤醒并使用离线语法识别的情况下需要设置,其他情况请忽略该参数 BDS_ASR_OFFLINE_ENGINE_TRIGGERED_WAKEUP_WORD 当前触发唤醒词,唤醒后立即调用识别的情况下配置,其他情况请忽略该参数 BDS_ASR_NEED_CACHE_AUDIO 唤醒后立刻进行识别需开启该参数,其他情况请忽略该参数 服务端配置相关 参数名称 说明 BDS_ASR_SERVER_URL
zip“后缀) 创建音频转写任务-请求说明 请求接口: https://aip.baidubce.com/rpc/2.0/aasr/v1/create HTTP 方法:POST URL参数: 参数 取值 access_token 通过 API Key 和 Secret Key 获取的 access_token,参考 Access Token获取 JSON方式上传音频 Body中放置请求参数,语音数据和其他参数通过标准
每次请求合成的文本建议 120GBK 以内,如需更长文本转换可使用长文本在线合成。 合成的文件格式为 mp3,pcm(8k及16k),wav(16k),具体见aue参数。 若您需要其它格式,音频文件的转换方法请参考 “语音识别工具”=>“音频文件转码” 一节 本文档描述了使用语音合成服务REST API的方法。 多音字可以通过标注自行定义发音。格式如:重(chong2)报集团。
MyWakeup ( this , listener ) ; // this是Activity或其它Context类 详见ActivityWakeUp类中”基于DEMO唤醒词集成第1.1, 1.2, 1.3步骤 2 开始唤醒 2.1 设置唤醒输入参数 SDK中,您需要根据文档或者demo确定您的输入参数。
3310 用户输入错误 输入的音频文件过大 或 len 参数过大 文件内容过大,音频时长不能超过 60s 3311 用户输入错误 采样率 rate 参数不在选项里 目前 rate 参数支持 16000、8000,填写其他值即会有此错误。
其他填写具体请求参数 ,详见 ”请求说明“。 短语音识别请求地址: http://vop.baidu.com/server_api 返回识别结果:识别结果会即刻返回,采用 JSON 格式封装,如果识别成功,识别结果放在 JSON 的 “result” 字段中,统一采用 utf-8 方式编码。详见 ”返回说明“。
POST调用方式(推荐) 将文本以及其他参数写入到body里面,利用html表单的方式将参数传递到服务端。 所有的参数都在body中。
适用于近场短语音交互,如手机语音搜索、聊天输入等场景。 支持上传完整的录音文件,录音文件时长不超过60秒,实时返回识别结果。 调用流程 创建账号及应用: 在 ai.baidu.com 控制台中,创建应用,勾选开通 “语音技术”—“短语音识别”、“短语音识别极速版” 能力。获取AppID、API Key、Secret Key,并通过请求鉴权接口换取 token ,详细见 “ 接入指南 ”。
音频格式 要求项 取值要求 采样率 8KHz 采样精度 16bits 声道 单声道 音频内容为:清晰的真人发音,无背景音或其它噪音,日常用语。