错误码及常见原因

错误码列表

错误码 用户输入/服务端 含义 一般解决方法
3300 用户输入错误 输入参数不正确 请参考技术文档及demo,核对输入参数
3301 用户输入错误 音频质量过差 请上传清晰的音频
3302 用户输入错误 鉴权失败 token字段校验失败。请检查并使用正确的appkey 和 app secret生成token。
3303 服务端问题 百度服务器后端繁忙 有可能是原始音频质量过差。可以将api返回结果和原始音频反馈至工单、论坛或者QQ群
3304 用户请求超限 用户的请求QPS超限 请降低识别api请求频率(账号内所有应用APPID共用QPS限额)
3305 用户请求超限 用户的日调用量(日请求量)超限 请开通付费,购买调用量资源(账号内所有应用APPID共用调用量限额)
3307 服务端问题 语音服务器后端识别出错问题 有可能是原始音频质量过差。可以将api返回结果和原始音频反馈至论坛或者QQ群
3308 用户输入错误 音频过长 音频时长不超过60s或音频base64后超过2MB,请将音频时长截取为更短的音频
3309 用户输入错误 音频数据问题 服务端无法将音频转为pcm格式,可能是长度问题,音频格式问题等。 请将输入的音频时长截取为60s以下,并核对下音频的编码,采样率16000,单声道,小端序,16bits
3310 用户输入错误 输入的音频文件过大 语音文件共有3种输入方式: json 里的speech 参数(base64后); 直接post 二进制数据;callback参数里url。 分别对应三种情况:json超过10M;直接post的语音文件超过10M;callback里回调url的音频文件超过10M
3311 用户输入错误 采样率rate参数不在选项里 目前rate参数仅支持16000,填写其他值即会有此错误。
3312 用户输入错误 音频格式format参数不在选项里 目前格式仅仅支持pcm,wav或amr,如填写mp3即会有此错误
3313 服务端问题 语音服务器解析超时 请将api返回结果反馈至工单、论坛或者QQ群
3314 用户输入错误 音频长度过短 音频长度的lan参数不能小于等于4
3315 服务端问题 语音服务器处理超时 请将api返回结果反馈至工单、论坛或者QQ群
3316 用户输入错误 音频转为pcm失败 使用pcm格式,或者确认wav和amr的采样率16000,单声道。 wav文件需要是pcm编码,小端序,16bits

错误码常见问题及具体分析

3300 错误

语音识别api使用的是HTTP POST方法, BODY里直接放置json, Content-Type头部为 application/json。 并非常见的浏览器表单请求(application/x-www-form-urlencoded或者multipart/x-www-form-urlencoded)。

必填字段:format rate channel 请勿漏填。此外 (speech, len) 及 (url, callback) 这两组参数必须二选一,如果都填,默认处理第一组。并确认音频时长截取为60s以下且音频文件base64后小于2MB。

3309错误

wav和amr的音频,服务端会自动转为pcm,这个过程中导致转码出错。请确认下format及rate参数与音频一致,并确认音频时长截取为60s以下。

3301 错误

识别结果实际为空。可能是音频质量过差,不清晰,或者是空白音频。
有时也可能是pcm填错采样率。如16K采样率的pcm文件,填写的rate参数为8000。

错误反馈

  • 结果含有错误码:请提供: 1. 原始音频 2. 返回的完整json 3. 调用的时间点 4. 识别的参数
  • 识别结果与期望不符: 请提供 : 1.原始音频 2. 返回的完整json 3.期望结果 4. 识别的参数 5. 是否偶发
  • 调用官方的rest sdk demo报错: 如果是rest sdk的报错,请提供完整报错信息。如果是上述两项,请按上面的说明。

识别效果优化

自定义词库

自定义词库在您网页申请的应用内设置(具体位置参见下图)。

自定义词库适合短句,保证词库中一模一样的短句可以被识别出,词库中的分词优先级较高。
原始音频的采用率需为16K。

最好在1万行以内。

副作用:如果用户的测试集中包含大量非自定义词表的query,整体上准确率下降。

举例

词库定义了1个短句:
1 . 摆渡船来了
百度内部处理的可能的分词结果: 摆渡船 来 了

以下录音的结果

  1. 原始音频:摆渡船来了 =>识别结果: 摆渡船来了 【保证结果】

  2. 原始音频:摆渡船来了么 =>识别结果: 百度传来了么 【可能结果,不保证】

  3. 原始音频:摆渡船来 => 识别结果: 百度传来 【可能结果,不保证】

  4. 原始音频:百度传来了喜讯 => 识别结果: 摆渡船传来了喜讯 【不保证,词库内的分词优先级高】

反馈渠道

  1. ai.baidu.com 底部查找QQ群
  2. 网页里的应用发送工单
  3. 论坛