【功能升级】实时语音识别,多方言沟通无界更贴心!

作者:百度语音技术2025.11.17 19:38浏览量:2

简介:除中文普通话、英文外,支持粤语、四川话和东北话等方言的识别

为进一步提升语音产品体验,满足多元化场景需求,实时语音识别API近期重大升级!在原有中文普通话、英文精准识别基础上,新增支持粤语、四川话、东北话等方言自动识别能力,覆盖更广泛的地域与人群,让沟通更自由、更高效!

升级亮点抢先看

1、方言识别再扩容,沟通无障碍

  • 新增方言:粤语、四川话、东北话,覆盖华南、西南、东北等区域

  • 支持中英混说场景,一个API即可实现方言与普通话、英文无缝切换,满足跨语种交流需求

2、场景覆盖更全面,**应用更广泛**

  • 社交娱乐:语音聊天、视频直播,字幕实时展示;

  • 办公协作:实时会议记录、演讲字幕展示,方言内容自动转文字,效率翻倍;

  • 交通出行:方言语音输入,解放双手,安全高效。

3、技术突破,体验升级

  • 采用Deep Peak2端到端建模,超过10万小时数据训练,多采样率多场景声学建模,识别精准度高

  • 实时反馈,毫秒级响应,语音转文字流畅无卡顿

  • 支持动态切换识别语言,无需单独设置,方言识别“随开随用”

如何使用方言识别?

如需体验,需在实时语音识别API请求参数user-使用中文多方言模型(pid:15376)时此参数必填。

详情参考实时语音识别API技术文档https://ai.baidu.com/ai-doc/SPEECH/jlbxejt2i

百度语音现已推出:短语音识别标准版短语音识别极速版实时语音识别音频文件转写短文本在线合成长文本在线合成流式文本在线合成定制音库声音复刻呼叫中心实时语音通话呼叫中心语音质检呼叫中心音频文件转写等多款语音产品,同时提供有声阅读解决方案呼叫中心语音解决方案语音数字大屏智能语音会议智能语音指令语音字幕服务等场景化解决方案,满足各类语音场景需求。提供在线APIHTTP SDK离线SDK私有化部署一体机等多种部署方式,接入便捷、稳定可靠。