长语音识别
通过SDK调用服务,可将长语音(长时间连续说话)转换为文字
即将开放,敬请期待
功能介绍
提供业界优质的长语音识别服务,在会议、教学或者媒体采访中,百度长语音识别服务可快速准确的将长时间的语音转化为文字,方便进行拷贝和编辑等后续的工作,让您的工作、生活变得更便捷
应用场景
会议记录
将会议上的音频转换为文字信息,方便后期的文字处理和内容存档,省去会议记录的人力和时间成本
实时字幕
将直播、视频、现场演讲等音频进行实时的字幕转换,降低理解成本,提升用户体验
语音笔记
可将笔记、总结等,通过语音的方式转为文字,进行记录,大幅提升了用户的录入效率
技术特色
自定义上传识别词库
开发者可以自行上传词库,训练专属识别模型,提交的语料越多、越全,语音识别的效果提升也会越明显
深度语义解析
支持多达35个垂类领域的语义理解,如:交通,社交,娱乐等领域。还可支持自定义指令集和问答对的设置
场景识别定制
可根据使用场景,自定义设置识别垂类模型。有视频、地图、游戏等17个垂类可供选择,一步设置,精确到位