实时语音识别_实时语音识别技术-百度智能云

实时语音识别

基于Deep Peak2的端到端建模，将中英文、方言的音频流实时识别为文字，并返回每句话的开始和结束时间，适用于长句语音输入、音视频字幕、会议等场景

功能介绍

除中文普通话、英文外，支持粤语、四川话和东北话等方言的识别

使用大规模数据训练模型，智能纠错识别结果，并基于内容与停顿自动匹配标点 (，。！？)

首包响应时间毫秒级，并实时展示中间文字结果，快速识别音频流

识别返回结果带有时间戳，展示VAD切分句子开始和结束时间，方便进行功能开发

实时语音输入

语音输入准确高效，解放双手，说话内容实时展示在屏幕上，聊天顺畅

实时会议记录

会议场景中，每个说话人的语音可以实时记录，提升会议记录效率

直播字幕

直播新玩法，主播说话可以直接将说话内容实时转写为字幕展示在屏幕上，或者可进行二次字幕编辑

课堂音频识别

对老师课堂内容实时记录，校方可以进行教学内容记录以及教学质量评估

小时包预付费
适用于调用时长可预估的企业，完成企业认证即刻享有10小时免费调用时长
时长
1000小时
有效期
1年
并发量
50（支持扩容）
技术支持
7*24小时响应
1800元
立即购买
通用场景
调用时长后付费
适用于不便预估调用时长的企业，完成企业认证即刻享有10小时免费调用时长
并发量
50（支持扩容）
服务稳定性
99.9%
技术支持
7*24小时响应
3元/小时
开通付费
通用场景
模型训练
适用于专业领域名词识别不准，需要对语音识别语言模型进行规模训练的客户
自定义内容训练
上传即训练
效果提升
专业评估精准提升
立即应用
模型上线专属使用
立即训练
通用场景
定价说明
本产品开通即享免费调用时长，使用完毕后可选择小时包预付费或按小时后付费两种计费方式，产生的计费调用时长优先消耗小时包额度，超出部分按时长计费
收费标准
通用场景
免费版
适用于测试对接和效果体验
噪声识别
背景音下精准识别
多场景分析
直播网课会议适用
额度试用
测试详情咨询商务
申请测试
音频视频
付费版
适用于业务环境下持续、稳定使用
噪声识别
背景音下精准识别
多场景分析
直播网课会议适用
定价咨询
产品定价详询商务
合作咨询
音频视频