语音识别
采用国际领先的流式端到端语音语言一体化建模算法,将语音快速准确识别为文字,支持手机应用语音交互、语音内容分析、机器人对话等多个场景
优惠
新客专享折扣,首购1折起!
>
立即选购
立即使用
技术文档
产品价格
商务咨询
API在线调试
HOT
快速调试语音识别效果
私有化部署
支持多种配置选择,开箱即用
客户案例
语音识别助爱奇艺优化搜索体验
语音字幕服务重磅升级
NEW
AI助力生产效率全面提升
产品列表
应用场景
特色优势
产品定价
支持交流
相关推荐
产品列表
短语音识别标准版
对60秒以内的语音精准识别为文字,融合百度领先的自然语言处理技术,支持手机语音输入、语音搜索、智能语音对话等场景
了解详情
短语音识别极速版
将60秒内的语音快速识别为文字,适用于手机语音输入、语音搜索、人机对话等语音交互场景
了解详情
实时语音识别
将音频流实时识别为文字,并返回每句话的开始和结束时间,适用于长句语音输入、音视频字幕、会议等场景
了解详情
音频文件转写
将批量上传的音频文件识别为文字,12小时内返回识别结果。适合录音质检、会议内容总结、音频内容分析等场景
了解详情
语音自训练平台
使用业务场景语料,自助训练语言模型,精准识别语音内容,提升业务领域识别准确率
了解详情
应用场景
手机应用语音输入
机器人对话
语音内容分析
实时语音转写
手机应用语音输入
将语音实时识别为文字,适用于语音聊天、语音输入、语音搜索、语音下单、语音指令、语音问答等多种场景
合作案例
特色优势
技术领先
采用领先国际的流式端到端语音语言一体化建模方法,融合百度自然语言处理技术,近场中文普通话识别准确率达98%
自助训练专属模型
支持在语音自训练平台上自助训练模型,上传词汇文本即可零代码完成训练,精准提升业务领域词汇识别率5-20%,并可专属使用
简单快速
支持API及多种SDK接入,可基于Demo快速简单接入,采用最新识别解码技术,识别速度极大提升
高效稳定
专有服务集群、提供企业级的稳定服务,弹性灵活的高并发承载及高可靠性保障
产品定价
短语音识别标准版
短语音识别极速版
实时语音识别
音频文件转写
次数包预付费
适用于调用量可预估的企业
免费调用量
10万次/企业账号
有效期
1年
并发量
50(支持扩容)
技术支持
7*24小时
100万次
2400
元
立即购买
调用量后付费
适用于不便预估调用量的企业
免费调用量
10万次/企业账号
并发量
50(支持扩容)
技术支持
7*24小时响应
调用量≤600万次
0.0034
元/次
开通付费
定制版
适用于需要特殊模式的大客户
享受特殊的大客户价格
购买更多的并发
其他付费模式购买
合作咨询
定价说明
本产品开通即享免费调用量,使用完毕后可选择次数包预付费或按量后付费两种计费方式,产生的计费调用量优先消耗次数包额度,超出部分按量阶梯计费
收费标准
支持交流
新手指南
找到适合您业务的AI技术能力,快速创建应用,开始便捷的开发之旅
查看详情 >
技术文档
针对使用API或SDK的开发者,提供百度语音识别技术开发文档
查看详情 >
SDK下载
支持Android、iOS、Linux、Java、PHP、Python、C++、C#、Node.js多种编程语言
查看详情 >
即刻获得语音识别能力
注册即可领取产品免费体验套餐
立即使用
相关推荐
语音合成
基于业内领先的深度学习技术,提供高度拟人、流畅自然的语音合成服务,支持在线、离线多种调用方式,满足泛阅读、订单播报、智能硬件等场景的语音播报需求
通用场景文字识别
覆盖多种通用场景、20+种语言的高精度整图文字检测和识别服务,包括各类印刷和手写文档、网络图片、表格、印章、数字、二维码等;可用于纸质文档电子化、办公文档/报表识别、图像内容审核等场景
卡证文字识别
结构化识别身份证、银行卡、营业执照等常用卡片及证照,支持营业执照信息的准确性核验,广泛适用于身份认证、金融开户、征信评估等业务场景
图像识别
精准识别超过十万种物体和场景,包含10余项高精度的识图能力并提供相应的API服务,充分满足各类开发者和企业用户的应用需求
机器翻译
依托海量的互联网数据资源和领先的机器翻译技术,上线全球首个互联网神经网络翻译系统,致力于帮助用户跨越语言鸿沟。支持多达200+个语种高质量互译,覆盖4万多个语言方向,日均响应千亿字符翻译请求。可提供公有云接口及私有化部署、定制化训练等服务
人脸实名认证
高安全性 高通过率 高易用性的远程人脸身份核验方案
合作咨询
售前咨询
填写您的业务需求,专属客户经理会尽快联系您,提供1对1咨询服务
售后智能助手
智能诊断,快速解决使用问题
联系销售
更多咨询,请拨打
400-920-8999 转 1
体验AI
Web端 前往
AI能力体验中心
移动端 打开百度APP“扫一扫”
添加成功
去结算