短语音识别标准版
将60秒以内的语音精准识别为文字,可适用于手机语音输入、智能语音交互、语音指令、语音搜索等短语音交互场景
特惠
新客专享,短语音识别标准版低至
3元/万次
,立即抢购
>
立即使用
技术文档
产品价格
功能介绍
应用场景
特色优势
产品定价
支持交流
相关推荐
功能介绍
技术领先识别准确
采用领先国际的流式端到端语音语言一体化建模方法,融合百度自然语言处理技术,近场中文普通话识别准确率达98%
多语种和多方言识别
支持普通话和略带口音的中文识别;支持粤语、四川话方言识别;支持英文识别
深度语义解析
支持50多个领域的语义理解,如:天气,交通,娱乐等。还可接入智能对话定制与服务平台UNIT自定义语义理解和对话服务,让您更准确地理解用户意图
中文标点智能断句
使用大规模数据集训练语言模型,根据语音的内容理解和停顿智能匹配合适的标点符号(包括,。!?),使识别结果的表现方式贴合表述,更加可懂
数字格式智能转换
根据语音内容理解可以将数字序列、小数、时间、分数、基础运算符正确转换为数字格式,使得识别的数字结果更符合使用习惯,直观自然
支持自助训练专属模型
支持在语音自训练平台上自助训练模型,上传词汇文本即可零代码完成训练,精准提升业务领域词汇识别率5-25%,并可专属使用
应用场景
语音输入
语音搜索
语音指令
社交聊天
游戏娱乐
语音输入
摆脱生僻字和拼音障碍,使用语音即时输入。略带口音的普通话、粤语四川话方言、英文,均可有效识别,并可根据句意自动纠错、自动断句添加标点,让输入更快捷,沟通交流更顺畅
合作案例
特色优势
技术世界领先
采用领先国际的流式端到端语音语言一体化建模方法,近场中文普通话识别准确率达98%
服务稳定高效
企业级稳定服务保障,专有集群承载大流量并发高效灵活,以及99.9%服务稳定性保障
模型自助优化
中文输入法模型可在语音自训练平台上零代码自助训练,上传文本语料即可有效提升业务词汇的识别准确率5-25%
产品定价
次数包预付费
适用于调用量可预估的企业
免费调用量
10万次/企业账号
有效期
1年
并发量
50(支持扩容)
技术支持
7*24小时
100万次
2400
元
立即购买
调用量后付费
适用于不便预估调用量的企业
免费调用量
10万次/企业账号
并发量
50(支持扩容)
技术支持
7*24小时响应
调用量≤600万次
0.0034
元/次
开通付费
模型训练优化
适用于专业领域名词识别不准,需要对语音识别语言模型进行规模训练的客户
上传文本、词汇即可训练
专业评估,精准提升
模型自动上线专属使用
立即训练
按设备授权购买
适用于语音遥控器、语音鼠标等近场硬件终端,支持在线短语音识别Android SDK按设备授权方式购买
按设备数
每台终端使用一个单独授权序列号激活
按产品线
一个授权序列号安装在多台终端设备使用
合作咨询
支持交流
新手指南
找到适合您业务的AI技术能力,快速创建应用,开始便捷的开发之旅
查看详情 >
技术文档
开放百度语音识别技术开发文档,帮助使用API或SDK的开发者赋能产品
查看详情 >
技术社区
在百度AI 开发者社区了解 AI 技术的最新动态,与开发者们一起学习和交流 AI 技术
查看详情 >
即可获得语音AI能力
注册即可领取产品免费体验套餐
立即使用
相关推荐
短语音识别极速版
将60秒内的语音快速识别为文字,适用于手机语音输入、语音搜索、人机对话等语音交互场景
短文本在线合成
基于业界领先的深度神经网络技术,提供高度拟人、流畅自然的语音合成服务,让您的应用、设备开口说话,更具个性
实时语音识别
基于Deep Peak2的端到端建模,将音频流实时识别为文字,并返回每句话的开始和结束时间,适用于长句语音输入、音视频字幕、会议等场
身份证识别
结构化识别二代居民身份证正反面所有8个字段,识别准确率超过99%;支持识别混贴身份证,适用于同一张图上有多张身份证正反面的场景;支持检测身份证正面头像,并返回头像切片的base64编码及位置信息
通用文字识别
多场景、多语种、高精度的整图文字检测和识别服务,多项ICDAR指标居世界第一,可识别中、英、日、韩、法、俄、西、葡、德、意等20+种语言
文本翻译
提供200+语种互译的在线文本翻译服务,可广泛应用于移动端、PC网站、智能硬件等不同产品形态中,满足多领域、多场景的翻译需求。
合作咨询
售前咨询
填写您的业务需求,专属客户经理会尽快联系您,提供1对1咨询服务
售后智能助手
智能诊断,快速解决使用问题
联系销售
更多咨询,请拨打
400-920-8999 转 1
体验AI
Web端 前往
AI能力体验中心
移动端 打开百度APP“扫一扫”
添加成功
去结算