百度智能云

百度智能云百度智能云

618钜惠 热销爆款 限时促销

7折

短语音识别-极速版

将60秒内的中文普通话音频快速识别为文字,实时返回识别结果,适用于手机语音搜索、聊天输入等场景。

适用场景

手机语音搜索

游戏文字输入

聊天语音输入

语音指令

人机对话

支持调用方式

REST API

支持语音识别模型

输入法模型

规格

100万次

购买方式

按次数包

有效期

1年

功能介绍

准确识别语音
采用领先国际的流式端到端语音语言一体化建模方法SMLTA,结合中文语义理解智能纠错,近场中文普通话识别准确率达98%
快速高效识别
采用最新解码技术,API接口识别速度提升5倍以上,耗时仅音频时长十分之一,提升语音交互体验
支持自定义优化
可通过上传自定义词条进行训练,持续优化特定词条的识别效果,提升特定行业或业务场景的准确率
智能中文标点
使用大规模数据集训练语言模型,根据语音的内容理解和停顿智能匹配合适的标点符号(,。!?),使识别结果的表现方式贴合表述,更加可懂

应用场景

语音输入
语音搜索
人机对话
application-sence-image
语音输入

语音输入

摆脱按键操作,通过语音识别直接输入文字,快速返回识别结果,可应用于游戏文字输入、社交聊天、语音指令等多个场景,提高输入效率及体验

我们的优势

超高识别准确率

采用领先国际的流式端到端语音语言一体化建模方法SMLTA,结合中文语义理解智能纠错,近场中文普通话识别准确率达98%

响应速度快

采用最新解码技术,API接口识别速度提升5倍以上,耗时仅音频时长十分之一

application-sence-image
语音搜索

语音搜索

搜索内容直接以语音的方式输入,响应速度更快,适用于音乐、电影、小说等内容搜索场景,让搜索内容输入更加便捷,高效

我们的优势

超高识别准确率

采用领先国际的流式端到端语音语言一体化建模方法SMLTA,结合中文语义理解智能纠错,近场中文普通话识别准确率达98%

响应速度快

采用最新解码技术,API接口识别速度提升5倍以上,耗时仅音频时长十分之一

application-sence-image
人机对话

人机对话

通过极速API接口,将语音识别为文字,毫秒级响应,可用于聊天机器人、故事机等近场语音识别环境,让人机对话更加流畅自然

我们的优势

超高识别准确率

采用领先国际的流式端到端语音语言一体化建模方法SMLTA,结合中文语义理解智能纠错,近场中文普通话识别准确率达98%

响应速度快

采用最新解码技术,API接口识别速度提升5倍以上,耗时仅音频时长十分之一

产品优势

技术领先

采用领先国际的流式端到端建模方法SMLTA,近场普通话语音识别准确率可达98%

01

简单快速

采用最新识别解码技术,识别速度提升5倍以上,极速返回识别结果

02

高效稳定

专有GPU服务集群、提供企业级的稳定服务,弹性灵活的高并发承载及高可靠性保障

03

render.title

产品定价

background

次数包预付费

适用于调用量可预估的企业

免费调用量

5万次/企业账号

并发量

50(支持扩容)

服务器配置

专有GPU集群

服务稳定性

99.9%

次数

100万次-10亿次

background

调用量后付费

适用于不便预估调用量的企业

免费调用量

5万次/企业账号

并发量

50(支持扩容)

服务器配置

专有GPU集群

服务稳定性

99.9%

background

模型训练

适用于专业领域名词识别不准,需要对语音识别语言模型进行规模训练的客户

上传文本、词汇即可训练

专业评估,精准提升

模型自动上线专属使用

background

定价说明

本产品开通即享免费调用量,使用完毕后可选择次数包预付费或按量后付费两种计费方式,产生的计费调用量优先消耗次数包额度,超出部分按量阶梯计费

相关产品

零基础语音自训练平台
零基础语音自训练平台

使用业务场景语料,零代码自助训练语言模型,精准识别语音内容,有效提升业务领域识别准确率

查看详情>
在线语音合成
在线语音合成

基于业界领先的深度神经网络技术,提供高度拟人、流畅自然的语音合成服务,让您的应用、设备开口说话,更具个性

查看详情>
呼叫中心语音解决方案
呼叫中心语音解决方案

呼叫中心场景的端到端的语音技术解决方案,包括呼叫中心场景专属的8K采样率语音识别、语音合成、MRCP服务,助力企业更高效快速的接入呼叫中心语音能力

查看详情>
即刻获得语音识别能力 立即使用
即刻获得语音识别能力 立即使用
未登录
需要实名认证
去实名认证