实时语音识别

基于Deep Peak2的端到端建模，将音频流实时识别为文字，并返回每句话的开始和结束时间，适用于长句语音输入、音视频字幕、会议等场景

查看详情

爱语音技术内容精选

短文本在线合成API - 语音技术
但是音频内容不是语音识别要求的自然人发音，所以识别效果会受影响。
查看更多>>
[AI行业案例]-语音合成技术让您可以随时随地“听”文档
使用产品语音合成支持与交流 AI社区教学视频文档中心 SDK下载语音合成技术让您可以随时随地“听”文档价值成果百度语音合成技术可对大篇幅文档进行语音播放，支持多种情感化朗读方式、语速设置等，合成体验清晰、流畅、自然，带来非常好的用户体验。案例故事核心诉求随着科技的不断进步，移动阅读因其便捷性逐渐成为主流阅读方式，满足用户在不同时间与空间中的阅读需求。
查看更多>>

爱语音技术更多内容

短语音识别REST-API-C#SDK - 语音技术
新建交互类 Baidu.Aip.Speech.Asr是语音识别的交互类，为使用语音识别的开发人员提供了一系列的交互方法。
查看更多>>
短语音识别REST-API-PythonSDK - 语音技术
新建AipSpeech AipSpeech是语音识别的Python SDK客户端，为使用语音识别的开发人员提供了一系列的交互方法。
查看更多>>
短语音识别REST-API-C++SDK - 语音技术
语音文件的格式，pcm 或者 wav 或者 amr。
查看更多>>
开源VAD音频切分工具 - 语音技术
注意这个是开源项目，效果远不如与百度语音LInux C++ SDK ，Android及iOS SDK自带的VAD功能，切割的文件需为pcm(16000采样率小端序 16bits)的格式，其他格式需要提前转换，切割后也是pcm文件原理一个FRAME时长默认10s，通过webrtc的vad计算这个FRAME是否是活动（ACTIVE: 有声音， INACTIVE：静音）。
查看更多>>
拼音相似度比较 - 语音技术
该工具能够有效解决同音词、相似发音词、发音不标准等特殊情况下的语音识别。例如，在通讯录场景下，如果用户需要识别的正确联系人是“张三”，但语音识别接口返回的结果可能是“张山”；此时则可以将用户的联系人列表和“张山”作为输入，通过本工具查找出与“张山”最匹配的结果，有效提高结果的准确率。具体可参考下方的示例。
查看更多>>
在线合成REST-API-C#-SDK - 语音技术
新建交互类 Baidu.Aip.Speech.Tts是语音合成的交互类，为使用语音合成的开发人员提供了一系列的交互方法。
查看更多>>
在线合成REST-API-Python-SDK - 语音技术
新建AipSpeech AipSpeech是语音合成的Python SDK客户端，为使用语音合成的开发人员提供了一系列的交互方法。
查看更多>>
在线合成REST-API-C++-SDK - 语音技术
接口说明语音合成接口描述基于该接口，开发者可以轻松的获取语音合成能力请求说明合成文本长度必须小于1024字节，如果本文长度较长，可以采用多次请求的方式。
查看更多>>

实时语音识别

短文本在线合成API - 语音技术

[AI行业案例]-语音合成技术让您可以随时随地“听”文档

短语音识别REST-API-C#SDK - 语音技术

短语音识别REST-API-PythonSDK - 语音技术

短语音识别REST-API-C++SDK - 语音技术

开源VAD音频切分工具 - 语音技术

拼音相似度比较 - 语音技术

在线合成REST-API-C#-SDK - 语音技术

在线合成REST-API-Python-SDK - 语音技术

在线合成REST-API-C++-SDK - 语音技术

热门活动

新闻动态

最新活动

相关主题

热门产品