拼音相似度比较 简介 本java demo能将中文转换为拼音,并比较拼音相似度;进而可以在一组候选词中,找到读音与搜索词最为接近的词组。 该工具能够有效解决同音词、相似发音词、发音不标准等特殊情况下的语音识别。 例如,在通讯录场景下,如果用户需要识别的正确联系人是“张三”,但语音识别接口返回的结果可能是“张山”;此时则可以将用户的联系人列表和“张山”作为输入,通过本工具查找出与“张山”最匹配的结果
产品更新动态 2024-04-02 【远场语音识别模型下线公告】 尊敬的百度语音客户您好!百度远场语音识别产品历史接口及模型资源整合升级,为您提供更优质的产品效果及使用体验。 以下模型资源将于4月30日下线 ,为避免影响您的服务,请您尽快将服务切换升级: dev_pid=1936(1936、19361、19362、19363) 升级方式: 远场语音识别相关合作需求,您可提交 合作咨询 ,我们将尽快
呼叫中心语音-音频文件转写(8K) 接口描述 音频文件转写接口可以将大批量的音频文件异步转写为文字。适合音视频字幕生产、批量录音质检、会议内容总结、录音内容分析等场景,一般12小时内返回识别接口。 步骤 : 1、根据音频url、音频格式、语言id以及采样率等参数创建音频转写任务,获取task_id参数。 2、根据task_id的数组批量查询音频转写任务结果。 在线调试&示例代码 您可以在
开源VAD音频切分工具 简介 由于百度rest api接口有60s的音频时长限制,使用此demo可以粗略地按照静音切分音频。 项目地址: https://github.com/Baidu-AIP/speech-vad-demo 集成 webrtc 开源项目,vad模块,具体算法 GMM (Gaussian Mixture Model)。 注意这个是开源项目,效果远不如与百度语音LInux C++
在线合成REST-API-C#-SDK 快速入门 安装语音合成 C# SDK C# SDK 现已开源! https://github.com/Baidu-AIP/dotnet-sdk 支持平台:.Net Framework 3.5 4.0 4.5, .Net Core 2.0 方法一:使用Nuget管理依赖 (推荐) 在NuGet中搜索 Baidu.AI ,安装最新版即可。 packet地址 ht
短语音识别REST-API-C#SDK 安装语音识别 C# SDK C# SDK 现已开源! https://github.com/Baidu-AIP/dotnet-sdk 支持平台:.Net Framework 3.5 4.0 4.5, .Net Core 2.0 方法一:使用Nuget管理依赖 (推荐) 在NuGet中搜索 Baidu.AI ,安装最新版即可。 packet地址 https:/
短语音识别REST-API-PythonSDK 安装语音识别 Python SDK 语音识别 Python SDK目录结构 ├── README.md ├── aip //SDK目录 │ ├── __init__.py //导出类 │ ├── base.py //aip基类 │ ├── http.py //http请求 │ └── speech.py //语音识别 └── setup.py //s
音频文件转写极速版API-邀测 接口描述 支持提取视频、音频文件中的语音内容,极速返回识别结果及时间戳,适用于对实时性有一要求的内容分析、字幕生产、录音转写场景。 (本接口处于邀测阶段,请提交 合作咨询 申请测试) 请求说明 请求接口: https://aip.baidubce.com/rest/2.0/speech/publiccloudspeech/v1/asr/topspeed HTTP 方
音频文件转写API 接口描述 音频文件转写接口可以将大批量的音频文件异步转写为文字。适合音视频字幕生产、批量录音质检、会议内容总结、录音内容分析等场景,一般12小时内返回识别接口。 步骤 : 1、根据音频url、音频格式、语言id以及采样率等参数创建音频转写任务,获取task_id参数。 2、根据task_id的数组批量查询音频转写任务结果。 在线调试&示例代码 您可以在 示例代码中心
音色列表 页面描述 本页面为调用发音人所属音库、发音人名称、调用per参数等信息。 试听demo 试听demo请点击 发音人详情 音库类型 发音人名称 per参数 场景 支持语言 调用权限 基础音库 度小美-标准女主播 0 资讯 中文/英文 直接调用 基础音库 度小宇-亲切男声 1 对话助手 中文/英文 直接调用 基础音库 度逍遥-情感男声 3 小说 中文/英文 直接调用 基础音库 度丫丫-童声