适用场景: 语音助手、情感陪伴、呼叫中心、在线教育、智能硬件 接入文档: 端到端语音语言大模型Android SDK 、 端到端语音语言大模型iOS SDK 2025-06-06 语音合成、识别支持HarmonyOS SDK 产品分类: 语音合成、语音识别 功能描述: 支持将语音合成与语音识别能力集成至HarmonyOS系统应用,支持无网或弱网环境下的文字合成语音与语音快速准确识别为文字。
资源领取&应用创建 本文主要介绍如何快速开通语音技术服务,并完成接口调用。 一、注册及实名认证 使用百度智能云语音识别服务前,您需要一个百度智能云账号并完成实名认证。具体操作如下: 注册并登录百度智能云平台,请参考 注册 和 登录 。个人用户可以直接使用自己的百度账号进行 登录 ,企业用户建议 注册账号 ,避免后续人员变动带来的账号归属问题。 完成实名认证,操作细节请参考 实名认证 。
日志中会打印相应错误码,它们的含义如下: err_no 含义 0 正确 -1 用户挂断 -2 音频质量问题,可能全是静音 -3 音频过长(超过默认55秒) -10 语音识别/合成后端未知错误 -11 等待用户语音超时 -12 语音解码器错误 -13 与后端连接被关闭 -14 等待后端结果超时 -15 连接百度服务鉴权失败 -16 连接百度服务失败 -17 语音识别失败 -20 语音合成文本为空 -
语音合成 Android SDK 1. 文档说明 文档名称 语音离线合成集成文档 所属平台 Android 提交日期 2025-11-11 概述 本文档是百度语音开放平台Andriod SDK的用户指南,描述了 在线合成,离线合成 等相关接口的使用说明。 合成的策略是边下载边播放,区别于Rest Api一次性下载整个录音文件。
当次数包/字符包内剩余额度为零时,系统会自动切换为“按调用量阶梯后付费”的计费策略;直至账户内余额不足以支付因调用产生的费用,此时语音识别服务暂停,用户则无法正常使用语音识别服务。用户重新购买次数包/字符包或给账户充值后,语音识别服务将恢复正常。
简介 简介 Hi,您好,欢迎使用百度语音合成服务。 本文档主要针对开发者,描述百度语音合成接口服务的相关技术内容。如果您对文档内容有任何疑问,可以通过以下几种方式联系我们: 在百度云控制台内 提交工单 ,咨询问题类型请选择 人工智能服务 ; QQ群快速沟通: AI开放平台官网首页 底部“QQ支持群”中,查找“百度语音”。
新建AipSpeech AipSpeech是语音识别的Java客户端,为使用语音识别的开发人员提供了一系列的交互方法。
二、API Key鉴权机制 API Key是百度智能云全新推出的鉴权方式,主要面向以下两个目标: 跨产品调用服务 。同一个API Key可同时调用AI开放能力( 文字识别 、 人脸识别 、 语音技术 等)、大模型服务与开发平台 ModelBuilder 、大模型应用开发平台 AppBuilder 的接口服务,降低您接入AI服务的成本。 简化调用步骤 。
该工具能够有效解决同音词、相似发音词、发音不标准等特殊情况下的语音识别。 例如,在通讯录场景下,如果用户需要识别的正确联系人是“张三”,但语音识别接口返回的结果可能是“张山”;此时则可以将用户的联系人列表和“张山”作为输入,通过本工具查找出与“张山”最匹配的结果,有效提高结果的准确率。具体可参考下方的示例。
语音合成 iOS SDK 1. 文档说明 文档名称 语音合成集成文档 所属平台 iOS 提交日期 2025-11-10 概述 本文档是百度离线语音合成iOS SDK的用户指南,描述了 离线语音合成SDK 相关接口的使用说明。