语音识别iOS SDK

更新时间：2026-02-26

1. 文档说明

文档名称	语音识别集成文档
所属平台	iOS
提交日期	2025-12-30
概述	本文档是百度语音开放平台iOS SDK的用户指南，描述了短语音识别、离线自定义命令词识别、语音唤醒等相关接口的使用说明。SDK内部均为采用流式协议，即用户边说边处理。区别于Restapi需要上传整个录音文件。

2. 版本说明

名称	版本号
语音识别	3.0.13.0
系统支持	支持iOS 12.0及以上系统
架构支持	armv7、arm64
开发环境	工程内使用了LTO等优化选项，建议使用最新版本Xcode进行开发

3. SDK说明

文件名称	版本号	说明	MD5值	类型
libBDSpeechBaseKit.a	3.0.13.0	语音识别SDK （支持pcm、wav文件识别格式）	37e494d1117e519d3b7fff7a48d11dfb	静态库

Framework

Framework	描述
libc++.tbd	提供对C/C++特性支持
libz.1.2.5.tbd	提供gzip支持
libsqlite3.0.tbd	提供对本地数据库的支持
AudioToolbox	提供录音和播放支持
AVFoundation	提供录音和播放支持
CFNetwork	提供对网络访问的支持
CoreLocation	提供对获取设备地理位置的支持，以提高识别准确度
CoreTelephony	提供对移动网络类型判断的支持
SystemConfiguration	提供对网络状态检测的支持
GLKit	内置识别控件所需

4. 运行项目工程

4.1 获取鉴权信息

创建并获取APP_ID、API_KEY、SECRET_KEY等参数。并绑定你的移动应用的BundleId。官网平台地址https://cloud.baidu.com

4.2 在线识别鉴权参数配置说明

在线识别鉴权方式说明

开放平台使用API/SECRET KEY + APPID方式进行验证（历史版本）
（控制台申请的ak、sk 参考https://ai.baidu.com/ai-doc/SPEECH/4l9mh6qf9 完成项目创建后控制台可查询对应的ak、sk等信息）开放平台使用ACCESSTOKEN进行验证（新增）
（https://ai.baidu.com/ai-doc/REFERENCE/Lkru0zoz4）开放平台使用IAMKEY进行验证（新增）（https://cloud.baidu.com/doc/AI_REFERENCE/s/Hm5us339w）

ak、sk鉴权方式代码参考事例

Text

1//ak、sk鉴权
2// 参数传递 ak、sk以及平台获取的appid
3[[BDSpeechBaseKit sharedInstance] setASRLicenseWithAk:API_KEY AndSK:SECRET_KEY AndAppcode:APP_ID];

APIkey（IAMKEY）鉴权方式

Text

1 //iamkey鉴权
2[[BDSpeechBaseKit sharedInstance] setASRLicenseWithIamKey:IAM_KEY Andsk:SECRET_KEY AndAppCode:APP_ID];

token鉴权方式参考：

Text

1    // 临时token鉴权方式 参考demo中sendPostRequest方法中使用事例
2//    [[BDSpeechBaseKit sharedInstance] setASRLicenseWithAuthToken:token AndExpirationDate:result AndAk:API_KEY AndAppCode:APP_ID];

鉴权接口及参数说明

Text

1/**
2 // ak、sk方式鉴权
3 ak：控制台申请的对应鉴权apikey
4 sk：控制台申请的对应鉴权secretkey
5 code：控制台申请的appid
6 */
7- (void)setASRLicenseWithAk:(NSString *)ak AndSK:(NSString *)sk AndAppcode:(NSString *)code;
8
9/**
10 iamkey方式初始化鉴权
11 iamkey：申请的iamkey
12 code：申请的appid
13 */
14- (void)setASRLicenseWithIamKey:(NSString *)iamkey Andsk:(NSString *)ak AndAppCode:(NSString *)code;
15
16// 获取鉴权asr鉴权sdk版本号
17- (NSString *)getASRLibVersion;
18
19/**
20 token鉴权方式
21 token：申请的token
22 code：申请的appid
23 expirationDate：token过期时间戳（毫秒）
24 */
25- (void)setASRLicenseWithAuthToken:(NSString *)token AndExpirationDate:(long long)expirationDate AndAk:(NSString *)ak AndAppCode:(NSString *)code;
26
27/**
28 iamkey方式初始化鉴权
29 iamkey：申请的iamkey
30 code：申请的appid
31 expirationDate：iamkey过期时间（毫秒）
32 */
33- (void)setASRLicenseWithIAMKey:(NSString *)iamkey AndExpirationDate:(long long)expirationDate AndAk:(NSString *)ak AndAppCode:(NSString *)code;

demo完整示例参考：

Text

1- (void)viewDidLoad {
2    [super viewDidLoad];
3    // 语音识别鉴权库manager管理类初始化
4    self.asrEventManager = [[BDSpeechBaseKit sharedInstance] getBDSEventManager];
5    // 设置唤醒类
6    self.wakeupEventManager = [[BDSpeechBaseKit sharedInstance] getWakeupEventManager];
7    // pid初始化 默认1537
8    [self.asrEventManager setParameter:@"1537" forKey:BDS_ASR_PRODUCT_ID];
9    // 版本号
10    NSLog(@"Current SDK version: %@", [[BDSpeechBaseKit sharedInstance] getASRLibVersion]);
11    // 配置鉴权库获取token、iamkey协议 用于实现 gettoken iamkey 方法
12    [AuthManager sharedInstance].temporaryTokenAndKeyDelegate = self;
13    // 鉴权sdk层错误日志开启 默认NO不开启
14//    [[BDSpeechBaseKit sharedInstance] setAuthLogStatus:YES];
15    //设置DEBUG_LOG的级别 默认0不打开日志 设置6全部日志 其他方式不常用特定场景考虑
16    [self.asrEventManager setParameter:@(EVRDebugLogLevelTrace) forKey:BDS_ASR_DEBUG_LOG_LEVEL];
17    //ak、sk鉴权
18    [[BDSpeechBaseKit sharedInstance] setASRLicenseWithAk:API_KEY AndSK:SECRET_KEY AndAppcode:APP_ID];
19    //iamkey鉴权
20//  [[BDSpeechBaseKit sharedInstance] setASRLicenseWithIamKey:IAM_KEY Andsk:SECRET_KEY AndAppCode:APP_ID];
21    // 临时token鉴权方式 参考sendPostRequest方法中使用事例
22//    [[BDSpeechBaseKit sharedInstance] setASRLicenseWithAuthToken:token AndExpirationDate:result AndAk:API_KEY AndAppCode:APP_ID];
23    self.continueToVR = NO;
24    [[BDVRSettings getInstance] configBDVRClient];
25    //设置端点检测
26    [self configDNNMFE];
27}

提供用户自定义获取鉴权信息的能力

描述：为了满足「鉴权信息保存在server端，app通过请求server端获取access token」的需求，语音SDK需要提供鉴权信息回调点，并由用户最终实现回调接口。

Text

1步骤一：
2// 配置鉴权库获取token、iamkey协议 用于实现 gettoken iamkey 方法
3[AuthManager sharedInstance].temporaryTokenAndKeyDelegate = self;
4
5// 分别实现协议传入token、iamkey
6/**
7 客户实现get token 协议方法
8 */
9- (void)getToken {
10    ......
11    //客户业务侧处理获取token的逻辑
12    // demo示例发送请求
13     [self sendPostRequest];
14}
15
16/**
17 客户实现get iamkey 协议方法
18 */
19- (void)getIAMKey {
20    ......
21    //客户业务侧处理获取iamkey的逻辑
22    // demo示例发送请求
23     [self sendPostRequest];
24}
25
26步骤二：
27//获取网络权限判断逻辑
28    ......
29    ......
30    ......
31// 检查当前网络状态并尝试网络请求         
32[self checkNetworkStatusAndMakeRequest];       
33          
34          
35  // 检查网络权限是否生效
36- (void)checkNetworkStatusAndMakeRequest {
37    // 生效 即可做post请求获取token、有效期
38    ......
39    ......
40    ......
41    // 调用本地获取token的请求逻辑
42     [self sendPostRequest];
43}
44
45  // post请求 仅供参考
46-(void)sendPostRequest {
47 // 请求逻辑具体参考demo代码
48  ......
49  ......
50  请求拿到token后调用API接口完成token鉴权
51  // token 鉴权   成功：正常完成合成主流程鉴权通过。 失败：触发上述步骤一中的协议回调 重新获取有效token（此处以token为例） 
52  [[BDSpeechBaseKit sharedInstance] setASRLicenseWithAuthToken:@"请求获取的token" AndExpirationDate:@"请求获取的token有效期" AndAk:@"平台获取的apikey" AndAppCode:@"平台获取的appid"];
53}
54
55逻辑整理 1.遵循鉴权sdk内置协议 2.完成初始化请求token获取[self sendPostRequest]; 并在请求结果中设置对应的鉴权方式如 [[BDSpeechBaseKit sharedInstance] setASRLicenseWithAuthToken:@"请求获取的token" AndExpirationDate:@"请求获取的token有效期" AndAk:@"平台获取的apikey" AndAppCode:@"平台获取的appid"];3.成功后正常继续下一步，异常或请求token失败、token有效期到期等 SDK代理会监听到 触发getToken、getIamkey代理 进行重新处理逻辑 demo示例中做了重新获取token的操作 仅供参考 
56注：使用该方式为了满足 「鉴权信息保存在server端，app通过请求server端获取access token」的需求，语音SDK需要提供 鉴权信息回调点，并由用户最终实现 回调接口。

4.3 下载语音识别SDK

在SDK下载页面下载 语音识别IOS SDK 文件，链接：https://ai.baidu.com/sdk

4.4 填写鉴权信息

全局搜索 “#error” 填入 AppID、API Key、Secret Key IAM_KEY鉴权信息测试，请按照以下步骤全部修改（参数信息参考4.2鉴权参数设置）：

4.5 测试语音识别功能

按照上述文档修改完成后，安装app打开后可进行在线语音识别：

简单的语音识别IOS SDK 测试完成了，其他各子功能可以按照详细的技术文档进行集成。

5. 集成步骤

5.1添加静态库及资源文件、头文件以及对应的Framework

添加头文件

识别相关

如果只需要使用识别功能，只需要引入如下头文件：

Text

1#import "BDSEventManager.h"
2#import "BDSASRDefines.h"
3#import "BDSASRParameters.h"
4#import "BDSpeechBaseKit.h"
5#import "AuthManager.h"

唤醒相关

如果需要使用离线唤醒功能，需要引入如下头文件：

Text

1#import "BDSWakeupDefines.h"
2#import "BDSWakeupParameters.h"

内置识别控件

如果需要使用内置识别控件，需要引入如下头文件：

Text

1#import "BDTheme.h"
2#import "BDRecognizerViewParamsObject.h"
3#import "BDRecognizerViewController.h"
4#import "BDRecognizerViewDelegate.h"

网络权限相关

Text

1#import "Reachability.h"

添加静态库

SDK提供的是静态库，开发者只需要将库文件拖入工程目录即可。对静态库有以下几点说明：

Text

11. 静态库采用lipo命令将armv7，arm64的静态库合并成的一个通用的库文件，避免开发者在编译不同target时频繁替换的问题；
22. 模拟器版本只支持在线识别，不支持离线识别及唤醒功能;

添加所需资源

提示音文件及识别控件所需主题文件

将开发包中BDSClientResource/ASR/BDSClientResources目录以“create folder references”方式添加到工程的资源Group中，注意使用"create groups"方式添加不能生效。

离线识别及唤醒所需资源文件

将开发包中BDSClientResource/ASR/BDSClientEASRResources目录以"create groups"方式添加到工程目录下即可，资源文件说明如下：

文件名	说明
bds_easr_gramm.dat	离线识别引擎语法模式所需语法文件，在开放平台编辑自定义语法文件
bds_easr_basic_model.dat	基础资源文件，用于modelVAD、唤醒、离线语音识别语法模式
bds_easr_wakeup_words.dat	唤醒引擎所需唤醒词文件，在开放平台编辑自定义唤醒词
bds_easr_mfe_dnn.dat	基础资源文件，用于DNNMFE、唤醒、离线语音识别语法模式
bds_easr_mfe_cmvn.dat	MFE CMVN文件,用于DNNMFE
bds_easr_dnn_wakeup_model.dat	用于DNNWakeup的模型文件

6. 相关授权文件

请将百度云控制台创建应用时获取的语音(APPID)、API/SECRET KEY 并填写包名。

在线识别与唤醒都需要进行相关验证后方可使用：

引擎类型	验证方法
在线识别	开放平台使用API/SECRET KEY + APPID进行验证（包含新增token鉴权、iamkey鉴权）
离线识别	使用APPID+包名首次联网自动下载授权文件进行验证
唤醒引擎	与离线识别验证方法一致

7. 语音相关接口调用流程

7.1语音识别

语音识别包含数据上传接口和离在线识别接口，接口概述如下：

Text

11. 创建相关接口对象 (createEventManagerWithName:)
22. 设置代理对象 (setDelegate:)
33. 配置参数 (setParameter:forKey:)
44. 发送预定义指令 (sendCommand:)
55. 参数列表及相关预定义值可参考附录，或相关parameters头文件、defines头文件

在线语音识别支持识别任意词，离线语音识别仅支持命令词识别（语法模式）。

单次短语音识别最长限制60秒。

7.1.1在线识别

Text

1// 创建语音识别对象
2self.asrEventManager = [[BDSpeechBaseKit sharedInstance] getBDSEventManager];
3// pid初始化 默认1537
4[self.asrEventManager setParameter:@"1537" forKey:BDS_ASR_PRODUCT_ID];
5// 设置语音识别代理
6[self.asrEventManager setDelegate:self];
7// 配置鉴权库获取token、iamkey协议 用于实现 gettoken iamkey 方法
8[AuthManager sharedInstance].temporaryTokenAndKeyDelegate = self;
9// 参数配置：ak、sk在线鉴权认证
10[[BDSpeechBaseKit sharedInstance] setASRLicenseWithAk:API_KEY AndSK:SECRET_KEY AndAppcode:APP_ID];
11// 发送指令：启动识别
12[self.asrEventManager sendCommand:BDS_ASR_CMD_START];

识别功能代理

Text

1@protocol BDSClientASRDelegate<NSObject>
2- (void)VoiceRecognitionClientWorkStatus:(int)workStatus obj:(id)aObj;
3@end

语音识别状态、录音数据等回调均在此代理中发生，具体事件请参考Demo工程中对不同workStatus的处理流程。

7.1.2离在线并行识别

Text

1// 创建语音识别对象
2self.asrEventManager = [BDSEventManager createEventManagerWithName:BDS_ASR_NAME];
3// 设置语音识别代理
4[self.asrEventManager setDelegate:self];
5// 参数配置：在线身份验证
6[[BDSpeechBaseKit sharedInstance] setASRLicenseWithAk:API_KEY AndSK:SECRET_KEY AndAppcode:APP_ID];
7// 参数设置：识别策略为离在线并行
8[self.asrEventManager setParameter:@(EVR_STRATEGY_BOTH) forKey:BDS_ASR_STRATEGY];
9// 参数设置：离线识别引擎类型
10[self.asrEventManager setParameter:@(EVR_OFFLINE_ENGINE_GRAMMER) forKey:BDS_ASR_OFFLINE_ENGINE_TYPE];
11// 参数配置：命令词引擎语法文件路径。请从控制台的左侧功能栏进入“离线词&语义设置”模块，根据页面上的引导自行定义词条和语法，并生成bsg文件。下载语法文件后，替换BDS_ASR_OFFLINE_ENGINE_GRAMMER_FILE_PATH参数
12[self.asrEventManager setParameter:@"命令词引擎语法文件路径" forKey:BDS_ASR_OFFLINE_ENGINE_GRAMMER_FILE_PATH];
13// 参数配置：命令词引擎语言模型文件路径
14[self.asrEventManager setParameter:@"命令词引擎语言模型文件路径" forKey:BDS_ASR_OFFLINE_ENGINE_DAT_FILE_PATH];
15// 发送指令：加载离线引擎
16[self.asrEventManager sendCommand:BDS_ASR_CMD_LOAD_ENGINE];
17// 发送指令：启动识别
18[self.asrEventManager sendCommand:BDS_ASR_CMD_START];

关于离线识别

注意
在线识别效果远优于离线识别，不推荐使用离线识别。
首次使用离线，SDK将会后台下载离线授权文件，成功后，授权文件有效期（三年）内无需联网。有效期即将结束后SDK将自动多次尝试联网更新证书)。

使用离线识别必须正确配置BDS_ASR_OFFLINE_APP_CODE，并设置BDS_ASR_STRATEGY为离线在线并行。

离线识别可识别自定义语法规则下的词，如“打电话给王五”，“打开微信”等。

请在语音控制台的左侧功能栏中，进入“离线词&语义设置”模块，根据页面上的引导自行定义词条和语法，并生成bsg文件。下载语法文件后，设置BDS_ASR_OFFLINE_ENGINE_GRAMMER_FILE_PATH参数

具体示例如下：

Text

1NSString* gramm_filepath = [[NSBundle mainBundle] pathForResource:@"bds_easr_gramm" ofType:@"dat"];;
2NSString* lm_filepath = [[NSBundle mainBundle] pathForResource:@"bds_easr_basic_model" ofType:@"dat"];;
3NSString* wakeup_words_filepath = [[NSBundle mainBundle] pathForResource:@"bds_easr_wakeup_words" ofType:@"dat"];;
4[self.asrEventManager setDelegate:self];
5[self.asrEventManager setParameter:APP_ID forKey:BDS_ASR_OFFLINE_APP_CODE];
6[self.asrEventManager setParameter:lm_filepath forKey:BDS_ASR_OFFLINE_ENGINE_DAT_FILE_PATH];
7// 请在 (官网)[http://speech.baidu.com/asr] 参考模板定义语法，下载语法文件后，替换BDS_ASR_OFFLINE_ENGINE_GRAMMER_FILE_PATH参数
8[self.asrEventManager setParameter:gramm_filepath forKey:BDS_ASR_OFFLINE_ENGINE_GRAMMER_FILE_PATH];
9[self.asrEventManager setParameter:wakeup_words_filepath forKey:BDS_ASR_OFFLINE_ENGINE_WAKEUP_WORDS_FILE_PATH];

7.1.3长语音识别

长语音识别对语音时长无限制，其本质是在本地进行VAD之后，由服务端逐句识别。

Text

1[self.asrEventManager setParameter:@(NO) forKey:BDS_ASR_NEED_CACHE_AUDIO];
2[self.asrEventManager setParameter:@"" forKey:BDS_ASR_OFFLINE_ENGINE_TRIGGERED_WAKEUP_WORD];
3[self.asrEventManager setParameter:@(YES) forKey:BDS_ASR_ENABLE_LONG_SPEECH];
4// 长语音请务必开启本地VAD
5[self.asrEventManager setParameter:@(YES) forKey:BDS_ASR_ENABLE_LOCAL_VAD];

使用长语音必须开启本地VAD: BDS_ASR_ENABLE_LOCAL_VAD

使用长语音必须关闭提示音（Known issue）

7.1.4VAD

端点检测，即自动检测音频输入的起始点和结束点。SDK默认开启VAD，检测到静音后自动停止识别。 如果需要自行控制识别结束需关闭VAD，请同时关闭服务端VAD与端上VAD：

Text

1// 关闭服务端VAD
2[self.asrEventManager setParameter:@(NO) forKey:BDS_ASR_ENABLE_EARLY_RETURN];
3// 关闭本地VAD
4[self.asrEventManager setParameter:@(NO) forKey:BDS_ASR_ENABLE_LOCAL_VAD];

目前SDK支持两种本地端点检测方式。说明如下：

识别策略	说明
ModelVAD	检测更加精准，抗噪能力强，响应速度较慢
DNNMFE	提供基础检测功能，性能高，响应速度快

使用ModelVAD、DNN需通过参数配置开启该功能，并配置相应资源文件（基础资源文件）

7.1.4.1ModelVAD

Text

1//获取VAD模型的路径
2NSString *modelVAD_filepath = [[NSBundle mainBundle] pathForResource:@"bds_easr_basic_model" ofType:@"dat"];
3//设置modelVAD的文件路径
4[self.asrEventManager setParameter:modelVAD_filepath forKey:BDS_ASR_MODEL_VAD_DAT_FILE];
5//设置ModelVAD可用
6[self.asrEventManager setParameter:@(YES) forKey:BDS_ASR_ENABLE_MODEL_VAD];

7.1.4.2DNNMFE

Text

1NSString *mfe_dnn_filepath = [[NSBundle mainBundle] pathForResource:@"bds_easr_mfe_dnn" ofType:@"dat"];
2//设置MFE模型文件
3[self.asrEventManager setParameter:mfe_dnn_filepath forKey:BDS_ASR_MFE_DNN_DAT_FILE];
4NSString *cmvn_dnn_filepath = [[NSBundle mainBundle] pathForResource:@"bds_easr_mfe_cmvn" ofType:@"dat"];
5//设置MFE CMVN文件路径
6[self.asrEventManager setParameter:cmvn_dnn_filepath forKey:BDS_ASR_MFE_CMVN_DAT_FILE];

DNNMFE 支持设置静音时长（需要同时关闭服务端VAD与端上VAD）。设置以下两个参数，单位为帧数，每帧10ms。如需设置为 5s：

Text

1[self.asrEventManager setParameter:@(501.f) forKey:BDS_ASR_MFE_MAX_SPEECH_PAUSE];
2[self.asrEventManager setParameter:@(500.f) forKey:BDS_ASR_MFE_MAX_WAIT_DURATION];

必须为浮点类型。

7.2语音唤醒

语音唤醒，需要配置所需语言模型文件(基础资源文件)及官网导出的自定义唤醒词文件，配置后加载引擎，即可进行开始唤醒。需要注意的是，唤醒引擎开启后会保持录音机为启动状态，用户说出正确的唤醒词后会触发唤醒，通过相关回调反馈给应用程序。

语音唤醒为离线功能，需配置离线授权信息(APP_ID)，加载唤醒所需语言模型文件，接口与语音识别接口相同。

基于多种因素考虑，在App进入后台后，唤醒将会被打断。

7.2.1代码示例

Text

1// 创建语音识别对象
2self.wakeupEventManager = [BDSEventManager createEventManagerWithName:BDS_WAKEUP_NAME];
3// 设置语音唤醒代理
4[self.wakeupEventManager setDelegate:self];
5// 参数配置：离线授权APPID
6[self.wakeupEventManager setParameter:APP_ID forKey:BDS_WAKEUP_APP_CODE];
7// 参数配置：唤醒语言模型文件路径, 默认文件名为 bds_easr_basic_model.dat
8[self.wakeupEventManager setParameter:@"唤醒语言模型文件路径" forKey:BDS_WAKEUP_DAT_FILE_PATH];
9// 发送指令：加载语音唤醒引擎
10[self.wakeupEventManager sendCommand:BDS_WP_CMD_LOAD_ENGINE];
11//设置唤醒词文件路径
12// 默认的唤醒词文件为"bds_easr_wakeup_words.dat"，包含的唤醒词为"百度以下"
13// 如需自定义唤醒词，请在 http://ai.baidu.com/tech/speech/wake 中评估并下载唤醒词文件，替换此参数
14 [self.wakeupEventManager setParameter：@"唤醒词文件路径”forKey:BDS_WAKEUP_WORDS_FILE_PATH]
15// 发送指令：启动唤醒
16[self.wakeupEventManager sendCommand:BDS_WP_CMD_START];

7.2.2唤醒功能回调接口

Text

1@protocol BDSClientWakeupDelegate<NSObject>
2- (void)WakeupClientWorkStatus:(int)workStatus obj:(id)aObj;
3@end

7.2.3唤醒辅助识别

使用唤醒的一种需求场景是唤醒后立刻识别，以唤醒词为百度以下举例，用户可能的输入为百度以下，北京天气怎么样？如果开发者需要对该种场景进行支持，请按如下操作：

正确配置唤醒引擎，语言模型文件及唤醒词文件，并加载引擎；

开启唤醒，接收用户语音输入；

在唤醒的唤醒词触发回调中，配置BDS_ASR_NEED_CACHE_AUDIO为YES到识别引擎，正常识别请将该值设为NO；

调用识别引擎开启识别过程；

Text

1// 如需要唤醒后立刻进行识别，为保证不丢音，启动语音识别前请添加如下配置，获取录音缓存：
2[self.asrEventManager setParameter:@(YES) forKey:BDS_ASR_NEED_CACHE_AUDIO];

8. 语音识别

8.1预定义命令

语音识别目前支持的命令如下：

命令	功能描述
BDS_ASR_CMD_START	启动识别
BDS_ASR_CMD_STOP	结束语音输入，等待识别完成
BDS_ASR_CMD_CANCEL	取消本次识别
BDS_ASR_CMD_LOAD_ENGINE	加载离线引擎，如使用离线识别，在启动识别前需调用此命令
BDS_ASR_CMD_UNLOAD_ENGINE	卸载离线引擎，如改变离线配置参数，需重新加载离线引擎

8.2参数说明

通过配置不同的参数，语音识别提供丰富的功能，说明如下：

在线引擎身份验证

参数名称	说明
BDS_ASR_API_SECRET_KEYS	开放平台设置API_KEY and SECRET_KEY
BDS_ASR_IAM_APIKEY	开放平台设置IAMKEY
BDS_ASR_ACCESS_TOKEN	开放平台设置TOKEN
BDS_ASR_PRODUCT_ID	内部产品设置产品ID

离线引擎身份验证

参数名称	说明
BDS_ASR_OFFLINE_LICENSE_FILE_PATH	离线授权文件路径
BDS_ASR_OFFLINE_APP_CODE	离线授权所需APPCODE（APPID），如使用该方式进行正式授权，请移除临时授权文件

识别器参数配置

参数名称	说明
BDS_ASR_SAMPLE_RATE	设置录音采样率，自动模式根据当前网络情况自行调整
BDS_ASR_STRATEGY	语音识别策略
BDS_ASR_LANGUAGE	设置识别语言
BDS_ASR_ENABLE_NLU	开启语义解析，将返回包含语义的json串
BDS_ASR_DISABLE_PUNCTUATION	关闭输出标点
BDS_ASR_PUNCTUATION_EXT_MOD	扩展标点模式，使用请确保BDS_ASR_DISABLE_PUNCTUATION参数为NO
BDS_ASR_ENABLE_LOCAL_VAD	是否需要对录音数据进行端点检测，如果关闭，请同时关闭服务端提前返回
BDS_ASR_ENABLE_EARLY_RETURN	服务端开启提前返回，即允许服务端在未收到客户端发送的结束标志前提前结束识别过程
BDS_ASR_ENABLE_MODEL_VAD	是否使用ModelVAD，打开需配置资源文件参数
BDS_ASR_MODEL_VAD_DAT_FILE	ModelVAD所需资源文件路径
BDS_ASR_VAD_ENABLE_LONG_PRESS	设置VAD模式为长按（特殊情况设置）
BDS_ASR_MFE_DNN_DAT_FILE	设置MFE模型文件
BDS_ASR_MFE_CMVN_DAT_FILE	设置MFE CMVN文件路径
BDS_ASR_MFE_MAX_WAIT_DURATION	设置DNNMFE最大等待语音时间
BDS_ASR_MFE_MAX_SPEECH_PAUSE	设置DNNMFE切分门限
BDS_ASR_ENABLE_LONG_SPEECH	是否启用长语音识别

音频相关

参数名称	说明
BDS_ASR_AUDIO_FILE_PATH	设置音频文件路径（数据源）支持wav、pcm格式
BDS_ASR_AUDIO_FILE_RATE	设置音频文件采样率（必须与音频文件本身采样率匹配）支持8k、16k设置
BDS_ASR_AUDIO_INPUT_STREAM	设置音频输入流（数据源）
BDS_ASR_PLAY_TONE	识别提示音设置，需添加相应声音文件，可替换
BDS_ASR_DISABLE_AUDIO_OPERATION	屏蔽SDK内部设置AudioSession的Active状态

日志级别

参数名称	说明
BDS_ASR_DEBUG_LOG_LEVEL	指定调试日志级别

离线识别相关

参数名称	说明
BDS_ASR_OFFLINE_ENGINE_TYPE	离线识别引擎类型
BDS_ASR_OFFLINE_ENGINE_DAT_FILE_PATH	离线识别资源文件路径
BDS_ASR_OFFLINE_ENGINE_GRAMMER_FILE_PATH	离线识别语法文件路径
BDS_ASR_OFFLINE_ENGINE_GRAMMER_SLOT	语法模式离线语法槽，使用该参数更新离线语法文件

唤醒后立刻识别相关

参数名称	说明
BDS_ASR_OFFLINE_ENGINE_WAKEUP_WORDS_FILE_PATH	唤醒词文件路径，使用了唤醒并使用离线语法识别的情况下需要设置，其他情况请忽略该参数
BDS_ASR_OFFLINE_ENGINE_TRIGGERED_WAKEUP_WORD	当前触发唤醒词，唤醒后立即调用识别的情况下配置，其他情况请忽略该参数
BDS_ASR_NEED_CACHE_AUDIO	唤醒后立刻进行识别需开启该参数，其他情况请忽略该参数

服务端配置相关

参数名称	说明
BDS_ASR_SERVER_URL	设置服务器地址
BDS_ASR_BROWSER_USER_AGENT	设置浏览器标识(Http request header)，资源返回时会根据UA适配

识别状态

语音识别回调状态如下：

识别状态	返回值说明	功能描述
EVoiceRecognitionClientWorkStatusStartWorkIng	nil	识别工作开始，开始采集及处理数据
EVoiceRecognitionClientWorkStatusStart	nil	检测到用户开始说话
EVoiceRecognitionClientWorkStatusEnd	nil	本地声音采集结束结束，等待识别结果返回并结束录音
EVoiceRecognitionClientWorkStatusNewRecordData	NSData-原始音频数据	录音数据回调
EVoiceRecognitionClientWorkStatusFlushData	NSDictionary-中间结果	连续上屏
EVoiceRecognitionClientWorkStatusFinish	NSDictionary-最终识别结果	语音识别功能完成，服务器返回正确结果
EVoiceRecognitionClientWorkStatusMeterLevel	NSNumber:int-当前音量	当前音量回调
EVoiceRecognitionClientWorkStatusCancel	nil	用户取消
EVoiceRecognitionClientWorkStatusError	NSError-错误信息	发生错误
EVoiceRecognitionClientWorkStatusLoaded	nil	离线引擎加载完成
EVoiceRecognitionClientWorkStatusUnLoaded	nil	离线引擎卸载完成
EVoiceRecognitionClientWorkStatusChunkThirdData	NSData	CHUNK: 识别结果中的第三方数据
EVoiceRecognitionClientWorkStatusChunkNlu	NSData	CHUNK: 识别结果中的语义结果
EVoiceRecognitionClientWorkStatusChunkEnd	NSString	CHUNK: 识别过程结束
EVoiceRecognitionClientWorkStatusFeedback	NSString	Feedback: 识别过程反馈的打点数据
EVoiceRecognitionClientWorkStatusRecorderEnd	nil	录音机关闭，页面跳转需检测此时间，规避状态条 (iOS)
EVoiceRecognitionClientWorkStatusLongSpeechEnd	nil	长语音结束状态

9.语音唤醒

9.1预定义命令

语音唤醒目前支持的命令如下：

命令	功能描述
BDS_WP_CMD_START	启动唤醒
BDS_WP_CMD_STOP	关闭唤醒，释放内存需调用卸载命令
BDS_WP_CMD_LOAD_ENGINE	加载唤醒引擎
BDS_WP_CMD_UNLOAD_ENGINE	卸载唤醒引擎，如改变了引擎参数，请重新加载

9.2参数说明

为使唤醒引擎正常工作，开发者需了解以下参数：

基本配置

参数名称	说明
BDS_WAKEUP_WORDS_FILE_PATH	唤醒词文件路径，从开放平台获取该文件
BDS_WAKEUP_DAT_FILE_PATH	唤醒引擎模型文件路径
BDS_WAKEUP_APP_CODE	离线正式授权所需APPCODE，即APPID
BDS_WAKEUP_LICENSE_FILE_PATH	离线授权文件路径，正式授权需移除该文件
BDS_WAKEUP_WORK_QUEUE	指定SDK工作队列

音频相关

音频相关的参数与识别引擎共享，如同时使用，只需配置一次

参数名称	说明
BDS_WAKEUP_AUDIO_FILE_PATH	设置音频文件路径（数据源）
BDS_WAKEUP_AUDIO_INPUT_STREAM	设置音频输入流（数据源）
BDS_WAKEUP_DISABLE_AUDIO_OPERATION	屏蔽SDK内部设置AudioSession的Active状态

9.3唤醒状态

语音唤醒回调状态如下：

唤醒状态	返回值说明	功能描述
EWakeupEngineWorkStatusStarted	nil	引擎开始工作
EWakeupEngineWorkStatusStopped	nil	引擎关闭完成
EWakeupEngineWorkStatusLoaded	nil	唤醒引擎加载完成
EWakeupEngineWorkStatusUnLoaded	nil	唤醒引擎卸载完成
EWakeupEngineWorkStatusTriggered	NSString-唤醒词	命中唤醒词
EWakeupEngineWorkStatusError	NSError-错误信息	引擎发生错误

10.服务端错误码

请参照API 错误码汇总

11. 权限

名称	用途
Privacy - Microphone Usage Description	获取麦克风权限

12. 只使用在线识别能力

可以参照7.1.1在线识别代码，删除离线资源文件

语音识别Android SDK

语音识别 HarmonyOS SDK

语音技术

语音识别iOS SDK

1. 文档说明

2. 版本说明

3. SDK说明

Framework

4. 运行项目工程

4.1 获取鉴权信息

4.2 在线识别鉴权参数配置说明

4.3 下载语音识别SDK

4.4 填写鉴权信息

4.5 测试语音识别功能

5. 集成步骤

5.1添加静态库及资源文件、头文件以及对应的Framework

添加头文件

识别相关

唤醒相关

内置识别控件

网络权限相关

添加静态库

添加所需资源

提示音文件及识别控件所需主题文件

离线识别及唤醒所需资源文件

6. 相关授权文件

7. 语音相关接口调用流程

7.1语音识别

7.1.1在线识别

7.1.2离在线并行识别

关于离线识别

7.1.3长语音识别

7.1.4VAD

7.1.4.1ModelVAD

7.1.4.2DNNMFE

7.2语音唤醒

7.2.1代码示例

7.2.2唤醒功能回调接口

7.2.3唤醒辅助识别

8. 语音识别

8.1预定义命令

8.2参数说明

在线引擎身份验证

离线引擎身份验证

识别器参数配置

音频相关

日志级别

离线识别相关

唤醒后立刻识别相关

服务端配置相关

识别状态

9.语音唤醒

9.1预定义命令

9.2参数说明

基本配置

音频相关

9.3唤醒状态

10.服务端错误码

11. 权限

12. 只使用在线识别能力