呼叫中心语音-音频文件转写(8K)
更新时间:2024-08-16
接口描述
音频文件转写接口可以将大批量的音频文件异步转写为文字。适合音视频字幕生产、批量录音质检、会议内容总结、录音内容分析等场景,一般12小时内返回识别接口。
步骤: 1、根据音频url、音频格式、语言id以及采样率等参数创建音频转写任务,获取task_id参数。 2、根据task_id的数组批量查询音频转写任务结果。
在线调试&示例代码
您可以在 示例代码中心 中调试该接口,可进行签名验证、查看在线调用的请求内容和返回结果、示例代码的自动生成。
Python Demo 点击下载 (文件为.zip压缩包,若无法打开时,可尝试在文件后上增加".zip“后缀)
创建音频转写任务-请求说明
请求接口:https://aip.baidubce.com/rpc/2.0/aasr/v1/create
HTTP 方法:POST
URL参数:
| 参数 | 取值 | 
|---|---|
| access_token | 通过 API Key 和 Secret Key 获取的 access_token,参考Access Token获取 | 
JSON方式上传音频
Body中放置请求参数,语音数据和其他参数通过标准 JSON 格式串行化 POST 上传,包括的参数如下:
| 参数名 | 类型 | 是否必需 | 对外状态 | 取值范围 | 
|---|---|---|---|---|
| speech_url | str | 是 | 音频url | 可使用百度云对象存储进行音频存储,生成云端可外网访问的url链接,音频大小不超过500MB | 
| format | str | 是 | 音频格式 | ["mp3", "wav", "pcm","m4a","amr"]编码 16bits 位深 | 
| pid | int | 是 | 语言类型 | [1134(呼叫中心中文普通话)] | 
| rate | int | 是 | 采样率 | [8000]固定值 | 
| channel | int | 否 | 声道 | [1、2] | 
若音频采样率为16k,请使用音频文件转写
Body请求示例:
                Plain Text
                
            
            1{
2    "speech_url": "https://platform.bj.bcebos.com/sdk%2Fasr%2Fasr_doc%2Fdoc_download_files%2F16k.pcm",
3    "format": "pcm",
4    "pid": 1134,
5    "rate": 8000,
6    "channel": 1    //双声道按声道识别请输入“2”
7}
            创建音频转写任务-返回说明
返回参数
| 参数名 | 类型 | 是否必需 | 对外状态 | 
|---|---|---|---|
| log_id | int | 是 | log id | 
| task_id | str | 否 | 任务id | 
| task_status | str | 否 | 任务状态 | 
| error_code | int | 否 | 错误码 | 
| error_msg | str | 否 | 错误信息 | 
Body返回示例:
                Plain Text
                
            
            1 # 创建成功
2{
3    "log_id": 12345678,
4    "task_status": "Created",
5    "task_id":  "234acb234acb234acb234acb"  #注意保存该id,用于后续请求识别结果
6}
7 # 创建失败,缺少参数
8{
9    "error_code": 336203,
10    "error_msg": "missing param: speech_url",
11    "log_id": 5414433131138366128
12}
            注意:查询识别结果时,需要该步骤返回的task_id来进行请求。请注意保存task_id列表。
查询音频转写任务-请求说明
请求接口:https://aip.baidubce.com/rpc/2.0/aasr/v1/query
HTTP 方法:POST
URL参数:
| 参数 | 取值 | 
|---|---|
| access_token | 通过API Key和Secret Key获取的access_token,参考Access Token获取 | 
Body中放置请求参数,参数如下:
| 参数名 | 类型 | 是否必需 | 描述 | 取值范围 | 
|---|---|---|---|---|
| task_ids | list | 是 | 任务id | task_ids为空,返回空任务结果列表;单次查询任务数不超过200个 | 
请求示例:
                Plain Text
                
            
            1{
2    "task_ids":  ["234acb234acb234acb234acb", "234acb234acb234acb234acd", "234acb234acb234acb234acbe"]
3}
            查询音频转写任务-返回说明
返回参数:
| 参数名 | 类型 | 是否必需 | 
|---|---|---|
| log_id | int | 是 | 
| tasks_info | list | 否 | 
| +task_id | str | 是 | 
| +task_status | str | 是 | 
| +task_result | dict | 否 | 
| ++corpus_no | str | 否 | 
| ++result | str | 否 | 
| ++detailed_result | list | 否 | 
| ++err_no | int | 否 | 
| ++err_msg | str | 否 | 
| ++sn | str | 否 | 
| error_code | int | 否 | 
| error_msg | str | 否 | 
| error_info | list | 否 | 
返回示例:
                Plain Text
                
            
            1{
2    "log_id": 12345678,
3    "tasks_info": [
4	    { # 转写中
5	    	"task_status": "Running"
6		    "task_id": "234acb234acb234acb234acb",
7	    },
8	    { # 转写失败
9	    	"task_status": "Failure"
10		    "task_id": "234acb234acb234acb234acd",
11		    "task_result": {
12			    "err_no":  3301
13			    "err_msg": "speech quality error",
14			    "sn": "xxx"
15		    }
16	    },
17	    { # 转写成功
18		    "task_status": "Success",
19		    "task_result": {
20		    	"left"{
21		    		"result": [
22			        	"观众朋友大家好,欢迎收看本期视频哦。毕竟..."
23			   	 ],
24			    	"detailed_result": [
25			      	  	{
26			        		"res": [
27			                "观众朋友大家好,欢迎收看本期视频哦。"
28			           	 	],
29			           		"end_time": 6700,
30			            	"begin_time": 4240,
31			            	"words_info": [
32			            		{
33                                	"end_time": 1750,
34                                	"words": "观众",
35                               		"begin_time": 1100
36                            	}
37                         	],
38			            	"sn": "257826606251573543780",
39			            	"corpus_no": "6758319075297447880"
40			        	}
41			        	...
42			    	],
43			    	"corpus_no": "6758319075297447880"
44			    	"error_no": 0
45				},
46		    	"right"{
47		    		"result": [
48			        	"观众朋友大家好,欢迎收看本期视频哦。毕竟..."
49			   	 ],
50			    	"detailed_result": [
51			      	  	{
52			        		"res": [
53			                "观众朋友大家好,欢迎收看本期视频哦。"
54			           	 	],
55			           		"end_time": 6700,
56			            	"begin_time": 4240,
57			            	"words_info": [
58			            		{
59                                	"end_time": 1750,
60                                	"words": "观众",
61                               		"begin_time": 1100
62                            	}
63                         	],
64			            	"sn": "257826606251573543780",
65			            	"corpus_no": "6758319075297447880"
66			        		}
67			        	...
68			    		],
69			    		"corpus_no": "6758319075297447880"
70			    		"error_no": 0
71			    	}
72                    "audio_duration": 6800   
73				},			
74				"task_id": "234acb234acb234acb234ace"
75	    }
76	]
77}
            