获取结果-轮询模式
更新时间:2023-10-10
音频文件异步审核-获取结果-轮询模式
接口地址: https://aip.baidubce.com/rest/2.0/solution/v1/async_voice/pull
请求方式:POST
Body请求参数
参数名称 | 数据类型 | 是否必须 | 描述 |
---|---|---|---|
taskId | String | N | 提交任务接口返回的任务的唯一标识(与audioId二选一),有效期为30天 |
audioId | String | N | 用户侧音频唯一标识(与taskId二选一),当taskId与audioId同时传入时,优先查询taskId |
响应参数
参数名称 | 数据类型 | 描述 |
---|---|---|
log_id | Long | 请求唯一id,用于问题排查 |
error_code | Integer | 审核服务异常错误码 |
error_msg | String | 审核服务异常错误提示信息 |
conclusion | String | 音频任务审核结果描述:合规、不合规、疑似、审核失败 |
conclusionType | Integer | 音频任务审核结果值:1 合规,2 不合规,3 疑似,4 审核失败 |
audioId | String | 用户侧音频唯一标识 |
account | String | 用户侧音频备注 |
rawText | StringArray | 语音识别文本结果,字符串数组 |
taskId | String | 透传提交任务接口返回参数中的taskId |
data | JSONArray | 语音识别文本审核结果,参见data结构 |
taskInfo | JSONObject | 语音识别文本审核结果,参见data结构 |
data结构
参数名称 | 数据类型 | 描述 |
---|---|---|
text | String | 分段文本结果 |
startTime | Long | 文本对应音频文件的起始时间戳 |
endTime | Long | 文本对应音频文件的终止时间戳 |
conclusion | String | 文本审核结果,可取值:合规、不合规、疑似、审核失败 |
conclusionType | Integer | 文本审核结果类型,可取值1.合规,2.不合规,3.疑似,4.审核失败 |
auditData | JSONArray | 文本审核结果详情,参见auditData结构 |
auditData结构
参数名称 | 数据类型 | 描述 |
---|---|---|
type | Integer | 审核主类型,11:百度官方违禁词库、12:文本反作弊、13:自定义文本黑名单、14:自定义文本白名单 20:存在娇喘内容 |
subType | Integer | 审核子类型,此字段需参照type主类型字段决定其含义: 当type=11时subType取值含义: 0:百度官方默认违禁词库 当type=12时subType取值含义: 0:低质灌水、2:文本色情、4:恶意推广、5:低俗辱骂、7:隐私信息 当type=13时subType取值含义: 0:自定义文本黑名单 当type=14时subType取值含义: 0:自定义文本白名单 *完整版subType说明,您可联系商务经理或填写咨询表单进行获取 |
msg | String | 不合规项描述信息 |
hits | JSONArray | 命中信息,参见hits结构 |
hits结构
参数名称 | 数据类型 | 描述 |
---|---|---|
probability | Float | 不合规项置信度 |
datasetName | String | 违规项目所属数据集名称 |
words | StringArray | 命中关键词 |
wordHitPositions | JSONArray | 命中关键词 |
modelHitPositions | Array | 送检文本命中模型的详细信息,包含位置信息及置信度信息。位置信息:命中模型的违规内容在送检原文中的位置(从0开始计算):“开始位置”、“结束位置”;置信度信息:命中模型对应的置信度分数(范围:0至1,数字越大,可能性越高)。返回示例见下方“成功响应示例——不合规”部分 |
wordHitPositions 结构
参数名称 | 数据类型 | 描述 |
---|---|---|
keyword | String | 送检文本命中词库的关键词 |
positions | Array | 关键词在送检原文中的位置(从0开始计算):分别为“起始位置”,“结束位置” |
label | String | 关键词命中的细分标签,标签规则见文末“细分标签对照表” |
taskInfo结构
参数名称 | 数据类型 | 描述 |
---|---|---|
taskDuration | Long | 任务时长,单位“秒” |
响应示例
{
"log_id": 16415253958306825,
"error_code": 282008,
"error_msg": "task not complete"
}
{
"log_id": 16415253958306825,
"conclusion": "不合规",
"conclusionType": 2,
"audioId": "test_audioId_85643",
"account": "test_account_room_001",
"rawText": [
"加个微信慢慢聊,关注公众号百万资源等你来,我们产品是第一品牌,你吃一瓶安眠药就可以睡"
],
"taskId": "e8ae004e-a8de-46fe-91b1-581a36310b40",
"taskDuration": 10,
"data": [
{
"conclusion": "不合规",
"conclusionType": 2,
"endTime": 9740,
"startTime": 0,
"text": "加个微信慢慢聊,关注公众号百万资源等你来,我们产品是第一品牌,你吃一瓶安眠药就可以睡",
"auditData": [
{
"hits": [
{
"wordHitPositions": [
{
"positions": [
[
32,
34
]
],
"label": "100200",
"keyword": "安眠药"
}
],
"probability": 1.0,
"datasetName": "百度默认文本反作弊库",
"words": [
"安眠药"
],
"modelHitPositions": [
[
0,
39,
0.7971
]
]
}
],
"msg": "存在暴恐违禁不合规",
"subType": 1,
"type": 12
},
{
"hits": [
{
"wordHitPositions": [
{
"positions": [
[
9,
11
],
[
2,
3
]
],
"label": "400200",
"keyword": "公众号&微信"
},
{
"positions": [
[
9,
11
],
[
7,
8
]
],
"label": "400200",
"keyword": "公众号&关注"
},
{
"positions": [
[
7,
8
],
[
2,
3
]
],
"label": "400200",
"keyword": "关注&微信"
}
],
"probability": 1.0,
"datasetName": "百度默认文本反作弊库",
"words": [
"公众号 微信",
"公众号 关注",
"关注 微信"
],
"modelHitPositions": [
[
0,
39,
0.9734
]
]
}
],
"msg": "存在恶意推广不合规",
"subType": 4,
"type": 12
}
]
}
],
"taskInfo": {
"taskDuration": 10
}
}