查看数据增强任务详情
更新时间:2024-09-23
注意: 为提升开发者使用体验,本文内容已合并至对应API文档,请查看API鉴权及调用-数据管理-查看数据增强详情;本文档已于2024年6月28日在平台文档中心下线,内容不再更新。
功能介绍
用于查看数据增强任务详情。
注意事项
调用本文API,需使用安全认证AK/SK鉴权,调用流程及鉴权介绍详见SDK安装及使用流程。
调用示例
import os
from qianfan.resources import Data
# 使用安全认证AK/SK鉴权,通过环境变量方式初始化;替换下列示例中参数,安全认证Access Key替换your_iam_ak,Secret Key替换your_iam_sk
os.environ["QIANFAN_ACCESS_KEY"] = "your_iam_ak"
os.environ["QIANFAN_SECRET_KEY"] = "your_iam_sk"
resp = Data.get_dataset_augmenting_task_info("task-n1zkqgn42bqbmj2g")
print(resp)
返回示例
QfResponse(
code=200,
headers={...},
body={
"log_id": "7hiag46agqbdd6ri",
"result": {
"id": 10,
"strId": "task-n1zkqgn42bqbmj2g",
"sourceDatasetId": 1,
"destDatasetId": 2,
"sourceDatasetStrId": "ds-czwtph4s9frc5ap3",
"destDatasetStrId": "ds-xum4fiskwyggrk3c",
"sourceDatasetName": "xx-V1",
"destDatasetName": "xxx-V1",
"labelIds": "",
"status": 2,
"area": 0,
"entityCount": 708,
"strategy": 0,
"operations": "",
"retStr": "已保存1条增强处理后的文本",
"startTime": "2023-11-24 15:34:57",
"finishTime": "2023-11-24 15:38:45",
"isSelfInstruct": True,
"name": "aug_sdk_1",
"serviceName": "ERNIE-Bot",
"appName": "xxxxx",
"userName": "xx",
"numSeedFewshot": 1,
"numInstancesToGenerate": 1,
"similarityThreshold": 0.5,
},
"status": 200,
"success": True,
},
)
参数说明
请求参数
名称 | 类型 | 必填 | 描述 |
---|---|---|---|
task_id | string | 是 | 数据增强任务ID,说明: (1)通过以下任一方式获取该字段值 · 方式一,通过调用创建数据增强任务接口,返回的增强任务ID字段enhanceTaskId获取 · 方式二,通过调用查看增强任务列表接口,返回的增强任务strId字段获取 · 方式三,在控制台-数据处理-数据增强页面查看,选择任务,点击详情查看,如下图所示: (2)该字段新增支持string类型,如果之前使用的是int类型,建议变更为string类型,后续可能将逐步废弃int类型;例如之前是通过调用查看增强任务列表接口,返回的id字段获取,请替换为接口返回的strId字段获取 |
返回参数
名称 | 类型 | 描述 |
---|---|---|
log_id | string | 操作记录id |
result | dict | 返回结果 |
status | int | 状态码 |
success | bool | 是否操作成功,说明: · true:成功 · false:失败 |
result说明
名称 | 类型 | 描述 |
---|---|---|
id | int | 数据增强任务ID,注意:如果有使用此字段,建议变更为strId字段,后续将逐步废弃此字段 |
strId | string | 数据增强任务ID(字符串类型),注意:如果有使用id字段,建议变更为此字段,后续将逐步废弃id字段 |
sourceDatasetId | int | 源数据集版本ID,注意:如果有使用此字段,建议变更为sourceDatasetStrId字段,后续将逐步废弃此字段 |
sourceDatasetStrId | string | 源数据集版本ID(字符串类型),注意:如果使用sourceDatasetId字段,建议变更为此字段,后续将逐步废弃sourceDatasetId字段 |
destDatasetId | int | 目标数据集版本ID,注意:如果有使用此字段,建议变更为destDatasetStrId字段,后续将逐步废弃此字段 |
destDatasetStrId | string | 目标数据集版本ID(字符串类型),注意:如有使用destDatasetId字段,建议变更为此字段,后续将逐步废弃destDatasetId字段 |
sourceDatasetName | string | 源数据集名称 |
destDatasetName | string | 目标数据集名称 |
labelIds | string | 增强的标签ID列表,例如"1,2,5" |
status | int | 任务状态,说明: · -1:无状态,表示没有任务 · 0:创建待运行 · 1:运行中 · 2:已完成 · 3 :已终止 · 4:已失败 |
area | int | 增强的区域,说明: · 0:全局 · 1:全局以及标注框局部 |
entityCount | int | 提交的实体数量 |
strategy | int | 算法策略,说明: · 1:串行叠加 · 2:并行遍历 |
operations | string | 增强方式,示例:"随机mask,随机删除",有以下增强方式: · 随机mask · 随机删除 · 同词性替换 · 近义词替换 · 同音词替换 |
retStr | string | 增强结果 |
startTime | string | 开始时间 |
finishTime | string | 结束时间 |
isSelfInstruct | bool | 是否self-instruct自监督 |
name | string | 增强任务名称 |
serviceName | string | 服务名称 |
appName | string | 应用名称 |
userName | string | 用户名称 |
numSeedFewshot | int | 指令生成依赖样本数 |
numInstancesToGenerate | int | 生成样本数 |
similarityThreshold | float | 相似度阈值 |