如下图示意: 对于上传的数据文件的要求,请注意: 请上传对应标注体系的标注数据,避免数据上传失败 标注数据格式要求为“文本内容\t标注结果\n”文本内容和标注结果都需要按字切分,每一行表示一组数据,每组数据的字符数建议不超过512个 标签映射文件名须为”label_map.json“,标签映射文件的格式为:{ key : value } 上传压缩包文件支持zip格式,单个压缩包限制5G以内。
返回参数 参数名称 类型 描述 result Result 获取数据空间表的详情 Result字段数据结构说明 参数名称 类型 描述 data Data List 表详情 totalCount Long 表数量 Data字段数据结构说明 参数名称 类型 描述 indexLength String 索引空间 tableSchema String 数据库名 tableName String 表名 dataLength
查询数据校验任务列表 接口说明 查看所有数据传输任务列表 请求结构 JSON 复制 1 POST /v { version } /task/checksum/ { dtsId } /list 2 Host : dts.baidubce.com 3 Authorization : string 4 { 5 maxKeys : 15 , 6 marker : dtsmxxxyyyzzz 7
响应体参数 响应体字段数据结构说明 参数名称 参数类型 是否必须 描述 示例值 success boolean 是 是否成功 true result Result 是 返回结果 result Result字段数据结构说明 参数名称 参数类型 是否必须 描述 示例值 dtsCheckTask DtsCheckTask 是 dtsCheckTask dtsCheckTask DtsCheckTask字段数据结构说明
每组数据的数建议不超过10000个字符(约5000个字),超出将被截断 通过Excel文件上传时,需注意: Excel文件内首行为表头,每行为一个样本,每个样本字符数不得超过10000个字符(约5000个字),超出将被截断 文件格式支持xlsx格式,单次可上传100个文件
查询processlist快照数据 接口说明 查询processlist快照数据。
查询视图列表数据 接口描述 本接口用于查询视图详细列表数据。 请求(Request) 请求URI GET /v1/vision?
查询级联列表数据 接口描述 本接口用于查询级联列表数据。 请求(Request) 请求URI GET /v1/visionCascade?
使用自定义任务处理数据 在百舸平台中用户可以利用已有资源池队列或创建专门的CPU资源池,使用分布式训练任务模块提交自定义任务方式处理数据,并将处理好的数据写入到BOS、PFS、CFS等存储中供后续业务使用。 此文档提供使用百舸自定义任务处理数据的最佳实践方法和思路,针对不同业务场景,用户可参考该文档实现更加复杂的数据处理任务,亦可以创建可以并发处理的分布式处理任务。
查询视图详细数据 接口描述 本接口用于查询视图详细数据。 请求(Request) 请求URI GET /v1/vision/{visionId} 参数名 类型 是否必须 描述 visionId Long 否 视图ID 请求头域 除公共头域外,无其它特殊头域。 请求体 无 响应(Response) 响应头域 除公共头域外,无其它特殊头域。