对于同步导入方式,返回结果即表示导入成功还是失败。而对于异步导入方式,返回成功仅代表作业提交成功,不代表数据导入成功,需要使用对应的命令查看导入作业的运行状态。 支持的数据格式 不同的导入方式支持的数据格式略有不同。
导入采集配置时,日志服务会根据配置信息自动为您创建项目,日志集以及传输任务;导入完成后,您也可以修改项目,日志集和传输任务。 前提条件 已在阿里云日志服务SLS中创建采集配置。 已获取阿里云访问密钥。迁移过程中需要提供阿里云的AK,SK,域名以及百度云的AK,SK和地区信息 首次使用此功能之前,需要完成云资源访问授权,即授予日志服务产品访问并写入资源的权限。
数据导入方式 创建数据集 完成后,在数据集管理页面中,找到该数据集,点击右侧操作列下的“导入”按钮,即可进入导入数据页面。 您可以使用以下方案上传文本数据:本地导入、BOS导入、分享链接导入、平台已有数据集。 导入方式 格式要求 本地导入 单文件。 压缩包。 BOS导入 文件导入:文件不超过50G,单次上传限制1000个文件。 目录导入。
短文本匹配数据导入与标注 1. 创建数据集 您可以在控制面板中,选择“数据总览”并点击按钮“创建数据集”,即可完成一个数据集的创建。 2.导入短文本相似度数据 进入到新创建的短文本数据集中,如果您手中的数据是未标注数据,可以选择数据标注状态为“无标注信息”,如果您手中的数据是完成标注的数据,可以选择数据标注状态为“有标注信息”。
已有 数据导入 的模块权限(默认情况下都具备),如果您看不到该入口,请联系您的系统管理员。 已有 数据导入 - 提交 权限。如何申请该权限,请参见 权限申请与审批 。 操作步骤 登录 DBSC 控制台 。 在左侧导航栏,点击 数据开发—>数据导入 。 在 数据导入 页面,单击页面右上角的 创建数据导入 。 在 创建数据导入 页面,按照下表进行配置1. 。
导入完成:ImportFinished · 导入失败:ImportFailed progress string 导入进度,说明: · 导入中:该字段值为当前导入进度,如XX % · 导入完成:该字段值为100% · 导入失败:该字段值为0 sizeMB float 数据集大小,单位为MB,例:0.01 sampleCount int 样本数 creator string 导入任务操作人 startTime
导入概述 在导入镜像前,您应该已经完成如下工作: 通读镜像导入说明,保证待导入的镜像满足各种限制和要求; 开通对象存储BOS。
数据文件列数不能超过1000列 · 51:导入数据失败,数据集总行数不能超过1000万行 · 52:导入数据失败,数据文件大小超过限制 · 53:导入数据失败,请确保文件编码格式为UTF-8或GBK · 54:导入数据失败,新导入文件与数据集schema不一致 · 55:文档解析失败 · 100:网络异常或服务异常 · 300:BOS没有找到文件 响应说明 说明:返回的部分字段如下,未说明的字段暂无需关注
数据导入方式 创建数据集 完成后,在数据集管理页面中,找到该数据集,点击右侧操作列下的“导入”按钮,即可进入导入数据页面。 您可以使用以下方案上传文本数据:本地导入、BOS导入、分享链接导入、平台已有数据集。 导入方式 格式要求 本地导入 jsonl格式。 BOS导入 文件导入。 目录导入。 分享链接导入 输入链接地址导入:压缩包(请确保将全部数据文件保存至同一压缩包)。
数据导入方式 创建数据集 完成后,在数据集管理页面中,找到该数据集,点击右侧操作列下的“导入”按钮,即可进入导入数据页面。 您可以使用以下方案上传数据:本地导入、BOS导入、分享链接导入、平台已有数据集。 导入方式 格式要求 本地导入 - BOS导入 文件导入:单个jsonl文件/压缩包源文件大小,均不超过50G,所有文件数量不超过1000。