您可以使用以下方案上传文本数据: 无标注信息导入: 本地导入 、 BOS导入 、 分享链接导入 、 平台已有数据集 有标注信息导入: 本地导入 、 BOS导入 、 分享链接导入 、 平台已有数据集 无标注信息 无标注信息-本地导入 本地导入支持两种导入格式:图片(jpg/png/bmp/jpeg)和压缩包。 导入格式 格式要求 格式示例 图片 1.
textLocation int 如果是文本,返回行号;其他返回空 textContent string 如果是文本,返回文本内容;其他返回空
是否操作成功 result object 返回结果 status int 状态码 log_id string 操作记录id result说明 名称 类型 描述 dataType string 导入类型,说明: · file:从文件导入 · copy:从其他数据集复制 downloadUrl string 下载地址 isZip int 是否为压缩文件,说明: · 0:否 · 1:是 projectType
发起数据集导入任务 功能介绍 用于发起数据集导入任务。 注意事项 调用本文API,需使用 安全认证AK/SK鉴权 ,调用流程及鉴权介绍详见 SDK安装及使用流程 。
发起数据集导入任务 功能介绍 本接口用于发起数据集导入任务。 接口调用效果,与下图操作实现效果类似,部分同产品页面有区别,具体以接口参数为准。
导入数据 创建数据集 完成后,在数据集管理页面中,找到该数据集,点击右侧操作列下的“导入”按钮,即可进入导入数据页面。 您可以使用以下方案上传文本数据: 本地导入 、 BOS导入 、 分享链接导入 、 平台已有数据集 本地导入 本地导入支持两种导入格式:单文件和压缩包。
详见平台导入数据处的数据样例。 文件类型支持xlsx格式,单次上传限制100个文件;文件格式示意图如下: 示例:例如在歌词创作场景中,希望用户输入歌名,由模型创作歌词,则上传文本为:“歌名:晴天”。 请注意,“歌名:”作为样本的前缀,需要固定在每一个样本中添加,不固定的前缀,将影响模型效果; 示例样本请详见平台导入数据处的数据样例。
其他:暂不支持API接口上传服务
上传已标注文件要求格式为zip格式压缩包 已有数据集 支持选择百度云 BOS 导入、分享链接导入、平台已有数据集导入;支持选择线上已有的数据集,包括其他图像类模型的数据集 BOS目录导入格式要求:请确保将全部图片已保存至同一层文件目录,该层目录下子文件目录及非相关内容(包括压缩包格式等)不导入 分享链接导入请确保将全部图片已保存至同一压缩包,压缩包仅支持zip格式,压缩前源文件大小限制5G以内;仅支持来自百度
创建数据集并导入 创建数据集 在训练模型之前,需要创建数据集。需输入数据集名称、选择相应的标注模版、选择数据去重策略,即可创建一个空数据集。 数据自动去重 即平台对您上传的数据进行重复样本的去重。建议创建数据集时选择「数据自动去重」 如果待导入数据集是中文简体/繁体,请选择『短文本单标签』;如果待导入数据集是非中文的其他语言,请选择『多语种文本单标签』, 点击可查看 支持的全部语言种类。