表示平台共享存储 storagePath string 存储类型为对象存储BOS时,对应的完整存储路径 sizeMB float 数据集大小,单位为MB,例:0.01 sampleCount int 数据集样本数 annotationProgress string 数据集样本标注进度,示例:1/10 importStatus string 导入状态,说明: · 新建:Created · 导入中:Importing
数据集管理API 本文档主要说明当您线下已有大量的已经完成标注的图片数据,如何通过调用API完成图片及标注的便捷上传和管理。 EasyDL图像数据集管理API在管理不同模型数据类型之间是通用的。上传不同模型类型数据,只是在部分接口入参存在差异,使用及接口地址完全一致。 数据集创建API 接口描述 该接口可用于创建数据集。
图像智能标注介绍说明 使用智能标注功能可降低数据的标注成本。启动后,系统会从数据集所有图片中筛选出最关键的图片并提示需要优先标注。通常情况下,只需标注数据集30%左右的数据即可训练模型。
平台限免阶段每个账户最多支持100万条样本数据,超出后会被平台忽略。 创建及导入数据集 1、在官网界面点击【数据总览】,进入数据集操作界面。 2、进入创建数据集界面,选择好数据类型和标注类型等信息,点击完成。 3、数据集创建完成后,可以在数据总览界面看到刚才创建好的数据集ID。
在线标注 目标跟踪在线标注 在创建好数据集,并导入视频数据后。可点击数据总览页面,上传数据对应的「查看与标注」操作开始标注任务。 在线标注视频示意 在线标注图例 1.添加标签 点击标注页面右上角的「添加标签」,输入标签名称来添加标签。
创建数据集 接口描述 本接口用于创建新的数据集,数据集创建完成后自带版本V1。 调用本接口和控制台创建数据集页面功能类似,如下图所示。说明:如下图页面与控制台页面不同,请以控制台页面为准。 权限说明 调用本文API,需符合以下权限要求,权限介绍及分配,请查看 角色与权限控制列表 、 账号创建与权限分配 。
导入未标注数据 本地数据 已有数据集 支持选择百度云BOS导入、分享链接导入、平台已有数据集导入;支持选择线上已有的数据集,包括其他语音类模型的数据集 导入已标注数据 本地数据 已有数据集 支持选择百度云BOS导入、分享链接导入、平台已有数据集导入;支持选择线上已有的数据集,包括其他语音类模型的数据集
在线标注 文本实体关系抽取数据标注 如果您上传的是文本实体关系抽取数据集为无标注数据集,为了整个模型的正确运行,您可以点击【去标注】根据以下两步操作完成实体关系抽取的数据标注工作。首先您需要创建实体类别,并设置实体关系,第二步您需要根据您上传的文本实体关系抽取数据,对每个样本选择实体,标注实体类别和关系。下面将详细介绍以上两个步骤。
经典版声音分类创建数据集 在训练之前需要在数据中心【创建数据集】 设计分类 每个标签就是对这个音频希望识别出的全部结果。标签的上限为1000种。 标签名由数字、中英文、中/下划线组成,长度上限256字符。 音频的具体格式要求 训练集音频需要和实际场景要识别的音频环境一致,举例:如果实际场景要识别的音频都是手机摄录的,那训练的音频也需要同样的场景获得,而不要采用网上随便下载的音频。
如需查看 工具调用 场景的单轮对话和多轮对话样例,请下载 jsonl示例模板 。 若您的数据集包含工具调用场景,请上传已标注文本数据。 Function Call工具调用场景的数据集当前仅适用于 ERNIE-Lite-128K-0722 模型精调,暂不支持 weight 字段参与训练。