数据质检 功能概述 该功能旨在对您数据集中的图像数据进行质量检测,通过提供客观指标,为您对数据集的下一步操作(标注、清洗等)进行参照引导。 整体质检报告将包括对原图、标注信息两个层面的指标进行统计,本期先上线原图维度的质检指标,标注层面的质检指标敬请期待。
数据质检 功能概述 该功能旨在对您数据集中的图像数据进行质量检测,通过提供客观指标,为您对数据集的下一步操作(标注、清洗等)进行参照引导。 整体质检报告将包括对原图、标注信息两个层面的指标进行统计,本期先上线原图维度的质检指标,标注层面的质检指标敬请期待。
数据看板 新增门店数据
数据开发 新建项目 进入“数据加工-我的项目”菜单,创建项目“产品体验测试”,并为项目绑定计算资源。 数据开发 进入项目“产品体验测试”,创建一个脚本作业,脚本类型HiveSQL、SparkSQL均可。将1.1中的示例数据写入表test_stu,并点击执行。 作业运维 执行通过的作业,点击“发布”后将进入运维阶段,在“任务运维”中,可以对该作业进行调度配置、查询运行实例等。
数据标注状态选择有标注信息,并选择标注格式为COCO格式 以COCO格式导入,导入路径下应包含JPEGImages以及Annotations两个子文件夹,JPEGImages下存储图片数据,Annotations下存储Json格式的一个标注文件,所有图片的标注信息均存储在一个Json文件中 平台自定义格式导入 数据标注状态选择有标注信息,并选择标注格式为平台自定义格式 以平台自定义格式导入,导入路径不包含子文件夹
平台去重策略 平台提供了可去重的数据集,即对您上传的数据进行重复样本的去重。注意:当您确定了数据集为去重或非去重的属性后,便不可修改。 当您创建了一个去重的数据集时,在后续上传数据的过程中,平台可通过检验您当前上传的样本与已上传到此数据集下的样本是否相同,如果相同,则会使用新的样本替代旧的样本。
小Tips:“如何利用好重复样本” 如果您的数据存在样本种类不均衡的现象,您可以通过将重复样本数量小的那一类,使其样本数量增加到与数据量大的那一类样本数量相近,以提高模型训练的效果,这种方法也称为“上采样”。 平台去重策略 平台提供了可去重的数据集,即对您上传的数据进行重复样本的去重。
数据标注说明 目录 标注操作说明 标注技巧说明 上传图片 标注操作说明 在数据集查看详情页面可以点击开始标注,进入到标注页面。 添加标签 点击右侧添加标签,输入不同分类名称,完成标签添加。 标签格式说明:目前平台标签名称只支持数字/字母/下划线,暂时不支持中文 标注方式 根据下侧选定的当前图片,在左侧选择合适的标注工具标注目标物体。
小Tips:“如何利用好重复样本” 如果您的数据存在样本种类不均衡的现象,您可以通过将重复样本数量小的那一类,使其样本数量增加到与数据量大的那一类样本数量相近,以提高模型训练的效果,这种方法也称为“上采样”。 平台去重策略 平台提供了可去重的数据集,即对您上传的数据进行重复样本的去重。注意:当您确定了数据集为去重或非去重的属性后,便不可修改。
智能数据API 智能数据API 目前BML对数据集进行创建、删除、导入、导出、新增版本等操作有两种操作方式。 一种是通过在平台页面直接进行操作; 一种为通过调用相关API对数据集进行相应操作。本文档主要介绍如何用API对数据集进行相关操作。