SKU单品图数据要求
简介
训练一个定制商品检测模型需要准备两类数据:SKU单品图片和实景图片。本文档将详细介绍训练一个定制商品检测模型的数据要求,如规格、大小、尺寸等,并提供相应的图片样例。另外,可以参考实景图标注规范文档文档内容,了解各个业务场景的数据如何正确标注。
点击下载数据采集与标注规范长图,一张图看懂如何采集和标注数据,让您不走弯路,获得一个高精度的商品检测模型。
SKU单品图指的是单个商品的图片,不是模型训练必须的数据,SKU单品图的作用是用来合成实景图,连同手工标注的实景图一起用于训练,降低实景图即训练数据采集和标注成本。
当每个SKU的实景图大于20张时,可以先不上传SKU单品图进行训练,后续提升模型以补充实景图为主,如果无法提供足量的实景图数据,可以通过上传SKU单品图来提升模型效果。
为了让模型能够完整地识别一个SKU,需要训练的图片中出现这个SKU的各个角度的样子,这意味着需要从实际业务场景中采集大量的图片,并且进行大量的标注工作。为了降低这部分的成本,我们通过数据合成和增强技术,只需为SKU上传各个角度的单品图,且单品图无需进行任何标注,即可让模型学习到这个SKU各个角度的样子。
平台上预置了近千个SKU,每个预置的SKU已匹配了50张左右各角度的单品图,绝大多数情况下无需再自行上传单品图,可根据训练结果补齐识别效果不好角度的单品图。
格式要求
图片的格式为:jpg、jpeg、png、bmp,图片大小不超过4M。
分辨率大小要求
图片分辨率大小建议达到1920×1080以上,拍摄相机像素200W以上,保证图片上的SKU清晰不模糊。
图片内容要求
项目 | 要求 |
---|---|
图中SKU数量 | 图片上仅可出现一个SKU |
背景 | 纯色,且背景颜色与SKU主体有区分度 |
角度 | 覆盖到实际检测场景中SKU可能出现的差异性较大的所有角度 |
光照 | 覆盖到实际检测场景中SKU可能出现的差异性较大的光照条件,比如灯光的颜色 |
下面举两个例子:
- 当要检测的SKU是罐装可口可乐时,背景不可以是非纯色或是纯红色,如下图所示:
- 当业务场景是货架陈列审核,且货架上的商品无确定的展示面时,单品图需要覆盖到可能在货架上出现的所有差异性较大的角度,考虑到拍摄角度,一个SKU需要覆盖到水平视角、俯视视角和仰视视角,如下图所示:
各场景单品图推荐拍摄角度和上传图片数
拍摄角度和上传张数基本原则是覆盖实际检测场景可能出现的角度,请根据实际业务场景的情况灵活调整单品图的拍摄角度和上传图片数。
场景 | 推荐拍摄角度 | 推荐上传图片数 |
---|---|---|
普通货架/货柜审核 | 水平视角、俯视视角和仰视视角 | 10 张 |
无人零售货柜 | 俯视视角 | 10 张 |
智能结算台 | 水平视角、俯视视角,可根据实际情况增加仰视视角 | 每个角度各10 张 |
地堆商品审核 | 可尽量在实景图中覆盖需要检测的角度 | 无需上传单品图 |
单品图片样例
以一个货架上瓶装商品为例,如下图所示:
使用API管理线上SKU数据
SKU的创建、删除、查询和上传SKU单品图均可以通过调用API实现,API使用方法请参考文档SKU管理API。