实景图数据要求
简介
训练一个定制商品检测模型需要准备两类数据:SKU单品图片和实景图片。本文档将详细介绍训练一个定制商品检测模型的数据要求,如规格、大小、尺寸等,并提供相应的图片样例。另外,可以参考实景图标注规范文档文档内容,了解各个业务场景的实景图片如何正确标注。
点击下载数据采集与标注规范长图,一张图看懂如何采集和标注数据,让您不走弯路,获得一个高精度的商品检测模型。
实景图指的是从业务场景中采集的图片,这些图片需要手动标注,只有标注的图片才会被用于训练,下面给出一些场景中的图片样例:
格式要求
图片的格式为:jpg、jpeg、png、bmp,图片大小不超过4M。
图片内容要求
上传标注的图片内容需要跟实际业务检测图片来源一致,比如货架上商品陈列审核业务,上传标注的图片是业务员巡店时拍摄的图片;无人货柜业务,上传标注的图片是货柜里摄像头采集的实际投放时摆放了商品的图片;智能结算台业务,上传标注的图片是结算台日常结算时拍摄的图片。
采集设备要求
采集设备推荐与实际业务中拍摄图片的设备一致。比如,智能结算台业务场景,采集设备推荐为结算台;无人货柜业务场景,采集设备推荐为货柜;普通货架/货柜审核业务场景,采集设备推荐为手机。
分辨率大小要求
实景图中能够清晰看清每一个要识别的SKU,各场景的推荐图片分辨率如下:
场景 | 推荐图片分辨率 |
---|---|
普通货架/货柜审核 | 1920×1440以上 |
地堆商品审核 | 1920×1440以上 |
无人零售货柜 | 1280×720以上 |
智能结算台 | 1280×720以上 |
以普通货架/货柜审核场景为例,如下图所示:
拍摄角度要求
在保证清晰度的前提下,实景图采集时的拍摄角度建议与实际检测时保持一致。普通货架/货柜审核场景需要注意,图片尽量从正面拍摄,角度可以少量倾斜,但不要倾斜过大,如下图所示:
推荐上传标注图片数
在第一次训练时,建议每个SKU至少有20张实景图,上传的实景图,只有标注过的图片会被训练,所有训练的图片中,系统会随机抽取70%作为训练集,剩余的30%作为测试集,如果标注的训练数据不足,可能会导致某个SKU的精确度远低于其它SKU,或是训练结果出现mAP、精确率、召回率全都为0的情况。
第一次训练后,通过调取服务接口测试模型效果,根据测试结果,不断补足识别效果达不到的需求的SKU实景图,这个过程可参考模型优化方法文档和使用模型优化工具处理识别效果不佳的实景图片。
实景图片样例
普通货架/货柜陈列审核场景
地堆商品陈列审核场景
无人货柜场景
智能结算台场景
使用API管理实景图数据
实景图也可以使用线下标注工具标注好后,通过API上传至EasyDL零售版训练平台,也可以通过API创建和删除实景图集,API使用方法请参考文档实景图管理API。