零售版常见问题
训练相关问题
为什么建议每个SKU至少出现在20张实景图中?
上传的实景图,只有标注过的图片会被训练,所有训练的图片中,系统会随机抽取70%作为训练集,剩余的30%作为测试集,如果标注的训练数据不足,可能会导致某个SKU的精确度远低于其它SKU,或是训练结果出现mAP、精确率、召回率全都为0的情况。
模型的训练结果是如何得到的?
上传的实景图,只有标注过的图片会被训练,所有训练图片中,系统会随机抽取70%作为训练集,剩余的30%作为测试集,训练集训练出的模型去对测试集进行检测,检测得到的结果跟人为标注的结果进行比对,得到页面显示的mAP,精确率和召回率。
为什么同样的数据集每次训练出来的结果会不一样?
上传的实景图,只有标注过的图片会被训练,所有训练的图片中,系统会随机抽取70%作为训练集,剩余的30%作为测试集,由于训练数据和测试数据每次都是随机抽取的,所以同样的数据集每次训练出来的结果会不一样。
SKU单品图是用来做什么的?
SKU单品图用来降低实景图即训练数据采集和标注成本的。为了让模型能够完整地识别一个SKU,需要训练的图片中出现这个SKU的各个角度的样子,这意味着需要从实际业务场景中采集大量的图片,并且进行大量的标注工作。为了降低这部分的成本,我们通过数据合成和增强技术,只需为SKU上传各个角度的单品图,且单品图无需进行任何标注,即可让模型学习到这个SKU各个角度的样子。由百度提供的SKU预置了50张左右的单品图,绝大多数情况下无需再自行上传单品图。
SKU单品图需不需要标注?
SKU单品图不要标注,只需要参考「SKU单品图数据要求」文档采集并上传至相应的SKU即可。
模型训练失败怎么办?
如果遇到模型训练失败的情况,请直接加入官方QQ群(群号:1009661589)咨询解决。
模型校验相关问题
如何校验模型的效果?
校验模型的目的是验证模型效果是否达到业务需求和找到模型效果最优的阈值,步骤如下两点:
- 初步校验:模型训练好后,可以使用「校验模型」功能,在页面上提交几张没有被用于训练且从实际业务场景中采集到的图片,调整阈值查看结果,找到校验结果最优的阈值范围。如果无论什么阈值都无法满足您的业务需求,则需要继续优化模型,可以针对校验中发现的问题参考模型效果优化相关问题对模型进行调优。
- 批量校验:在初步校验后,得到校验结果最优的阈值范围,申请发布模型,发布成功后调用服务接口进行批量校验,找到校验结果最优的阈值。调用接口的时候可以通过threshold这个参数设置阈值,threshold可以精确度小数点后2位。
模型上线相关问题
希望加急上线怎么处理?
加入官方QQ群(群号:1009661589)咨询群管高优审核。
每个账号可以上线几个模型?是否可以删除已上线的模型?
每个账号最多申请发布十个模型,已上线模型无法删除。
SKU相关问题
每个账号允许创建多少个SKU
每个账号默认允许创建的SKU数量为50个,如果需要增加SKU数量,请加入官方QQ群(群号:1009661589)咨询解决。
收费相关问题
接口上线后是否收费?调用量不够怎么办?
目前接口是限量免费使用的原则,上线模型后可以免费获得500次/天,qps=2的调用限额(QPS为每秒请求数)。如需调用更多次数,请在控制台中开通付费,开通付费后无调用次数限制,按调用成功次数收费,QPS免费提高至4,费用请参考服务价格文档。
模型效果优化相关问题
如何正确标注
- 单独框选要识别的SKU,不可同时框选多个目标
- 完整并仅仅框选要识别的SKU
- 标注框不要框选到其它SKU或是价目标签等非要识别的SKU的干扰信息
- 在实景图中出现的所有要识别的SKU必须全部标注
部分SKU识别效果太差
上传SKU单品图能够有效提高识别效果,上传要求如下:
- 图片像素足够高,不能模糊不清
- 单品图背景颜色必须为纯色且与SKU主体颜色不相似
- 角度、光线覆盖到实际检测场景中SKU所有可能出现的情况
- 要识别的SKU建议至少出现在20张实景图中,并且正确标注
错误示例中检查出漏标的情况
- 参考模型列表中模型效果下的「完整评估结果」内的推荐阈值,校验时适当调低阈值后测试效果,找到合适的阈值,在调用API接口时用请求参数threshold设定合适的阈值
- 在实景图中出现的该SKU必须全部标注,不能存在漏标注的情况
- 要识别的SKU建议至少出现在20张实景图中,并且正确标注
某些SKU在特定的一些角度下识别度很低
- 添加出现这些角度的SKU的实景图到训练的实景图集中,并正确标注
- 为这些SKU添加这些角度的单品图
错误示例中出现一个大框框选住多个SKU的情况
- 参考模型列表中模型效果下的「完整评估结果」内的推荐阈值,校验时适当调高阈值后测试效果,找到合适的阈值,在调用API接口时用请求参数threshold设定合适的阈值
训练结果精确度很高,但是校验或是在实际场景调用时结果不好
- 要识别的SKU建议至少出现在20张实景图中,并且正确标注
- 参与训练的实景图集一定要包含和实际商品检测场景环境一致的图片,每个标签的图片需要覆盖实际场景里面的可能性,如拍照角度、光线明暗的变化,训练集覆盖的场景越多,模型的泛化能力越强
- 参考模型列表中模型效果下的「完整评估结果」内的推荐阈值,校验时适当调整阈值后测试效果,找到合适的阈值,在调用API接口时用请求参数threshold设定合适的阈值
- 用于训练、校验、实际检测的图片,像素都要足够高,不能出现模糊不清的情况
mAP、精确率、召回率全都为0
- 要识别的各个SKU推荐至少出现在20张以上实景图中,并且正确标注
误识别到相识度极高的非目标SKU
- 提交工单或是加入官方QQ群(群号:1009661589),将这些相似度极高的SKU基本信息(SKU名称、品牌、规格、包装)反馈给我们
其他问题
模型能否支持私有化部署?
目前定制商品检测服务提供在线调用API,如需私有化部署,可以提交工单咨询或是加入官方QQ群(群号:1009661589)联系管理员反馈
申请发布模型审核不通过都是什么原因?
可能原因如下:
- 经过电话沟通当前模型存在一些问题或者不再使用,如训练数据异常、数据量不够、不想再继续使用等原因,沟通达成一致拒绝
- 电话未接通且模型效果较差,会直接拒绝。如果需要申诉,加入官方QQ群(群号:1009661589)咨询群管解决