快速训练一个模型
简介
本文档介绍使用EasyDL零售版商品检测快速训练一个识别可口可乐的商品检测模型,基本流程如下:
1.创建模型
2.创建SKU
3.上传和标注训练数据
4.训练模型
5.发布模型
6.使用模型API
步骤1.创建模型
这个步骤将会介绍如何创建模型
进入创建模型页面
在EasyDL零售版商品检测产品主页点击【开始训练】按钮进入到模型训练页,下面会出现两种情况:
- 第一种,如果您没有登录百度智能云,则会跳转到百度智能云登录页面,没有百度账户的客户请先注册百度账户。登录后,会跳转到模型概览页,点击【商品检测】卡片上的【立即定制】按钮,会跳转模型训练页面的创建模型页。
- 第二种,如果您已登录,会直接进入到【我的模型】页,该页面能够管理已经创建的模型,点击左侧列表中的【创建模型】进入创建模型页面。
创建模型
进入创建模型页面后你会看到如下图中展示的内容
需要填写的项目如下:
-
模型名称
模型的名称
-
模型归属
模型是属于公司的,还是属于个人的,如果是前者,请填写公司名称
-
应用场景
提示:请根据真实业务应用场景选择,选择的场景将会关联后端数据增强算法,若不确定,请选择“其他”
可选项为普通货架/货柜、智能结算台、无人零售柜、地堆商品和其他
-
邮箱地址
用于联系到您的邮箱地址
-
联系方式
有效的联系方式将有助于后续模型上线的人工快速审核,以及更快的百度官方支持,推荐填写个人手机号码
-
功能描述
描述改模型将要应到的业务场景,详细的描述,在获取官方支持时,能帮助我们为您提供准确的使用建议
完成所有填写项后点击【下一步】按钮完成模型创建,创建完成后会跳转到【我的模型】页面。
步骤2.创建SKU
这个步骤将会介绍如何创建SKU,SKU是客户需要检测的商品,在训练品台上有两个作用,其一是“SKU名称_品牌名称_规格参数”用于标注训练数据的标签,二是SKU的单品图片用于商品增强合成技术,提高模型效果。
完成上一个步骤后,会跳转到【我的模型】页面,这时您会看到如下图展示的内容,由于模型还未训练,所以模型列表中没有显示模型的效果,在训练模型前,需要先完成SKU的创建。
点击左侧列表中的【我的SKU】进入SKU管理页面,点击【创建SKU】按钮进入创建SKU页面,您会看到如下图展示的内容
提示:在调用API接口识别SKU时,识别结果中SKU的名字是以“SKU名称_品牌名称_规格参数”的形式返回的,所以在填写SKU名称、品牌名称和规格参数时避免这三项内容重复。
需要填写的项目如下:
-
SKU名称
SKU的名称,可适当填入SKU细节,例如:原味可乐,番茄味薯片,奥运版纯牛奶等
-
品牌名称
SKU的品牌名称,如可口可乐,乐事,伊利等
-
规格参数
SKU的规格,如330ml,500g,20片等
-
商品品类
可选择的有饮品、药品、保健品、零食、香烟、调味品、日用品和其他
-
包装类型
可选择的有瓶装、罐装、袋装、盒装和其他
-
商品编号
如果您自身的业务系统中有现成SKU对应的商品编码,比如商品条形码,可以填在该填写框中,之后模型接口将支持返回该内容,用于您快速匹配SKU
-
SKU单品图
SKU的单品图不是模型训练的必须数据,其作用为用来合成实景图,连同手工标注的实景图一起用于训练,降低实景图即训练数据采集和标注成本。拍摄角度和上传张数基本原则是覆盖实际检测场景可能出现的角度,具体请参考SKU单品图数据文档中进行单品图采集。
当每个SKU的实景图大于20张时,可以先不上传SKU单品图进行训练,后续提升模型效果以补充实景图为主,如果无法提供足量的实景图数据,可以通过上传SKU单品图来提升模型效果。
完成填写和上传SKU单品图上传后,页面内容显示如下图所示
点击【创建SKU】按钮完成创建,点击后回到【我的SKU库】,SKU列表中的SKU图数需要大约5秒的时间进行计算,刷新页面即可显示SKU单品图片数。
步骤3.上传和标注训练数据
这个步骤将会介绍如何上传和标注训练数据,训练数据是SKU在货架上的实景图,需要客户从真实的业务场景中采集,这些图片在被正确标注中,可以用于训练成模型。
完成上一个步骤后,在左侧列表中点击【实景图上传/标注】进入上传和标注页面,在上传前请在实景图集选择栏内创建实景图集,如下图所示
需要填写的项目如下:
-
实景图集名称
实景图集的名称,可适当填入SKU细节,例如:原味可乐,番茄味薯片,奥运版纯牛奶等
-
选择类型
实景图集的类型,请与创建模型时选择的应用场景保持一致,上传时只上传跟选择类型相同的实景图。可选项为普通货架/货柜、智能结算台、无人零售柜、地堆商品和其他
完成创建实景图集后,页面显示为如下图所示的内容
点击页面上【标注】为该实景图集上传作为训练数据的实景图,点击【标注示例】右侧的上传图片上传实景图。
上传完需要标注的图片后,EasyDL零售版的在线标注工具提供了辅助标注功能,该功能可以使用平台预置模型和用户自训练定制模型预先为未标注的图片进行预标注,来降低整体标注工作的成本,如下图所示,使用方式请参考实景图标注文档。
实景图基本要求如下:
实景图的详细采集要求,请参考实景图数据要求文档
- 实景图片需要是从真实业务场景中采集来的数据
- 支持上传的图片格式为jpg,png,jpeg,bmp,大小限制为4M
- 建议图片尺寸:最长不超过4096px,最小不低于30px,长宽比3:1以内
标注基本要求如下:
实景图的具体标注要求,请参考实景图标注规范文档
- 完整并仅仅框选要识别的SKU
- 标注框不要框选到其它SKU或是价目标签等非要识别的SKU的干扰信息
- 在实景图中出现的所有要识别的SKU必须全部标注,不能遗漏
完成所有实景图的标注后,返回到【我的SKU库】可以查看到SKU列表中【实景图数】列显示标注了该SKU的实景图片的数量,如下图所示
步骤4.训练模型
这个步骤将会介绍如何训练模型
如上面图片所示,点击左侧列表中的【训练模型】,需要先后完成下面三项选择:
- 选择要训练的模型
- 选择需要想要模型支持检测的SKU,选择完成后,下方左侧会显示已添加的SKU,右侧会显示包含已添加SKU的实景图集
- 选择要参与训练的实景图集
完成选择后,点击【开始训练】按钮页面跳转至【我的模型】页面,如下图所示,可以看到模型已进入训练状态,将鼠标移至状态"训练中"右边的小问号上,可以查看训练进度,训练进度数值只是作为参考,所以推荐打开短信通知功能,这样就第一时间知晓模型训练完成了。
训练完成后,可以点击校验和申请发布。
步骤5.发布模型
这个步骤将会介绍如何将训练好的模型发布为服务API
在模型训练好后,点击模型列表内对应模型「操作」列中的「申请发布」,或是在左侧导航栏点击「发布模型」可以进入发布模型页面,如上图所示。在对应选项中选择和输入相应内容发起模型发布的申请:
-
选择模型(必选)
选择需要发布的模型,只能选择已经完成训练的模型
-
选择版本(必选)
选择需要发布的模型版本,只能选择完成训练且没有发布过的版本
-
服务名称(必填)
为发布的服务命名,服务名称不得多于20个字符
-
接口地址(必填)
自定义服务的API URL,接口地址需要多于5个字符但不能超过20个字符,仅限英文
-
其他要求
如果有其他要求可以输入要求描述
填写完上述信息后,点击「提交申请」完成发布模型申请。提交申请后,模型列表内该模型的申请状态和服务状态为有以下几种情况:
申请状态 | 服务状态 | 状态描述 |
---|---|---|
审核中 | 未发布 | 服务刚申请发布,模型在审核中 |
审核成功 | 发布中 | 服务通过审核,进入系统自动发布阶段 |
审核成功 | 已发布 | 服务发布成功 |
审核失败 | 未发布 | 服务未通过审核,通常为模型训练结果mAP < 0.6,如需申诉,可以加入官方QQ群(群号:1009661589)咨询群管 |
提示:第一次申请发布的模型需要人工审核,通常4小时内完成,如果希望加急上线,请加入官方QQ群(群号:1009661589)咨询群管高优审核。非第一次申请发布的模型,如果模型训练结果mAP>0.6,则会自动通过审批。审批完成后,大约需要5分钟左右自动完成发布。
步骤6.使用模型API
发布成功后,可以点击模型列表内「操作」列中的「配置服务功能」,如下图:
点击后弹出下图所示窗口,可以获取模型的云服务API URL,API使用方式请参考API调用方法文档。
在该页面可以为模型的云服务API配置服务功能,支持以下四项功能:
-
商品基本信息识别(必选)
接口支持识别商品信息(商品名称、品牌、规格)、编号和置信度
-
商品陈列层数识别(可选)
接口支持识别商品陈列所在货架层数,货架总层数以及商品的陈列顺序,货架类型支持:货架、端架和立式冰柜内货架
-
商品陈列场景识别(可选)
接口支持识别商品陈列的场景,场景类型支持:普通货架、挂钩货架、斜口篮货架、端架、立式冰柜、地堆、割箱、地龙、小端架、吧台
-
商品排面占比统计(可选)
接口支持统计商品排面数/占比、未识别商品数、总空位数、每货架层的空位数及货架利用率
接口单次调用的费用,根据开启的功能不同而不同,详情可见购买指南文档。
可在页面随时开启和关闭可选的功能,变更功能后约5分钟生效,生效后单次调用费用按变更后的功能计费,接口将返回变更后的功能字段,详情可见API调用方法文档。