优化工具
简介
本文档介绍如何使用云服务数据回流功能来优化商品检测模型。
云服务调用数据管理
EasyDL零售版云服务数据回流功能,可用于查找云服务模型识别错误的数据,纠正结果并将其加入模型迭代的训练集,实现训练数据的持续丰富和模型效果的持续优化。
提示:模型发布成功后,才可以开通该功能,如果模型还未发布,可以参考文档模型发布发布一个模型。
使用步骤
该功能的使用步骤如下:
- 开通功能
- 筛选数据
- 修正标注
- 优化模型
步骤1. 开通功能
开通此项功能有两种方式,一是在发布模型页面,发布模型时勾选「同意云服务调用数据管理服务条款并开通服务」,发布后即可开通这项功能;二是在左侧导航栏「数据中心」点击「云服务调用数据」,在页面上选择已发布的定制商品检测模型接口,选择后仔细阅读服务条款,接受后即可开通这项功能。如下两张图所示:
数据查看说明
服务开通后,次日服务开始生效,生效后接口调用的数据可在次日通过网页查看。
举例: 如果您在2019年8月29日开通该功能,该功能将于2019年8月30日生效,如果在30日调用过接口,那么30日使用该接口识别过的图片,将在31日0点后可以在网页上查看到。
步骤2. 筛选数据
如上图所示,选择想要查询的接口调用时间和要筛选的SKU标签,筛选条件可以根据模型的阈值和业务的情况而定,筛选出的图片会显示在页面上。 举个例子,比如调用接口识别图片时,设置的阈值(threshold)是0.6,业务上认为置信度达到80%以上才是可以接受的结果,那么这里置信度填写的标签应该是0~80%。这样,所有调用识别的图片中,含有该SKU标签且置信度在60%~80%的图片就会被筛选出显示在页面上。
阈值(threshold),是正确结果的判定标准,例如阈值是0.6,置信度大于0.6的识别结果会被当作正确结果返回。在调用接口时,可以通过参数「threshold」设定,如果不填,则默认设置为推荐阈值,推荐阈值可以在「我的模型」页模型的「完整评估结果」里查看。
步骤3. 修正标注
如上图所示,选择一张图片点击查看,可以看到图中三个识别结果都是误识别,点击「重新标注」后,在弹窗内选择需要将该图片添加到的实景图集,如下图所示:
推荐每次将用于优化模型的图片都添加至一个新的实景图集中,可以点击「新建实景图集」新增一个图集,比如新建一个名称叫「优化0827」,表示用于放8月27日优化模型的图片,这样便于标注和在训练模型时直接勾选上这个实景图集。点击「提交」后,可以点击实景图集的名称立刻跳转去标注页面,也可以点击「继续处理数据」留在该页面继续处理其它的图片,如下图所示:
步骤4. 迭代模型
将所有需要修正标注的图片都标注好后,去到我的模型页,在需要优化的模型表里,点击「训练」,如下图所示:
点击后会跳转至训练页面,如下图所示,新增勾选添加了这部分修正标注的图片的图集即可,比如如果是将这些图片放在实景图集「优化0827」,那么勾选最初训练这个模型的实景图集的同时勾选这个新的图集,确认选择无误后,点击开始训练,训练完成后即完成了一次模型优化。