配置NLP任务
- 在新建任务的面板中,可查看相关项目“基本信息”、“配置任务类型”、“添加数据”、“配置任务”等操作,如下图:
配置任务类型时,您可以看到增量训练有一个开关选项。增量训练也成为模型热启动,当您训练完模型但效果不理想想继续添加数据,或您的训练模型超过训练时长被中断是,您可以开启增量训练,使该新任务能在基准任务的基础上继续运行。在配置任务类型上您需要注意以下几点,如您是第一次新建任务,增量训练的开关将默认关闭,不允许打开。如您在满足已有训练完成或是训练中断的任务的情况下,您可以开启增量训练的开关,选中您想继续的基准任务版本。在设置学习率时,您可以重新设置学习率,也可以加载优化后的学习率。如您选择重新设置学习率,您可以在下方【配置网络】的脚本编辑中修改学习率的大小,如您选择加载优化后的学习率,您将直接继承您选中的基准任务的超参数,在脚本编辑中将不允许再修改。
训练任务,我们需要添加模型训练使用的训练集和模型评测的评测集,如果您没有特别创建评测集,可以将评测集开关设置为“OFF”,系统将从训练集中取出一定比例的数据作为评测集。如果您有准备评测集,则可以将评测集开关设置为“ON”,并上传对应的数据集即可,如下图:
在上传数据的时候,您需要注意,如您打开了增量训练的开关,那么将直接选中您选中的基准任务的使用的数据集。点击查看基准任务标签时,您可以看到基准任务数据集的标签信息,此时您选择增量训练的数据集,您可保留基准任务数据集,也可添加新数据集,但新数据标签须与基准任务保持一致。
- 配置网络过程中,您可以选择使用预训练模型ERNIE2.0对应的三个版本:ERNIE2.0_Base、ERNIE2.0_Large和ERNIE2.0_Tiny。本章节演示创建流程,先选择“ERNIE2.0_Tiny”,并选择TextCNN网络。 EasyDL专业版目前支持飞桨(Paddle Paddle)深度学习框架,自然语言训练任务支持的框架脚本为paddle-fluid-v1.6.1。了解飞桨
平台提供了脚本编辑的工具,您可以直接在平台点击“立即编辑”进行脚本编辑,如下图:
注意,当您打开增量开关后,如您选中重新设置学习率,那么您可以脚本编辑中设置学习率,此时,如您修改其他超参数,仍将默认基准任务的超参数。如您选中加载优化后的学习率将脚本将不允许编辑。目前平台为您提供了对应代码的注释,方便您了解如何进行代码编辑和修改。
3.在配置资源部分,目前平台已提供GPU V100、P40两种机型。选中您所需的机型,根据需要设置计算节点数,如您选择多节点进行分布式训练,可有效提升训练速度,节点数越多训练效率越高。在最长训练设置部分,目前文本任务方向没有时间上线,建议您尽量设置较长时长,注意如您使用ERNIE预训练模型,建议训练时长不低于4小时。
- 点击提交训练任务,任务将在平台提供的GPU训练资源上进行训练。
提交成功的任务,将会在项目列表中展示状态。
在此,NLP任务的创建,已经完成。
错误码
如果您的任务出现失败情况,您可以通过查看平台反馈的错误码来查询,如下表:
错误码 | 训练失败原因说明 |
---|---|
01-05、07、08、10、11 | 后端服务超时或训练失败,请提交工单或加入EasyDL官方QQ群(群号:86882600)联系群管解决 |
6 | 数据量过少导致训练失败,请补充数据重新提交模型训练 |
9 | 代码错误导致训练失败,请检查脚本代码内容修改后重新提交模型训练,有疑问请提交工单或加入EasyDL官方QQ群(群号:868826008)联系群管解决 |