配置NLP任务

更新时间：2023-01-18

在新建任务的面板中，可查看相关项目“基本信息”、“配置任务类型”、“添加数据”、“配置任务”等操作，如下图：

配置任务类型时，您可以看到增量训练有一个开关选项。增量训练也成为模型热启动，当您训练完模型但效果不理想想继续添加数据，或您的训练模型超过训练时长被中断是，您可以开启增量训练，使该新任务能在基准任务的基础上继续运行。在配置任务类型上您需要注意以下几点，如您是第一次新建任务，增量训练的开关将默认关闭，不允许打开。如您在满足已有训练完成或是训练中断的任务的情况下，您可以开启增量训练的开关，选中您想继续的基准任务版本。在设置学习率时，您可以重新设置学习率，也可以加载优化后的学习率。如您选择重新设置学习率，您可以在下方【配置网络】的脚本编辑中修改学习率的大小，如您选择加载优化后的学习率，您将直接继承您选中的基准任务的超参数，在脚本编辑中将不允许再修改。

训练任务，我们需要添加模型训练使用的训练集和模型评测的评测集，如果您没有特别创建评测集，可以将评测集开关设置为“OFF”，系统将从训练集中取出一定比例的数据作为评测集。如果您有准备评测集，则可以将评测集开关设置为“ON”，并上传对应的数据集即可，如下图：

在上传数据的时候，您需要注意，如您打开了增量训练的开关，那么将直接选中您选中的基准任务的使用的数据集。点击查看基准任务标签时，您可以看到基准任务数据集的标签信息，此时您选择增量训练的数据集，您可保留基准任务数据集，也可添加新数据集，但新数据标签须与基准任务保持一致。

配置网络过程中，您可以选择使用预训练模型ERNIE2.0对应的三个版本：ERNIE2.0_Base、ERNIE2.0_Large和ERNIE2.0_Tiny。本章节演示创建流程，先选择“ERNIE2.0_Tiny”，并选择TextCNN网络。 EasyDL专业版目前支持飞桨（Paddle Paddle）深度学习框架，自然语言训练任务支持的框架脚本为paddle-fluid-v1.6.1。了解飞桨

平台提供了脚本编辑的工具，您可以直接在平台点击“立即编辑”进行脚本编辑，如下图：

注意，当您打开增量开关后，如您选中重新设置学习率，那么您可以脚本编辑中设置学习率，此时，如您修改其他超参数，仍将默认基准任务的超参数。如您选中加载优化后的学习率将脚本将不允许编辑。目前平台为您提供了对应代码的注释，方便您了解如何进行代码编辑和修改。

3.在配置资源部分，目前平台已提供GPU V100、P40两种机型。选中您所需的机型，根据需要设置计算节点数，如您选择多节点进行分布式训练，可有效提升训练速度，节点数越多训练效率越高。在最长训练设置部分，目前文本任务方向没有时间上线，建议您尽量设置较长时长，注意如您使用ERNIE预训练模型，建议训练时长不低于4小时。

点击提交训练任务，任务将在平台提供的GPU训练资源上进行训练。

提交成功的任务，将会在项目列表中展示状态。

在此，NLP任务的创建，已经完成。

错误码

如果您的任务出现失败情况，您可以通过查看平台反馈的错误码来查询，如下表：

错误码	训练失败原因说明
01-05、07、08、10、11	后端服务超时或训练失败，请提交工单或加入EasyDL官方QQ群(群号:86882600)联系群管解决
6	数据量过少导致训练失败，请补充数据重新提交模型训练
9	代码错误导致训练失败，请检查脚本代码内容修改后重新提交模型训练，有疑问请提交工单或加入EasyDL官方QQ群(群号:868826008)联系群管解决

创建NLP任务

查看训练结果

百度智能云

BML 全功能AI开发平台

BML 全功能AI开发平台

配置NLP任务

错误码