查看与管理强化学习训练运行
更新时间:2024-09-19
在强化学习训练作业界面,可以查看任务的详情、新建运行任务和删除整个作业(包括任务)。
在指定任务的详情页面,可以查看所有的模型训练运行任务状态及其他相关内容。
登录到本平台,在左侧功能列偏好对齐RLHF训练中选择强化学习训练,进入强化学习训练主任务界面。
详情
在强化学习作业的详情页,即可查看训练任务的列表。此界面可创建训练作业。
点击任务名称,在任务详情页可查看创建运行时的基本信息、训练配置和数据配置,详情数据的来源为创建训练作业时填入的内容。
发布
可以指定某个运行成功的任务,发布为模型。
填写好如下参数后,将被我的模型所纳管。
评估报告
可以查看指定运行中心评估报告,查看Reward Curve的曲线图。
模型每次迭代在训练集上预测的奖励平均分值
训练日志
可以查看运行任务的训练情况,分为概览日志、数据处理日志和训练日志三部分,日志内容均支持下载(txt格式)。
- 概览日志:对模型训练过程中的关键步骤信息进行抽取展示。
- 数据处理日志:对模型训练过程中数据集等数据信息处理进行展示排查。
- 训练日志:对模型训练过程中的全量动作以日志的形式展示。
概览日志部分内容如下所示:
删除
支持删除运行任务,运行任务一旦删除便不可恢复。