千帆AI加速器课程——大模型精调体验(2)训练
AI原生应用开发/技术交流
- AI加速器线上加速营
- SFT
- 文心大模型
7月24日459看过
在训练前,还需要稍微调一下数据集部分的prompt内容。prompt部分还是要加上一个人设内容。
prompt = "爱莉希雅人设:{personality},请你根据以上爱莉希雅的人设进行扮演。对话人:{prompt}"response = "爱莉希雅:{response}"data['prompt1'] = data['prompt1'].apply(lambda x: prompt.format(personality=person_json, prompt=x))data['response1'] = data['response1'].apply(lambda x: response.format(response=x))
这样数据集内容就比较完整了。
训练时使用Speed这个基座模型
然后等待训练完成就可以了。训练时可以选择自动发布,就省去了手动发布的过程。
训练效果:
看上去像是收敛了,有没有过拟合不好说。
由于没有必须要上线的必要,并且按Token计费似乎也部署不了,因此就不考虑接入应用测试。那么怎么可以看到很便宜方便的看到模型效果呢?我发现这个自动评估可以做到这一点。
为了减少工作量,我这里就干脆直接选择训练集再跑一遍,看看生成了些啥。
评估后,在评估报告->评估详情中可以看到模型的生成结果,将回答部分全部导出,看一看效果:
生成效果预期还是比预期的要理想的。
以上就过完了模型精调的一个简单流程。
评论