评估效果
更新时间:2022-05-06
模型评估
模型训练完成后,可以在「我的模型」列表中查看该模型的效果,以及完整评估结果。
「完整评估结果」页面中将记录整体评估与详细评估的报告,包括该模型整体的准确率、F1-score、精确率、召回率,以及评估样本具体数据情况,各分类的精确值、F1-Score等指标。
整体评估中,各指标的释义如下:
- 准确率:正确分类的样本数与总样本数之比
- F1-score:给每个类别相同的权重,计算每个类别的F1-score,然后求平均值
- 精确率:给每个类别相同的权重,计算每个类别的精确率,然后求平均值
- 召回率:给每个类别相同的权重,计算每个类别的召回率,然后求平均值
如果单个标签的文本量在100条以内,会影响评估指标的科学有效性,请确保提交的训练数据中每个标签的数据量
模型校验
在完成训练后,发布模型前,可以先进行模型校验,以确保模型在实际环境中能获得预期的性能。操作方法如下:
- 在左侧「模型中心」目录中点击「校验模型」,进入校验模型页面
- 选择需要校验能力的模型、部署方式、版本,点击「启动模型校验服务」
-
校验服务启动后,在左侧输入文本,点击「校验」后,右侧识别结果栏将输出预测结果
- 校验数据支持两种输入方式,直接输入文本或上传txt格式文本,文本长度上限为512汉字
- 在识别结果栏中,可进行阈值的调整。置信度在阈值以下的预测结果将不予显示。例如,阈值调整为0.85时,置信度小于85%的预测结果将不予显示。各类标签的置信度均小于85%时,识别结果栏将显示为:“没有满足条件的识别结果”
-
若您对预测结果满意,可点击「申请上线」,进行模型的发布
如果单个标签的文本量在100条以内,会影响评估指标的科学有效性,请确保提交的训练数据中每个标签的数据量