文本实体抽取训练说明
更新时间:2020-12-23
训练模型
数据提交后,可以在目录中找到【训练模型】操作训练。
首先选择一个模型,然后勾选对应要训练的数据标签。
平台为您提供了两种算法,分别是「高精度」和「高性能」两种算法训练方式。如果您手中的标注数据集样本较少(例如少于1000条),可选择「高精度」的算法。使用高精度的算法训练模型将会耗时更久,实验环境下1000个样本,预计在20分钟左右完成训练,同时训练处的模型预测效果也会更佳。
如果您手中有充足的数据集,您可选择「高性能」的算法。在实验环境下1万条样本的数据集,将在15分钟左右完成训练,同样的数据量情况下,效果比高精度的模型4-5%
添加数据集成功后,点击开始训练即可启动训练。
注意,文本实体抽取模型至少需要有1个及以上实体类别,样本数建议超过1000