训练任务失败错误排查
更新时间:2023-02-15
时序预测任务失败,一般主要是由于时间列格式错误或配置错误导致的,您可以参照如下内容检测您的数据或配置是否正确:
时间列要求
在创建时序预测任务时,所使用的数据集的时间列应为Date类型并以yyyy-MM-dd开头,否则会造成训练任务失败. 如 "yyyy-MM-dd'T'HH:mm:ssX" "yyyy-MM-dd HH:mm:ss" "yyyy-MM-dd" 等等
时间间隔
选择时间列与目标列后,系统会根据数据的前100行去推断时间间隔,但是难免会推断错误。
预处理阶段会根据选择的时间间隔对数据进行重新采样,若选择了过大的时间间隔,降采样会导致数据过短。反之,过小的时间间隔会导致数据分布异常,合理的选择时间间隔是保证预测质量的重要环节之一。
时间序列长度
时序预测通常会采用历史的一段时间的数据作为特征,因此数据长度必须满足一定要求才能保证有足够的训练与评估样本。
当时序数据为分组数据时,每个分组会作为一个单独的时间序列,因此需要保证每个分组的时间序列足够长。
另外选取了不适当的时间间隔,降采样后也会导致数据量不够的情况。
分组字段
为了确保每个时间列有充分的数据,限制了平均每个分组至少包含20条数据,若数据中存在大量超短时序数据,请您提前做好筛选。
窗口长度与预测长度
时序模型的输入为窗口长度中的各个特征,输出为预测长度的目标列。因此当数据中的时间序列较短的时候,请您合理地降低窗口长度和预测长度,有助于模型有充足的样本进行预测。