1.新能能源发电量预测
项目说明
业务背景
在"碳达峰"、"碳中和"背景下,风电、光伏等新能源电力并网量显著提升,并逐步在企业园区自备电厂推广使用。新能源精准调度可以最大限度节约新能源、提高新能源利用率。
业务难题
新能源调度的核心依据来自对一段时间内的新能源发电量预测,精准预估发电量可以保证能源调度的合理性。能源作为消费类产品,它的发电量受天气等环境因素影响较大,波动较大,对电网稳定性、能源调度都带来了极大挑战,除此之外,设备状态、装机量也是影响发电量预测准确性的关键因素。由于以上多种原因导致精准预估新能源发电量难度较大。
解决思路
为满足上述场景需求,精准预估新能源发电量,可通过EasyDL快速构建AI预测模型。通过全面采集新能源发电影响因子(社会活动、天气、季节、设备状态等),选择EasyDL结构化数据场景的时序预测任务类型,可自动训练不同时间尺度的发电量(天、周、月等)预测模型,有效提升预测准确率。某省电网公司通过应用EasyDL时序预测训练电力母线负荷预测模型,有效提升该地区新能源发电量预测准确率达98%以上。
数据准备
新能源发电预测建模所需的数据一般来自发电设备管理系统、天气预报系统等,可线下合并为一份Excel/CSV文件后导入至EasyData数据服务用于训练。 本示例中使用的数据为天颗粒度,包含了date(日期,时间列)、temp_xx(不同测点的环境温度)、humid_xx(不同测点的环境湿度)、wind_xx(不同测点的风速)、rain_xx(不同测点的降雨情况)、power(当天发电量,目标列)。时序预测使用的数据集需包含时间列、目标列。
模型训练
发起训练任务
数据导入平台后,可进入 EasyDL时序预测 模块进行模型训练。EasyDL时序预测将根据历史的时间序列数据对目标列未来的变化趋势进行预测。根据预测长度字段设置,模型每次可预测未来1个或多个点。 在配置训练任务时,需指定数据集中的时间列、目标列,平台将根据数据颗粒度自动解析时间间隔(本例为24小时)。用户可根据预测需求配置历史滑动窗口大小、预测长度大小。 滑动窗口大小往往根据场景经验进行配置,在本例中,我们认为过去5天的数据波动对未来趋势影响较大,因此滑动窗口设定为5。 若后续训练效果不佳,也可返回尝试不同的滑动窗口大小重新训练。
模型评估与优化
模型训练完成后,可在评估报告页面查看模型的主要评价指标。在时间序列预测任务中,一般关注 MAPE 平均绝对百分比误差,一般小于10%的模型可认为效果较好。
在评估报告页面也可对模型的实际预测结果、每个时间点的预测误差进行进一步分析,深入了解模型在不同工况下的预测表现。
如下图所示,预测序列在最后2周内(2016-01-18 ~ 2016-01-31)预测残差较大,从图上可以看出是由于趋势性波动与过往数据显著不同,建议通过加入相似波动的训练数据、引入新的相关变量、或分工况分别训练模型来提升模型效果。
模型部署
完成训练的模型可直接发布为公有云API进行使用,并集成至业务系统(例如能源调度系统),结合新能源发电量预测结果进行能源调度。
API请求数据为单次预测所需的时间窗数据,返回为模型时序预测结果。公有云API调用文档详见:https://ai.baidu.com/ai-doc/EASYDL/1kff9r20o