北极星

搜索历史清空

  • 水处理
您的位置:电力电力新闻配售电电力现货评论正文

甘肃中长期交易场景下的现货价格预测方法

2024-12-26 08:36来源:兰木达电力现货作者:李天赐关键词:电力市场电力交易甘肃售电市场收藏点赞

投稿

我要投稿

全文共3714字,阅读全文需要12分钟

价格预测

电力交易中,价格预测具有极其关键的作用。电力市场价格波动比较大,同时受到多种因素影响(如供需关系、天气变化、政策调整等)。准确的价格预测可以有效帮助交易员识别和管理市场风险。

(来源:微信公众号“兰木达电力现货”作者:李天赐)

电力交易的核心目标是最大化利润。准确的价格预测可以帮助交易员选择最佳时机买入或卖出,从而实现利润最大化。另外,价格预测也直接关系到优化资源配置、决策支持和投资回报等。通过科学的市场分析和技术手段,交易员能够在复杂的电力市场中识别机会、规避风险。

在进行价格预测时,我们通常需要针对多种参数来进行研究。首先需要利用历史价格和市场数据进行分析;其次要结合天气预报和电力负荷预测,综合考虑对价格的影响;最后选择合适的机器学习算法并训练模型,从而实现对价格的预测。本文将聚焦于对价格预测过程中的算法选择与模型调优进行探讨。

在电力交易中的价格预测模型,有两种构建方式。其一,将天气、负荷、联络线、新能源出力等边界条件作为模型参数,将价格作为目标变量(target,也可以称作响应变量),构建多参数回归模型。其二,考虑到天气、负荷、联络线等边界条件的变化具有时间矢量上的周期性,可以侧重关注价格在时间序列上的延续性,并依此进行预测。下面我们针对两类模型构建方式分别对算法进行讨论,采用的历史数据包含2022.1.1至2024.10.31每天的「日前系统负荷预测、日前系统间联络线总输电曲线预测、新能源总出力预测(风电)、新能源总出力预测(光电)、水电计划发电总出力预测」96点数据。预测标的为11.4-11.10一周的日前价格均值。

回归算法

多参数回归算法是一类用于分析多个解释变量与一个或多个响应变量之间关系的统计方法,在电力市场的价格预测中作为与价格高度相关的一系列边界条件能够很好的启到解释变量的作用。在多参数回归方向,我们探讨以下三种常用的算法:

1

RandomForest——随机森林算法

随机森林是一种集成学习方法,通过构建多个决策树并取其平均值来提高模型的准确性和稳定性。

随机森林通常具有较高的准确性和泛化能力,由于使用了集成方法和随机特征选择,随机森林不容易过拟合,同时可以评估每个特征的重要性。但是,其计算复杂度较高,也难以解释决策过程。

2

Gradient Boosting Trees——梯度提升树算法

梯度提升树是一种迭代算法,通过逐步添加弱学习器来最小化损失函数。

梯度提升术树可以处理各种类型的数据和损失函数,可以在许多问题上达到很高的预测精度。但是如果模型过于复杂或者训练数据不足,容易过拟合,另外梯度提升树的参数调优也比较困难。

3

CatBoost回归算法

CatBoost是一种基于梯度提升的算法,专门设计用于处理类别特征。

CatBoost在处理大样本和复杂数据集时表现出色,能够通过使用不同的正则化技术和数据扰动方法来减少过拟合,但是计算资源消耗大,参数调优也比较困难。

综上所述,考虑到通过边界条件预测价格这一个多参数回归问题中,算法无需解释决策过程,需要避免过拟合,同时考虑参数调优难度,经过测试比较后最终选择随机森林算法。

模型训练中,新增了年、月、时刻、年度周数(1、2……)四个非边界条件参数,目的是适当的捕获目标变量在时间序列上的延续性和周期性。经过参数调优之后训练得到局部最优模型,使用测试集验证模型效果,得到MAE为20.4,在各算法中表现最优。

上图为随机森林预测价格与实际出清价格对比,可以看到实际偏差比较大,单时段平均误差达到57元/兆瓦时,最大误差达到228元/兆瓦时。事后复盘原因,是因为在随机森林算法中,针对大量历史数据来构建决策树的过程中,弱化了价格阶段性的特点。例如,进入11月后,光伏出力时间缩短,16-18点价格走高;再例如,从10月延续而来的平段抬价行为,经过大量的历史数据训练后,在模型中权重极低。总结来说,就是缺少对价格近期特点的重视。因为价格反应的不只是市场边界情况,还有近期的市场态度。那么为了解决这个问题,我们就要提到下面的时间序列算法了。

时间序列算法

时间序列算法是一类专门设计用于分析和预测随时间变化的数据的统计和机器学习方法。在年、月、周的市场周期中,很容易发现价格是具有时间依赖性、季节性和趋势性的。最典型的就是常规情况下平段价格高于谷段,小于峰段,日内96点价格大体呈凹形分布。在时间序列方向,我们探讨以下三种常用的算法:

1

Holt-Winter算法

Holt-Winter算法是一种经典的指数平滑方法,用于预测具有趋势和季节性的时间序列数据。

Holt-Winter算法易于理解和实现,能够很好地处理具有明显季节性和趋势的时间序列数据,面对大规模数据处理时计算效率较高。但是有一定局限性,无法处理高维特征和复杂的非线性关系。

2

RNN循环神经网络

RNN是一种具有循环结构的神经网络,能够处理序列数据,捕捉时间依赖性。

RNN能够处理各种长度的时间序列数据,适用于复杂模式,在自然语言处理等领域广泛应用。但面对长序列时容易出现梯度消失或者梯度爆炸问题。

3

LSTM长短期记忆网络

LSTM是一种改进的RNN,通过引入门控机制解决了RNN的梯度问题。

LSTM能够有效处理长序列中的长期依赖关系,避免梯度问题,可以处理的时间序列数据类型宽泛。但是计算资源消耗大,训练时间长,同时模型参数多,调参难度大且容易过拟合。

综上考虑,在为期三年的每天96点历史出清数据的长序列中,并无高维特征,并且需要避免训练中的梯度消失、过拟合等问题,经过测试比较后选择Holt-Winter算法。

模型训练中,舍弃边界条件和日期信息,仅将价格看作具有充分季节性的时间序列对模型进行训练。同样对模型进行参数调优,并使用测试集验证模型效果,得到MAE为22.76,表现较好。

上图为Holt-Winter预测价格与实际出清价格对比,可以看到平段、峰段预测价格偏高,谷段预测价格误差较小,并且未预测到8点、18点的价格凸起。事后复盘原因发现在Holt-Winter算法中,针对长时间序列进行学习时,自然的较近时间点的数据的学习权重就要大一些,这也导致了着重延续近期的价格态势,从而忽略了边界条件可能出现的明显变化,例如异军突起的8点、18点价格。

当我们依次使用了随机森林算法和Holt-Winter算法得到预测价格并与实际出清对比后,我们可以发现两种算法都有其侧重的点,也有忽略的点。但是作为交易员来说,不论是市场边界情况,还是近期的市场态势,都是在预测未来价格时不可忽视的点。所以将上述的两种价格预测相结合,得到综合版价格预测便成为我们现阶段的目标。这一任务目前来看不便由机器学习代劳,而是由交易员通过人工智慧来干预比较好。

权重寻优

2024年10月,平段、峰段价格对比9月有明显的走高,谷段价格却有走低。事后分析来看,价格走高主要是因为检修、抬价、全时段风出力走低导致的;谷段价格较低主要是由于光出力较高导致的。那么同时对比9、10月的价格情况来分析11的出清价格,11月的价格从形状上与10月比较相似,且由于风光比较小,抬价行为延续,平峰谷的价格都有所提高。另一方面,对比9月的光伏出力,10月的19点光伏出力明显降低,对比10月的光伏出力,11月的8、18点光伏出力有明显降低,这也就导致了8、18点价格显著走高。同时,11月上旬频繁的检修导致了阻塞,也时谷段价格走高的原因之一。

经过上面对月度价格的分析,我们可以发现,不论是随机森林还是Holt-Winter算法,都不能把我们提到的所有关键点囊括在内。于是笔者考虑,是否可以将两个算法得到的值赋予不同的权重,从而得到综合版价格预测?

▶方案一:24时段统一权重

首先尝试了给24时段分配一个统一的权重,例如RF权重为20%时,综合版价格便等于(RF价格*20%+HW价格*80%),并计算综合版价格与出清价格的MAE,很遗憾,预测效果丝毫没有随着权重的改变而优化的表现,甚至综合MAE比单独每个算法的MAE都要大。

▶方案二:峰平谷分配权重

方案二尝试了根据峰平谷分配不同的RF占比权重,每一段的权重范围为【-100%,100%】,测试间隔为1%,即遍历了RF峰平谷权重分别为「-1、-0.99、-0.98……0.98、0.98、1」的2003种情况,得到的最MAE为38.88,RF平段、谷段、峰段权重分别为66%,-4%,33%。虽然对比方案一优化效果有所提升,但是依旧难尽人意。

▶方案三:分时段人工调整

经过以上两个方案,认为简单的通过参数将两个预测结果结合起来虽然理论上可行并有意义,但实际实验中并不能在短时间得到较好的参数考量。所以,认为应及时充分发挥交易员的能力,结合已知信息针对不同时段价格进行适当调整,例如文中多次提到的8、18点价格。

通过上文的分析我们可以知道,7、8、17、18点的价格因光伏出力时长的缩短有一定走高,22、23点的价格因联络线形状的变动而略有走低,故交易员在RF全时段占比50%的综合版基础上,对这几个点针对性进行调整。调整后的MAE能够落到25左右,这个数据已经相对可以接受。

其实对于交易员来说,调整前版本价格预测的偏差程度已经算是可以接受,之所以对针对点进行调整,是为了契合月度的价格特点。在案例中,标的周为11.4-11.10,这几个点的人工调整也是基于标的周的时间位置来考虑的,如果换到10月,12月,或者4月,5月,可能不需要调整,也可能需要调整其他时段。

到此为止,我们的权重寻优过程告一段落。我们虽然得到了全时段和峰平谷时段的最优MAE参数组,但其可靠性和可用性还需要进一步的测试和研究。综合来说,通过某种方法将随机森林算法和Holt-Winter算法结合起来是可行的,那么同时抓取价格的参数特征与时间序列特征就也是可行的。

总结

为了对本文进行一个总结,我们需要回归到价格预测的本质。

价格预测的根本目的,是为了根据现有条件,对目标时间周期的价格作出一个预判。不论是我们所尝试的回归算法,还是时间序列算法,都是为了从不同的角度抓住价格序列的特征:或是参数特征,或是时序特征。在挖掘这些特征的过程中,我们分别选择了随机森林算法和Holt-Winter算法,并将两个版本的价格预测进行加权,以得到综合版价格预测。为了进一步契合当前市场情绪,我们引入了交易员这一角色作为价格预测过程中的有机组成部分,通过对不同时段价格的人工调整,我们在事后得到了与出清价格相似性较高的价格预测曲线。但随着应用场景的拓展,如何确定人工调整的方向和程度,需要交易员能够培养对市场敏锐的感知,才能够在算法的基础上对价格预测进行进一步的调控,以提高价格预测的准确率和可信度。

投稿与新闻线索:陈女士 微信/手机:13693626116 邮箱:chenchen#bjxmail.com(请将#改成@)

特别声明:北极星转载其他网站内容,出于传递更多信息而非盈利之目的,同时并不代表赞成其观点或证实其描述,内容仅供参考。版权归原作者所有,若有侵权,请联系我们删除。

凡来源注明北极星*网的内容为北极星原创,转载需获授权。

电力市场查看更多>电力交易查看更多>甘肃售电市场查看更多>