文章编号:1004-289X(2019)02-0045-05
基金项目:考虑多种源-网-荷柔性匹配方式的试验型微电网规划运
行及平台示范
基于Bootstrap方法的风电输出功率置信区间预测
王楚迪1ꎬ马少华1ꎬ董鹤楠2
(1.沈阳工业大学电气工程学院ꎬ辽宁㊀沈阳㊀110870ꎻ2.国网辽宁省电力
有限公司经济技术研究院ꎬ辽宁㊀沈阳㊀110015)
摘㊀要:本文对实际风力发电机在线检测装置记录的历史数据进行挖掘ꎬ确定影响风机输出功率及随机分布的主要因素ꎻ建立风机输出功率均值预测模型ꎬ求出风机输出功率偏差ꎻ按风力等级将风机输出功率偏差样本划分成多个子集ꎬ分别采用Bootstrap方法和参数化概率方法求解风机输出功率偏差子集和全集的置信区间ꎬ进而对风机输出功率可能出现的范围进行概率预测ꎮ利用实际运行数据对方法进行了验证和对比ꎬ结果表明:按风速划分风机输出功率偏差子集能显著地提高风机输出功率置信区间预测的准确率ꎻBootstrap方法预测准确率比参数概率方法高10%以上ꎬ但置信区间平均宽度约是后者的1 3倍ꎮ
关键词:风力发电机ꎻ输出功率ꎻ区间估计ꎻBootstrap方法ꎻ概率分布类型中图分类号:TM614㊀㊀㊀㊀㊀文献标识码:B
ConfidenceIntervalPredictionofWindPowerOutput
PowerBasedonBootstrapMethod
WANGChu ̄di1ꎬMAShao ̄hua1ꎬDONGHe ̄nan2
(1.SchoolofElectricalEngineeringꎬShenyangUniversityofTechnologyꎬShenyang110870Chinaꎻ
2.StateGridLiaoningElectricPowerCompanyLimitedEconomicResearch
InstituteꎬShenyang110015ꎬChina)
Abstract:Thehistoricaldatarecordedbytheactualwindturbineon ̄linedetectiondeviceisminedinthispaperꎬand
themainfactorswhichaffecttheoutputpowerofthefanandtherandomdistributionaredetermined.Thusꎬthefanoutputpowermeanpredictionmodelisestablishedꎬandthefanoutputpowerdeviationisobtained.Accordingtothewindlevelꎬ
thefanoutputpowerdeviationsampleisdividedintomultiplesubsetsꎬtheBootstrapmethodandtheparameterizedproba ̄bilitymethodareusedtosolvetheconfidenceintervalofthefanoutputpowerdeviationsubsetandthecompletesetꎬandthentheprobabilitypredictionoftherangeinwhichthefanoutputpowermayoccurispredicted.Themethodisverifiedandcomparedwiththeactualoperationdata.Theresultsshowthatthesubsetoffanoutputpowerdeviationaccordingtowindspeedcansignificantlyimprovetheaccuracyoffanoutputpowerconfidenceintervalp
rediction.TheBootstrapmeth ̄odhasapredictionaccuracythatismorethan10%higherthantheparameterprobabilitymethodꎬbuttheaveragewidth
ofconfidenceintervalisabout1.3timesthatofthelatter.
Keywords:wind ̄millgeneratorꎻoutputpowerꎻintervalestimationꎻBootstrapmethodꎻprobabilitydistributiontype1㊀引言
风机输出功率与风速有关ꎬ且具有随机性和波动
性[1]ꎬ精准地预测风机输出功率可能出现的范围可以为含有风电的清洁能源电网的规划㊁运行和稳定分析提供有力支撑ꎮ由于风机输出功率或风机输出功率偏差[2]与典型概率分布拟合效果不够理想ꎬ参数化概率
预测[3-5]的效果可能会牵强ꎻ非参数概率预测[6-7]无
需考虑预测目标的分布类型ꎬ被越来越多地用于风机
输出功率的预测ꎮ常用的非参数概率预测方法有分位
点回归[8]和核密度估计[9]等ꎬ这些算法需要大量的观测样本ꎬ运算复杂ꎬ实现起来有一定的难度ꎮ
随着计算机运算速度和运算能力的快速增长ꎬ面
向应用和涉及大量模拟计算的模拟抽样统计推断方法
得以实现ꎮ其中ꎬBootstrap[10]方法作为一种增广样本统计方法ꎬ以原始数据为基础ꎬ另辟蹊径ꎬ在其范围内
作有放回的再抽样ꎬ无需对统计量的分布类型[11]进行假设ꎬ也无需增加新的观测数据ꎬ即可得到较准确的检
验及推理结果ꎬ解决了许多传统的统计难题ꎮ
本文对实际风力发电机的历史发电和气象数据进
行统计分析ꎬ按风速将风机输出功率偏差样本划分成
若干子集ꎬ采用Bootstrap非参数概率统计方法和参数
概率统方法分别求出风机输出功率偏差子集的概率置
信区间[12]ꎬ再跟据风机输出功率与风速的关系特性ꎬ对风机输出功率的概率置信区间进行预测ꎮ算法通过
了仿真测试和验证ꎮ
2㊀影响风机输出功率及随机分布的因素
风速㊁风向及风速变化率会对风机的输出功率及分布产生一定影响ꎬ为提高风机输出功率预测的精准性ꎬ最好根据风机运行条件建立差异化风机输出功率预测模型ꎮ
提取实际风力发电机在线检测设备记录的历史数
据ꎬ包括风速㊁风向角㊁环境温度㊁机舱温度㊁有功功率
和风机运行状态等ꎮ数据采样周期为1minꎬ记录长度
一整年(2017年1月1日~2017年12月31日)ꎬ风机
运行状态包括:故障㊁暂停㊁待机㊁运行㊁维护和通讯中
断ꎮ抽取正常运行状态下的历史记录ꎬ构建风机输出
功率预测的训练样本和测试样本集ꎮ
对样本进行统计分析ꎬ结果表明: (1)风向角对风力发电机输出功率的影响不明显ꎬ原因在于所分析的风力发电机装有迎风装置ꎬ基本可以保证其在各风向角下都能最大化地利用风能ꎮ此外ꎬ环境温度和机舱温度对风力发电机的发电能力无明显影响ꎮ
(2)风速对风力发电机发电能力的影响极为显著ꎬ图1所示为该风机春㊁夏㊁秋㊁冬(3月㊁6月㊁9月和12月)的输出功率与风速的关系特性散点及拟合曲线ꎮ㊀㊀(3)风机输出功率的随机波动范围与风速有关ꎬ图2所示为该风机春㊁夏㊁秋㊁冬输出功率偏差与风速的关系特性
图1㊀
风机输出功率与风速关系的实测结果
图2㊀风机功率偏差与风速关系的实测结果
㊀㊀(4)图3所示为不同风速条件下该风机3月份输出功率偏差与风速变化率(根据连续两个采样点的风速之差求得)的关系ꎬ其他月份与3月相类似ꎮ从表面上看ꎬ风机输出功率偏差与风速变化率相关ꎬ但实际上风速变化率位于-1~1m/s min之间的样本居多ꎬ样本的分布特性也比较接近ꎻ风速变化率
大于1m/s和小于-1m/s min的样本较为稀少ꎮ此外ꎬ风速变化率是跟据连续两个测量点(1min)的速度之差估算出来的ꎮ因此ꎬ风速变化率对风机输出功率偏差的影响程度不太明确ꎮ
图3㊀风机功率偏差与风速变化率的实测结果
㊀㊀本文暂不考虑风速变化率对风机输出功率的影响ꎬ根据风机历史风速和输出功率ꎬ建立输出功率均值预测模型ꎬ构建风机输出功率偏差样本集ꎮ基于不同风速下风机输出功率偏差的分布特征ꎬ按风速变
化范围将样本划分成若干个子集ꎻ对各子集的样本进行概率统计分析ꎬ建立输出功率偏差子集的概率置信区间预测模型ꎻ根据风机输出功率均值预测模型㊁输出功率偏差子集概率置信区间预测模型ꎬ估计出风机输出功率的概率置信区间ꎬ从而对风机输出功率可能出现的范围进行概率预测ꎮ
3㊀Bootstrap方法预测风机输出功率置信区间
首先根据风机输出功率偏差分布与风速关系ꎬ将风机输出功率偏差划分成若干子集ꎬ假设各子集风机输出功率偏差的概率分布相同ꎮ
设ΔPk=(ΔPk1ꎬΔPk
2ꎬ ꎬΔPkn)是第k个子集样
本ꎬ样本的风速范围为[vk-1ꎬvk)ꎮ采用Bootstrap方法对该子集的风机输出功率进行概率置信区间估计ꎬ步骤如下:
(1)对样本ΔPk=(ΔPk1ꎬΔPk2ꎬ ꎬΔPkn)按放回抽
样的方法ꎬ独立地抽取B个容量为N的子样本(亦称Bootstrap样本)ΔPbk=(ΔPkb1ꎬΔPkb2ꎬ ꎬΔPkb
n)ꎬb=1ꎬ
2ꎬ ꎬBꎻ
(2)进行Bootstrap估计ꎬ计算第b个样本的算术均值ꎬ计算公式为
Δ Pkb=1Nðn
i=1
ΔPkbi
(1)
(3)将Δ Pk1ꎬΔ Pk2ꎬ ꎬΔ PkB按从小到大顺序排列ꎬ得到Δ Pk(1)ꎬΔ Pk(2)ꎬ ꎬΔ Pk(B)ꎮ定义[]为取整符号ꎬ取
kαL=[B α/2]和kαH=[B (1-α)/2]ꎮ置信度为1-α的双侧区间估计为
ΔPkLα=Δ Pk(kαL
)
ΔP
Hα
=Δ Pk(kαH
){
(2)
式中ꎬΔPkLα
为置信区间的下限ꎻΔPkHα为置信区间的上限ꎮ
bootstrap项目Bootstrap方法的特点是只要有样本就可以进行自采样和进行Bootstrap估计ꎬ无需考虑被统计量的分布类型ꎮBootstrap方法借助计算机进行随机模拟ꎬ具有较高的灵活性和实用性ꎮ根据风机输出功率偏差置信区间ꎬ对风机输出功
率的置信区间[PLαꎬPHα]进行预测
PLα=P(v)-ΔPkkαPHα
=P(v)Δ Pk(kαH
)
{
vɪ[vkLꎬvk
H(3)
式中ꎬP(v)为风机输出功率均值与风速的关系特
性ꎻ[vkLꎬvk
H)为第k个子集样本的速度区间ꎮ
4㊀分散式风电场储能系统选址定容流程
4.1㊀风机输出功率偏差样本集
根据被预测日前连续30天的历史风速和输出功
率ꎬ采用最小二乘线性回归拟合出风机输出功率均值与风速关系特性ꎮ其中ꎬ风机输出功率与风速关系采用多项式函数进行逼近ꎮ根据风机输出功率和风机输出功率均值预测模型ꎬ求出风机输出功率偏差ꎮ
4.2㊀风机输出功率偏差的置信区间
根据风机输出功率偏差与风速的关系ꎬ将样本划
分成若干个子集ꎮ本文按风力等级将样本划分成6个子集ꎮ为进行对比ꎬ还对全体样本进行了概率统计分析ꎮ
分别采用Bootstrap方法和参数化概率统计方法对各子集和全集进行概率置信区间估计ꎮ利用Python进行Bootstrap概率统计ꎬ从典型概率分布中出一种与样本最接近的概率分布类型并估计出特征参数和求概率密度函数ꎮ以3月31日风机输出功率置信区间预测结果为例对算法进行评价ꎮ表1所示为根据3月
1~30日风机历史数据求出的风机输出功率偏差的概率置信区间(置信度为90%)ꎮ
Python概率分析结果表明:
(1)风电输出功率偏差与典型概率分布类型拟合的效果并不十分理想ꎬ分布类型最接近t分布㊁f分布㊁
genlogistic分布㊁norm分布或recipinvgauss分布ꎮ尽管可以按照参数化概率模型求出风机输出功率偏差的置信区间ꎬ但存在模型误差ꎮ图4所示为参数概率检验和估计得到的部分子集和全集的概率分布ꎮ子集
1~6分别服从f分布㊁genlogistic分布㊁norm分布㊁genlogistic㊁norm分布㊁t分布ꎬ全集服从genlogistic分布ꎬ不同子集的概率分布虽然可能相同ꎬ但特征参数不同ꎮ
表1㊀不同风速下风机输出功率偏差置信区间
Tab.1㊀Confidenceintervaloffanoutputpowerdeviationunderdifferentwindspeeds
子集风级风速范围m/s置信区间/kW
Bootstrap方法参数概率方法10~2[0ꎬ3.3)
(-30.9ꎬ67.7)(-25.5ꎬ38.7)23[3.4ꎬ5.4)(-75.5ꎬ69.7)
(-54.4ꎬ50.6)
34[5.5ꎬ8.0)
(-197.5ꎬ238.0)(-154.1ꎬ178.7)45[8.0ꎬ10.8)(-320.6ꎬ320.0)(-255.5ꎬ234.8)56
[10.8ꎬ13.9)(-103.9ꎬ60.1)(-56.3ꎬ53.3)6
7~8[13.9ꎬ20.7)(-68.4ꎬ68.4)
(-49.4ꎬ58.3)1~60~8[0ꎬ20.7)
(-103.0ꎬ61.1)
(-49.9ꎬ53.
3)
图4㊀风机输出功率偏差概率分布
㊀㊀(2)Bootstrap方法和参数概率方法求出的风机输出功率偏差置信区间不同ꎬ不论是子集还是全集ꎬ前者的比后者宽ꎮ
(3)风力较弱或较强的风机输出功率偏差子集的
置信区间较窄ꎻ风力中等子集的风机输出功率偏差置信区间较宽ꎬ与图2所示的风机输出功率偏差与风速的关系特性相吻合ꎮ
(4)根据全体风机输出功率偏差样本求的置信区
间比弱风子集和强风子集的置信区间宽ꎬ但比中等风力子集的置信区间窄ꎮ原因在于弱风和强风下风机
输出功率偏差波动范围窄ꎬ样本主要分布在0附近ꎻ中等风速下风机输出功率偏差波动范围宽ꎬ样本分布范围较宽ꎮ表面上看ꎬ相同的置信度下ꎬ不按风速划分风机输出功率偏差子集所得到的置信区间比中等风力风机输出功率偏差子集的置信区间宽ꎬ但实际上位于置信区间之外的样本中ꎬ中等风力等级样本所占的比例较高ꎬ这会对中等风力条件下风机输出功率偏差预测的准确性造成不利影响ꎮ
4.3㊀预测效果分析
如果i个点的预测结果位于置信区间之内ꎬ则预
测结果准确ꎬ反之亦然ꎮ定义
ξ1-αi
=0Pi∉[P1-αLꎬP1-α
]1
Piɪ[P
1-α
ꎬP
1-αH
]
{
(4)
式中ꎬPi为第i个样本的实际输出功率ꎻ如ξ1-α
=1ꎬ则评价结果准确ꎬ如ξ1-α
=0ꎬ则评价结果不准确ꎮ采用置信上限与置信下限之差评价第i个点的预
测结果是否具有指导意义ꎮ定义
δ1-αi=P1-αH-P1-αL
(5)
总体预测结果是否准确用预测区间的覆盖概率
R1-a
cover加以评价ꎬ为
1-α
cover
=1NðNi=1
ξ1-αi
(6)预测结果的指导意义用区间平均宽度表示ꎬ为δ
1-αmean
=1NðN
i=1
δ1-α
(7)
根据3.2节的计算结果ꎬ代入被预测日的风速ꎬ分别求出置信度为0 9下风机输出功率的点估计和风机输出功率偏差的置信区间估计值ꎬ再进一步求出风机
输出功率的置信区间的估计(预测)值ꎮ采用R0.9
cover和δ0.9mean对预测效果进行评价ꎮ
分别按表1㊁表2和表3的风机输出功率偏差置信区间预测模型ꎬ代入预测日的历史风速ꎬ预测出当日风机输出功率偏差置信区间ꎮ3月31日某时段(15min)风机输出功率置信区间预测结果如图5所示ꎮ不同预测方法的性能评价指标如表2所示ꎮ㊀㊀对预测结果进行分析可以看出:虽然采用不同方法对不同样本建立的风机输出功率偏差置信区间预测模型的置信度均为90%ꎬ但实际预测结果的覆盖概率
R0.9cover达不到90%ꎮ其中ꎬ采用Bootstrap方法按风力划
分子集的准确性最接好R0.9
coverꎬ达86 38%ꎬ但置信区间平均宽度最宽ꎬδ0.9mean为361 3kWꎻ采用参数概率方法按风力划分子集的准确性稍差ꎬR0.9cover达74 47%ꎬ置信区间平均宽度稍窄ꎬδ0.9mean为286 3kWꎻ如果不按风速范
围划分子集ꎬ而是跟据全体样本建立Bootstrap或参数概率置信区间ꎬ预测结果的覆盖概率R0.9cover分别为
57 28%和41 62%ꎬ但置信区间宽度比按风力划分子
集窄ꎬδ0.9mean分别为169 1kW和103 2kWꎬ原因在于建模时没有考虑差异化条件ꎬ模
型不能很好地反映风速对风机输出功率偏差的显著影响
图5㊀风机输出功率置信区间预测结果与实际输出功率
表2㊀风机输出功率概率置信区间预测效果评价
评价指标
全体样本Bootstrap参数概率按风力划分子集Bootstrap参数概率R0.9cover/%
57.28
41.62
86.38
74.47
δ0.9mean/kW
169.1103.2361.3286.35㊀结论
(1)风力发电机输出功率偏差的分布与风速有
关ꎬ风速较小或较大时ꎬ风力发电机的输出功率偏差较小ꎻ风速4~6级时ꎬ风力发电机的输出功率偏差较大ꎬ应考虑风速对风机输出功率偏差的影响建立差异化风机输出功率置信区间预测模型ꎻ
(2)虽然风机输出功率置信区间预测模型是在一
定置信度下建立的ꎬ但实际预测效果达不到理想的置信度ꎮ预测效果与所采用的建模方法有关ꎬBootstrap方法的准确率比参数概率方法高10%以上ꎬ但置信区
间平均宽度约是参数概率方法的1 3倍ꎮ
(3)按风速划分样本子集比不按风速划分样本子
集的准确率高30%左右ꎬ但置信区间平均宽度大约仅为不按风速划分样本子集的40%ꎮ可见ꎬ按风速划分风机输出功率偏差子集可以显著提高预测结果的准确率ꎮ
参考文献
[1]㊀王琦ꎬ关添升ꎬ秦本双.基于MRMR的ORELM的短期风速预测[J].可再生能源ꎬ2018ꎬ36(1):85-90.
[2]㊀刘红柳ꎬ杨茂ꎬ于宁ꎬ等.风向空间分散性及其对全场风电功率预测误差的影响[J].电测与仪表ꎬ2017ꎬ54(12):54-59.
[3]㊀LiuHꎬShiJꎬQuX.Empiricalinvestigationonusingwindspeedvola ̄tilitytoestimatetheoperationprobabilityandpoweroutputofwindturbines[J].EnergyConversion&Managementꎬ2013ꎬ67(67):8-17.
[4]㊀RuiliYEꎬGuoZꎬLiuRꎬetal.Reliablepoweroutputbasedonconfi ̄denceintervalestimationandoptimalESSconfigurationofwindfarm[J].E ̄lectricPowerAutomationEquipmentꎬ2017.
[5]㊀梁海峰ꎬ曹大卫ꎬ刘博ꎬ等.风电场概率分布模型建模及误差分析[J].华北电力大学学报(自然科学版)ꎬ2017ꎬ44(3):8-14.
[6]㊀WanCꎬXuZꎬØstergaardJꎬetal.Discussionof CombinedNonpara ̄metricPredictionIntervalsforWindPowerGeneration [J].IEEETransac ̄tionsonSustainab
leEnergyꎬ2017ꎬ5(3):1021-1021.
[7]㊀QinXꎬLiYꎬShenCꎬetal.TheCorrelationAnalysisofCleanEnergyOutputBasedonNonparametricKernelDensityEstimationProbabilityMod ̄els[C]//InternationalConferenceonArtificialIntelligenceandIndustrialEngineering.2016.
[8]㊀LiuYꎬYanJꎬHanSꎬetal.UncertaintyAnalysisofWindPowerPre ̄
dictionBasedonQuantileRegression[C]//PowerandEnergyEngineeringConference.2012:1-4.
[9]㊀刘晓楠ꎬ周介圭ꎬ贾宏杰ꎬ等.基于非参数核密度估计与数值天气预报的风速预测修正方法[J].电力自动化设备ꎬ2017ꎬ37(10):15-20.[10]㊀JohnsonRW.AnIntroductiontotheBootstrap[J].TeachingStatis ̄ticsꎬ2001ꎬ23(2):49-54.
[11]㊀杨宏ꎬ苑津莎ꎬ张铁峰.一种基于Beta分布的风电功率预测误差最小概率区间的模型和算法[J].中国电机工程学报ꎬ2015ꎬ35(9):2135-2142.
[12]㊀叶瑞丽ꎬ刘建楠ꎬ苗峰显ꎬ等.风电场风电功率预测误差分析及置信区间估计研究[J].陕西电力ꎬ2017ꎬ45(2):21-25.
[13]㊀YERuiliꎬLIUJiannanꎬMIAOFengxianꎬSONGHongleiꎬetal.Analy ̄sisofWindPowerPredictionErrorandItsConfidenceIntervalEstimationinWindFarms[J].SHAANXIELECTRICPOWERꎬ2017ꎬ45(2):21-25.
收稿日期:2018-00-00
作者简介:王楚迪(1992-)ꎬ女ꎬ博士ꎬ研究方向为电力系统大数据分析ꎻ
马少华(1963-)ꎬ女ꎬ教授ꎬ研究方向为研究方向为智能化电器及微电网控制技术ꎻ
董鹤楠(1986-)ꎬ男ꎬ国网辽宁省电力有限公司电力科学研究院高级工程师ꎬ专业电力系统及其自动化ꎮ