1.What
提出了一種基于K-means++降維剖析和極限學習機(ELM)的短期風電功率預測方式,同時使用數值天氣預報(NWP)數據與SCADA系統的歷史檢測數據,實現了對未來72h的短期風電功率預測。
2.Why
生物質能的波動性對風電產業的迅速發展帶來了巨大挑戰,確切可靠的短期風電功率預測對滿足電網調度以及增加度電成本具有重要意義。
3.How
3.1物理方式
(1)互信息
互信息(MI)是評判變量間相關性的量度,互信息越大,代表變量間的相關性越強。對于離散隨機變量X,Y,其互信息I(X,Y)表示為:
式中p(x)和p(y)分別是X和Y的邊沿機率分布函數;p(x,y)為X和Y的聯合機率分布函數。
(2)K-means++降維
本文選用K-means++算法對數據進行降維,主要步驟如下:
a.在數據集中隨機選出一個降維中心點C1,依次估算其他數據樣本Xi與C1之間的距離,記為L(x),則樣本點被選中為下一降維中心點的機率為:
使用輪盤法選出下一個降維中心,重復此步,直到選出K個降維中心點;
b.估算剩余的數據樣本與K個降維中心點的距離,按距離大小,將剩余的數據樣本分入距離最小的中心點Ck所在的子集中;
c.重新估算各數據子集中數據點的中心點;
d.重復步驟b~步驟c,直到降維中心點不再發生聯通。
(3)極限學習機
極限學習機是一種基于單隱層卷積神經網路的新型算法,其結構如圖1所示:
圖1ELM結布光
對于給定N個任意樣本(Xj,tj),其中,Xj=[Xj1,Xj2,…,Xjn]T∈Rn,tj=[tj1,tj2,…,tjm]T∈Rm,具有L個隱藏層的ELM網路可以表示為:
式中j=1,...,N,G(x)為激活函數,Wi=[Wi1,Wi2,…,Win]T為第i個隱藏層與輸入層之間的權重矩陣,ρi=[ρi1,ρi2,…,ρim]T為第i個隱藏層與輸出層之間的權重矩陣超短期風電功率預測,bi為第i個隱層單元的偏置。式(3)可表示為:
其中,
式中H代表ELM的隱藏層輸出矩陣。ELM的系數ρ可以通過搜索線性系統Hρ=T的最小二乘解
來確定:
其中,H+是蘊涵層輸出矩陣H的Moore-廣義逆。
ELM模型訓練時其輸入層的殘差與閥值為隨機形成,算法執行過程中只須要對蘊涵層神經元的個數進行調整,無需調整參數。
3.2短期功率預測模型
本文提出的風電功率預測模型的結構框圖如圖2所示:
圖2系統結構框圖
(1)數據預處理
風電場的SCADA系統采集頻度為60s,將數據集進行平均處理,幀率為15min。因為輸入向量量綱不一致,使用Z-score標準化方式對數據進行歸一化,依照各輸入特點與風電功率之間的互信息值選擇輸入特點,其結果如表1所示。按照J1、J2數據集的互信息值,J1、J2均選擇風向、溫度、相對溫度、風速、表面浮力作為輸入特點。
表1互信息值
(2)數據降維
針對上一步所選定的輸入特點及前三天的實測風速數據,將數據界定為K個子集,并估算偏差平方和(SSE),使用手指法選定最合適的K值。按照手指法的原理,SSE值在接近真實降維數時會隨之變化,當分類的個數小于4后,其SSE值變化漸趨緩慢,因而令數據集J1、J2的K值為4。
(3)功率預測
針對上一步界定的數據子集,分別建立ELM預測模型。通過估算NWP數據與降維中心點的距離選擇合適的模型實現預測。
3.3算例剖析
(1)實驗數據
選用山東魚臺海上風場提供的風電數據超短期風電功率預測,對文中提出的功率預測模型進行驗證。其中J1為該風場2020年11月13日~2021年2月3日提供的NWP信息,J2為2020年12月09日~2021年3月3日提供的NWP信息。選用其后20天的數據作為測試集,其他數據作為訓練集,預測時長均為3天。
(2)評價標準
文中使用NRMSE(RootError,歸一化均方根偏差)、NMAPE(MeanError,歸一化平均絕對比率偏差)作為功率預測評價指標。其公式如下所示:
式中yt為原始風速值;
為風速預測值;C為風機的額定功率。
(3)實驗結果
為了驗證該模型的性能,文中比較了未經降維的持續法、BP神經網路、ELM模型,與使用K-means降維的K-ELM模型作為對比模型,每位模型訓練50次取平均值,預測時長每隔24h(即96個預測點)取平均值,從預測精度來評價該模型。其預測結果如表2~表5所示。
表2J1數據集與精典方式的對比結果
表3J1數據集與降維方式的對比結果
表4J2數據集與精典方式的對比結果
表5J2數據集與降維方式的對比結果
剖析表2、表4的預測結果可以看出,與精典風電功率預測方式相比,文中提出的K++ELM方式的NRMSE、NMAPE分別平均增加了15.2%、17%。從表3、表5的預測結果可以看出,將數據降維后更能確切地實現預測。
4.
實驗結果表明,本文提出的基于K-means++降維與ELM的短期風電功率預測方式與其他4種預測模型相比,具有較高的機率預測精度。
5.
(1)本文先介紹了所采用的物理方式:互信息法、K-means++算法、極限學習機算法;隨即提出短期功率預測模型,將實驗樣本帶入,詳盡地描述了數據預處理、聚類剖析、功率預測的步驟;最后再進行算例剖析驗證算法的有效性。思路清晰,結構嚴謹,無論是“機器學習”領域還是“功率預測”領域,都是一篇例文。
(2)筆者之前在學習《基于K均值降維算法的電源運行狀態數據剖析》論文時,曾考慮到K-means降維“需要人為給定K的個數”以及“聚類結果受初始降維中心選定影響大”的缺陷,而本文使用的K-means++降維算法完美解決了這兩個問題。筆者總結該算法的核心思想是:所選初始降維中心之間的互相距離要盡可能的遠,如果早已選定了n個降維中心,則在選定第n+1個降維中心時,距離當前n個降維中心越遠的點越容易被選中。
(3)本文所用實驗數據均為四川風電數據,又集中在11月-3月之間,樣本容量較小,且在地域和時間上均存在一定的局限性,還須要進一步研究不同地貌、不同季節對風電功率預測的影響。
(4)在實驗結果的展示方面,原文只突顯出數據集被分為4類,倘若能提供每位類別的預測曲線圖,是否會愈加直觀形象?
(5)待學習:神經網路。筆者對神經網路理論有些遺忘,造成對本文預測算法理解不深入,須要備考相關知識,為后續學習更多功率預測算法打下基礎。