免費(fèi)下載!
[!--downpath--]風(fēng)電機(jī)組風(fēng)速功率數(shù)據(jù)清理是風(fēng)電機(jī)組異常運(yùn)行數(shù)據(jù)識(shí)別與清理的研究熱點(diǎn)。 其中,風(fēng)力電機(jī)的風(fēng)速-功率數(shù)據(jù)清理分為三類。 第一類是基于數(shù)理統(tǒng)計(jì)的清洗方法(如密度、距離、中值、方差、平均值等),但此類方法對(duì)于識(shí)別密集分布的異常數(shù)據(jù)效果有限。 例如文獻(xiàn)[]采用四分位數(shù)法處理異常數(shù)據(jù),風(fēng)電數(shù)據(jù)中異常數(shù)據(jù)所占比例較大,四分位數(shù)法會(huì)剔除大量正常數(shù)據(jù); 文獻(xiàn)【】采用四分位法和降維分析方法剔除異常數(shù)據(jù),但沒有給出具體的剔除標(biāo)準(zhǔn),可能會(huì)導(dǎo)致正常數(shù)據(jù)被刪除,對(duì)數(shù)據(jù)處理結(jié)果影響較大; 文獻(xiàn)[]采用局部異常值因子(local中期風(fēng)電功率預(yù)測(cè),LOF)算法來檢查異常值,該算法根據(jù)風(fēng)速-功率曲線,估計(jì)曲線周圍的相對(duì)密度,消除異常值。 第二種是基于數(shù)據(jù)挖掘的,即通過無監(jiān)督學(xué)習(xí)來識(shí)別大量數(shù)據(jù)中具有異常特征的數(shù)據(jù),并將其用于數(shù)據(jù)分析和處理。 這類方法不需要提前建立模型,具有較好的抗干擾性中期風(fēng)電功率預(yù)測(cè),例如文獻(xiàn)[]采用LOF與支持向量機(jī)相結(jié)合,通過LOF值修復(fù)異常范圍,然后構(gòu)造結(jié)合支持向量機(jī)的判斷機(jī)制,從而判斷異常值,有效防止基于距離降維方法的異常值吞噬現(xiàn)象。 文獻(xiàn)[]采用最優(yōu)殘差算法實(shí)現(xiàn)了分散異常數(shù)據(jù)的有效識(shí)別,但無法有效識(shí)別高密度的累積異常數(shù)據(jù)。 第三類方法是基于數(shù)據(jù)的分布特征。 該類方法的依據(jù)是位于風(fēng)速-功率曲線之外的數(shù)據(jù)為異常數(shù)據(jù),可以實(shí)現(xiàn)多類異常數(shù)據(jù)的清洗。 例如,如果風(fēng)速-功率的概率密度偏差服從正態(tài)分布,文獻(xiàn)[]提出了一種基于“3σ規(guī)則”的判斷方法來衡量異常值,即位于[0, 3σ]為異常偏差,位于[0,3σ]以內(nèi)的偏差為正常偏差,從而達(dá)到數(shù)據(jù)清洗的目的。 而且風(fēng)速-功率的概率密度往往是多峰的,精度不高。 文獻(xiàn)[]借助成熟的預(yù)測(cè)算法獲取方差的偏差信息,綜合分析偏差概率密度的特征,判斷異常信息。 文獻(xiàn)[]提出了一種不需要概率密度分布函數(shù)的四分位數(shù)算法,避免了擬合概率密度的復(fù)雜過程。