![]() |
學校地址:湖南省 長沙市 雨花區 車站南路紅花坡路口 |
![]() |
學校地址:湖南省 長沙市 雨花區 車站南路紅花坡路口 |
軟計算方法和數據挖掘理論在電力系統負荷預測中的應用
1吳小明 1邱家駒 2張國江 3蔡建穎
(1浙江大學電氣工程學院 2江蘇省電力調皮通信中心 3清華大學電機系)
摘 要 數據挖掘技術能夠從大量數據中發現潛在知識,軟計算是創建智能系統的有效方法,本文將兩者結合,完成電力預測過程的兩個主要任務:負荷壞數據處理和多因素負荷預測模型的建立。通過對Kohonen網聚類挖掘和BP網分類挖掘的效果分析,設計由這兩種網絡組合而成的神經網絡模型,完成壞數據辨識和調整的任務;以模糊推理系統為基礎構建多因素負荷預測模型,本文采用CART分類挖掘技術解決模糊結構辨識中的兩個難點問題:輸入空間劃分和輸入變量選擇,在此基礎上設計ANFIS網絡進行參數辨識。良好的實例分析效果說明,數據挖掘思想和軟計算方法相結合,是電力系統負荷預測的一種有效的思路和方法。
關鍵詞 負荷預測 模糊推理 數據挖掘 分類和聚類 軟計算
1 引言
分類方法與聚類分析是數據挖掘技術的兩種重要的思想。本文關于負荷預測問題的研究始終貫穿了這兩種思想。神經網絡和模糊系統是軟計算的重要基礎,它們是設計智能系統的精髓。本文詳細討論了BP網、Kohonen網兩種神經網絡和TSK型模糊推理系統的原理、結構和算法,其中前兩者用于對負荷壞數據的處理,后者用在多因素負荷預測建模。
壞數據的處理是預測建模之前必須解決的問題,根據負荷曲線相似性和平滑性的特性,我們設計了一個由Kohonen網[1]和若干BP網組成的組合神經網絡模型,先利用Kohonen網絡對日負荷曲線進行分類,確定出每一類負荷曲線的特征曲線,然后用BP網對特征曲線進行辨識訓練, 后利用特征曲線對壞數據進行調整。
在短期負荷預測中除了考慮到負荷本身的時間序列外,還要考慮到多種非負荷因素的影響,如氣象,節假日等,在傳統的預測方法中只有人工神經網絡[1]和模糊推理系統[4]可以考慮到不同因素對電力負荷的影響,模糊系統的規則結構適于描述不同種類變量之間的復雜關系,效果較人工神經網絡要更清晰直觀。輸入變量選擇和輸入空間劃分是模糊建模的前提,對于電力負荷的大樣本數據,要正確反映輸入變量對輸出值的影響的重要性程度和他們之間的實際關系,必須建立一個更為簡便有效的分類模型,以完成模糊推理系統的結構辨識,根據數據挖掘技術中的一種重要的分類思想,既從大量定性與定量的數據中學會一個分類模型,該模型能把數據庫中的數據項映射到給定類別中的某一個,我們采用了分類和回歸樹(CART,classification and regression tree)算法[3]構造了這個模型,在此基礎上采用TSK模型構造相應的ANFIS(adaptive neural-fuzzy inference system)網絡進行參數辨識。
2 壞數據的辨識與調整的神經網絡模型
2.1 壞數據辨識與調整的基本思想
壞數據辨識的過程含了兩個問題:首先從大量可能含有壞數據的負荷曲線中提取正常曲線模式,然后實現不正常曲線模式與正常曲線模式的分類。
我們可以采用一種抗差性能較好的聚類方法,將正常曲線和含有壞數據的曲線以及與它們相似的其他曲線聚成一類,那么,這一聚類的代表曲線是一條沒有壞數據特征的正常負荷曲線。當一個聚類成功的產生后,該類的正常曲線模式只有一類,即這一聚類的特征曲線。但是,不正常曲線模式的類別數量非常大。以每天96個采樣為例,每個數據點可能有三種模式:過高和過低的兩種壞數據模式和一種正常數據模式?偟膲臄祿J浇M合就有396-1種,顯然,把它們一個個精確地描述出來是不可能的,必須采用一種泛化能力較強的分類算法,用較少的、有代表性的壞數據模式將這一分類算法模型建立起來,那么,其他的壞數據模式就可以用它辨識出來。壞數據準確定位以后,還需要按照正常數據的模式加以調整。每一聚類的代表曲線為調整壞數據提供了參考依據,這樣調整的結果盡可能地“復原”了正常模式應有的負荷值。
2.2 Kohonen網進行負荷曲線抗差聚類和產生特征曲線
聚類的方法有多種,其中有一類重要的自組織神經網絡方法,不需要或極少需要數據矢量的先驗知識,抗差性能好,而且使用極為方便,我們采用了自組織特征映射算法實現負荷曲線的抗差聚類。
自組織特征映射的重要特征是其相鄰神經元之間的側反饋。圖1為自組織特征映射網絡的拓撲結構,該網僅有輸入層和輸出層,兩層之間為全互聯結,輸出層神經元之間存在側反饋。網絡經過訓練以后,每一輸出節點所連接的權矢量即為該節點所代表模式類的特征矢量。
每天的負荷數據作為一個輸入矢量,將某時期負荷作為輸入樣本集對Kohonen網進行訓練。訓練結束后,每一聚類的特征矢量對應一條日負荷特征曲線。
2.3 非正常曲線模式分類
采用多輸出BP完成非正常曲線模式分類的任務。BP網分類模型的建立分兩個步驟:訓練樣本集的產生和網絡的訓練。也就是存在兩個問題:①以少量的訓練樣本獲得對于巨量的壞數據模式的識別能力;②盡可能縮短網絡的訓練時間。
2.3.1 BP網
反向傳播神經網絡(BP網)[1]算法是數據挖掘中的一種重要的和有效的算法。它可以實現從輸入到輸出的任意復雜的非線性映射關系,并具有良好的泛化能力,能夠完成復雜模式識別的任務。其缺點為收斂速度慢,并存在許多局部極小值,為此,采用附加動量法和自適應調整學習率相結合的方法對BP算法加以改進[2]。
2.3.2 用特征曲線產生B
[1] [2] [3] 下一頁
湖南省陽光電子技術學校常年面向全國招生.安置就業?荚嚭细耦C發全國通用權威證書:《中華人民共和國職業資格證》 、《電工證》 、《焊工證》 。采用我校多年來獨創的“模塊教學法”,理論與實踐相結合、原理+圖紙+機器三位一體的教學模式,半天理論,半天實踐,通俗易懂,確保無任何基礎者也能全面掌握維修技能、成為同行業中的佼佼者。工作(一期不會,免費學會為止)。