eské vysoké u£ení technické v Praze Fakulta elektrotechnická Katedra po£íta£·
Bakalá°ská práce
Porovnání algoritm· predikce výroby elektrické energie fotovoltaické elektrárny
Milan Babka
Vedoucí práce:
Ing. Pavel Kordík, Ph.D.
Studijní program: Softwarové technologie a management, Bakalá°ský
Obor: Softwarové inºenýrství
24. kv¥tna 2011
iv
v
Prohlá²ení Prohla²uji, ºe jsem práci vypracoval samostatn¥ a pouºil jsem pouze podklady uvedené v p°iloºeném seznamu. Nemám závaºný d·vod proti uºití tohoto ²kolního díla ve smyslu 60 Zákona £. 121/2000 Sb., o právu autorském, o právech souvisejících s právem autorským a o zm¥n¥ n¥kterých zákon· (autorský zákon).
V Jirkov¥ dne 21. 5. 2011
.............................................................
vi
Abstract The goal of this bachelor thesis is to nd and study appropriate method for photovoltaic power plant output prediction. To achieve this goal we need to study the basics of time series, check weather conditions depending on the performance of photovoltaic power plant, compare the output estimates with some external systems that solve a similar problem. The result from this work can help control energy system and thus improve the quality and stability.
Abstrakt Cílem této bakalá°ské práce je najít a prostudovat vhodné metody z oblasti predikce výroby fotovoltaické elektrárny. K dosaºení tohoto cíle je t°eba prostudovat základy analýzy £asových °ad, zjistit závislosti klimatických podmínek na výkonu fotovoltaické elektrárny, porovnat vygenerované odhady s n¥kterými externími systémy, které °e²í podobnou problematiku. Výzvou je, ºe v budoucnu by výsledky této práce mohly pomoci p°i regulaci energetické sít¥ a tím i zlep²it její kvalitu a stabilitu.
vii
viii
Obsah 1 Úvod
1
2 Trocha teorie
3
2.1
Popis technologie FVE . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3
2.2
Datové rozhraní FVE . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3
2.3
Predikce výroby FVE
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3
2.4
P°edpov¥¤ po£así . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
4
2.4.1
Rozd¥lení podle období, na které se predikuje . . . . . . . . . . . . . .
4
2.4.2
Rozd¥lení podle ú£elu
. . . . . . . . . . . . . . . . . . . . . . . . . . .
5
2.4.3
Rozd¥lení podle místa
. . . . . . . . . . . . . . . . . . . . . . . . . . .
5
2.4.4
Informace pot°ebné pro p°edpov¥¤ po£así
. . . . . . . . . . . . . . . .
5
2.4.5
Metody st°edn¥dobé místní p°edpov¥di po£así . . . . . . . . . . . . . .
6
2.5
Analýza £asové °ady
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
7
2.5.1
asová °ada . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
7
2.5.2
Vlastnosti £asových °ad
. . . . . . . . . . . . . . . . . . . . . . . . . .
7
2.5.3
Metody ur£ené k analýze £asové °ady . . . . . . . . . . . . . . . . . . .
9
2.5.3.1
Dekompozi£ní metody . . . . . . . . . . . . . . . . . . . . . .
2.5.3.2
Box-Jenkinsonova metodologie
. . . . . . . . . . . . . . . . .
11
2.5.3.3
Lineární dynamické modely . . . . . . . . . . . . . . . . . . .
11
2.5.3.4
Spektrální analýza . . . . . . . . . . . . . . . . . . . . . . . .
12
2.5.3.5
Autokorela£ní funkce ACF
12
2.5.3.6
áste£ná autokorela£ní funkce PACF
2.5.3.7
Periodogram
2.5.3.8
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
12
. . . . . . . . . . . . . . . . . . . . . . . . . . .
12
M¥°ení vzdálenosti mezi £asovými °adami . . . . . . . . . . .
12
3 Analýza 3.1
15
Vstupní data 3.1.1
9
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
15
Struktura datového zdroje . . . . . . . . . . . . . . . . . . . . . . . . .
15
3.2
Ov¥°ení závislosti výkonu FVE na ostatních veli£inách
. . . . . . . . . . . . .
16
3.3
Základní analýza £asové °ady
. . . . . . . . . . . . . . . . . . . . . . . . . . .
20
3.4
Výstupní data . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
22
4 Návrh model· predikce 4.1
ARIMA 4.1.1
25
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Popis
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
ix
25 25
x
OBSAH
4.2
4.3
4.4
4.1.2
Implementace modelu
. . . . . . . . . . . . . . . . . . . . . . . . . . .
26
4.1.3
Predikce . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
28
ARIMAS
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
4.2.1
Popis
4.2.2
Implementace modelu
. . . . . . . . . . . . . . . . . . . . . . . . . . .
30
4.2.3
Predikce . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
31
PBMSP
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
30
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
31
4.3.1
Popis
4.3.2
Implementace modelu
. . . . . . . . . . . . . . . . . . . . . . . . . . .
31
4.3.3
Predikce . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
33
PBMSPS
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
30
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
31
33
4.4.1
Popis
4.4.2
Implementace modelu
. . . . . . . . . . . . . . . . . . . . . . . . . . .
33
4.4.3
Predikce . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
35
5 Porovnání model·
33
37
5.1
Porovnání výsledk· model· ARIMA, ARIMAS, PBMSP a PBMSPS
. . . . .
5.2
Porovnání predikce s externími systémy
. . . . . . . . . . . . . . . . . . . . .
39
5.3
Zhodnocení výsledk· . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
40
6 Záv¥r 6.1
Návrh na dal²í práci
37
41 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
41
7 Seznam pouºitých zkratek
45
8 Obsah CD
47
Seznam obrázk· 2.1
P°íklad £asové °ady . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
7
2.2
Porovnání nestacionární stochastické vs stacionární stochastické TS . . . . . .
8
2.3
Trendová sloºka TS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
9
2.4
Sezónní sloºka TS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
10
2.5
Cyklická sloºka TS
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
10
2.6
Reziduální sloºka TS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
11
2.7
Euklidovská metrika
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
13
3.1
Struktura datového zdroje . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
16
3.2
Vývoj výkonu, osvitu a teploty v £ase
3.3
Závislost výkonu zaloºená osvitu, bez ltru
. . . . . . . . . . . . . . . . . . .
17
3.4
Závislost výkonu zaloºená osvitu, s ltrem . . . . . . . . . . . . . . . . . . . .
18
3.5
Závislost výkonu zaloºená osvitu, s ltrem . . . . . . . . . . . . . . . . . . . .
19
3.6
Závislost výkonu zaloºená teplot¥ . . . . . . . . . . . . . . . . . . . . . . . . .
19
3.7
Trendová sloºka £asové °ady osvitu . . . . . . . . . . . . . . . . . . . . . . . .
20
3.8
Power spectrum density
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
22
4.1
ARIMA - predikce
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
26
4.2
Linearizace £asové °ady
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
27
4.3
ACF a PACF . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
28
5.1
Porovnání výstup· predikce model·
. . . . . . . . . . . . . . . . . . . . . . .
39
5.2
PointSolar 8.5.2011 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
40
5.3
ARIMA a PBMSP 8.5.2011
. . . . . . . . . . . . . . . . . . . . . . . . . . . .
40
8.1
Obsah CD . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
47
xi
. . . . . . . . . . . . . . . . . . . . . .
17
xii
SEZNAM OBRÁZK
Seznam tabulek 2.1
Datové rozhraní FVE . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.1
Pr·m¥rná ro£ní intenzita slune£ního zá°ení
. . . . . . . . . . . . . . . . . . .
21
3.2
Výstupní datové rozhraní modelu predikce . . . . . . . . . . . . . . . . . . . .
23
4.1
ARIMA - predikce modelu . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
29
4.2
ARIMAS - predikce modelu . . . . . . . . . . . . . . . . . . . . . . . . . . . .
32
4.3
Váºený pr·m¥r . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
33
4.4
PBMSP - predikce modelu . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
34
4.5
PBMSPS - predikce modelu . . . . . . . . . . . . . . . . . . . . . . . . . . . .
36
5.1
Celkové porovnání predikce model· . . . . . . . . . . . . . . . . . . . . . . . .
38
5.2
Porovnání predikce model· - 1.5. aº 4.5.
. . . . . . . . . . . . . . . . . . . . .
38
5.3
Porovnání predikce model· - 5.5. aº 7.5.
. . . . . . . . . . . . . . . . . . . . .
39
xiii
4
xiv
SEZNAM TABULEK
Kapitola 1
Úvod V posledních letech dochází k výraznému rozvoji obnovitelných zdroj· elektrické energie (dále jen OZE). Mezi nejroz²í°en¥j²í OZE v eské republice pat°í zejména fotovoltaické farmy (dále jen FVE), vodní elektrárny, biomasa, bioplyn a v¥trné elektrárny. Spolu s rozvojem OZE vzniká n¥kolik pot°eb souvisejících s regulací výkonu, stabilitou elektriza£ní soustavy, do které je vyveden výkon OZE, zp·sob chrán¥ní a zejména p°edcházení fenoménu "BLACK OUT". V sou£asné dob¥ je v¥t²ina OZE p°ipojena na soustavu vysokého nap¥tí, a protoºe se jedná o velmi nestabilní zdroje, tak výrazným zp·sobem ovliv¬uje stabilitu elektriza£ní soustavy.
Z toho také vyplývá, ºe predikce výroby OZE spolu dal²ími faktory je pot°ebná pro bezpe£ný a spolehlivý chod elektriza£ní soustavy. Tato práce se práv¥ zabývá analýzou a návrhem st°edn¥dobých predik£ních model·, které se za pomoci matematického simulátoru také verikují. Práce se omezuje na predikci výroby elektrické energie FVE.
Predikci výroby elektrické energie FVE si m·ºeme p°edstavit jako odhad x budoucích hodnot, tedy predikcí £asové °ady. Obecn¥ lze °íci, ºe £ím více hodnot máme k dispozici, tím jsou lep²í výsledky predikce hodnot. To v²ak není jedinou podmínkou pro uspokojivý odhad vývoje hodnot. Schopnost predikce je z velké £ásti závislá také na povaze dat.
Práce je rozd¥lena do n¥kolika £ástí. První £ást této práce je teoretická a zabývá se obecným popisem metod predikce výroby elektrické energie FVE a p°edpov¥dí po£así, která s tématem úzce souvisí. Praktická £ást této práce se zabývá analýzou dostupných hodnot a jejich vzájemné závislosti. Poslední £ást, implementa£ní, této práce se zabývá návrhem jednotlivých metod, verikací a vzájemném porovnáním v matematickém simulátoru Matlab.
1
2
KAPITOLA 1.
ÚVOD
Kapitola 2
Trocha teorie •
Popis technologie FVE
•
Datové rozhraní FVE
•
Predikce výroby FVE
•
P°edpov¥¤ po£así
•
Analýza £asové °ady
2.1
Popis technologie FVE
FVE elektrárna je soubor men²ího £i v¥t²ího po£tu solárních panel· a st°ída£·. Protoºe FVE jsou v¥t²inou p°ipojeny do soustavy vysokého nap¥tí elektriza£ní soustavy, musí být vybaveny vysokonap¥´ovým trafem a v²ím co k tomu náleºí. Pro pot°eby fakturace je kaºdá FVE vybavena faktura£ním elektrom¥rem, který je ve správ¥ spole£nosti provozující elektriza£ní soustavu. Pro na²e ú£ely je FVE také vybavena profesionální pozemní meteorologickou stanicí, ze které pravideln¥ ukládáme data o vývoji po£así do místní £i vzdálené databáze.
2.2
Datové rozhraní FVE
V práci se nebudeme omezovat na predikci n¥jaké konkrétní FVE, ale popí²eme problém obecn¥. To se týká také datového rozhraní, které by m¥lo být dostupné u kaºdé FVE, kde chceme predikovat výrobu elektrické energie. Tabulka 2.1 popisuje data a zárove¬ denuje, ze kterého zdroje jsou po°ízena. Sloupec interval denuje periodu ukládání dat do databáze.
2.3
Predikce výroby FVE
Protoºe FVE je zaloºena na fotovoltaickém jevu, je zcela z°ejmé, ºe výroba elektrické energie FVE je siln¥ závislá na slune£ním zá°ení. Kaºdý fotovoltaický £lánek má v katalogovém
3
4
KAPITOLA 2.
TROCHA TEORIE
Dato
Zdroj
Interval
Výkon
Analyzátor sít¥
1min
Vyrobená energie
Analyzátor sít¥
1hod
Slune£ní zá°ení
Meteorologická stanice
1min
Okolní teplota
Meteorologická stanice
1min
Atmosférický tlak
Meteorologická stanice
1min
Úhrn sráºek
Meteorologická stanice
1min
Vý²ka mrak·
Meteorologická stanice
1min
Tabulka 2.1: Datové rozhraní FVE
listu uveden údaj o ²pi£kovém výkonu £lánku. Tento údaj udává výkon p°i ideálních podmínkách, sv¥tlo o intenzit¥ 1000W/m2 dopadá kolmo na panel p°i teplot¥ 25
◦ C. Dostupné
jsou také základní informace o st°ída£i. Zejména údaj o ú£innosti, se kterou dokáºe p°em¥nit stejnosm¥rný výkon na st°ídavý. Z vý²e uvedených informací lze usuzovat, ºe predikce výroby elektrické energie FVE se rovná p°edpov¥di po£así, konkrétn¥ vývoji slune£ního zá°ení a teploty. Výkon FVE je moºné z t¥chto údaj· dopo£ítat. Do výpo£tu se musí zárove¬ zapo£ítat lokalita FVE, instalovaný ²pi£kový výkon, sklon panel· a samoz°ejm¥ jejich orientace.
2.4
P°edpov¥¤ po£así
Tato £ást práce je ur£ena k lehkému seznámení s pojmy týkající se p°edpov¥di po£así a zárove¬ p°edstavuje n¥které numerické modely, které se zabývají p°edpov¥dí po£así. Ve²keré denice a pojmy v této kapitole jsem £erpal ze zdroje RNDr. Milana álka [3].
2.4.1
Rozd¥lení podle období, na které se predikuje
Velmi krátkodobá: 0-12 hodin K p°edpov¥di vyuºívá numerických model·, metod dálkové detekce nebo koncep£ních model·. Do této kategorie lze za°adit také tzv. Nowcasting, coº je krátkodobá p°edpov¥¤ po£así v rozmezí 0-2 hodiny. Tyto p°edpov¥di jsou v dne²ní dob¥ docela p°esné, pokud se vztahují na v¥t²í území.
Krátkodobá: 1-3 dny K p°edpov¥di vyuºívá zejména numerické modely. Opírá se o aktuální stav po£así a stejn¥ jako velmi krátkodobá p°edpov¥¤ má docela vysokou úsp¥²nost, pokud se p°edpov¥¤ vztahuje k v¥t²ímu území. Nejvíce pouºívaný model je Aladin.
St°edn¥dobá: 3-15 dn· K p°edpov¥di vyuºívá také numerické modely. Vyuºívá poznatk· z teorie deterministického chaosu k odhadu p°edpov¥di po£así. Do této p°edpov¥di také s men²ím podílem zasahuje
2.4.
PEDPOV
POASÍ
5
aktuální po£así v dané lokalit¥. Tato p°edpov¥¤ uº není tak p°esná jako krátkodobé p°edpov¥di po£así.
Dlouhodobá: m¥síce Je nejmén¥ p°esná. Jedná se spí²e o výhled po£así neº o p°edpov¥¤. Tato p°edpov¥¤ dokáºe odhadnout s ur£itou p°esností charakter po£así (de²tivo, slune£no), teplotní rozsah, ale uº nedokáºe odpov¥d¥t na otázku, zda bude o víkendu za m¥síc hezké po£así.
2.4.2
Rozd¥lení podle ú£elu
V²eobecná Je ur£ena nej²ir²í ve°ejnosti. Bývá ²í°ena v²emi hromadnými sd¥lovacími prost°edky TV, rozhlas, internet atd. Informace o p°edpov¥di jsou základní k dané lokalit¥, to je teplota vzduchu, sráºky, rychlost a sm¥r v¥tru, tlakové tendence atd.
Speciální Je ur£ena pro konkrétní uºivatele z r·zných oblastí lidské £innosti. Podle toho jsou také vybírána konkrétní meteorologická data. Nap°íklad v leteckých p°edpov¥dích jsou to vodorovná viditelnost, vý²ka spodní základny oblak· a vítr. Nebo pro p°edpov¥¤ výroby elektrické energie FVE jsou to intenzita slune£ního zá°ení a okolní teplota, která má vliv na teplotu fotovoltaických panel·.
2.4.3
Rozd¥lení podle místa
Oblastní N¥kdy jsou ozna£ovány jako regionální p°edpov¥di. Jak uº je z°etelné z názvu vydávají se pro dané oblasti (regiony) o rozloze do n¥kolika stovek km2. Tyto oblasti jsou v¥t²inou geogracky rozd¥leny (Ústecký kraj, eskomoravská vrchovina, atd.)
Liniová Vydávají se pro r·zné úseky dálnic, povodí nebo jiných komunikací.
Místní N¥kdy jsou ozna£ovány jako bodové p°edpov¥di po£así. Název napovídá tomu, ºe se jedná o p°edpov¥di na konkrétní lokality ne v¥t²í neº n¥kolik km2. Vydávají se pro m¥sta, leti²t¥, fotovoltaické elektrárny.
2.4.4
Informace pot°ebné pro p°edpov¥¤ po£así
K získání kvalitní p°edpov¥di po£así je zapot°ebí znát aktuální stav po£así (atmosféry). Tento stav lze získat informacemi z n¥kolika zdroj·.
6
KAPITOLA 2.
TROCHA TEORIE
Informace z pozemních stanic V dne²ní dob¥ existuje n¥kolik desítek tisíc pozemních meteorologických stanic, které poskytují data kaºdých 6 hodin. Zpráva je posílána formou kódu SYNOP, BUFR pop°ípad¥ CREX. Informace odpovídají aktuálnímu po£así p°i povrchu zem¥.
Informace z aerologických stanic Jsou to stanice, které m¥°í vý²kový prol základních meteorologických prvk·, jako jsou teplota, vlhkost, tlak vzduchu nebo vítr. Data jsou posílána alespo¬ jednou za den. K aerologickému m¥°ení se nej£ast¥ji pouºívají radiosondy a radiolokátory. Radiosondy m¥°í teplotu, vlhkost, tlak vzduchu, sm¥r a rychlost v¥tru, stav ozónu a jiné. M¥°ení se provádí ve vý²ce 25 km. Sondy jsou nej£ast¥ji upevn¥ny k balónu, který je napln¥n vodíkem.
Radiolokátor umoº¬uje sledovat jevy atmosféry na dálku bez p°ímého kontaktu. Vyuºívá se jich p°i zkoumání polohy a pohybu obla£ných systém·. Zkoumá jejich vnit°ní strukturu a vývoj.
Informace získané metodami dálkové detekce Data jsou získána p°edev²ím z meteorologické druºice, meteorologického radaru nebo také ze systému dálkové detekce blesk·. Pouºívá se p°edev²ím pro detekci konkrétních jev· (sráºek). Metody dálkové detekce vyuºívají p°edev²ím velmi krátkodobé p°edpov¥di po£así, kde se uplat¬ují extrapola£ní procedury.
2.4.5
Metody st°edn¥dobé místní p°edpov¥di po£así
ALADIN Projekt ALADIN je jedním z nejd·leºit¥j²ích model· v oblasti numerické p°edpov¥di po£así (NWP). Tento projekt byl zahájen v roce 1990 Meteo-France s cílem vytvo°it model omezené oblasti (LAM) pro numerické p°edpov¥di po£así a dnes se projektu ú£astní 15 zemí. Podrobné informace o modelu ALADIN lze nalézt na webové stránce http://www.cnrm.meteo.fr/aladin/.
HIRLAM High resolution local area model vyvíjí konsorcium severských stát· a pan¥lska. V sou£asné dob¥ spolupracuje na vývoji i se skupinou vyvíjející numerický model ALADIN. Podrobné informace o modelu HIRLAM nalezneme na webové stránce http://hirlam.org/.
MM5 MM5 je numerický model atmosféry, vyuºívaný pro ú£ely p°edpov¥di po£así. Byl vyvinut na Pennsylvania State University/ National Center for Atmospheric Research (PSU/NCAR), USA, vyvíjí se od sedmdesátých let. "MM"v názvu znamená "Mesoscale and Microscale", tedy st°ední a malé oblasti modelování, poslední generace je pátá. Model byl specieln¥ navrºen pro regionální p°edpov¥¤ po£así. V sou£asnosti je celosv¥tov¥ pouºíván desítkami významných institucí.
2.5.
ANALÝZA ASOVÉ ADY
2.5
7
Analýza £asové °ady
Hlavní náplní této práce je práv¥ analýza £asové °ady. Vý²e zmín¥né modely jsou vypsány pouze pro informaci, protoºe ºádná spole£nost neposkytuje datové výstupy pro dané modely. V této £ásti práce je popsán obecný úvod do problematiky £asové °ady a procedur, které se na £asové °ady aplikují.
2.5.1
asová °ada
Je posloupnost pozorování (dat). Tyto pozorování jsou °azeny od nejstar²ích pozorování k t¥m nejmlad²ím. Vzdálenost mezi jednotlivými pozorováními je v na²em p°ípad¥ konstantní, ne vºdy je to pravidlo. Snahou analýzy £asové °ady je porozum¥ní principu, kterým jsou data v £ase postupn¥ generována, tedy najít n¥jaká obecná pravidla. Úsp¥²nost predikce vývoje hodnot £asové °ady je potom závislá na hloubce porozum¥ní t¥mto princip·m. Obrázek 2.1 vykresluje ukázku £asové °ady vývoje po£así.
Obrázek 2.1: P°íklad £asové °ady
2.5.2
Vlastnosti £asových °ad
Ekvidistantní Vzdálenost mezi jednotlivými pozorováními je konstantní
Neekvidistantní Vzdálenost mezi jednotlivými pozorováními je prom¥nlivá. Tuto £asovou °adu je nutné p°e-
8
KAPITOLA 2.
TROCHA TEORIE
vést na ekvidistantní dopln¥ním chyb¥jících pozorování.
Deterministická Pozorování neobsahují ºádnou náhodnou informaci, tedy jsou generována podle ur£itého modelu a lze ji vºdy p°esn¥ rekonstruovat. Predikce je v tomto p°ípad¥ velmi úsp¥²ná, generuje data podle ur£itého modelu.
Stochastická Opakem deterministické £asové °ady je práv¥ °ada stochastická. Tato °ada v sob¥ obsahuje náhodná pozorování. V¥t²ina jev· v reálném sv¥t¥ je stochastická. Predikce v tomto p°ípad¥ je sloºitá a její úsp¥²nost závisí na hloubce porozum¥ní posloupnosti pozorování.
Stacionární asová °ada vykazuje v celém svém rozsahu stejné chování, nap°. aritmetický pr·m¥r, variabilita. P°íkladem m·ºe být tzv. "Bílý ²um". N¥které modely v této práci vyºadují, aby £asová °ada m¥la stacionární charakter.
Nestacionární Opakem stacionárních £asových °ad. Její chování se v pr·b¥hu li²í, nap°. aritmetický pr·m¥r dvou náhodn¥ vybraných vzork·. Tyto °ady je v¥t²inou pot°eba p°evést na °ady stacionární. Obrázek 2.2 vykresluje porovnání mezi nestacionární a stacionární £asovou °adou.
Obrázek 2.2: Porovnání nestacionární stochastické vs stacionární stochastické TS
Pro ú£ely predikce se tato práce soust°edí na £asové °ady ekvidistantní a stochastické.
2.5.
ANALÝZA ASOVÉ ADY
2.5.3
9
Metody ur£ené k analýze £asové °ady
2.5.3.1 Dekompozi£ní metody Dekompozi£ní metody pat°í mezi základní nástroje pro analýzu £asové °ady. Pomocí t¥chto metod se zji²´ují základní vlastnosti t¥chto °ad, jako je nap°íklad sledování trendu, sezónní, cyklické nebo reziduální sloºky. V podstat¥ lze °íci, ºe £asovou °adu chápeme jako trend, na který se nabalují ostatní sloºky (sezónní, periodické £i reziduální). Reziduální sloºku £asové °ady tvo°í tzv. "Bílý ²um", tj. náhodná sloºka.
Trendová sloºka Trendem £asové °ady se rozumí dlouhodobé zm¥ny ve vývoji pozorování (viz 2.3). Tedy sleduje se pokles, nár·st nebo také kolísání kolem jedné hodnoty. Jedná se o £asové °ady s konstantním trendem.
Obrázek 2.3: Trendová sloºka TS
Sezónní sloºka Sezónní sloºka £asové °ady je odchýlení pozorování od trendu, které probíhá b¥hem roku a kaºdý rok se opakuje (viz 2.4). Tyto zm¥ny jsou zp·sobeny nap°íklad st°ídáním ro£ních období.
Cyklická sloºka Tato sloºka p°edstavuje dlouhodobé zm¥ny vývoje pozorování £asové °ady (viz 2.5). Perioda jednoho cyklu je del²í neº sloºky sezónní, tedy i n¥kolik let. Tyto zm¥ny je t¥ºké vysledovat, protoºe m¥ní nejen periodu, ale také amplitudu. Proto bývají velmi £asto sou£ástí trendu.
Reziduální sloºka Reziduální sloºku £asové °ady p°edstavují náhodná pozorování, která nemají systematický charakter (viz 2.6). Bývá v¥t²inou zp·sobena chybou m¥°ení, zaokrouhlováním. Velmi £asto
10
KAPITOLA 2.
Obrázek 2.4: Sezónní sloºka TS
Obrázek 2.5: Cyklická sloºka TS
TROCHA TEORIE
2.5.
ANALÝZA ASOVÉ ADY
11
se p°edpokládá, ºe náhodná sloºka má charakter bílého ²umu. To je pozorování s nulovou st°ední hodnotou a konstantním rozptylem.
Obrázek 2.6: Reziduální sloºka TS
Tato práce p°i dekompozici £asové °ady uvaºuje pouze ze systematickou sloºkou trendovou, sezónní a cyklickou. P°i práci se v¥t²inou vyuºívá vlastností metod regresní analýzy.
2.5.3.2 Box-Jenkinsonova metodologie Tato metoda p°edpokládá, ºe £asová °ada je stacionární [5], nebo alespo¬ slab¥ stacionární. Box and Jenkins také doporu£ují, pokud £asová °ada není stacionární, £asovou °adu jednou £i vícekrát diferencovat. Diferencováním £asová °ada získává stacionární charakter. ád diference je závislý na charakteru £asové °ady. Box-Jenkins·v model povaºuje za základní prvek p°i konstrukci modelu náhodnou sloºku £asové °ady, která m·ºe být tvo°ena korelovanými náhodnými veli£inami.
Existuje n¥kolik model·, které pracují na principu Box-Jenkinsonovi metodologie. Mezi nejznám¥j²í pat°í AR, MA, ARMA, ARIMA a SARIMA. První t°i modely AR autoregresivní, MA moving average a smí²ený ARMA model, jsou výhradn¥ ur£eny pro práci se stacionární £asovou °adou. Dal²í dva modely ARIMA a SARIMA jsou ur£eny pro práci s nestacionárními £asovými °adami, kde parametr I ur£uje °ád diference. Parametr S ozna£uje, ºe tento model je schopen zpracovat i sezónní sloºku £asové °ady.
2.5.3.3 Lineární dynamické modely Lineární dynamické modely jsou zobecn¥ním Box-Jenkinsonova modelu. Tyto modely pro analýzu sledované £asové °ady pouºívají mnoºinu dal²ích podp·rných £asových °ad. Tyto
12
KAPITOLA 2.
TROCHA TEORIE
podp·rné £asové °ady se pouºívají k vytvo°ení modelu sledované °ady.
2.5.3.4 Spektrální analýza Spektrální analýza p°edpokládá, ºe sledovaná £asová °ada je soubor navzájem propojených sinusových £i kosinusových k°ivek o r·zné amplitud¥ a frekvenci. Za pouºití statistických nástroj· lze stanovit frekvence, které jsou v £asové °ad¥ nejvýrazn¥j²í. P°i analýze £asových °ad se nejvíce vyuºívá Fourierova analýza.
2.5.3.5 Autokorela£ní funkce ACF Jednotlivé sloupce ACF vyjad°ují sílu lineární závislosti mezi hodnotami £asové °ady. První sloupec vyjad°uje sílu lineární závislosti mezi °adou pec vyjad°uje sílu lineární závislosti mezi °adou
xt
xt
a °adou
a °adou
xt−1 ,
xt−2 ,
t=2,3,..,T. Druhý slou-
t=3,4,..,T. Hodnota auto-
korela£ní funkce je statisticky významná p°ekoná-li mez intervalu spolehlivosti. Pom·ckou, jak ur£it stacionaritu, je tvar autokorela£ní funkce. Pokud k°ivka s rostoucím zpoºd¥ní klesá k nule, je £asová °ada stacionární.
2.5.3.6 áste£ná autokorela£ní funkce PACF První sloupec PACF má stejný význam jako v metod¥ ACF. Druhý sloupec vyjad°uje sílu lineární závislosti mezi °adou
xt−1 .
xt
xt−2 , t=3,4,..,T. P°itom zohled¬uje p°ítomnost °ady xt−1 a xt−2 .
a °adou
T°etí sloupec zohled¬uje °ady
2.5.3.7 Periodogram Prost°edek pro analýzu sezónní sloºky £asové °ady. Pouºívá se pro vyhledávání významných periodických sloºek. Na ose x jsou vyneseny frekvence j/n, kde j=1.2,..,n/2. Parametr n denuje po£et hodnot £asové °ady.
2.5.3.8 M¥°ení vzdálenosti mezi £asovými °adami Tato práce se zabývá analýzou £asových °ad. K této analýze neodmysliteln¥ pat°í i m¥°ení vzdáleností mezi dv¥ma £asovými °adami k ur£ení nap°íklad podobnosti nebo chyby odhadu ur£itého modelu. Podle [1] nejjednodu²²ím zp·sobem, jak m¥°it vzdálenost mezi dv¥ma £asovými °adami stejné velikosti, je pouºití euklidovské metriky 2.7.
2.5.
ANALÝZA ASOVÉ ADY
Obrázek 2.7: Euklidovská metrika
13
14
KAPITOLA 2.
TROCHA TEORIE
Kapitola 3
Analýza •
Vstupní data
•
Ov¥°ení závislosti výkonu FVE na ostatních veli£inách
•
Základní analýza £asové °ady
•
Výstupní data
První podkapitola popisuje vstupní datové rozhraní a struktury datového zdroje, se kterým systém pracuje. Protoºe snahou této práce je predikovat vývoj výkonu FVE, tak v dal²í £ásti je popsán zp·sob hledání závislostí mezi vstupními daty. V dal²í £ásti práce je popsána základní analýza £asové °ady. Na základ¥ zji²t¥ných vlastností, je vybrána skupina metod, která budou schopna predikovat vývoj výkonu FVE. Aby výsledky predikce jednotlivých model· byly srovnatelné, je na konci této kapitoly popsán jednotný systém generování výstup· jednotlivých model·.
3.1
Vstupní data
Tato kapitola popisuje datové rozhraní na vstupu systému. Dále nás seznámí jakým zp·sobem, a kde data získá (z jakého datového zdroje). Nakonec nás seznámí se za°ízeními poskytující data pot°ebná k predikci FVE.
3.1.1
Struktura datového zdro je
Pro pot°eby predikce výroby byl navrºen tento model (viz 3.1). Systém predikce výroby FVE p°istupuje pouze k datovému zdroji ve form¥ rela£ní databáze, která implementuje tabulku "HistoryOut". Tato tabulka archivuje historii výroby FVE spole£n¥ s daty o vývoji po£así. Vzorkování jednotlivých záznam· je po jedné minut¥ (co minuta, to záznam o výrob¥ a stavu po£así). Externí systém, který není v této práci popsán, zaji²´uje import dat z jednotlivých za°ízení. Pro pot°eby predikce jsou to zejména meteorologická stanice a analyzátor sít¥. Seznam dat, s kterými systém pracuje, upravuje, generuje z nich modely a také predikuje vývoj
15
16
KAPITOLA 3.
ANALÝZA
po£así respektive výkon FVE, je popsán v tabulce 2.1.
Obrázek 3.1: Struktura datového zdroje
3.2
Ov¥°ení závislosti výkonu FVE na ostatních veli£inách
Jak je uvedeno ve v¥t²in¥ publikací a katalogových listech solárních panel·, je výkon solárního panelu závislý na dvou veli£inách. První veli£inou je intenzita slune£ního zá°ení a druhou je teplota panelu. Následující analýza se pokusí potvrdit vý²e zmín¥né tvrzení. Obrázek 3.2 vykresluje náhodn¥ vybraný vzorek t°í £asových °ad. Jsou zde vyneseny pr·b¥hy intenzity slune£ního zá°ení, výkonu FVE a teploty panelu.
Z obrázku lze vy£íst n¥kolik základních vlastností. Uº te¤ bez jakékoliv dal²í analýzy, lze °íci, ºe výkon FVE elektrárny je siln¥ závislý na intenzit¥ slune£ního zá°ení (moºná se jedná p°ímo o lineární závislost). Závislost výkonu FVE na teplot¥ panel· nelze z t¥chto pr·b¥h· stanovit. Rychlý pokles teploty panelu je zp·soben náhlým poklesem intenzity slune£ního zá°ení a tedy i poklesem výroby FVE. Zvy²ování teploty panelu je zp·sobeno p°ímo intenzitou slune£ního zá°ení, ale také protékajícím proudem.
Obrázky 3.4 a 3.5 vykreslují závislost výkonu na osvitu. První z nich vykresluje v²echny data, které jsou k dispozici. Kdeºto druhý obrázek vykresluje tu samou závislost, s tím rozdílem, ºe data jsou o£i²t¥na o data nevyhovující. B¥hem provozu m·ºe nastat situace, kdy FVE je zám¥rn¥ vypnuta nebo je v poru²e (m·ºe zp·sobit pokles výkonu). Tento stav má negativní vliv na analýzu závislosti mezi výkonem FVE a intenzitou slune£ního zá°ení. Filtr aplikovaný na data kontroluje vyuºití FVE v závislosti na intenzit¥ slune£ního zá°ení. Tedy,
3.2.
OV
ENÍ ZÁVISLOSTI VÝKONU FVE NA OSTATNÍCH VELIINÁCH
Obrázek 3.2: Vývoj výkonu, osvitu a teploty v £ase
Obrázek 3.3: Závislost výkonu zaloºená osvitu, bez ltru
17
18
KAPITOLA 3.
ANALÝZA
spo£ítá si pom¥r mezi optimálním a skute£ným výkonem.
Obrázek 3.4: Závislost výkonu zaloºená osvitu, s ltrem
Uº z p°edchozích obrázk· byla patrná závislost výkonu FVE na slune£ním zá°ení. Jen pro vysv¥tlení je zde uveden je²t¥ jeden graf, který vykresluje chybu modelu v závislosti na stupni polynomu. Z tohoto grafu vyplívá tém¥° konstantní chyba na testovacích datech pro stupe¬ polynom· v¥t²í neº 4. Proto byl vybrán stupe¬ polynomu 4 p°i analýze výkonu FVE na intenzit¥ slune£ního zá°ení.
Dal²í graf 3.6 hledá závislost výkonu FVE zaloºeného na teplot¥ panel·. Hledání této závislosti je velmi obtíºné. Je zapot°ebí analyzovat data p°i konstantní intenzit¥ slune£ního zá°ení. To samoz°ejm¥ není moºné zajistit v reálných podmínkách. Byly vybrány data výkonu a teploty panel·, která byla nam¥°ena p°i podobných klimatických podmínkách. Konkrétn¥ se jedná o intenzitu slune£ního zá°ení. Z grafu nelze nalézt ºádnou závislost mezi výkonem a teplotou panel·. Je to proto, ºe data jsou po°ízena b¥hem jednoho aº maximáln¥ dvou zimních m¥síc·. B¥hem této doby se teplota panel· p°íli² nem¥nila, jednak z d·vodu nízké intenzity slune£ního zá°ení a s tím související výroba FVE. Tuto závislost je pot°eba vyhodnotit pro del²í £asový horizont.
Z vý²e uvedených okolností se dal²í £ást této práce omezuje na skute£nost, ºe výkon FVE je závislý pouze na intenzit¥ slune£ního zá°ení. Z toho d·vodu, v²echny dal²í modely v této práci se budou snaºit predikovat vývoj intenzity slune£ního zá°ení a ne výkon FVE. Výkon FVE se dá dopo£ítat.
3.2.
OV
ENÍ ZÁVISLOSTI VÝKONU FVE NA OSTATNÍCH VELIINÁCH
Obrázek 3.5: Závislost výkonu zaloºená osvitu, s ltrem
Obrázek 3.6: Závislost výkonu zaloºená teplot¥
19
20
KAPITOLA 3.
3.3
ANALÝZA
Základní analýza £asové °ady
Od této £ásti se tato práce výhradn¥ zabývá analýzou, predikcí a také testovním úsp¥²nosti odhad· jednotlivých model·. Aby bylo moºné navrhnout model, který bude schopen predikovat vývoj intenzity slune£ního zá°ení, je nutné nálézt základní vlastnosti £asové °ady. K nalezení vlastností práce vyuºívá dekompozi£ní metody. Denuje trendovou, sezónní a reziduální sloºku £asové °ady. Cyklickou sloºku nemá smysl hledat, není k dispozici dostatek pozorování. K dispozici jsou data cca za 3 m¥síce.
Trendová sloºka Trendová sloºka, jak jiº bylo d°íve zmín¥no, udává pokles £i r·st hodnot pozorování. Protoºe jsou k dispozici data za poslední 3 m¥síce, lze z t¥chto dat jiº vypozorovat i tuto sloºku. Obrázek 3.7 vykresluje t°i grafy. První graf vykresluje skute£ný vývoj intenzity slune£ního zá°ení. Druhý graf je trendová sloºka tohoto vývoje. T°etí graf vykresluje p°edpokládané pr·m¥rné m¥sí£ní hodnoty intenzity slune£ního zá°ení. Data byla po°ízena ze zdroje [8], kde mimo jiné lze generovat i tento graf. Sta£í vybrat lokaci, pro kterou hledáme vývoj intenzity slune£ního zá°ení.
Obrázek 3.7: Trendová sloºka £asové °ady osvitu
Lze p°epokládat, ºe trendová sloºka této £asové °ady bude mýt velice podobný pr·b¥h, jako je vygenerován informa£ním systémem PVGIS [8]. V tomto p°ípad¥ je trendová sloºka £asové °ady nahrazena sloºkou sezónní. Pr·b¥h trendu tomu napovídá.
Sezónní sloºka Sezónní sloºka vývoje intenzity slune£ního zá°ení je jednozna£n¥ ovlivn¥na st°ídáním ro£ních období. B¥hem celého roku se m¥ní pr·m¥rná délka slune£ního zá°ení, vý²ka horizontu
3.3.
21
ZÁKLADNÍ ANALÝZA ASOVÉ ADY
M¥síc
Hh[Wh/m2] T24h[◦ C]
Jan
759
-1.5
Feb
1420
0.4
Mar
2380
3.1
Apr
3660
7.9
May
4730
12.9
Jun
4710
15.6
Jul
4890
17.6
Aug
4190
17.7
Sep
2810
13.5
Oct
1840
9.3
Nov
821
3.4
Dec
531
-0.4
Year
2740
8.3
Tabulka 3.1: Pr·m¥rná ro£ní intenzita slune£ního zá°ení
slunce atd. Tabulka 3.1 vygenerovaná informa£ním systémem PVGIS [8] vypisuje pr·m¥rné denní hodnoty slune£ního zá°ení a okolní teplotu pro vybranou lokalitu. Z uvedených dat lze snadno vygenerovat i jednoduchý sezónní model 3.1, který pro ú£ely práce úpln¥ posta£í. P°edpokládá se pouze vyuºití pro kontrolu odhad· jednotlivých model·, zda predikce není zcela mimo rozsah.
y(t) = sin(
π∗t ) 12
(3.1)
t ... po°adové £íslo m¥síce 12... leden aº prosinec
Analýza spektrální hustoty Tato analýza poskytuje základní informace o tom, jak je energie pozorování závislá na kmito£tech. Z grafu 3.8 je celkem z°ejmé, ºe nejvýrazn¥j²í vzorek je kolem 180 aº 190. P°i v¥t²ím p°iblíºení byla ode£tena hodnota 184 z celkových 131000. Vzorkování je po jedné minut¥. Z t¥chto údaj· lze vypo£ítat nejvýznamn¥j²í frekvenci.
T =
1 ( sample N ) f=
T ... perioda
1 T
(3.2)
(3.3)
22
KAPITOLA 3.
ANALÝZA
f ... nejvýrazn¥j²í frekvence sample ... nejvýrazn¥j²í vzorek N... po£et vzork· Po dosazení do rovnice 3.2 a 3.3 byla vypo£tena nejvýrazn¥j²í frekvenci cca
12 hodin.
Tato frekvence odpovídá tzv. kolob¥hu tmy. Kolob¥h tmy je st°ídání sv¥tla a tmy.
Obrázek 3.8: Power spectrum density
3.4
Výstupní data
Hlavní náplní této práce je porovnání algoritm· predikce. Proto je také d·leºité denovat základní pravidla, která ur£ují výstup kaºdého modelu. Tyto pravidla pozd¥ji uleh£ují práci s porovnáním výsledk· a ur£ením vhodn¥j²ího algoritmu. Tabulka 3.2 vypisuje strukturu výstupního datového rozhraní kaºdého modelu. Dal²í podmínkou je, ºe v²echny modely musí pracovat se stejnými vstupními daty a musejí predikovat vývoj £asové °ady pro stejný £asový horizont.
3.4.
23
VÝSTUPNÍ DATA
Pravidlo
Popis
Veli£ina
slune£ní osvit [W/m2]
Období
predikovat na 7 dní
Vzorkování
1 hodina, z toho plyne 168 vzork·
Pr·m¥r
denní
pr·m¥r
intenzity
slu-
ne£ního zá°ení pro kaºdý den [Wh]
Tabulka 3.2: Výstupní datové rozhraní modelu predikce
24
KAPITOLA 3.
ANALÝZA
Kapitola 4
Návrh model· predikce •
ARIMA
•
ARIMAS
•
PBMSP
•
PBMSPS
Tato kapitola se zabývá popisem zp·sobu predikce vývoje intenzity slune£ního zá°ení jednotlivých predik£ních model·. U kaºdého modelu je popis funkce, p°iblíºení implementace v matematickém simulátoru MATLAB a nakonec také predikce na zvolené období. K predikci byly vybrány celkem £ty°i modely, z toho první dva jsou jiº léta vyuºívané v mnoha odv¥tvích. Dal²í dva modely jsou navrºeny na základ¥ mých prvních dojm·, které jsem nabyl je²t¥ p°ed studiem problematiky analýzy £asových °ad.
4.1 4.1.1
ARIMA Popis
Autoregresní integrovaný model klouzavých pr·m¥r· (Autoregressive integrated moving average model). Pomocí tohoto modelu lze modelovat i £asové °ady, které vykazují nestacionaritu. Model je zaloºen na Box-Jenkinsonov¥ metologii. Protoºe tato metodologie je výhradn¥ ur£ena pro stacionární £asové °ady. Je pot°eba na²í nestacionární £asovou °adu p°evést na °adu stacionární. Podrobný popis modelu viz [2] nebo [4].
Predikce vývoje intenzity slune£ního zá°ení je zaloºena na vyhledání nejvíce podobného vzorku v £asové °ad¥ 4.1. Pro tento vzorek se model snaºí nalézt vhodné parametry modelu testováním nejmen²í RMSE. Tento model pak aplikuje p°i predikci p·vodního vzorku. Nejvíce podobný vzorek se vybere m¥°ením vzdálenosti pomocí euklidovské vzdálenosti pouze v £asové °ad¥ intenzity slune£ního zá°ení. N¥které dal²í metody porovnávají vzdálenost v n¥kolika £asových °adách (intenzita slune£ního zá°ení, atmosférický tlak, okolní teplota, atd.) a pak z nich vytvo°í váºený pr·m¥r.
25
26
KAPITOLA 4.
NÁVRH MODEL PREDIKCE
Obrázek 4.1: ARIMA - predikce
4.1.2
Implementace modelu
1. fáze - linearizace £asové °ady 2. fáze - ur£ení °ádu diference £asové °ady 3. fáze - nalezení ²ablony 4. fáze - nalezení hodnot parametr· p a q 5. fáze - odhad modelu 6. fáze - verikace modelu 7. fáze - aplikace prognózy
Linearizace £asové °ady Ú£elem linearizace £asové °ady je provést takové úpravy, aby ji bylo moºné popsat lineárními modely. Úkolem je zbavit £asovou °adu posunutí v ose y 4.1, normalizovat rozsah hodnot 4.2 a nakonec odstranit ²um 4.3. Linearizace £asové osy také pom·ºe p°i hledání nejvíce podobného vzorku.
Q = Q − mean(Q) Q − mean(Q) Q= std(Q) Q = smooth(Q)
(4.1) (4.2) (4.3)
Ur£ení °ádu diference £asové °ady Je zapot°ebí zvolit takový °ád diference £asové °ady, který zajistí stacionaritu £asové °ady. Stacionarita £asové °ady bude ov¥°ována pomocí autokorela£ní funkce ACF. Obrázek 4.3 vykresluje n¥kolik graf·, mimo jiné i funkce ACF a PACF pro n¥kolik °ád· diferencování £asové °ady. Z obrázku lze ode£íst, ºe nejlep²í tvar autokorela£ní funkce je pro
druhou
4.1.
27
ARIMA
Obrázek 4.2: Linearizace £asové °ady
diferenci £asové °ady. Po první diferenci tvar k°ivky ACF klesá p°íli² pomalu a pro t°etí diferenci se tvar k°ivky ACF nezlep²il. Pokud není t°eba, je lep²í nediferencovat £asovou °adu. Diferencí £asové °ady lze ztratit nosnou informaci, která je v £asové °ad¥ ukryta.
Nalezení ²ablony Jedním úkolem p°i predikci £asové °ady je nalezení nejvíce podobného vývoje v minulosti. Hledání si lze p°estavit jako posouvání okénka velikosti 48 záznam· (2 dny) po £asové ose zp¥t a hledání nejmen²í vzdálenosti mezi dv¥ma £asovými °adami. K ur£ení vzdálenosti mezi £asovými °adami se vyuºívá euklidovská metrika. Úsek £asové °ady s nejmen²í euklidovskou vzdáleností je ozna£en za ²ablonu.
Nalezení hodnot parametr· p a q Pro nalezenou ²ablonu je nyní pot°eba vyhledat vhodné parametry modelu ARIMA. Hledání parametr· v této práci bylo provedeno hrubou silou, protoºe doporu£ené metody [2] [4] nevedly k ºádným uspokojivým výstup·m. Algoritmus postupn¥ prochází v²emi parametry modelu ARIMA a testuje výstup predikce. Model je vytvo°en a testován pro kaºdou kombinaci ze v²ech t°í parametr·. Rozsah parametru pro diferencování £asové °ady je od 1 do 5. Pro dal²í dva parametry byl zvolen rozsah od 1 do 50. Na konec je vybrán model s nejmen²í euklidovskou vzdáleností mezi odhadem modelu na trénovacích datech a skute£ností. B¥hem pr·b¥ºného testování bylo navíc zji²t¥no, ºe optimální parametry modelu ARIMA se m¥ní s vývojem £asové °ady.
Odhad modelu Odhad modelu je generován pro kaºdou kombinaci parametr· p, d, q modelu ARIMA. Odhad je provád¥n na trénovacích datech. Jak jiº bylo zmín¥no v p°edchozí £ásti, je tento odhad
28
KAPITOLA 4.
NÁVRH MODEL PREDIKCE
Obrázek 4.3: ACF a PACF
porovnáván se skute£ností.
Verikace modelu Verikace modelu je provedena na datech, které bezprost°edn¥ následují za daty trénovacími. Mezi t¥mito dv¥ma £asovými °adami se hledá odhad modelu s nejmen²í RMSE. Verikace modelu je op¥t provedena pro v²echny kombinace parametr· p, d, q modelu ARIMA.
Aplikace prognózy Nyní jsou k dispozici v²echny pot°ebná data k vytvo°ení predikce. Algoritmus vybere model s nejlépe ohodnocenými parametry na trénovacích datech a provede op¥t odhad, ale tentokráte na datech testovacích. Tento odhad modelu je zárove¬ predikcí vývoje £asové °ady.
4.1.3
Predikce
Vygenerovaný odhad modelu vykazuje dobré výsledky pro prvních 5 dní (viz 4.1). estý den do²lo k výrazné zm¥n¥ klimatických podmínek, které model nezachytil. Z odhadu je také vid¥t, ºe £tvrtý den se za£ínají rozcházet hodnoty východu slunce. Aplikace, které vyuºijí tento model, by m¥ly tento odhad p°izp·sobit kolob¥hu tmy. Je známo, kdy vychází a zapadá slunce.
4.1.
29
ARIMA
Model: Datum:
ARIMA 1.5.2011
Datum
Odhad[kWh]
Skute£nost[kWh] RMSE[kWh]
1.5.
200,52
279,15
78,63
2.5.
172,25
149,68
22,57
3.5.
160,09
145,47
14,62
4.5.
150,30
162,72
12,42
5.5.
141,03
187,39
46,36
6.5.
131,08
287,29
156,21
7.5.
122,91
290,07
167,16
Tabulka 4.1: ARIMA - predikce modelu
30
KAPITOLA 4.
4.2
NÁVRH MODEL PREDIKCE
ARIMAS
4.2.1
Popis
Princip z·stává stejný jako u modelu ARIMA. Zm¥na je v generování výstupu, kde tento model je roz²í°en o sezónní sloºku £asové °ady. Princip modelu ARIMA spo£ívá v nalezení nejvíce podobného vzorku a jeho modelu ,který pozd¥ji pouºije v predikci. Problém nastává v p°ípad¥, ºe vzdálenost mezi testovacími a trénovacími daty je p°íli² velká, t°eba i n¥kolik m¥síc·. Protoºe se b¥hem roku také m¥ní pr·m¥rná doba dne, je nutné výstupní data p°izp·sobit sezónní sloºce.
4.2.2
Implementace modelu
1. fáze - linearizace £asové °ady 2. fáze - ur£ení °ádu diference £asové °ady 3. fáze - nalezení ²ablony 4. fáze - nalezení hodnot parametr· p a q 5. fáze - odhad modelu 6. fáze - verikace modelu 7. fáze - aplikace prognózy 8. fáze - aplikace sezónní sloºky Ze seznamu je viditelné, ºe se jedná o model ARIMA, který je roz²í°en o jednu fázi vývoje. Jedná se práv¥ o aplikaci sezónní sloºky £asové °ady na odhad modelu na testovacích datech. Z toho d·vodu je popsána pouze poslední fáze implementace tohoto modelu.
Aplikace sezónní sloºky Výstupem p°edchozí fáze je odhad modelu na trénovacích datech. Z tabulky 3.1 lze ode£íst pr·m¥rnou dobu slune£ního zá°ení pro daný m¥síc. Algoritmus této fáze je velmi jednoduchý, ze zmín¥né tabulky ode£te hodnoty pr·m¥rného slune£ního zá°ení pro trénovací a testovací data a vypo£ítá z nich sezónní koecient
ks
podle rovnice 4.4. Koecient
ks
aplikuje na od-
had, který vygenerovala p°edchozí fáze.
ks =
n m
(4.4)
n ... odpovídá hodnot¥ slune£ního zá°ení z tabulky 3.1 pro m¥síc posledního záznamu testovacích dat m ... to samé pro trénovací data
4.3.
PBMSP
4.2.3
31
Predikce
Aplikace sezónní sloºky na odhad modelu ARIMA výrazn¥ zhor²il jeho kvalitu (viz 4.2). Ke zhor²ení do²lo hlavn¥ v první £ásti odhadu, naopak ve druhé £ásti do²lo ke zlep²ení kvality odhadu. Pro pot°eby predikce má vy²²í prioritu odhad mezi prvním a £tvrtým dnem. Proto lze °íci, ºe aplikace sezónní sloºky pro toto období zhor²ila kvalitu odhadu vývoje intenzity slune£ního zá°ení.
4.3
PBMSP
Prediction based on the most similar pattern, nebo-li metoda zaloºená na analogii. Podle [1] jsou to metody zaloºené na analogii, kdy v neznámé situaci pouºijeme °e²ení, které jiº v minulosti nastalo. Nejv¥t²í d·raz je kladen na vyhledání neznámé situace v minulosti.
4.3.1
Popis
Model predikce zaloºený na výb¥ru ²ablony. ablonou v tomto p°ípad¥ je mnoºina trénovacích dat, které mají nejmen²í euklidovskou vzdálenost s daty testovacími. Algoritmus modelu nejprve vybere data testovací (posledních x záznam·) a jako v p°edchozích modelech, vyhledává nejlep²í vzorek m¥°ením vzdálenosti mezi £asovými °adami. Vzorek s nejmen²í vzdáleností ozna£í za ²ablonu. Predikce spo£ívá ve výb¥ru x hodnot £asové °ady, které nastaly bezprost°edn¥ za daty ²ablony.
4.3.2
Implementace modelu
1. fáze - linearizace £asové °ady 2. fáze - nalezení ²ablony 3. fáze - odhad modelu 4. fáze - aplikace prognózy
Linearizace £asové °ady Zp·sob linearizace £asové °ady je stejný jako v p°edchozích modelech ARIMA a ARIMAS. Rozdíl je pouze v tom, ºe tento model pouºívá k vyhledání ²ablony v²echny dostupné £asové °ady (intenzita slune£ního zá°ení, atmosférický tlak, okolní teplota, vý²ka mrak· a úhrn sráºek). Proto se v tomto p°ípad¥ linearizuje ne jedna, ale hned p¥t £asových °ad.
Nalezení ²ablony P°i hledání ²ablony se op¥t porovnává euklidovská vzdálenost. V tomto p°ípad¥ se porovnává vzdálenost v²ech £asových °ad, tedy intenzity slune£ního zá°ení, atmosférického tlaku, okolní teploty, vý²ky mrak· a také úhrnu sráºek. Výstupem kaºdého testu je váºený pr·m¥r
32
KAPITOLA 4.
Model: Datum:
NÁVRH MODEL PREDIKCE
ARIMAS 1.5.2011
Datum
Odhad[kWh]
Skute£nost[kWh] RMSE[kWh]
1.5.
289,54
279,15
10,39
2.5.
268,69
149,68
119,01
3.5.
249,11
145,47
103,64
4.5.
239,32
162,72
76,6
5.5.
230,05
187,39
42,66
6.5.
227,51
287,29
59,78
7.5.
211,93
290,07
78,14
Tabulka 4.2: ARIMAS - predikce modelu
4.4.
33
PBMSPS
Veli£ina
Váha
Intenzita slune£ního zá°ení
5
Atmosférický tlak
2
Okolní teplota
2
Vý²ka mrak·
1
Úhrn sráºek
1
Tabulka 4.3: Váºený pr·m¥r
euklidovských vzdáleností. Tabulka (viz 4.3) vypisuje váhy jednotlivých vzdáleností. ablonu reprezentuje vzorek s nejmen²ím váºeným pr·m¥rem.
Odhad modelu Vývoj intenzity slune£ního zá°ení za£ínající bezprost°edn¥ za trénovacími daty (²ablonou) reprezentuje odhad modelu.
Aplikace prognózy Algoritmus tohoto modelu generuje odhad vývoje intenzity slune£ního zá°ení pro dvoje trénovací data. První skupina trénovacích dat p°edstavuje vývoj po£así za posledních 24 hodin. Druhou skupinu p°edstavuje vývoj po£así o 24 hodin star²í neº je první skupina. Výstupem predikce je aritmetický pr·m¥r obou odhad·.
4.3.3
Predikce
Odhad tohoto modelu vykazuje nejlep²í pr·m¥rné výsledky pro celý interval (viz 4.4). Tento model dokázal, s relativn¥ malou chybou, také reagovat na výraznou zm¥nu klimatických podmínek.
4.4 4.4.1
PBMSPS Popis
Tak jako model ARIMAS i tento model roz²i°uje svého p°edch·dce, model PBMSP, o sezónní sloºku. Implementace jednotlivých fází vývoje tohoto modelu jiº není popsána, nebo´ je tak u£in¥no v p°edchozí £ásti této práce - modely PBMSP a ARIMAS.
4.4.2
Implementace modelu
1. fáze - linearizace £asové °ady 2. fáze - nalezení ²ablony
34
KAPITOLA 4.
Model: Datum:
NÁVRH MODEL PREDIKCE
PBMSP 1.5.2011
Datum
Odhad[kWh]
Skute£nost[kWh] RMSE[kWh]
1.5.
185,59
279,15
93,56
2.5.
168,79
149,68
19,11
3.5.
156,31
145,47
10,84
4.5.
210,25
162,72
47,53
5.5.
209,38
187,39
21,99
6.5.
225,45
287,29
61,84
7.5.
217,30
290,07
72,77
Tabulka 4.4: PBMSP - predikce modelu
4.4.
PBMSPS
35
3. fáze - odhad modelu 4. fáze - aplikace prognózy 5. fáze - aplikace sezónní sloºky
4.4.3
Predikce
Tento model s porovnáním s ostatními modely generuje zdaleka nejhor²í odhady vývoje intenzity slune£ního zá°ení pro zvolené období (viz 4.5).
36
KAPITOLA 4.
Model: Datum:
NÁVRH MODEL PREDIKCE
PBMSPS 1.5.2011
Datum
Odhad[kWh]
Skute£nost[kWh] RMSE[kWh]
1.5.
320.09
279,15
40,94
2.5.
292,26
149,68
142,58
3.5.
279,79
145,47
134,32
4.5.
333,72
162,72
171,00
5.5.
332,86
187,39
145,47
6.5.
348,93
287,29
61,64
7.5.
340,77
290,07
50,7
Tabulka 4.5: PBMSPS - predikce modelu
Kapitola 5
Porovnání model· •
porovnání výsledk· model· ARIMA, ARIMAS, PBMSP a PBMSPS
•
porovnání predikce s externími systémy
•
zhodnocení výsledk·
Dal²ím d·leºitým krokem této práce je srovnání a zhodnocení výsledk· jednotlivých model·. První £ást této kapitoly se zabývá analýzou predikce v²ech model·. V dal²í £ásti je porovnání výsledk· predikce s n¥kterým externím systémem. Na konci kapitoly je zhodnocení dosaºených výsledk· predikce vývoje itenzity slune£ního zá°ení v²ech model·.
5.1
Porovnání výsledk· model· ARIMA, ARIMAS, PBMSP a PBMSPS
Aby bylo moºné porovnat výsledky jednotlivých model·, je nutné ur£it n¥kolik základních metrik pro porovnání výsledk· predikce £asové °ady. Podle [1] se jako kritérium pro porovnání numerické predikce pouºívají nap°íklad st°ední kvadratická chyba (mean-squared error, MSE), odmocnina ze st°ední kvadratické chyby (root mean-squared error, RMSE), st°ední absolutní chyba (mean absolute error, MAE) nebo relativní kvadratická chyba (relative squared error, RSE).
M SE =
(p1 − s1 )2 + ... + (pn − sn )2 n s
RM SE =
M AE =
(5.1)
(p1 − s1 )2 + ... + (pn − sn )2 n
(5.2)
|p1 − s1 | + ... + |pn − sn | n
(5.3)
37
38
KAPITOLA 5.
Interval Model
MSE
ARIMA
POROVNÁNÍ MODEL
1.5. - 7.5. RMSE
MAE
RSE
338893637,89 18409,06
10896,80
0,49
ARIMAS
343373387,76 18530,33
11864,78
0,52
PBMSP
207913456,03 14419,20
9248,09
0,32
PBMSPS
402896857,85 20072,29
13961,02
0,53
Tabulka 5.1: Celkové porovnání predikce model·
Interval Model
MSE
ARIMA ARIMAS
1.5. - 4.5. RMSE
MAE
RSE
224899005,45 14996,63
8717,18
0,41
373001960,67 19313,25
11613,04
0,62
PBMSP
208500025,00 14439,52
8952,61
0,39
PBMSPS
463086003,27 21519,43
15318,38
0,67
Tabulka 5.2: Porovnání predikce model· - 1.5. aº 4.5.
RSE = V uvedených vzorcích je
(p1 − s1 )2 + ... + (pn − sn )2 1X si , kde s¯ = 2 2 (s1 − s¯) + ... + (sn − s¯) n i
pi
predikovaná hodnota a
si
(5.4)
je hodnota skute£ná pro i-té pozorování
vývoje £asové °ady.
Protoºe tato práce se zabývá st°edn¥dobou predikcí, tak stojí za to, porovnat jednotlivé modely po intervalech. Pro pot°eby této práce je nejvíce d·leºitá predikce pro první 4 dny, první interval. Druhý interval je tedy pro pátý aº sedmý den. Dal²ím zp·sobem jak lze porovnat modely je jejich spole£ná vizualizace a porovnání se skute£ností.
Obecn¥ je dávána p°ednost modelu s nejniº²í hodnotou uvedených základních metrik. Je pot°eba si uv¥domit, ºe ºádná z t¥chto metrik není univerzální, ale podává pouze díl£í informaci o kvalit¥ modelu. Pro porovnání výsledk· predikce r·zných model· lze pouºít v²echny zmín¥né metriky. Kdyby bylo zapot°ebí porovnat nap°íklad dv¥ a více £asových °ad, bylo by nutné pouºít metriky relativní (mean percent error MPE, mean absolute percent error MAPE).
Tabulky 5.1 5.2 5.3 vypisují výstupy základních metrik pro vyhodnocení kvality modelu. Protoºe na hodnocení kvality se hodí v²echny zmín¥né metriky, byla vybrána metrika RSE. Z výsledk· je celkem z°ejmé, ºe nejlep²í odhad vývoje intenzity slune£ního zá°ení pro období od 1.5. do 7.5.2011 vykazuje model PBMSP. Naopak nejhor²í je model PBMSPS. Výstupy model· ARIMA a ARIMAS ukazují, ºe se p°íli² nehodí pro odhad vývoje na del²í období. Modely PBMSP a PBMSPS na rozdíl od model· ARIMA a ARIMAS vykazují lep²í odhady vývoje £asové °ady pro druhý interval.
5.2.
39
POROVNÁNÍ PREDIKCE S EXTERNÍMI SYSTÉMY
Interval Model
MSE
ARIMA
5.5. - 7.5. RMSE
MAE
RSE
619038869,41 24880,49
15661,46
0,68
ARIMAS
510948639,64 22604,17
16129,12
0,66
PBMSP
134502160,71 11597,50
7224,32
0,17
PBMSPS
221628263,02 14887,18
8834,94
0,27
Tabulka 5.3: Porovnání predikce model· - 5.5. aº 7.5.
Obrázek 5.1 ukazuje odhad v²ech model·. Odhad lze porovnat se skute£ností. Z obrázku je také viditelné, ºe ºádný z uvedených model· neporu²uje kolob¥h tmy (st°ídání dne a noci v pravidelných intervalech), li²í se pouze amplitudou odhadu.
Obrázek 5.1: Porovnání výstup· predikce model·
5.2
Porovnání predikce s externími systémy
Následující experiment porovnává odhady model· predikce s jinými externími systémy. Po dlouhém hledání na internetu byl nalezen pouze jeden systém, který který je schopen generovat alespo¬ obrázek s odhadem vývoje slune£ního zá°ení. Obrázek 5.2 práv¥ ukazuje odhad vývoje intenzity slune£ního zá°ení, který vygeneroval systém PointSOLAR [7]. Tento systém generuje data na základ¥ mesoscale modelu [6], který monitoruje pohyb obla£nosti. Uvedený model generuje odhad vývoje pro období od 9.5.2011 do 13.5.2011. Tento experiment porovnává odhady model· ARIMA a PBMSP s odhadem systému PointSOLAR.
40
KAPITOLA 5.
POROVNÁNÍ MODEL
Obrázek 5.2: PointSolar 8.5.2011
Vývoj intenzity slune£ního zá°ení v období od 9.5. do 13.5. byl tém¥° periodický aº na jednu vyjímku. Dne 12.5 cca 12 hodin byl zaznamenán prudký pokles intenzity slune£ního zá°ení. Vývoj osvitu spole£n¥ s odhadem model· ARIMA a PBMSP je zobrazen na obrázku 5.3. Vizuálním posouzením lze °íci, ºe model ARIMA vykazuje nejlep²í odhad. Na druhou stranu model systému PointSolar dokázal odhadnout prudký pokles intenzity slune£ního zá°ení dne 12.5.
Obrázek 5.3: ARIMA a PBMSP 8.5.2011
5.3
Zhodnocení výsledk·
Z dosavadních výsledk· nelze stanovit, který model je lep²í. M·ºe se zdát, ºe modely ARIMA a PBMSP nyní vykazují lep²í odhady neº zbylé dva, kde je zapo£ítána i sezónní sloºka. Teprve £as ukáºe, který model generuje kvalitn¥j²í odhady. Je pot°eba modely stále testovat, archivovat odhady a parametry a dále zpracovávat. Dále se nabízí moºnost kombinovat zmín¥né modely.
Kapitola 6
Záv¥r Cílem této práce bylo navrhnout nebo nalézt algoritmy pro st°edn¥dobou predikci výroby elektrické energie fotovoltaické elektrárny. Tyto algoritmy mezi sebou, nebo s n¥kterými externími systémy, také porovnat. K dosaºení tohoto cíle bylo zapot°ebí denovat a pochopit základní pojmy analýzy £asových °ad a vliv klimatických podmínek na výrobu elektrické energie fotovoltaické elektrárny. S tím v²ím jsme byly seznámeni v první teoretické £ásti této práce. Na základ¥ nabitých v¥domostí bylo moºné navrhnout základní datové rozhraní pot°ebné k predikci. V dal²í analytické £ásti byly navrºeny a zanalyzovány £ty°i modely, které dovedou predikovat vývoj hodnot £asové °ady. Na záv¥r této práce byly modely mezi sebou, i mezi jedním externím systémem, porovnány.
Z vygenerovaných odhad· jednotlivých model· jsem byl docela mile p°ekvapen, hlavn¥ z výsledk· model· ARIMA a PBMSP. Na sezónních modelech je zapot°ebí stále pracovat a rozvíjet je. Sou£asné °e²ení p°íli² nevyhovuje poºadavk·m. B¥hem zpracování této práce jsem provedl n¥kolik kontrolních odhad· model· ARIMA, PBMSP a externího systému PointSOLAR. Z dosaºených výsledk· lze °íci, ºe modely jsou srovnatelné s odhady externího systému PointSOLAR a má smysl se jimi dále zabývat a rozvíjet je.
6.1
Návrh na dal²í práci
B¥hem analýzy a návrhu jednotlivých model· jsem narazil na spoustu problém·, které je pot°eba lépe °e²it. Nap°íklad odhad parametr· model· ARIMA a ARIMAS. V této práci se problém vy°e²il hrubou silou, coº vede k p°íli² veliké £asové náro£nosti vygenerování modelu. Cílem dal²í práce je analýza sou£asného °e²ení odhadu parametr· a nalezení lep²í metody pro efektivn¥j²í odhad parametr·. Dal²ím vylep²ením m·ºe být nap°íklad optimalizace odhad· na základ¥ znalostí kolob¥hu tmy. Víme, kdy slunce vychází a zapadá a tomu také p°izp·sobit odhad. Díky uspokujícím odhad·m jednotlivých model· lze navrhnout systém, který na základ¥ vytvo°ených odhad·, dokáºe zregulovat energetickou soustavu fotovoltaických elektráren a tím napom·ºe zlep²it její kvalitu a stabilitu.
41
42
KAPITOLA 6.
ZÁV
R
Literatura [1] BERKA, P.
Dobývání znalostí databází.
1. Legerova 61, Praha, eská Republika :
Academia, 1th edition, 2003. [2] DOUGLAS C.MONTGOMERY, J. S. L. A.
Forecasting and time series analysis.
1.
1221 Avenue of the Americas, New York, NY 10020 : McGraw-Hill, Inc., 2th edition, 1990. [3] áLEK, R. M. P°edpov¥¤ po£así.
zity, listopad 2003.
[4] PETER J.BROCKWELL, R. A.
P°edná²ka pro Katedru geograe Masarykovy univer-
Introduction to time series and forecasting.
1. 175 Fifth
Avenue, New York, NY 10010 : Springer-Verlag New York, Inc., 2th edition, 1996. [5] web:Box-Jenkins
model.
Box/Jenkins
model,
http://www.itl.nist.gov/div898/handbook/pmc/section4/pmc445.htm,
2011. stav
ze
6. 5. 2011. [6] web:MesoScale.
Nonhydrostatic
http://www.meteoblue.com/en_GB/content/464, [7] web:PointSOLAR. Solar Energy, 2011.
Meso-Scale
modeling,
2011.
stav ze 14. 5. 2011.
http://www.meteoblue.com/content/687,
stav
ze 8. 5. 2011. [8] web:PVGIS.
Fotovoltaický
geogracký
informa£ní
http://re.jrc.ec.europa.eu/pvgis/apps3/pvest.php,
43
systém,
stav ze 7. 5. 2011.
2011.
44
LITERATURA
Kapitola 7
Seznam pouºitých zkratek OZE
obnovitelný zdroj elektrické energie
FVE
fotovoltaická elektrárna
TS
time series nebo-li £asová °ada
PSD
power spectrum density
ARIMA
autoregressive integrated moving average models
ARIMAS PBMSP
prediction based on the most similar pattern
SPBMSP RMSE ACF
ARIMA model dopln¥ný o sezóní sloºku
PBMSP model dopln¥ný o sezóní sloºku
root mean squere error
autokorela£ní funkce
PACF
£áste£ná autokorela£ní funkce
. . .
45
46
KAPITOLA 7.
SEZNAM POUITÝCH ZKRATEK
Kapitola 8
Obsah CD
Obrázek 8.1: Obsah CD
Adresá° data obsahuje v²echny datové zdroje pouºité k vyhledání závislostí mezi daty a analýze £asové °ady. Adresá° matlab obsahuje v²echny pouºité skritpy na p°edzpracování dat, jejich analýzy a také výslednou predikci. Adresá° text obsahuje v²echny zdrojové texty a obrázky této bakalá°ské práce.
47