´ UNIVERZITA PALACKEHO V OLOMOUCI
ˇ´ ˇ ´ FAKULTA PR IRODOVEDECK A ´ ANALYZY ´ KATEDRA MATEMATICKE A APLIKAC´I MATEMATIKY
´ PRACE ´ DIPLOMOVA Statistick´e zpracov´an´ı fuzzy dat
Vedouc´ı diplomov´e pr´ace: RNDr. Ondˇ rej Pavlaˇ cka, Ph.D. Rok odevzd´an´ı: 2011
Vypracovala: Pavl´ına Kacrov´ a AME, II. roˇcn´ık
Prohl´ aˇ sen´ı Prohlaˇsuji, ˇze jsem vytvoˇrila tuto diplomovou pr´aci samostatnˇe za veden´ı RNDr. Ondˇreje Pavlaˇcky, Ph.D. a ˇze jsem v seznamu pouˇzit´e literatury uvedla vˇsechny zdroje pouˇzit´e pˇri zpracov´an´ı pr´ace.
V Olomouci dne 31. bˇrezna 2011
Podˇ ekov´ an´ı R´ada bych na tomto m´ıstˇe podˇekovala vedouc´ımu diplomov´e pr´ace RNDr. Ondˇreji Pavlaˇckovi, Ph.D. za obˇetavou spolupr´aci i za ˇcas, kter´ y mi vˇenoval pˇri konzultac´ıch. D´ale si zaslouˇz´ı podˇekov´an´ı m˚ uj poˇc´ıtaˇc, ˇze vydrˇzel moje pracovn´ı tempo, a typografick´ y syst´em TEX, kter´ ym je pr´ace vys´azena.
Obsah ´ 1 Uvod
5
2 Popisn´ a statistika 2.1 Z´akladn´ı pojmy . . . . . . . . . . . . . . . . 2.1.1 Bodov´e rozdˇelen´ı ˇcetnost´ı . . . . . . 2.1.2 Intervalov´e rozdˇelen´ı ˇcetnost´ı . . . . ˇ ıseln´e charakteristiky . . . . . . . . . . . . 2.2 C´ 2.2.1 Charakteristiky polohy . . . . . . . . 2.2.2 Charakteristiky variability . . . . . . 2.2.3 Charakteristiky ˇsikmosti a ˇspiˇcatosti 2.3 Grafick´a zn´azornˇen´ı . . . . . . . . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
6 6 9 9 10 10 14 16 17
3 Z´ akladn´ı pojmy z teorie fuzzy mnoˇ zin
20
4 Popisn´ a statistika pro fuzzy data ˇ 4.1 C´ıseln´e charakteristiky polohy . . . . . . . 4.1.1 Fuzzy pr˚ umˇer . . . . . . . . . . . . 4.1.2 Fuzzy medi´an . . . . . . . . . . . . 4.1.3 Fuzzy geometrick´ y pr˚ umˇer . . . . . 4.1.4 Fuzzy doln´ı a horn´ı kvartil . . . . . 4.1.5 Minim´aln´ı a maxim´aln´ı fuzzy ˇc´ıslo . ˇ ıseln´e charakteristiky variability . . . . . 4.2 C´ 4.2.1 Fuzzy rozptyl . . . . . . . . . . . . 4.2.2 Fuzzy smˇerodatn´a odchylka . . . . 4.2.3 Variaˇcn´ı koeficient . . . . . . . . . 4.2.4 Variaˇcn´ı rozpˇet´ı . . . . . . . . . . . 4.3 Histogram . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . .
27 27 27 28 30 32 33 34 34 36 37 38 40
5 Modelov´ y pˇ r´ıklad 5.1 Pouˇzit´ y software . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.2 Statistick´a anal´ yza fuzzy dat . . . . . . . . . . . . . . . . . . . . . 5.3 Grafick´e zn´azornˇen´ı - fuzzy histogram . . . . . . . . . . . . . . . .
45 45 47 55
6 Z´ avˇ er
60
Pˇ r´ılohy
63
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
. . . . . . . . . . . .
Pouˇ zit´ e znaˇ cen´ı n x xi [a, b] (a, b) a, b, c, d x¯G x¯H χA x˜ x˜0,75 x˜0,25 s2x µA , A(.) Ker A Aα Supp A xˆ h Rx sx α β FN (R) x∗i d U Vx x(α), x(α) xF xHF xGF s2xF s xF R xF VxF hnF () x˜0,75F x˜0,25F
rozsah statistick´eho souboru aritmetick´ y pr˚ umˇer i-t´a pozorovan´a hodnota uzavˇren´ y interval s mezemi a a b otevˇren´ y interval s mezemi a a b konstanty geometrick´ y pr˚ umˇer harmonick´ y pr˚ umˇer charakteristick´a funkce mnoˇziny A medi´an horn´ı kvartil doln´ı kvartil rozptyl funkce pˇr´ısluˇsnosti fuzzy mnoˇziny A j´adro fuzzy mnoˇziny A α-ˇrez fuzzy mnoˇziny A nosiˇc fuzzy mnoˇziny A modus ˇs´ıˇrka tˇr´ıdy variaˇcn´ı rozpˇet´ı smˇerodatn´a odchylka ˇsikmost ˇspiˇcatost syst´em vˇsech fuzzy ˇc´ısel fuzzy pozorov´an´ı pr˚ umˇern´a odchylka univerzum variaˇcn´ı koeficient horn´ı a doln´ı funkce fuzzy ˇc´ısla x aritmetick´ y fuzzy pr˚ umˇer fuzzy harmonick´ y pr˚ umˇer fuzzy geometrick´ y pr˚ umˇer fuzzy rozptyl fuzzy smˇerodatn´a odchylka fuzzy variaˇcn´ı rozpˇet´ı fuzzy variaˇcn´ı koeficient fuzzy relativn´ı ˇcetnost fuzzy horn´ı kvartil fuzzy doln´ı kvartil
4
´ Uvod
1
C´ılem m´e diplomov´e pr´ace je sezn´amit ˇcten´aˇre s metodami statistick´eho zpracov´an´ı fuzzy dat. Budou zde uvedeny jak z´akladn´ı pojmy z klasick´e popisn´e statistiky, tak i ze z´aklad˚ u fuzzy mnoˇzin pro lepˇs´ı pochopen´ı problematiky. Dalˇs´ı z c´ıl˚ u je popsat konstrukci z´akladn´ıch charakteristik statistick´eho souboru, jako napˇr. v´ ybˇerov´ y pr˚ umˇer, v´ ybˇerov´ y rozptyl atp., ˇci dalˇs´ıch n´astroj˚ u popisn´e statistiky, napˇr. histogramu, v pˇr´ıpadˇe, ˇze data jsou d´ana v podobˇe fuzzy ˇc´ısel. Problematika bude ilustrov´ana na n´azorn´ ych pˇr´ıkladech a grafech, ke kter´ ym vyuˇzijeme software Matlab a R. Cel´a teorie fuzzy mnoˇzin iniciovan´a L. A. Zadehem roku 1965 se dnes jiˇz dok´azala prosadit v mnoha oblastech a odvˇetv´ıch, pˇriˇcemˇz vˇse nasvˇedˇcuje tomu, ˇze stejn´ y trend bude pokraˇcovat i do budoucna. L. A. Zadeh tvrd´ı v t´eto teorii fuzzy mnoˇzin, ˇze prvky mohou do mnoˇziny patˇrit na rozd´ıl od klasick´eho pˇr´ıstupu i pouze ˇc´asteˇcnˇe. Od t´e doby se rozv´ıj´ı a vyuˇz´ıv´a v kaˇzdodenn´ım ˇzivotˇe. M´alo kdo v´ı, ˇze teorie fuzzy mnoˇzin se pouˇz´ıv´a v praˇck´ach, v´ ytaz´ıch a v plno dalˇs´ıch aplikac´ıch. My se v t´eto pr´aci budeme zab´ yvat problematikou statistick´eho zpracov´an´ı fuzzy dat, jelikoˇz je ned´ılnou souˇc´ast´ı mnoha aplikac´ı. V re´aln´em ˇzivotˇe je totiˇz velmi d˚ uleˇzit´e uvaˇzovat nepˇresn´a data nebo data vyj´adˇrena kvalitativnˇe. Cel´a pr´ace bude rozdˇelena do dvou ˇc´ast´ı. Prvn´ı z nich bude teoretick´a ˇc´ast, kde se sezn´am´ıme se z´aklady klasick´e popisn´e statistiky a pˇripomeneme si nˇekter´e z´akladn´ı definice z teorie fuzzy mnoˇzin, kter´e budou d´ale vyuˇz´ıv´any. V dalˇs´ı kapitole si nadefinujeme popisnou statistiku pro fuzzy data s n´azorn´ ymi pˇr´ıklady s menˇs´ım poˇctem fuzzy ˇc´ısel. V druh´e ˇc´asti se budeme vˇenovat modelov´emu pˇr´ıkladu, kde si jako prvn´ı pˇredstav´ıme pouˇz´ıvan´ y software, a n´aslednˇe se budeme vˇenovat problematice v´ ypoˇctu statistick´ ych charakteristik pro velk´ y rozsah fuzzy dat.
5
2
Popisn´ a statistika Popisn´a statistika (deskriptivn´ı statistika) je velmi star´ y vˇedn´ı obor, kter´ y
prov´az´ı lidskou spoleˇcnost uˇz od poˇc´atku. Slovo statistika poch´az´ı z latinsk´eho ”status” – stav. Statistika byla p˚ uvodnˇe n´astrojem pro zaznamen´an´ı nezbytn´ ych dat pro st´at a jeho ˇr´ızen´ı. Tˇemito d˚ uleˇzit´ ymi informacemi byly u ´daje o poˇctu obyvatel, v´ yˇsi dan´ı, velikosti u ´zem´ı atd. Tyto informace se vˇzdy z´ısk´avaly prostˇrednictv´ım pozorov´an´ı a mˇeˇren´ı. S v´ yvojem v matematice se vyv´ıjela i popisn´a statistika a nyn´ı o n´ı m˚ uˇzeme ˇr´ıci, ˇze se zab´ yv´a uspoˇr´ad´an´ım datov´ ych soubor˚ u, jejich popisem a sumarizac´ı. Tento vˇedn´ı obor a jeho aplikace pouˇz´ıv´ame prakticky dennˇe. M˚ uˇzeme se s popisnou statistikou setkat ve zdravotnictv´ı, ve finanˇcn´ıch anal´ yz´ach, bankovnictv´ı atd. Cel´a tato kapitola bude zpracov´ana dle [1, 4, 5].
2.1
Z´ akladn´ı pojmy
V´ ychoz´ım pojmem je statistick´ y soubor , coˇz je mnoˇzina statistick´ ych jednotek , napˇr. ˇclovˇek, zv´ıˇre, organizace, doba apod., jeˇz maj´ı stejn´e nˇekter´e vlastnosti. Urˇcen´ım tˇechto shodn´ ych vlastnost´ı je tento statistick´ y soubor definov´an. U statistick´e jednotky lze mˇeˇrit jeden nebo v´ıce statistick´ ych znak˚ u, kter´e nab´ yvaj´ı pozorovateln´ ych hodnot. Pokud sledujeme pouze jednu vlastnost, dost´av´ame jednorozmˇern´ y statistick´ y soubor. Statistick´e znaky m˚ uˇzeme dˇelit na alternativn´ı, kde mohou nab´ yvat pouze dvou r˚ uzn´ ych hodnot (napˇr. ano-ne, ˇzenamuˇz), a nebo tak´e mnoˇzn´e, kter´e nab´ yvaj´ı v´ıce tˇechto hodnot. D´ale se mohou dˇelit podle hodnot, kter´ ych mohou nab´ yvat, na : • kvantitativn´ı, kter´e nab´ yvaj´ı pouze ˇc´ıseln´ ych hodnot. Napˇr. hmotnost, d´elka, pevnost, 6
cena, ˇzivotnost,. . . . D´ale lze kvantitativn´ı hodnoty dˇelit na: 1. diskr´ etn´ı, kter´e nab´ yvaj´ı pouze oddˇelen´ ych hodnot ( napˇr. poˇcet v´ yrobk˚ u, poˇcet zmetk˚ u, kusov´e produkce atp.), 2. spojit´ e, kter´e mohou nab´ yvat vˇsech hodnot z nˇejak´eho intervalu re´aln´ ych ˇc´ısel ( napˇr. d´elka, teplota, cenov´ y index,. . . atp.). • kvalitativn´ı, kter´e mohou vˇsak b´ yt vyj´adˇreny pouze slovy, znaˇckami, ˇcili nemaj´ı ˇc´ıseln´ y charakter ( napˇr. n´arodnost, tvar, barva,. . . ). Tyto kvalitativn´ı znaky m˚ uˇzeme dˇelit takto: 1. ordin´ aln´ı, kter´e m´a smysl uspoˇr´adat (napˇr. jakostn´ı tˇr´ıdy, klasifikace,..), 2. nomin´ aln´ı, kter´e nelze uspoˇr´adat jako ordin´aln´ı kvalitativn´ı znaky (napˇr. barva, tvar apod.). Podstatou tˇechto statistick´ ych metod je, ˇze vˇsechny informace nezjiˇst’ujeme u vˇsech jednotek, ale jen u nˇekter´ ych, kter´e z´ısk´ame tzv. v´ ybˇerem. K tomuto v´ ybˇeru n´as vedou r˚ uzn´a omezen´ı, napˇr. velk´ y rozsah z´akladn´ıho souboru, n´aklady na statistick´e sledov´an´ı a dalˇs´ı. Poˇcet vybran´ ych jednotek do v´ ybˇeru pak naz´ yv´ame rozsahem v´ ybˇeru. Dle rozsahu dˇel´ıme tyto v´ ybˇery na : • mal´ e, u kter´ ych se obvykle uvaˇzuje rozsah v´ ybˇeru mezi 30 aˇz 50, • velk´ e, do t´eto skupiny patˇr´ı ˇr´adovˇe stovky, tis´ıce i v´ıce. Podle toho, zda se proˇsetˇruj´ı vˇsechny statistick´e jednotky z´akladn´ıho souboru nebo jen nˇekter´e, m˚ uˇzeme ˇclenit na: 7
• u ´ pln´ a, kdy se zkoumaj´ı statistick´e znaky na vˇsech jednotk´ach z´akladn´ıho souboru. • ne´ upln´ a jsou charakteristick´a t´ım, ˇze nezkoumaj´ı znaky vˇsech jednotek, n´ ybrˇz n vybran´ ych jednotek, z nichˇz se pak snaˇz´ıme utvoˇrit z´avˇer o z´akladn´ım souboru. Proto je velmi d˚ uleˇzit´e, aby tento soubor byl co nejvˇerohodnˇejˇs´ı zmenˇseninou tohoto souboru. Tento v´ ybˇer by mˇel pak b´ yt reprezentativn´ı, ˇcili poskytovat informace bez omezen´ı, a tak´e homogenn´ı . To ve vˇetˇsinˇe pˇr´ıpad˚ u vˇsak nelze zajistit, proto jsou statistick´e jednotky do v´ ybˇeru vyb´ır´any n´ahodnˇe. Podle r˚ uzn´eho proveden´ı rozliˇsujeme v´ ybˇery: • s opakov´ an´ım dan´a jednotka statistick´eho znaku m˚ uˇze b´ yt ve v´ ybˇeru vybr´ana v´ıce jak jedenkr´at, • bez opakov´ an´ı dan´a jednotka statistick´eho znaku m˚ uˇze b´ yt ve v´ ybˇeru vybr´ana nejv´yˇse jedenkr´at, • z´ amˇ ern´ y vyb´ır´ame pouze typick´e jednotky pro dan´ y statistick´ y znak, • oblastn´ı vyb´ır´ame ze souboru menˇs´ı podsoubor, z kter´eho d´ale prov´ad´ıme ˇc´asti v´ ybˇeru, • systematick´ y zde vyb´ır´ame systematicky vˇzdy nˇekolik´atou jednotku co do poˇrad´ı pˇri realizaci v´ ybˇeru, • mechanick´ y v´ ybˇer je zde prov´adˇen pomoc´ı mechanick´eho v´ ybˇeru jednotky dle poˇrad´ı. 8
Pˇri velk´em n je v´ yhodn´e prov´est t tˇr´ıdˇen´ı, kdy u ´daje uvedeme a uspoˇr´ad´ame do pˇrehledn´eho tvaru, vytvoˇr´ıme tzv. tabulku rozdˇelen´ı ˇcetnost´ı. 2.1.1
Bodov´ e rozdˇ elen´ı ˇ cetnost´ı
ˇ Cetnost je vyj´adˇrena jako poˇcet prvk˚ u se stejnou hodnotou statistick´eho znaku, neboli rozdˇelen´ı ˇcetnost´ı. Jestliˇze rozliˇsujeme hodnoty znak˚ u, mluv´ıme o bodov´em zpracov´an´ı. Je tedy zˇrejm´e, ˇze sledujeme-li jeden kvantitativn´ı statistick´ y znak na statistick´ ych jednotk´ach. Cel´e tˇr´ıdˇen´ı prov´ad´ıme tak, ˇze uspoˇr´ad´ame vˇsechny u ´daje do rostouc´ı posloupnosti a ke kaˇzd´e variantˇe pˇriˇrad´ıme poˇcty pˇr´ısluˇsn´ ych statistick´ ych jednotek, kter´e pak naz´ yv´ame ˇcetnosti. Tabulku, kter´a n´am vznikne naz´ yv´ame tabulku rozdˇelen´ı ˇcetnost´ı. Pod´av´a informace o poˇctu v´ yskytu jednotliv´ ych variant znak˚ u v dan´em souboru. Abychom mohli vz´ajemnˇe napozorovan´a data a jejich rozdˇelen´ı ˇcetnosti porovn´avat, pouˇz´ıv´ame relativn´ı ˇcetnosti. Tyto ˇcetnosti z´ısk´ame jako pod´ıl jednotliv´ ych absolutn´ıch ˇcetnost´ı k celkov´emu rozsahu souboru: ni , kde i= 1,2,. . . , k. n
(1)
Je tedy zˇrejm´e, ˇze souˇcet vˇsech relativn´ıch ˇcetnost´ı pak bude vypadat n´asledovnˇe: k X ni i=1
2.1.2
k
1X n = ni = = 1. n n i=1 n
(2)
Intervalov´ e rozdˇ elen´ı ˇ cetnost´ı
Sledujeme-li statistick´ y znak s velk´ ym poˇctem obmˇen, pak by bodov´e rozdˇelen´ı ned´avalo smysl a pouˇz´ıv´a se intervalov´e rozdˇelen´ı ˇcetnosti. Pˇrehlednost pak m˚ uˇzeme regulovat ˇs´ıˇrkou a poˇctem zvolen´ ych interval˚ u. Pˇri sestavov´an´ı intervalov´eho rozdˇelen´ı ˇcetnosti mus´ıme br´at v u ´vahu, ˇze je tu probl´em, do kolika interval˚ u sledovan´e hodnoty rozdˇelit. Toto rozdˇelen´ı do tˇr´ıd je velmi subjektivn´ı z´aleˇzitost. Je vˇsak velmi d˚ uleˇzit´e si zde uv´est, ˇze pˇr´ıliˇs ˇsirok´e intervaly sniˇzuj´ı kvalitu prezentace a naopak pˇr´ıliˇs mal´e intervaly pro n´as znamenaj´ı ˇspatnou pˇrehlednost, 9
zvyˇsuj´ı rozsah tabulky. Vˇetˇsinou se pro poˇcet tˇr´ıd k pouˇz´ıv´a tzv. Sturgesovo pravidlo: k = 1 + 3, 3 ∗ log n.
(3)
Dalˇs´ı probl´em, kter´ y m˚ uˇze pˇri konstrukci intervalov´eho rozdˇelen´ı ˇcetnost´ı nastat, je spojen s ot´azkou, jak urˇcovat hranici interval˚ u, aby bylo moˇzno jednotliv´e hodnoty znaku zaˇradit do pˇr´ısluˇsn´ ych interval˚ u jednoznaˇcnˇe. Objev´ı-li se v souboru prvky, kter´e jsou souhlasn´e s hranicemi intervalu, doporuˇcuje se pˇriˇradit tento prvek do intervalu, kter´ y m´a sud´e poˇradov´e ˇc´ıslo nebo se absolutn´ı ˇcetnost´ı obou interval˚ u zvˇetˇs´ı o polovinu. Pˇri v´ ypoˇctech statistick´ ych charakteristik nahrazujeme pozorov´an´ı, kter´a patˇr´ı do jedn´e skupiny, jedinou zastupitelnou hodnotou, za kterou se zpravidla vol´ı stˇred intervalu.
2.2
ˇ ıseln´ C´ e charakteristiky
ˇ ıseln´e charakteristiky n´am slouˇz´ı k pˇresnˇejˇs´ımu popisu souboru dat, kter´e C´ jsou ve v´ ybˇeru. Interpretuj´ı n´am tyto data pomoc´ı tˇr´ı skupin ˇc´ıseln´ ych charakteristik: • charakteristiky polohy, • charakteristiky variability, • charakteristiky ˇsikmosti a ˇspiˇcatosti. 2.2.1
Charakteristiky polohy
Polohu lze povaˇzovat za z´akladn´ı vlastnost rozdˇelen´ı. Mˇeˇr´ı se pomoc´ı r˚ uzn´ ych druh˚ u stˇredn´ıch hodnot, coˇz jsou jednoduch´e ˇc´ıseln´e charakteristiky, pomoc´ı kter´ ych m˚ uˇzeme nahradit a zobecnit hodnoty souboru. Poˇc´ıtaj´ı-li se stˇredn´ı hodnoty ze vˇsech jednotek statistick´eho souboru, naz´ yvaj´ı se pr˚ umˇery. Nejd˚ uleˇzitˇejˇs´ı 10
pak jsou pr˚ umˇer aritmetick´y, harmonick´y a geometrick´y. Do druh´e skupiny m˚ uˇzeme zaˇradit ty stˇredn´ı hodnoty, kter´e jsou zaloˇzeny pouze na nˇekter´ ych vybran´ ych hodnot´ach souboru. Z t´eto skupiny pr˚ umˇer˚ u si uk´aˇzeme medi´ an a modus. Pr˚ umˇery zaloˇzen´e na velikosti hodnoty znaku u vˇsech statistick´ ych jednotek pˇredstavuj´ı kvalitnˇejˇs´ı charakteristiku polohy neˇz stˇredn´ı hodnoty ostatn´ı. Nejˇcastˇeji se snaˇz´ıme ve statistick´em souboru urˇcit nejpravdˇepodobnˇejˇs´ı hodnotu, okolo kter´e se data soustˇred’uj´ı. Tˇemto ˇc´ıseln´ ym charakteristik´am ˇr´ık´ame charakteristiky polohy. Nejzn´amˇejˇs´ı charakteristiky polohy jsou bezpochyby: • Aritmetick´ y pr˚ umˇ er Aritmetick´ y pr˚ umˇer je jedn´ım z nejuˇz´ıvanˇejˇs´ıch a nejzn´amˇejˇs´ıch pr˚ umˇer˚ u. Je ovlivnˇen vˇsemi hodnotami znaku v souboru a je proto povaˇzov´an za typickou hodnotu, tj. hodnotu, kolem kter´e se soustˇred’uj´ı vˇsechny hodnoty statistick´eho souboru. Aritmetick´ y pr˚ umˇer ze zjiˇstˇen´ ych hodnot, kde m´ame celkem n pozorov´an´ı, vypoˇc´ıt´ame jednoduˇse pomoc´ı vzorce n´asledovnˇe: n
x¯ =
1X xi , n i=1
(4)
Pr˚ umˇer vyj´adˇren´ y takov´ ymto zp˚ usobem naz´ yv´ame jednoduch´ ym (prost´ ym) aritmetick´ ym pr˚ umˇerem. Vlastnosti pr˚ umˇ eru: 1. Souˇcet odchylek hodnot souboru pr˚ umˇeru je roven nule, tj. n X
(xi + x¯) = 0.
i=1
2. Pˇriˇcteme-li k hodnot´am souboru konstantu a, pak pr˚ umˇer nov´eho souboru je n
1X (xi − a) = x¯ + a. n i=1 3. N´asob´ım-li hodnoty souboru ˇc´ıslem b, n´asob´ı se pr˚ umˇer tak´e b. Tedy 11
yi = bxi , pak y¯ = b¯ x. • Geometrick´ y pr˚ umˇ er Geometrick´ y pr˚ umˇer x¯G z n kladn´ ych hodnot znaku x1 , x2 , ..., xn je definov´an jako v u n uY √ n xi . x¯G = n x1 .x2 .x3 ....xn = t
(5)
i=1
Geometrick´ y pr˚ umˇer se na rozd´ıl od aritmetick´eho pr˚ umˇeru pouˇz´ıv´a pˇri v´ ypoˇctu koeficient˚ u, napˇr. pro v´ ypoˇcet pr˚ umˇern´eho r˚ ustu, v situac´ıch, kdy mˇeˇr´ıme napˇr. v obvykl´ ych ekonomick´ ych hodnocen´ıch, je vyuˇzit pˇri urˇcov´an´ı ”pr˚ umˇern´e” inflace nebo v´ ynosnosti bˇehem nˇekolika ˇcasov´ ych obdob´ı. Geometrick´ y pr˚ umˇer nelze pouˇz´ıt v situac´ıch, kdy jsou p˚ uvodn´ı pozorov´an´ı z´aporn´a nebo nulov´a. • Harmonick´ y pr˚ umˇ er Harmonick´ y pr˚ umˇer se ˇcasto uˇz´ıv´a pˇri charakterizov´an´ı u ´rovnˇe znaku, jehoˇz hodnoty lze vyj´adˇrit jako pomˇer hodnot dvou jin´ ych promˇenn´ ych. M´a smysl pouze pro kladn´e hodnoty znaku. M´ame-li n nenulov´ ych hodnot znaku x1 , x2 , . . . , xn urˇc´ıme harmonick´ y pr˚ umˇer x¯H jako x¯H =
n n X i=1
1 xi
.
(6)
Tento pr˚ umˇer se nejˇcastˇeji pouˇz´ıv´a pˇri situaci, kdy jsou hodnoty znaku nerovnomˇernˇe rozloˇzeny kolem aritmetick´eho pr˚ umˇeru, nebo kdyˇz jsou hodnoty extr´emnˇe n´ızk´e ˇci vysok´e, k v´ ypoˇctu pr˚ umˇern´e rychlosti, pˇri normov´an´ı, a tak´e v teorii index˚ u. Pˇ r´ıklad 2.1. V jedn´e ze smˇen´ aren jsme smˇenili 100 eur na dolary na v´yˇsi 0, 7 euro za dolar a dva dny pot´e 100 eur v kurzu ve v´yˇsi 0, 8 euro za dolar. Potom pr˚ umˇern´y smˇenn´y kurz vypoˇc´ıt´ ame pomoc´ı harmonick´eho pr˚ umˇeru,
12
kter´y po dosazen´ı vypad´a n´ asledovnˇe: x¯H =
1 0.7
2 +
1 0.8
= 0.7467
Eura za dolar. • Modus Modus znaku je obmˇenou s nejvˇetˇs´ı relativn´ı ˇcetnost´ı. Proto se o nˇem mluv´ı jako o nejpravdˇepodobnˇejˇs´ı hodnotˇe. Jeho urˇcen´ı je velmi d˚ uleˇzit´e pr´avˇe tehdy, jde-li o vystiˇzen´ı typick´e hodnoty znaku v dan´em souboru. A tak´e nen´ı ovlivnˇen extr´emn´ımi hodnotami. V pˇr´ıpadˇe intervalov´eho rozdˇelen´ı ˇcetnosti se pˇri stanoven´ı modu spokoj´ıme s urˇcen´ım nejˇcastˇejˇs´ıho intervalu nebo v r´amci tohoto intervalu modus odhadujeme, napˇr. stˇredem intervalu. Chceme - li vˇsak pouˇz´ıt pˇresn´ y postup vyuˇzijeme n´asleduj´ıc´ı vzorec xˆ = aj −
nj+1 − nj−1 h , 2 nj+1 − 2nj + nj−1
(7)
kde aj je stˇredem intervalu, kter´ y m´a nejvˇetˇs´ı ˇcetnost nj , ˇc´ısla nj−1 ,nj+1 jsou ˇcetnosti sousedn´ıch tˇr´ıd, h je ˇs´ıˇrka tˇr´ıdy. Modus povaˇzujeme za d˚ uleˇzitou charakteristiku k aritmetick´emu pr˚ umˇeru. Pokud se modus i aritmetick´ y pr˚ umˇer v´ yraznˇe liˇs´ı, znamen´a to, ˇze aritmetick´ y pr˚ umˇer nevyjadˇruje dobˇre u ´roveˇ n hodnot souboru, kter´ y m˚ uˇze b´ yt napˇr´ıklad ovlivnˇen existenc´ı extr´emn´ıch hodnot. • Medi´ an Pro u ´plnost pˇrehledu o nejuˇz´ıvanˇejˇs´ıch charakteristik´ach polohy je tˇreba jeˇstˇe pˇripomenout medi´an x˜. Vzoreˇckem ho m˚ uˇzeme vyj´adˇrit pro sud´ y a lich´ y poˇcet pozorov´an´ı vyj´adˇrit n´asledovnˇe:
x˜ =
x( n−1 ) , pro lich´a n; 2 1 n n [x + x( 2 +1) ], pro sud´a n. 2 (2) 13
(8)
Velikost medi´anu nez´avis´ı bezprostˇrednˇe na velikosti vˇsech hodnot znaku dan´eho souboru v tom dan´em smyslu, ˇze velikost medi´anu neovlivˇ nuje pˇr´ımo velikost kaˇzd´e hodnoty. 2.2.2
Charakteristiky variability
Charakteristiky variability urˇcuj´ı odliˇsnost neboli variabilitu jednotliv´ ych hodnot znaku od pr˚ umˇeru a umoˇzn ˇuj´ı porovn´avat statistick´e soubory vz´ajemnˇe. Pˇ r´ıklad 2.2. Napˇr´ıklad dvˇe r˚ uzn´e ˇrady : 7, 7, 7, 8, 8, 8, 8, 9, 9, 9 a 1, 1, 1, 8, 8, 8, 8, 8, 15, 15, 15, maj´ı stejn´y aritmetick´y pr˚ umˇer, modus i medi´ an a proto je nelze podle tˇechto charakteristik polohy porovn´avat. Proto, jak je vidˇet z v´ yˇse uveden´em pˇr´ıkladu, je tˇreba zkoumat i to, jak se vz´ajemnˇe liˇs´ı od charakteristiky polohy. A pr´avˇe v tomto pˇr´ıpadˇe pouˇzijeme ˇc´ıseln´e charakteristiky variability, kde z´akladn´ım poˇzadavkem na tyto charakteristiky by mˇel b´ yt invariance v˚ uˇci posunut´ı, nebot’ pˇriˇcten´ım stejn´e konstanty ke vˇsem hodnot´am se tato variabilita nezmˇen´ı. Charakteristiky variability m˚ uˇzeme dˇelit na : 1. Charakteristiky absolutn´ı variability
Tyto charakteristiky jsou ve smyslu komplexu absolutn´ıch rozd´ıl˚ u hodnot znaku jednotliv´ ych prvk˚ u od m´ıry polohy ˇci od sebe navz´ajem. • Variaˇ cn´ı rozpˇ et´ı Tuto charakteristiku absolutn´ı variability povaˇzujeme za nejjednoduˇsˇs´ı a snadno urˇcitelnou. Jde o rozd´ıl nejvyˇsˇs´ı xmax a nejniˇzˇs´ı xmin hodnoty sledovan´eho znaku. Potom variaˇcn´ı rozpˇet´ı Rx vypoˇc´ıt´ame jako Rx = xmax − xmin 14
(9)
Variaˇcn´ı rozpˇet´ı m´a ten v´ yznam, ˇze n´am v podstatˇe urˇcuje d´elku intervalu, v nˇemˇz se pohybuj´ı hodnoty sledovan´eho znaku. Je tak´e d˚ uleˇzit´e zm´ınit, ˇze toto rozpˇet´ı velmi z´avis´ı na extr´emn´ıch hodnot´ach, proto se toto rozpˇet´ı vˇetˇsinou vyuˇz´ıv´a jen jako orientaˇcn´ı charakteristika. • Rozptyl Jsou-li pozorov´an´ı soustˇredˇena okolo sv´eho pr˚ umˇeru, pak je jejich variabilita mal´a. Jejich variabilitu tedy mˇeˇr´ıme pomoc´ı odchylek pozorov´an´ı od aritmetick´eho pr˚ umˇeru. Nejpouˇz´ıvanˇejˇs´ı a nejzn´amˇejˇs´ı charakteristikou variability je pak rozptyl, kter´ y definujeme vztahem: n
s2x
n
1 X 1 X 2 = (xi − x¯)2 = [ xi ] − (¯ x)2 . n − 1 i=1 n − 1 i=1
(10)
• Smˇ erodatn´ a odchylka V´ ysledek rozptylu n´am s´am o sobˇe nic neˇrekne, proto se pouˇz´ıv´a druh´a odmocnina z t´eto veliˇciny, ˇci-li v´ ybˇerov´a smˇerodatn´a odchylka. v u p u sx = s2x = t
n
1 X (xi − x¯)2 . n − 1 i=1
(11)
Tato charakteristika je daleko vypov´ıdaj´ıc´ı neˇz samotn´ y rozptyl, jelikoˇz jej´ı v´ yhodou je, ˇze je uvedena ve stejn´ ych jednotk´ach jako zkouman´ y znak. 2. Charakteristiky relativn´ı variability
Variabilitu dvou ˇci v´ıce soubor˚ u nelze porovn´avat, liˇs´ı-li se u ´rovn´ı znaku ˇci jsou vyj´adˇreny v jin´ ych jednotk´ach. • Variaˇ cn´ı koeficient
Vx = 15
sx x¯
(12)
Variaˇcn´ı koeficient je definov´an jako pod´ıl smˇerodatn´e odchylky a pr˚ umˇeru. Tento pomˇer se velice ˇcasto n´asob´ı procenty 100% a tud´ıˇz pak vyjadˇruje variabilitu v procentech. 2.2.3
Charakteristiky ˇ sikmosti a ˇ spiˇ catosti
V prvn´ı ˇradˇe si nadefinujeme charakteristiku ˇsikmosti, kter´a n´as informuje, zda jsou hodnoty okolo zvolen´eho stˇredu rozloˇzeny soumˇernˇe ˇci nikoliv. Zn´ame - li koeficient ˇsikmosti, m˚ uˇzeme si uˇcinit z´akladn´ı pˇredstavu o tvaru rozdˇelen´ı ˇcetnost´ı, aniˇz bychom ho museli graficky zn´azornit. Tento koeficient je d´an vztahem: 1 n
α=
n X
(xi − x¯)3
i=1
s3x
.
(13)
Jsou-li tyto hodnoty rozloˇzeny soumˇernˇe a jsou-li symetrick´e, potom tento koeficient ˇsikmosti je roven nule. Potom je - li α = 0, jsou hodnoty symetrick´e. Je-li α < 0, je graf zn´azornˇen´ı rozpoloˇzen´ı tˇechto hodnot prot´ahlejˇs´ı smˇerem nalevo. V opaˇcn´em pˇr´ıpadˇe se jedn´a o pˇr´ıpad, kdy α > 0. A na z´avˇer je nutn´e zm´ınit charakteristiku ˇspiˇcatosti, kter´a ud´av´a, jak´ y pr˚ ubˇeh m´a rozdˇelen´ı hodnot kolem zvolen´eho stˇredu. 1 n
β=
n X
(xi − x¯)4
i=1
s4x
− 3.
(14)
Potom pokud je β < 0, jedn´a se o ˇspiˇcatˇejˇs´ı rozdˇelen´ı a v opaˇcn´em pˇr´ıpadˇe o zploˇstˇelejˇs´ı, ˇcili β > 0.
16
2.3
Grafick´ a zn´ azornˇ en´ı
V popisn´e statistice se data nejˇcastˇeji zapisuj´ı do tabulek. Je vˇsak velikou v´ yhodou vyuˇz´ıt i grafick´e zn´azornˇen´ı pro pˇrehlednost a lepˇs´ı orientaci v souboru dat. Nejpouˇz´ıvanˇejˇs´ım je pak histogram.
Obr. 1 Histogram
Je to grafick´e zn´azornˇen´ı ˇcetnosti spojit´eho znaku, ve kter´em na svislou osu zn´azorˇ nujeme ˇcetnosti nebo relativn´ı ˇcetnosti a na osu vodorovnou zakreslujeme tˇr´ıdy. Na rozd´ıl pak od sloupcov´ ych graf˚ u, kde zakreslujeme sloupce v dan´em grafu oddˇeleny, zde u histogramu jsou tˇesnˇe u sebe, aby pokryly vˇsechny tˇr´ıdy. V´ıce si histogram rozebereme v kapitole 5.3. Pˇ r´ıklad 2.3. Pro lepˇs´ı grafickou interpretaci budeme pro vˇsechny typy graf˚ u uvaˇzovat stejn´a namˇeˇren´a data. N´ asleduj´ıc´ı teploty byly namˇeˇreny bˇehem jednoho mˇes´ıce: 11, 10, 10, 9, 8, 7, 8, 9, 4, 9, 8, 7, 8, 9, 12, 13, 15, 11, 12, 10, 9, 8, 9, 11, 10, 9, 6, 6, 7, 12. Pro tato data jsme zkonstruovali v´yˇse uveden´y histogram, a d´ ale polygon ˇcetnost´ı 17
a box plot. Nˇekdy se m´ısto histogramu vyuˇz´ıv´a polygon ˇ cetnost´ı, kdy x-ov´e souˇradnice pˇredstavuj´ı stˇred tˇr´ıdy a y-ov´e jej´ı ˇcetnost.
Obr. 2 Polygon ˇcetnost´ı
M˚ uˇzeme se tak´e setkat se situac´ı, kdy je statistick´ y soubor zn´azornˇen graficky pomoc´ı tzv. krabicov´ eho grafu, kde je nezbytn´e nadefinovat n´asleduj´ıc´ı definici. Definice 2.1. Necht’ p ∈ (0, 1). p- kvantil x˜p , (p-t´y kvantil) je ta hodnota znaku, pro kterou plat´ı, ˇze nejm´enˇe 100p % ˇc´ısel ve statistick´em souboru je menˇs´ı nebo rovno x˜p a nejm´enˇe 100(1 − p) % ˇc´ısel ve statistick´em souboru je vˇetˇs´ı nebo rovno x˜p . Pozn´ amka 2.1. Potom m˚ uˇzeme ˇr´ıci, ˇze x˜0,5 se naz´yv´ a medi´ an, x˜0,25 je doln´ı kvartil a x˜0,75 naz´yv´ame horn´ım kvartilem. Doln´ı kvartil, medi´an a horn´ı kvartil pak rozdˇeluj´ı uspoˇr´ adanou ˇradu hodnot znaku na 4 stejn´e ˇc´asti. 18
Takto nedefinovan´e kvartily potom vyuˇzijeme pˇri zobrazen´ı krabicov´eho grafu, kde je v obd´eln´ıku vyznaˇcen medi´an pˇr´ısluˇsn´eho statistick´eho souboru, doln´ı a horn´ı kvartil. ”Vousy” ukazuj´ı hranice pro velmi vysok´e (resp. n´ızk´e) hodnoty. Je-li h∗ = max {x1 , ..., xn } > h = x˜0.75 + 1.5(˜ x0.75 − x˜0.25 ),
(15)
konˇc´ı jeden z ”vous˚ u” v bodˇe h. Je-li d∗ = min {x1 , . . . , xn } < d = x˜0.25 − 1.5(˜ x0.75 − x˜0.25 ),
(16)
konˇc´ı druh´ y ”vous” v bodˇe d. V opaˇcn´em pˇr´ıpadˇe konˇc´ı ”vousy” v maximu h∗ pozorov´an´ı resp. v minimu d∗ .
Obr. 3 Box plot
19
3
Z´ akladn´ı pojmy z teorie fuzzy mnoˇ zin V t´eto kapitole se sezn´am´ıme se z´akladn´ımi pojmy teorie fuzzy mnoˇzin, kter´e
jsou velmi d˚ uleˇzit´e pro dalˇs´ı pr´aci s fuzzy ˇc´ısly. Tuto kapitolu budeme zpracov´avat dle [2, 5, 7]. Speci´alnˇe se jiˇz zamˇeˇr´ıme na fuzzy ˇc´ısla, jelikoˇz v´ ypoˇcty s nimi jsou ned´ılnou souˇc´ast´ı fuzzy popisn´e statistiky. Teorie fuzzy mnoˇzin uvaˇzuje pˇr´ıpad, kdy prvek m˚ uˇze do mnoˇziny patˇrit jen ˇc´asteˇcnˇe. T´ım se liˇs´ı od klasick´e teorie mnoˇzin, kde pˇredpokl´ad´ame, ˇze prvek do mnoˇziny patˇr´ı ˇci nikoli. Tedy m˚ uˇzeme ˇr´ıci, ˇze klasickou mnoˇzinu lze ch´apat jako speci´aln´ı pˇr´ıpad fuzzy mnoˇziny, jej´ımˇz nadefinov´an´ım zaˇcneme.
Definice 3.1. Necht’ je d´ana nepr´ azdn´ a mnoˇzina U, tzv. univerzum. Pak fuzzy mnoˇzina A na univerzu U je definov´ ana zobrazen´ım µA : U −→ h0, 1i. Funkci µA naz´yv´ame funkc´ı pˇr´ısluˇsnosti fuzzy mnoˇziny A. Pro kaˇzd´e x ∈ U nazveme hodnotu µA (x) stupnˇem pˇr´ısluˇsnosti x k fuzzy mnoˇzinˇe A. Pˇ r´ıklad 3.1. Pˇr´ıkladem fuzzy mnoˇziny m˚ uˇzeme uv´est napˇr´ıklad teplou vodu. Studen´ a voda v 10 ◦ C m´a stupeˇ n pˇr´ısluˇsnosti 0. S rostouc´ı teplotou stupeˇ n pˇr´ısluˇsnosti roste, ale v urˇcit´em okamˇziku povaˇzujeme vodu uˇz za horkou, stupeˇ n pˇr´ısluˇsnosti tedy zaˇcne klesat, jak je vidˇet na n´ asleduj´ıc´ım obr´ azku.
20
Obr. 4 Fuzzy mnoˇzina
Pozn´ amka 3.1. Funkce pˇr´ısluˇsnosti fuzzy mnoˇziny je zobecnˇen´ım charakteristick´e funkce klasick´e mnoˇziny. Charakteristick´ a funkce χA je definov´ ana vztahem χA (x) =
1 x ∈ A; 0 jinak.
(17)
Fuzzy mnoˇzina na U je jednoznaˇcnˇe urˇcena svou funkc´ı pˇr´ısluˇsnosti. Z d˚ uvodu jednoduˇsˇs´ıho z´apisu budeme funkci pˇr´ısluˇsnosti znaˇcenou jako µA zapisovat jako A(.). Stupeˇ n pˇr´ısluˇsnosti µA (x) budeme potom znaˇcit jako A(x), kde x ∈ U. Pozn´ amka 3.2. Syst´em vˇsech fuzzy mnoˇzin definovan´ych na univerzu U budeme oznaˇcovat FN (U ). Tedy tu skuteˇcnost, ˇze A je fuzzy mnoˇzina na U, je moˇzno vyj´ adˇrit i z´apisem, ˇze A ∈ FN (U ). N´asleduj´ıc´ı pojmy jsou pro n´as velmi d˚ uleˇzit´e, jelikoˇz n´am pomohou l´epe charakterizovat fuzzy mnoˇzinu. Definice 3.2. Necht’ je d´ana fuzzy mnoˇzina A definovan´ a na U a re´ aln´e ˇc´ıslo 21
α ∈ [0, 1]. Pak α -ˇrezem fuzzy mnoˇziny A naz´yv´ ame ostrou mnoˇzinu Aα = {x ∈ U | A(x) ≥ α}.
(18)
J´adrem fuzzy mnoˇziny A na univerzu U je ostr´ a mnoˇzina KerA = {x ∈ U | A(x) = 1}.
(19)
Nosiˇcem fuzzy mnoˇziny A na univerzu U je ostr´ a mnoˇzina SuppA = {x ∈ U | A(x) > 0}.
(20)
Definice 3.3. Necht’ Ker A 6= 0, pak fuzzy mnoˇzinu A naz´yv´ ame norm´aln´ı fuzzy mnoˇzinu. V opaˇcn´em pˇr´ıpadˇe tuto mnoˇzinu naz´yv´ ame subnorm´aln´ı. Z t´eto definice plyne, ˇze fuzzy mnoˇzina je norm´aln´ı, jestliˇze existuje prvek, kter´ y do dan´e fuzzy mnoˇziny zcela patˇr´ı. Definice 3.4. Fuzzy mnoˇzina A definovan´ a na line´ arn´ım prostoru U se naz´yv´ a konvexn´ı, jestliˇze pro kaˇzd´e α ∈ [0, 1] je pˇr´ısluˇsn´y α-ˇrez Aα konvexn´ı mnoˇzinou, tj. jestliˇze pro kaˇzd´e x,y ∈ Aα a pro kaˇzd´e λ ∈ [0, 1] plat´ı λx + (1 − λ)y ∈ Aα .
(21)
Jiˇz ve sv´e bakal´aˇrsk´e pr´aci jsem se zab´ yvala r˚ uzn´ ymi pˇr´ıstupy k definov´an´ı fuzzy ˇc´ısel, kter´e jsou speci´aln´ı tˇr´ıdou fuzzy mnoˇzin na mnoˇzinˇe re´aln´ ych ˇc´ısel R. V literatuˇre se m˚ uˇzeme setkat s mnoha pˇr´ıstupy definov´an´ı fuzzy ˇc´ısel. My pro dalˇs´ı v´ ypoˇcty v cel´em dalˇs´ım textu budeme uvaˇzovat fuzzy ˇc´ıslo s omezen´ ym nosiˇcem, definovan´e n´asleduj´ıc´ı definic´ı. Definice 3.5. Fuzzy mnoˇzina A definovan´ a na mnoˇzinˇe R, kter´ a m´ a n´ asleduj´ıc´ı vlastnosti: 1. A je norm´aln´ı fuzzy mnoˇzina, 2. α- ˇrezy Aα pˇredstavuj´ı pro vˇsechna α ∈ [0, 1] uzavˇren´e intervaly, 3. nosiˇc Supp A je omezen´y, 22
se naz´yv´a fuzzy ˇc´ıslem.
Obr. 5 Fuzzy ˇc´ıslo s omezen´ ym nosiˇcem
Jelikoˇz v praktick´ ych aplikac´ıch je potˇreba prov´adˇet v´ ypoˇcty, je tˇreba si nadefinovat princip rozˇs´ıˇren´ı, na jehoˇz z´akladˇe se nˇekter´e v´ ypoˇcty prov´adˇej´ı. Definice 3.6. (Princip rozˇs´ıˇren´ı) Necht’ X a Y jsou nepr´ azdn´e mnoˇziny a necht’ f : X −→ Y . Pak zobrazen´ı fF : F(X) −→ F(Y ), kter´e kaˇzd´e fuzzy mnoˇzinˇe A ∈ F(X) pˇriˇrad´ı fuzzy mnoˇzinu fF (A) ∈ F(Y ), jej´ıˇz funkce pˇr´ısluˇsnosti je pro kaˇzd´e y ∈ Y definovan´a vztahem fF (A)(y) =
sup{A(x)|x ∈ X, f (x) = y}, jestliˇze f (−1) (y) 6= 0 0, jinak,
(22)
nazveme fuzzy rozˇs´ıˇren´ım funkce f. Nˇekter´e fuzzy v´ ypoˇcty vˇsak lze vypoˇc´ıtat i pomoc´ı fuzzy reprezentace dvojice funkc´ı. Tento zp˚ usob je vyuˇz´ıvan´ y zejm´ena pro svoji jednoduchost a tak´e pro rychlejˇs´ı v´ ypoˇcet, jak jiˇz bylo uk´az´ano v m´e bakal´aˇrsk´e pr´aci [2]. Pro tyto v´ ypoˇcty 23
je vˇsak nezbytn´e nadefinovat nˇekter´e d˚ uleˇzit´e pouˇz´ıvan´e pojmy. N´asleduj´ıc´ı ˇc´ast bude zpracov´ana na z´akladˇe [5]. Nyn´ı si uk´aˇzeme, ˇze kaˇzd´e fuzzy ˇc´ıslo lze jednoznaˇcnˇe charakterizovat pomoc´ı dvojice funkc´ı c(α) a c(α) definovan´ ych na [0, 1], jeˇz popisuj´ı nejmenˇs´ı a nejvˇetˇs´ı hodnoty jednotliv´ ych α-ˇrez˚ u. Vˇ eta 3.1. Necht’ C je fuzzy ˇc´ıslo. Necht’ jsou funkce c : [0, 1] → R a c : [0, 1] → R definovan´e tak, ˇze plat´ı: Cα = [c(α), c(α)] pro vˇsechna α ∈ (0, 1] a uz´ avˇer nosiˇce fuzzy ˇc´ısla C Cl(SuppC) = [c(0), c(0)]. Pak jsou funkce c a c zleva spojit´e na (0, 1], zprava spojit´e v 0 a splˇ nuj´ı c(α) ≤ c(β) ≤ c(β) ≤ c(α),
(23)
pro vˇsechna 0 ≤ α < β ≤ 1. D˚ ukaz:
Viz [6].
Pozn´ amka 3.3. Pro fuzzy ˇc´ıslo, jehoˇz funkce pˇr´ısluˇsnosti je definov´ ana vztahem (23), budeme pouˇz´ıvat znaˇcen´ı C = {[c(α), c(α)]|α ∈ [0, 1]}. Pro naˇse dalˇs´ı v´ ypoˇcty budeme pouˇz´ıvat pro modelov´an´ı neurˇcit´ ych vstupn´ıch hodnot jednoduˇsˇs´ı tˇr´ıdu fuzzy ˇc´ısel, jelikoˇz ve vˇetˇsinˇe pˇr´ıpad˚ u se d´a urˇcit pouze ˇctveˇric´ı bod˚ u. Definice 3.7. Line´arn´ım fuzzy ˇc´ıslem urˇcen´ym ˇctveˇric´ı bod˚ u (c1 , 0), (c2 , 1), (c3 , 1), (c4 , 0), kde c1 , c2 , c3 , c4 jsou re´aln´a ˇc´ısla splˇ nuj´ıc´ı c1 ≤ c2 ≤ c3 ≤ c4 , rozum´ıme fuzzy ˇc´ıslo C, jehoˇz funkce pˇr´ısluˇsnosti z´ avis´ı na parametrech c1 , c2 , c3 , c4 n´ asleduj´ıc´ım zp˚ usobem: 0, x−c c2 −c11 , ∀x ∈ R : C(c1 , c2 , c3 , c4 ) = 1, c4 −x , c4 −c3 0, 24
pro x < c1 ; pro c1 ≤ x < c2 ; pro c2 ≤ x < c3 ; pro c3 ≤ x < c4 ; c4 ≤ x.
(24)
Pozn´ amka 3.4. N´azev line´arn´ıho fuzzy ˇc´ısla C = hc1 , c2 , c3 , c4 i je odvozen z t´e skuteˇcnosti, ˇze pouˇzijeme-li reprezentaci pomoc´ı dvojice funkc´ı C = {[c(α), c(α)]| α ∈ [0, 1]}, pak obˇe tyto funkce c a c jsou line´ arn´ı. Tyto funkce c a c jsou d´ any pro vˇsechna α ∈ [0, 1] n´asledovnˇe: c(α) = c1 + α(c2 − c1 ) a c(α) = c4 − α(c4 − c3 ). Line´arn´ı fuzzy ˇc´ıslo m˚ uˇze m´ıt r˚ uzn´e typy. My v naˇs´ı pr´ aci vyuˇzijeme fuzzy ˇc´ıslo troj´ uheln´ıkov´e, kde c2 = c3 . V n´asleduj´ıc´ı vˇetˇe je pak uk´az´ana postaˇcuj´ıc´ı podm´ınka kladen´a na funkci f jedn´e nebo v´ıce promˇenn´ ych a fuzzy ˇc´ısla X1 , . . . , Xm , kde m ≥ 1, kter´a maj´ı omezen´ y nosiˇc, jej´ıˇz splnˇen´ı n´am zaruˇcuje, ˇze obraz fF (X1 , . . . , Xm ) je opˇet fuzzy ˇc´ıslo s omezen´ ym nosiˇcem. Vˇ eta 3.2. Necht’ D ⊆ Rm , kde m ≥ 1 a necht’ f : D → R je spojit´ a funkce jedn´e nebo v´ıce re´aln´ych promˇenn´ych. Necht’ X1 , . . . , Xm jsou fuzzy ˇc´ısla. Jestliˇze Cl(SuppX1 ) × . . . × Cl(SuppXm ) ⊆ D, pak fF (X1 , . . . , Xm ) je fuzzy ˇc´ıslo. D˚ ukaz:
Viz [5].
Vˇ eta 3.3. Necht’ D ⊆ Rn af : D −→ R je spojit´ a funkce. Necht’ Xi = {[xi (α), xi (α)]|α ∈ [0, 1]} pro kaˇzd´e i ∈ {1, . . . , n} jsou fuzzy ˇc´ısla takov´ a, ˇze [x1 (0), x1 (0)] × . . . × [xn (0), xn (0)] ⊆ D . Pak plat´ı, ˇze fF (X1 , ..., Xm ) = {[c(α), c(α)]|α ∈ [0, 1]},
(25)
kde c(α) = min{f (x1 , x2 , . . . , xm )|xi ∈ [xi (α), xi (α)], ∀i ∈ {1, . . . , m}},
(26)
c(α) = max{f (x1 , x2 , . . . , xm )|xi ∈ [xi (α), xi (α)], ∀i ∈ {1, . . . , m}}.
(27)
25
D˚ ukaz 3.1. Viz [5]. Vˇ eta 3.4. Necht’ D ⊆ Rm , m ≥ 1, a necht’ f : D −→ R. Necht’ indexov´ a mnoˇzina N ↑ ⊆ {1, . . . , m} obsahuje indexy vˇsech promˇenn´ych, ve kter´ych je f neklesaj´ıc´ı, indexov´a mnoˇzina N ↓ ⊆ {1, . . . , m} indexy vˇsech promˇenn´ych, ve kter´ych je S ale necht’ pro fuzzy ˇc´ısla f nerostouc´ı a necht’ N ∗ = {1, . . . , m}\(N ↑ N ↓ ). D´ (X1 , . . . , Xm ) ∈ FN (R). Oznaˇcme fF (X1 , . . . , Xm ) = {[c(α), c(α)]|α ∈ [0, 1]}.
(28)
Pak pro kaˇzd´e α ∈ [0, 1] plat´ı
− − − c(α) = min{f (x− 1 , . . . , xi , . . . , xm )|xi ∈ [xi (α), xi (α)]
pro vˇsechna i ∈ N ∗ , x− i = xi (α) pro vˇsechna i ∈ N ↑ , x− sechna N ↓ }. 1 = xi (α) pro vˇ
+ + c(α) = max{f (x+ 1 , . . . , xm )|xi ∈ [xi (α), xi (α)]
pro vˇsechna i ∈ N ∗ , x+ i = xi (α) pro vˇsechna i ∈ N ↑ , x+ sechna N ↓ }. 1 = xi (α), pro vˇ
D˚ ukaz 3.2. Tvrzen´ı plyne pˇr´ımo z (26) a (27). Pˇr´ıkladem fuzzifikace spojit´ ych re´aln´ ych funkc´ı je tzv. fuzzy aritmetika. Jedn´a se o fuzzy rozˇs´ıˇren´ı z´akladn´ıch aritmetick´ ych operac´ı. Jelikoˇz jsou tyto funkce spojit´e, m˚ uˇzeme vyuˇz´ıt v´ yˇse nadefinovanou vˇetu. Tuto vˇetu pouˇzijeme v dalˇs´ıch kapitol´ach, kde s jej´ı pomoc´ı budeme prov´adˇet v´ ypoˇcty.
26
4
Popisn´ a statistika pro fuzzy data V bˇeˇzn´em ˇzivotˇe se ˇcasto setk´av´ame s probl´emem, ˇze m´ame k dispozici data,
kter´a maj´ı popisovat nˇejak´ y dˇej, strukturu, uspoˇr´ad´an´ı nebo jinou ˇc´ast re´aln´eho svˇeta, a potˇrebujeme vhodn´ ym zp˚ usobem tyto data vyhodnotit. Protoˇze popis re´aln´eho svˇeta se k n´am dost´av´a zprostˇredkovanˇe pˇres naˇse smysly nebo pˇres hodnoty z mˇeˇr´ıc´ıch pˇr´ıstroj˚ u, m˚ uˇze b´ yt tento popis nepˇresn´ y, nebot’ naˇse smysly jsou nedokonal´e a mˇeˇr´ıc´ı pˇr´ıstroje maj´ı koneˇcnou pˇresnost mˇeˇren´ı. Proto to m˚ uˇzeme vyj´adˇrit pomoc´ı fuzzy ˇc´ısel a ta n´aslednˇe statisticky zpracovat. V cel´e t´eto kapitole budeme uvaˇzovat fuzzy ˇc´ısla ve tvaru, ve kter´em jsme si ho nadefinovali v pˇredeˇsl´e kapitole. Pro zpracov´an´ı ˇc´asti t´eto kapitoly budeme ˇcerpat z [9].
4.1
ˇ ıseln´ C´ e charakteristiky polohy
V t´eto podkapitole si uvedeme nejzn´amˇejˇs´ı a nejpouˇz´ıvanˇejˇs´ı ˇc´ıseln´e charakteristiky, kter´ ymi jsou • Fuzzy aritmetick´ y pr˚ umˇer • Fuzzy medi´an • Fuzzy doln´ı a horn´ı kvartil • Fuzzy geometrick´ y pr˚ umˇer • Fuzzy harmonick´ y pr˚ umˇer 4.1.1
Fuzzy pr˚ umˇ er
D˚ uleˇzit´ y a velmi ˇcasto pouˇz´ıvan´ y pojem v klasick´e statistice re´aln´eho pozorov´an´ı x1 , . . . , xn je pr˚ umˇer definov´an vzorcem (4). U fuzzy pr˚ umˇeru postupujeme obdobn´ ym zp˚ usobem. 27
Definice 4.1. Necht’ Xi = {[xi (α), xi (α)]|α ∈ [0, 1]} pro kaˇzd´e i ∈ {1, . . . , n} jsou fuzzy ˇc´ısla. Pak fuzzy aritmetick´ ym pr˚ umˇerem fuzzy ˇc´ısel X1 , . . . , Xn ∈ FN (R) nazveme fuzzy ˇc´ıslo x¯F = {[¯ xF (α), x¯F (α)]|α ∈ [0, 1]}, kde pro kaˇzd´e α ∈ [0, 1] plat´ı: n X
x¯F (α) =
n n X
x˜F (α) =
xi (α)
i=1
,
(29)
.
(30)
xi (α)
i=1
n
Pˇ r´ıklad 4.1. Pro n´azornou uk´ azku uk´ aˇzeme fuzzy pr˚ umˇer na mal´em poˇctu fuzzy ˇc´ısel. Tˇechto fuzzy ˇc´ısel jsme si zvolili n = 6. Pomoc´ı vzorc˚ u (31), (32) postupnˇe nalezneme horn´ı a doln´ı funkce v´ysledn´eho fuzzy aritmetick´eho pr˚ umˇeru, kter´y je n´ıˇze uveden ˇcernou barvou.
Obr. 6 Fuzzy pr˚ umˇer
4.1.2
Fuzzy medi´ an
Medi´an pro re´aln´a data jsme si jiˇz pˇredstavili v podkapitole 2.2.1. Nyn´ı zavedeme pojem fuzzy medi´an a uk´aˇzeme si jeho konstrukci na pˇr´ıkladu. Jelikoˇz je 28
medi´an rostouc´ı a spojit´a funkce ve vˇsech sv´ ych promˇenn´ ych, tak Vˇeta 3.4 n´as opravˇ nuje vyslovit definici fuzzy medi´anu. Definice 4.2. Necht’ Xi = {[xi (α), xi (α)]|α ∈ [0, 1]} pro kaˇzd´e i ∈ {1, . . . , n} jsou fuzzy ˇc´ısla. Fuzzy medi´anem fuzzy ˇc´ısel X1 , . . . , Xn ∈ FN (R) nazveme fuzzy ˇc´ıslo x˜F = {[˜ xF (α), x˜F (α)]|α ∈ [0, 1]}, kde pro kaˇzd´e α ∈ [0, 1] plat´ı: x˜F (α) = x˜(x1 (α), . . . , xn (α)),
(31)
x˜F (α) = x˜(x1 (α), . . . , xn (α)).
(32)
Pˇ r´ıklad 4.2. Mˇejme d´ana n´asleduj´ıc´ı fuzzy ˇc´ısla zn´ azornˇen´ a na Obr. (7), kter´ a jsme jiˇz vyuˇzili pˇri konstrukci fuzzy pr˚ umˇeru. Pomoc´ı formul´ı (33), (34) postupnˇe provedeme jednotliv´e v´ypoˇcty a sestav´ıme fuzzy medi´ an.
Obr. 7 Fuzzy ˇc´ısla
U fuzzy medi´anu vyuˇzijeme principu rozˇs´ıˇren´ı, kter´y jsme si nadefinovali v pˇredchoz´ı kapitole. Kde medi´an je rostouc´ı funkce tzn. α - ˇrez medi´ anu jednotliv´ych fuzzy ˇc´ısel je interval, jehoˇz minim´ aln´ı hodnota je medi´ an z minim´ aln´ıch hodnot α- ˇrez˚ u jednotliv´ych fuzzy ˇc´ısel ˇci-li. A jehoˇz maxim´ aln´ı hodnota je medi´ an 29
z maxim´aln´ıch hodnot α- ˇrez˚ u jednotliv´ych fuzzy ˇc´ısel. Pot´e pomoc´ı tˇechto interval˚ u sestav´ıme fuzzy medi´an. V´ysledek vid´ıme na Obr. 8, kde jsme s v´ysledn´ym fuzzy ˇc´ıslem vykreslili i ostatn´ı fuzzy ˇc´ısla, kter´ a tento fuzzy medi´ an ovlivˇ nuj´ı. V´ysledn´e fuzzy ˇc´ıslo zn´azorn´ıme pro pˇrehlednost ˇcernou barvou. Je tedy vidˇet, ˇze je-li alespoˇ n jedno ze zadan´ych fuzzy ˇc´ısel lichobˇeˇzn´ıkov´eho tvaru, pak v´ysledn´e fuzzy ˇc´ıslo je t´eˇz lichobˇeˇzn´ıkov´e.
Obr. 8 Medi´ an zadan´ych fuzzy ˇc´ısel
4.1.3
Fuzzy geometrick´ y pr˚ umˇ er
Fuzzy geometrick´ y pr˚ umˇer x¯GF m˚ uˇzeme definovat dle n´asleduj´ıc´ı definice. Definice 4.3. Necht’ Xi = {[xi (α), xi (α)]|α ∈ [0, 1]} pro kaˇzd´e i ∈ {1, . . . , n} jsou fuzzy ˇc´ısla.Fuzzy geometrick´ ym pr˚ umˇerem fuzzy ˇc´ısel X1 , . . . , Xn ∈ FN (R) nazveme fuzzy ˇc´ıslo x¯GF = {[¯ xGF (α), x¯GF (α)]|α ∈ [0, 1]}, kde pro kaˇzd´e α ∈ [0, 1] plat´ı: v u n uY n x¯GF (α) = t xi (α),
(33)
i=1
v u n uY n x¯GF (α) = t xi (α). i=1
30
(34)
Pˇ r´ıklad 4.3. Jako interpretaci fuzzy geometrick´eho pr˚ umˇeru m˚ uˇzeme uv´est ekonomick´eho ukazatele, pr˚ umˇern´e tempo r˚ ustu, z pˇeti fuzzy ˇc´ısel. Tuto interpretaci uvedeme jen pro mal´y rozsah dat, jelikoˇz naˇse hodnoty v modelov´em pˇr´ıkladu nejsou pro tohoto ukazetele vypov´ıdaj´ıc´ı. Na n´asleduj´ıc´ım Obr. 9 jsme vykreslili tempo r˚ ustu v podobˇe fuzzy ˇc´ısel, kter´a nejsou zcela pˇresn´a, proto vyuˇzijeme k v´ypoˇctu tohoto ukazatele fuzzy ˇc´ısla.
Obr. 9 Fuzzy ˇc´ısla pro pr˚ umˇern´e tempo r˚ ustu
S tˇemito fuzzy ˇc´ısly pak provedeme v´ypoˇcet pomoc´ı formul´ı (35), (36), kde z´ısk´ ame jako v´ysledek opˇet fuzzy ˇc´ıslo, kter´e m˚ uˇzeme vykreslit takto.
Obr. 10 V´ysledn´y fuzzy geometrick´y pr˚ umˇer 31
Pozn´ amka 4.1. U fuzzy harmonick´eho pr˚ umˇeru x¯HF bychom postupovali obdobnˇe, ˇcili s vyuˇzit´ım principu rozˇs´ıˇren´ı. Jelikoˇz vˇsak v´ypoˇcet nen´ı zcela jednoduch´y, v t´eto pr´aci ho nebudeme uv´ adˇet. 4.1.4
Fuzzy doln´ı a horn´ı kvartil
Fuzzy doln´ı a horn´ı kvartil m˚ uˇzeme nadefinovat obdobnˇe jako fuzzy medi´an, jelikoˇz medi´an je tak´e ze skupiny kvartil˚ u, kter´ y m˚ uˇzeme ps´at x˜F =˜ x0,5F , proto i jejich nadefinov´an´ı bude obdobn´e. Definice 4.4. Necht’ Xi = {[xi (α), xi (α)]|α ∈ [0, 1]} pro kaˇzd´e i ∈ {1, . . . , n} jsou fuzzy ˇc´ısla. Fuzzy doln´ım kvartilem fuzzy ˇc´ısel X1 , . . . , Xn ∈ FN (R) nazveme fuzzy ˇc´ıslo x˜0,25F = {[˜ x0,25F (α), x˜0,25F (α)]|α ∈ [0, 1]}, kde pro kaˇzd´e α ∈ [0, 1] plat´ı:
x˜0,25F (α) = x˜0,25 (x1 (α), . . . , xn (α)),
(35)
x˜0,25F (α) = x˜0,25 (x1 (α), . . . , xn (α)).
(36)
Potom pro fuzzy horn´ı kvartil m˚ uˇzeme vyslovit n´asleduj´ıc´ı definici. Definice 4.5. Necht’ Xi = {[xi (α), xi (α)]|α ∈ [0, 1]} pro kaˇzd´e i ∈ {1, . . . , n} jsou fuzzy ˇc´ısla. Fuzzy horn´ım kvartilem fuzzy ˇc´ısel X1 , . . . , Xn ∈ FN (R) nazveme fuzzy ˇc´ıslo x˜0,75F = {[˜ x0,75F (α), x˜0,75F (α)]|α ∈ [0, 1]}, kde pro kaˇzd´e α ∈ [0, 1] plat´ı:
x˜0,75F (α) = x˜0,75 (x1 (α), . . . , xn (α)),
(37)
x˜0,75F (α) = x˜0,75 (x1 (α), . . . , xn (α)).
(38)
Pˇ r´ıklad 4.4. Vˇsechny tyto v´yˇse uveden´e kvartily se vyuˇz´ıvaj´ı k sestaven´ı krabicov´eho grafu. My ho v pˇr´ıpadu fuzzy dat neuvedeme, jelikoˇz jeho vykreslen´ı nen´ı zcela jednoduch´e a hlavnˇe pˇrehlednˇe pro vypov´ıdaj´ıc´ı interpretaci dat. My si zde 32
proto vykresl´ıme pouze fuzzy doln´ı a fuzzy horn´ı kvartil spolu s fuzzy medi´ anem. Pro toto vykreslen´ı jsme vyuˇzili zadan´ a data z Obr.7 .
Obr. 11 Fuzzy doln´ı, horn´ı kvartil a fuzzy medi´ an
4.1.5
Minim´ aln´ı a maxim´ aln´ı fuzzy ˇ c´ıslo
Definice 4.6. Necht’ Xi = {[xi (α), xi (α)]|α ∈ [0, 1]} pro kaˇzd´e i ∈ {1, . . . , n} jsou fuzzy ˇc´ısla. Potom minim´aln´ım fuzzy ˇc´ıslem z fuzzy ˇc´ısel X1 , . . . , Xn ∈ FN (R) nazveme fuzzy ˇc´ıslo min xF = {[min xF (α), min xF (α)]|α ∈ [0, 1]}, kde pro kaˇzd´e α ∈ [0, 1] plat´ı:
min xF (α) = min(x1 (α), . . . , xn (α)),
(39)
min xF (α) = min(x1 (α), . . . , xn (α)).
(40)
Definice 4.7. Necht’ Xi = {[xi (α), xi (α)]|α ∈ [0, 1]} pro kaˇzd´e i ∈ {1, . . . , n} jsou fuzzy ˇc´ısla.Potom maxim´aln´ım fuzzy ˇc´ıslem fuzzy ˇc´ısel X1 , . . . , Xn ∈ FN (R) nazveme fuzzy ˇc´ıslo max xF = {[max xF (α), max xF (α)]|α ∈ [0, 1]}, kde pro kaˇzd´e α ∈ [0, 1] plat´ı:
max xF (α) = max(x1 (α), . . . , xn (α)),
33
(41)
max xF (α) = max(x1 (α), . . . , xn (α)).
4.2
(42)
ˇ ıseln´ C´ e charakteristiky variability
Charakteristiky variability n´am rozˇsiˇruj´ı informaci o zkouman´em statistick´em souboru. Obecnˇe plat´ı, ˇze nulov´a nebo velmi mal´a hodnota ukazatel˚ u variability ukazuje na stejnorodost statistick´eho souboru, na vyrovnanost hodnot znaku. Mezi ˇc´ıseln´e charakteristiky variability pro fuzzy data si n´azornˇe uk´aˇzeme nejzn´amˇejˇs´ı z´astupce: • Fuzzy rozptyl • Fuzzy smˇerodatn´a odchylka • Fuzzy variaˇcn´ı koeficient • Fuzzy variaˇcn´ı rozpˇet´ı. 4.2.1
Fuzzy rozptyl
Fuzzy rozptyl je nejzn´amˇejˇs´ım z´astupcem ˇc´ıseln´ ych charakteristik variability. Fuzzy rozptyl naz´ yv´ame druh´ ym centr´aln´ım empirick´ ym momentem n´ahodn´eho v´ ybˇeru. Definice 4.8. Necht’ Xi = {[xi (α), xi (α)]|α ∈ [0, 1]} pro kaˇzd´e i ∈ {1, . . . , n} jsou fuzzy ˇc´ısla. Fuzzy rozptylem fuzzy ˇc´ısel X1 , . . . , Xn ∈ FN (R) nazveme fuzzy ˇc´ıslo s2xF = {[s2xF (α), s2xF (α)]|α ∈ [0, 1]}, kde pro kaˇzd´e α ∈ [0, 1] plat´ı: s2xF (α) = min{s2x (x1 , . . . , xn )|xi ∈ [xi (α), xi (α)], i = {1, . . . , n}},
(43)
s2xF (α) = max{s2x (x1 , . . . , xn )|xi ∈ [xi (α), xi (α)], i = {1, . . . , n}}.
(44)
34
Pro tento sloˇzit´ y v´ ypoˇcet jsme vyuˇzili v MATLABu optimalizaˇcn´ı u ´lohy, kterou si uvedeme v modelov´em pˇr´ıkladu. Pˇ r´ıklad 4.5. M´ame d´ano 6 fuzzy ˇc´ısel, kter´ a jsou zobrazena na Obr.12. Na tomto mal´em rozsahu dat, pak m˚ uˇzeme pouˇz´ıt formule (45), (46) a vykreslit v´ysledn´y fuzzy rozptyl jak je zobrazen na Obr. 13.
Obr. 12 Zadan´ a fuzzy ˇc´ısla
Obr. 13 fuzzy rozptyl
35
4.2.2
Fuzzy smˇ erodatn´ a odchylka
Smˇerodatn´a odchylka je v teorii pravdˇepodobnosti a statistice ˇcasto pouˇz´ıvanou m´ırou statistick´e disperze. Jedn´a se o kvadratick´ y pr˚ umˇer odchylek hodnot znaku od jejich aritmetick´eho pr˚ umˇeru. Jednoduˇse ˇreˇceno vypov´ıd´a o tom, jak moc se od sebe liˇs´ı navz´ajem typick´e pˇr´ıpady v souboru dat. Je-li mal´a, jsou si prvky naˇseho souboru navz´ajem podobn´e, a naopak velk´a smˇerodatn´a odchylka dokazuje velk´e vz´ajemn´e odliˇsnosti. Fuzzy smˇerodatn´a odchylka je pak druhou odmocninou fuzzy rozptylu. Definice 4.9. Necht’ Xi = {[xi (α), xi (α)]|α ∈ [0, 1]} pro kaˇzd´e i ∈ {1, . . . , n} jsou fuzzy ˇc´ısla. Fuzzy smˇerodatnou odchylkou fuzzy ˇc´ısel X1 , . . . , Xn ∈ FN (R) nazveme fuzzy ˇc´ıslo sxF = {[sxF (α), sxF (α)]|α ∈ [0, 1]}, kde pro kaˇzd´e α ∈ [0, 1] plat´ı: sxF (α) =
p
min{s2x (x1 , . . . , xn )|xi ∈ [xi (α), xi (α)], i = {1, . . . , n}},
(45)
sxF (α) =
p max{s2x (x1 , . . . , xn )|xi ∈ [xi (α), xi (α)], i = {1, . . . , n}}
(46)
Pˇ r´ıklad 4.6. Pro n´azornost a vypov´ıdaj´ıc´ı zobrazen´ı fuzzy smˇerodatn´e odchylky ji vykresl´ıme pro stejn´a fuzzy data, jako na Obr.12.
Obr. 14 Fuzzy smˇerodatn´ a odchylka 36
4.2.3
Variaˇ cn´ı koeficient
Variaˇcn´ı koeficient je pak pod´ılem fuzzy smˇerodatn´e odchylky a fuzzy pr˚ umˇeru. Nadefinovat pak m˚ uˇzeme tento koeficient n´asledovnˇe : Definice 4.10. Necht’ Xi = {[xi (α), xi (α)]|α ∈ [0, 1]} pro kaˇzd´e i ∈ {1, . . . , n} jsou fuzzy ˇc´ısla. Fuzzy variaˇcn´ım koeficientem fuzzy ˇc´ısel X1 , . . . , Xn ∈ FN (R) nazveme fuzzy ˇc´ıslo VxF = {[VxF (α), VxF (α)]|α ∈ [0, 1]}, kde pro kaˇzd´e α ∈ [0, 1] plat´ı: VxF (α) = min{Vx (x1 , . . . , xn )|xi ∈ [xi (α), xi (α)], i = {1, . . . , n}}, VxF (α) = max{Vx (x1 , . . . , xn )|xi ∈ [xi (α), xi (α)], i = {1, . . . , n}}.
(47) (48)
Pˇ r´ıklad 4.7. Pro n´azornost a vypov´ıdaj´ıc´ı zobrazen´ı fuzzy variaˇcn´ıho koeficientu ji vykresl´ıme pro stejn´a fuzzy data, jako na Obr.12. K vykreslen´ı t´eto ˇc´ıseln´e charakteristiky variability je potˇrebn´e vypoˇc´ıtat fuzzy smˇerodatnou odchylku a fuzzy pr˚ umˇer ze souboru dat. Jejich grafick´e zpracov´ an´ı jsme jiˇz provedli na Obr.(6) a Obr.14. Jelikoˇz v re´aln´ych datech se tento ukazatel vyuˇz´ıv´ a v procentu´ aln´ım vyj´ adˇren´ı, je zˇrejm´e, ˇze toto fuzzy ˇc´ıslo bude pro hodnotu j´ adra na ose x menˇs´ı nebo rovno 1.
Obr. 15 Fuzzy variaˇcn´ı koeficient
37
4.2.4
Variaˇ cn´ı rozpˇ et´ı
Jak jiˇz v´ıme z pˇredeˇsl´e teorie, variaˇcn´ı rozpˇet´ı povaˇzujeme za nejjednoduˇsˇs´ı ˇc´ıselnou charakteristiku variability. Nen´ı tomu vˇsak tak u fuzzy variaˇcn´ıho rozpˇet´ı. Je zde komplikace v tom, ˇze m˚ uˇze nastat n´asleduj´ıc´ı situace z Obr. 16 .
Obr. 16 Minim´aln´ı a maxim´aln´ı fuzzy ˇc´ıslo
Jak je z obr´azku patrn´e, tak fuzzy ˇc´ıslo A n´am pˇredstavuje minim´aln´ı fuzzy ˇc´ıslo a fuzzy ˇc´ıslo B n´am pˇredstavuje maxim´aln´ı fuzzy ˇc´ıslo. Jak vid´ıme doln´ı funkce minima a horn´ı funkce maxima n´am vˇsak m˚ uˇze poch´azet ze stejn´eho fuzzy ˇc´ısla, proto klasick´e odeˇcten´ı tˇechto fuzzy ˇc´ısel nelze pouˇz´ıt. Je proto tˇreba definovat fuzzy variaˇcn´ı rozpˇet´ı pomoc´ı doln´ı a horn´ı funkce. Pˇritom mus´ıme br´at v potaz tuto z´avislost. Definice 4.11. Necht’ Xi = {[xi (α), xi (α)]|α ∈ [0, 1]} pro kaˇzd´e i ∈ {1, . . . , n} jsou fuzzy ˇc´ısla. Necht’ m´ame minim´ aln´ı fuzzy ˇc´ıslo min xF = {[min xF (α), min xF (α)]|α ∈ [0, 1]} a maxim´aln´ı fuzzy ˇc´ıslo max xF = {[max xF (α), max xF (α)]|α ∈ [0, 1]}.
38
Necht’ i∗α ∈ {1, . . . , n} je libovoln´y index, pro kter´y plat´ı xi∗α (α) = max(α),
(49)
(je-li takov´ych index˚ u, pro dan´e α v´ıce, zvol´ıme si jeden z nich), a necht’ i∗∗ y index, pro kter´y plat´ı α ∈ {1, . . . , n} je libovoln´ (α) = min(α). xi∗∗ α
(50)
r1 (α) = max(α) − min∗ xj (α)
(51)
r2 (α) = max xj (α) − min(α). ∗∗
(52)
Potom si oznaˇcme: j6=iα
a j6=iα
Fuzzy variaˇcn´ım rozpˇet´ım fuzzy ˇc´ısel X1 , . . . , Xn ∈ FN (R) nazveme fuzzy ˇc´ıslo RxF = {[RxF (α), RxF (α)]|α ∈ [0, 1]} , kde pro kaˇzd´e α ∈ [0, 1] plat´ı: RxF (α) = max{r1 (α), r2 (α)},
(53)
RxF (α) = |max(α) − min(α)|.
(54)
Takto potom prezentujeme v´ ysledn´e fuzzy variaˇcn´ı rozpˇet´ı z fuzzy dat z Obr.16.
Obr. 17 Fuzzy variaˇcn´ı rozpˇet´ı 39
Pˇ r´ıklad 4.8. Pro fuzzy ˇc´ısla jiˇz nadefinov´ ana u fuzzy rozptylu, kter´ a pouˇz´ıv´ ame jako ilustrativn´ı pro vˇsechny charakteristiky variability, by pak v´ysledn´e fuzzy variaˇcn´ı rozpˇet´ı vypadalo n´asledovnˇe.
Obr. 18 V´ysledn´e fuzzy variaˇcn´ı rozpˇet´ı
Pak fuzzy ˇc´ıslo A je fuzzy minimum, B je fuzzy maximum. Jako fuzzy ˇc´ıslo C je zobrazeno variaˇcn´ı rozpˇet´ı vˇsech 6-ti fuzzy ˇc´ısel.
4.3
Histogram
V popisn´e statistice se velice ˇcasto jako jej´ı grafick´ y n´astroj pouˇz´ıv´a histogram, jak jiˇz bylo zm´ınˇeno v ˇc´asti grafick´eho zn´azornˇen´ı pro re´aln´a data 2.3. V t´eto podkapitole si tuto teorii rozˇs´ıˇr´ıme a pot´e pˇrid´ame pˇredpoklad, ˇze nem´ame vstupn´ı data re´aln´a, ale zadan´a ve tvaru fuzzy ˇc´ısel. Pˇredpokl´adejme tedy, ˇze jsme na n statistick´ ych jednotk´ach namˇeˇrili soubor hodnot x1 ,. . . ,xk
(55)
dan´eho znaku. Celkov´emu poˇctu prvk˚ u souboru ˇr´ık´ame rozsah souboru. Tyto hodnoty srovn´ame do neklesaj´ıc´ı posloupnosti a dostaneme uspoˇr´adan´ y soubor hod40
ˇ not. Opakuj´ı - li se hodnoty, m˚ uˇzeme je zapsat do ˇcetnostn´ıch tabulek. Cetnost´ ı tabulku potom zn´azorˇ nujeme nejˇcastˇeji do histogramu, kter´ y slouˇz´ı k zn´azornˇen´ı rozloˇzen´ı tˇechto hodnot souboru. Ke konstrukci histogramu budeme uvaˇzovat prostor M, tj. prostor moˇzn´ ych pozorov´an´ı v k disjunktn´ıch tˇr´ıd´ach K1 ,. . . ,Kk , tj. T Ki Kj = ∅ pro vˇsechna 1 ≤ i < j ≤ k. Jednotliv´e soubory hodnot nemus´ı m´ıt stejn´e ˇs´ıˇrky tˇr´ıd, vˇetˇsinou jsou tyto ˇs´ıˇrky tˇr´ıd oznaˇcov´any jako h1 , ..., hk . Nejˇcastˇeji vˇsak vznikaj´ı stejn´e tˇr´ıdy, tj. h1 = ... = hk V pˇr´ıpadˇe n´ahodn´eho souboru hodnot x1 , . . . , x n
(56)
s re´aln´ ymi hodnotami urˇc´ıme nejdˇr´ıve relativn´ı ˇcetnost v r´ amci jednotliv´ych tˇr´ıd pomoc´ı vzorce: {]xj |xj ∈ Ki } e hn (Ki ) = , i=1,. . . , k. n
(57)
Celkov´ y obsah jednotliv´ ych obd´eln´ık˚ u je vˇzdy 1. Na n´asleduj´ıc´ım obr´azku pak m˚ uˇzeme vidˇet pˇr´ıklad histogramu s odliˇsn´ ymi ˇs´ıˇrkami interval˚ u tˇr´ıd.
Obr. 19 Histogram s odliˇsn´ ymi ˇs´ıˇrkami tˇr´ıd
V pˇr´ıpadˇe fuzzy dat mus´ı b´ yt sestaven´ı histogramu zobecnˇeno. V tomto pˇr´ıpadˇe nen´ı totiˇz jist´e, zda data do jednotliv´ ych tˇr´ıd patˇr´ı ˇci nikoliv. Cel´ y postup nen´ı nic jednoduch´eho. V mnoha aplikac´ıch jiˇz maj´ı sestaven´e vlastn´ı speci´aln´ı programy pro v´ ypoˇcet tohoto histogramu. Z´akladem t´eto problematiky je nadefinovat si 41
fuzzy relativn´ı ˇcetnost. Definice 4.12. Necht’ Xi = {[xi (α), xi (α)]|α ∈ [0, 1]} pro kaˇzd´e i ∈ {1, . . . , n} jsou fuzzy ˇc´ısla. Fuzzy relativn´ı ˇcetnost fuzzy ˇc´ısel X1 , . . . , Xn ∈ FN (R) nazveme ¯ nF,(K ) (α)]|α ∈ [0, 1]}, kde pro kaˇzd´e α ∈ fuzzy ˇc´ıslo hnF (Ki ) = {[h (α), h nF,(Ki )
i
[0, 1] v jednotliv´ych tˇr´ıd´ach Ki plat´ı: hn,Ki (α) =
{]Xi |Xiα
hn,Ki (α) =
T
Ki 6= ∅}
n
,
{]Xi |Xiα ⊆ Ki } . n
(58)
(59)
Pro horn´ı a doln´ı funkci α- ˇrezu fuzzy relativn´ı ˇcetnosti plat´ı pro souˇcet vˇsech tˇr´ıd n´asleduj´ıc´ı vztahy: k X
hnF,(Ki ) (α) ≤ 1 ∀α ∈ (0, 1],
(60)
hnF,(Ki ) (α) ≥ 1 ∀α ∈ (0, 1].
(61)
i=1 k X i=1
Tyto dva vztahy plynou z definice hnF,(Ki ) (α) a hnF,(Ki ) (α). Postup zaˇrazen´ı do jednotliv´ ych tˇr´ıd K budeme nejl´epe prezentovat na konkr´etn´ım pˇr´ıkladu. Pˇ r´ıklad 4.9. Necht’ uvaˇzujeme 5 fuzzy ˇc´ısel, n = 5. Na tomto Obr. 20 si uk´ aˇzeme, do kter´e ze tˇr´ıd zaˇradit fuzzy ˇc´ısla A a B, kter´ a jsou zn´ azornˇena mezi hranicemi tˇr´ıd Ki a Ki+1 , a n´aslednˇe vytvoˇrit fuzzy histogram.
42
Obr. 20 Fuzzy ˇc´ısla
Z obr´azku vid´ıme, ˇze n´as zaj´ım´ a tˇr´ıda Ki a fuzzy ˇc´ıslo A a fuzzy ˇc´ıslo B. Vˇsimnˇeme si, ˇze aˇz po α = 0, 8, neobsahuje naˇse zvolen´ a tˇr´ıda Ki zcela ani jedno fuzzy ˇc´ıslo v dan´em α - ˇrezu. Proto v t´eto ˇc´ asti uvaˇzujeme po dosazen´ı do formul´ı (58) a (59) hodnotu nulovou. Pod´ıv´ ame - li se na Obr.21 je z tohoto obr´ azku patrn´e, ˇze hodnota v α = 1, je pr´ avˇe v hodnotˇe 0, 4. T´ımto jsme zjistili horn´ı a doln´ı funkci dan´e tˇr´ıdy. V´ysledn´y histogram pak dostaneme poskl´ ad´ an´ım vˇsech horn´ıch a doln´ıch funkc´ı jednotliv´ych tˇr´ıd vedle sebe. Pro konstrukci fuzzy histogramu vyuˇzijeme softwaruR.
43
Obr.21 Fuzzy histogram 3D
Na tomto Obr.21 se n´am odr´ aˇz´ı i skuteˇcnost, ˇze n´ ami zadan´ a fuzzy ˇc´ısla nejsou troj´ uheln´ıkov´a, proto v α - ˇrezu rovnu jedn´e nen´ı tento fuzzy histogram jednoznaˇcnˇe urˇcen. Je rozdˇelen do 5 tˇr´ıd a zn´ azornˇen v 3D proveden´ı pro pˇrehlednost a barevnost n´am urˇcuje pˇriˇrazen´ı k urˇcit´emu α - ˇrezu.
44
5
Modelov´ y pˇ r´ıklad Druh´a ˇc´ast naˇs´ı diplomov´e pr´ace bude zcela praktick´a. V prvn´ı ˇc´asti jsme si
obohatili znalosti popisn´e statistiky a z´aklady fuzzy mnoˇzin a tak´e nadefinovali vˇse potˇrebn´e i pro statistick´e zpracov´an´ı fuzzy dat. Nyn´ı bude naˇsim u ´kolem zpracovat tuto nadefinovanou teorii pro 100 zadan´ ych fuzzy ˇc´ısel pomoc´ı program˚ u MATLAB a softwareR. Protoˇze se jedn´a o velk´ y soubor, zamˇeˇr´ıme se i na vytvoˇren´ı program˚ u pro v´ ypoˇcet jednotliv´ ych charakteristik, kter´e budou pˇriloˇzeny na CD.
5.1
Pouˇ zit´ y software
MATLAB je vysoce v´ ykonn´ y jazyk pro technick´e v´ ypoˇcty. Integruje v´ ypoˇcty, vizualizaci a programov´an´ı do jednoduˇse ovladateln´eho prostˇred´ı, kde probl´emy a ˇreˇsen´ı jsou vyj´adˇreny pomoc´ı dobˇre zn´am´ ych matematick´ ych vztah˚ u. Typick´e pouˇzit´ı zahrnuje: • matematiku a v´ ypoˇcty, • tvorbu algoritm˚ u, • z´ısk´av´an´ı dat, • modelov´an´ı a simulace, • anal´ yzu dat, v´ yzkum a vizualizaci, • vˇedeckou a inˇzen´ yrskou grafiku, • tvorbu aplikac´ı vˇcetnˇe grafick´eho rozhran´ı. MATLAB je interaktivn´ı syst´em, kter´ y umoˇzn ˇuje pr´aci s poli, kter´e nen´ı potˇreba dimenzovat. To umoˇzn ˇuje ˇreˇsit mnoho technick´ ych probl´em˚ u s pouˇzit´ım formulac´ı pomoc´ı vektor˚ u a matic. 45
Jm´eno MATLAB je zkratka ze slov ”matrix laboratory”. MATLAB byl vyvinut pˇred lety s podnˇety od mnoha uˇzivatel˚ u. V univerzitn´ım prostˇred´ı je to standardn´ı instrukt´aˇzn´ı n´astroj v u ´vodn´ıch a pokroˇcil´ ych kursech matematiky, vˇedy a techniky. V pr˚ umyslu je to vysoce produktivn´ı n´astroj pro v´ yzkum, v´ yrobu a anal´ yzu. Jeho souˇc´ast´ı jsou i toolboxy, mimo jin´e i fuzzy toolbox, kter´ y budeme pˇri n´asleduj´ıc´ıch v´ ypoˇctech charakteristik polohy a variability potˇrebovat.
Tak´e si zde ve zkratce pˇredstav´ıme statistick´ y softwareR, pomoc´ı kter´eho v naˇs´ı pr´aci konstruujeme fuzzy histogramy.
R je integrovan´e prostˇred´ı pro • anal´ yzu dat, • statistick´e v´ ypoˇcty, • numerick´e v´ ypoˇcty, • a tak´e grafick´e zn´azornˇen´ı dat. Obsahuje podm´ınky, cykly, uˇzivatelem definovan´e funkce a tak´e n´astroje pro vstup a v´ ystup dat. Z´akladn´ı jednotka, se kterou R pracuje, se naz´ yv´a objekt. Jednoduˇse ˇreˇceno se jedn´a o nˇejak´ y soubor dat. Na R m˚ uˇzeme pohl´ıˇzet jako na n´astroj programovac´ıho jazyka S, kter´ y byl vyvinut´ y v Bell Laboratories R. Beckerem, J. Chambersem a A.Wilkesem. Prostˇred´ı R je dostupn´e jako free software a volnˇe ˇsiˇriteln´e pod GNU General Public Licence. Software je dostupn´ y pro vˇetˇsinu syst´em˚ u. Hlavn´ı webovou str´ankou tohoto projektu je http://www.r.project.org/. Na t´eto str´ance najdeme informace a manu´aly potˇrebn´e pro pr´aci s R, jako napˇr. [8], d´ıky ˇcemuˇz je R snadno ˇsiˇriteln´ y. Instalace, zdrojov´ y k´od a pomoc ve formˇe helpu m˚ uˇzeme naj´ıt na http://cran.at.r-project.org/. Software R obsahuje mnoho r˚ uzn´ ych bal´ıˇck˚ u, kter´e se dle potˇreby daj´ı volnˇe na internetu pˇridat k jiˇz nainstalovan´emu softweruR. My zde pouˇzijeme bal´ıˇcek ’SAFD’(Statistical Analysis of Fuzzy Data). Je to bal´ıˇcek, pomoc´ı kter´eho m˚ uˇzeme 46
zpracov´avat statisticky fuzzy data. A v naˇsem pˇr´ıpadˇe ho vyuˇzijeme pro vykreslen´ı histogramu.
5.2
Statistick´ a anal´ yza fuzzy dat
V t´eto podkapitole provedeme jiˇz zm´ınˇen´e v´ ypoˇcty. M´ame zad´ano 100 troj´ uheln´ıkov´ ych fuzzy ˇc´ısel, kter´e jsme si nadefinovali v excelovsk´em souboru diplomka.xls. Tento soubor je pˇriloˇzen na CD nosiˇci k naˇs´ı diplomov´e pr´aci. Pomoc´ı MS Excel m˚ uˇzeme prov´est jednoduch´e propojen´ı se softwarem MATLAB, d´ıky jednomu z doplˇ nk˚ u, kter´ y lze jednoduˇse v MS Excelu naj´ıt v nastaven´ı a pˇripojit. V MS excel proto m˚ uˇzeme prov´adˇet jednoduch´e propoˇcty a zad´avat velk´e mnoˇzstv´ı hodnot jednoduˇseji neˇz v MATLABu. Potom d´ıky propojen´ı tˇechto dvou program˚ u m´ame v MATLABu velice usnadnˇen´e v´ ypoˇcty. Zadan´a fuzzy ˇc´ısla m´ame nadefinov´ana na intervalu [0, 100] v pˇr´ıloze A., vyps´an´ım trojic´ı bod˚ u, ale i v pˇr´ıloze B., jejich zn´azornˇen´ım. Uvaˇzujeme troj´ uheln´ıkov´a fuzzy ˇc´ısla pr´avˇe proto, ˇze v j´adˇre maj´ı pr´avˇe jednu hodnotu, a tud´ıˇz je m˚ uˇzeme porovn´avat s re´aln´ ymi daty. V´ ypoˇcty budeme prov´adˇet postupnˇe ve stejn´em poˇrad´ı, v jak´em jsme si tyto charakteristiky nadefinovali v pˇredeˇsl´e teorii. Jako prvn´ı si uvedeme Aritmetick´ y pr˚ umˇ er, u nˇehoˇz jak jiˇz v´ıme z pˇredeˇsl´e teorie n´am ho ovlivˇ nuj´ı extr´emn´ı hodnoty. Pˇri v´ ypoˇctech aritmetick´eho pr˚ umˇeru jsme vyuˇzili software Matlab, kde pro re´aln´a data staˇc´ı nadefinovat soubor hodnot a pro v´ ypoˇcet zadat pˇr´ıkaz mean(x). Pro v´ ypoˇcet fuzzy aritmetick´eho pr˚ umˇeru vyuˇzijeme fuzzy toolboxu a dle Definice 4.1 n´aslednˇe dosad´ıme. V´ ystupem je pro n´as opˇet fuzzy ˇc´ıslo. Na n´asleduj´ıc´ım obr´azku m˚ uˇzeme vidˇet fuzzy aritmetick´ y pr˚ umˇer, kdy pro re´aln´a data n´am pr˚ umˇer pˇredstavuje hodnotu v α - ˇrezu rovno jedn´e. Je d˚ uleˇzit´e si vˇsimnout, ˇze v´ ysledn´e fuzzy ˇc´ıslo nen´ı symetrick´e, proto je d˚ uleˇzit´e tuto neurˇcitost uvaˇzovat. Je proto zˇrejm´e, ˇze hodnoty aritmetick´eho pr˚ umˇeru by se z uveden´eho 47
obr´azku mˇeli sp´ıˇse pohybovat okolo niˇzˇs´ıch hodnot neˇz je jeho j´adro.
Obr.22 Pr˚ umˇer 100 fuzzy ˇc´ısel
Pro vykreslen´ı fuzzy aritmetick´eho pr˚ umˇeru jsme vyuˇzili jednoduch´ y z´apis v softwaru MATLAB. %%%%%%%%%pr˚ umˇ er%%%%%%%%%%%%%%% % pro pr˚ umˇ er je potˇ reba v MS Excel oznaˇ cit pomoc´ ı putmetrix jednak hodnoty y,tak i souˇ cet vˇ sech 4 sloupc˚ u a ty n´ aslednˇ e oznaˇ cit p´ ısmenem l x=0:0.001:60; n=size(y); prumer=trapmf(x,[l(1)/n l(2)/n l(3)/n l(4)/n]); plot(x,prumer) Dalˇs´ı z charakteristik, kterou si zde zm´ın´ıme je pak Medi´ an. Konstrukce fuzzy medi´anu vˇsak jiˇz nen´ı tak jednoduch´a. Konstrukci nem˚ uˇzeme prov´est dle fuzzy toolboxu, kter´ y n´am je k dispozici, ale je potˇreba nadefinovat jednotlivˇe horn´ı a doln´ı funkci t´eto charakteristiky pomoc´ı cyklu. Jelikoˇz m´ame 100 dat, je potˇreba tento cyklus prov´est pro kaˇzd´e z nich ve v´ıce α - ˇrezech. Tento algoritmus uvedeme v tomto textu, jelikoˇz pro jeho obt´ıˇznost je tˇreba ho zm´ınit. Pro v´ ypoˇcet medi´anu pro re´aln´a data lze opˇet vyuˇz´ıt pˇr´ıkaz z n´apovˇedy pro 48
popisnou statistiku a to pˇr´ıkazem median(x). %%%%%%%%medi´ an%%%%%%%%%%% %zde je potˇ reba naˇ c´ ıst v MS Excel nejprve matici y. x=20:0.001:50; pocet=100; %%%poˇ cet vykreslen´ ych alfa ˇ rez˚ u for a=0:0.01:1 b(round(a*pocet+1))=a; for i=1:1:n yd(i,round(a*pocet+1))=y(i,1)+a*(y(i,2)-y(i,1)); yh(i,round(a*pocet+1))=y(i,4)-a*(y(i,4)-y(i,3)); end end medd=median(yd); medh=median(yh); plot(medd,b,’k’,medh,b,’k’) Pro zad´an´ı tohoto cyklu se n´am vykresl´ı fuzzy medi´an, kter´ y je vidˇet na Obr.23. Z tˇechto dat jde pˇrehlednˇe vyvodit fakt, ˇze medi´an n´am neovlivˇ nuj´ı extr´emn´ı hodnoty. A tak´e opˇet n´am jako v´ ysledek nebylo vykresleno fuzzy ˇc´ıslo symetrick´e, ˇcili vzd´alenost j´adra od bod˚ u, kter´a jsou zn´azornˇena v nulov´em α ˇrezu nejsou shodn´a.
Obr.23 Fuzzy medi´an 49
Nyn´ı si pˇrid´ame pro porovn´an´ı zobrazen´ı, kdy jsme k fuzzy medi´anu pˇrikreslili i doln´ı a horn´ı fuzzy kvartil. Doln´ı kvartil je zn´azornˇen jako fuzzy ˇc´ıslo A, horn´ı kvartil fuzzy ˇc´ıslem C a medi´an je oznaˇcen shodnˇe s Obr. 23 barvou ˇcernou.
Obr.24 Fuzzy doln´ı, horn´ı kvartil a fuzzy medi´an
T´ımto jsme si pˇredstavili ˇc´ıseln´e charakteristiky polohy a nyn´ı pˇrejdeme k v´ ypoˇct˚ um ˇc´ıseln´ ych charakteristik variability. Jako prvn´ı si zkonstruujeme Rozptyl. Rozptyl je z´akladn´ı charakteristikou pro v´ ypoˇcet dalˇs´ıch charakteristik variability, jako jsou smˇerodatn´a odchylka a variaˇcn´ı koeficient. Proto i v´ ypoˇcet v MATLABu je obdobn´ y. Pˇri tomto v´ ypoˇctu bylo potˇreba nadefinovat v´ ypoˇcet horn´ı a doln´ı funkce a n´aslednˇe prov´est optimalizaci pomoc´ı pˇr´ısluˇsn´eho toolboxu. %%%%%%%%%%%%%%%%%%%%%rozptyl%%%%%%%%%%%%%%%% % u fuzzy rozptylu mus´ ıme pomoc´ ı MS Excel nadefinovat matici y. x=-10:0.01:1000; n=size(y);
%%% rozmˇ er zadan´ e matice y
pocet=1000; %%%poˇ cet vykreslen´ ych alfa ˇ rez˚ u for a=0:1/pocet:1 a; for i=1:n yd(i,1)=y(i,1)+a*(y(i,2)-y(i,1)); 50
yh(i,1)=y(i,4)-a*(y(i,4)-y(i,3)); end x0=yd; %%% poˇ c´ ateˇ cn´ ı bod [x,fval] = fmincon(@(x)var(x),x0,[],[],[],[],yd,yh); S2min=fval; [x,fval] = fmincon(@(x)-var(x),x0,[],[],[],[],yd,yh); S2max=-fval;
hold on plot(S2min,a,’.k’,S2max,a,’.k’) hold off end
Na Obr.25 je tento rozptyl vykreslen. Pro re´aln´a data je v Matlabu pˇrichyst´an jednoduch´ y pˇr´ıkaz var(x), kter´ ym si v naˇsem pˇr´ıpadˇe m˚ uˇzeme ovˇeˇrit spr´avnost v´ ypoˇctu pro naˇse zadan´a troj´ uheln´ıkov´a fuzzy data, kdy tato hodnota pˇredstavuje hodnotu v α - ˇrezu rovnu jedn´e.
Obr.25 Fuzzy rozptyl
Jako druhou odmocninou rozptylu je pro n´as zn´am´a Smˇ erodatn´ a odchylka. 51
U fuzzy smˇerodatn´e odchylky, jak jiˇz bylo ˇreˇceno, vych´az´ıme z fuzzy rozptylu. Nen´ı tomu jinak ani pˇri samotn´ ych v´ ypoˇctech pomoc´ı dan´eho softwaru. V z´apisu, jak je jiˇz uveden v´ yˇse, se n´am v optimalizaˇcn´ı u ´loze na m´ısto var(x) vyskytne funkce std(x), kter´a je jiˇz pˇreddefinov´ana funkc´ı smˇerodatn´e odchylky pro re´aln´a data.
Obr.26 Fuzzy smˇerodatn´a odchylka
Jako posledn´ı charakteristika, kter´a vyuˇz´ıv´a podobn´eho postupu v´ ypoˇctu je Variaˇ cn´ı koeficient. U fuzzy variaˇcn´ıho koeficientu jsme vyuˇzili stejn´e nadefinov´an´ı pro software Matlab, jako u fuzzy rozptylu a fuzzy smˇerodatn´e odchylky. Je nutno prov´est u ´pravu na pod´ıl fuzzy smˇerodatn´e odchylky a fuzzy aritmetick´eho pr˚ umˇeru. Tento krok jiˇz je pro Matlab sloˇzitˇejˇs´ı operace, proto je potˇreba ho nepatrnˇe upravit. Tato u ´prava spoˇc´ıv´a v tom, ˇze je velmi d˚ uleˇzit´e naj´ıt vhodnou volbu poˇc´ateˇcn´ıch bod˚ u. U fuzzy variaˇcn´ıho koeficientu bylo potˇreba zvolit jednotlivˇe poˇc´ateˇcn´ı bod, jak pro doln´ı funkci tak pro horn´ı funkci. Tento algoritmus je jiˇz pro n´aˇs uveden´ y software sloˇzitˇejˇs´ı, proto jeho v´ ypoˇcet je ponˇekud zdlouhav´ y, avˇsak optimalizaˇcn´ı metoda pouˇzita i v pˇr´ıpadˇe fuzzy rozptylu a fuzzy smˇerodatn´e odchylky n´as dovede k v´ ysledn´emu fuzzy variaˇcn´ımu koeficientu. Zde pak pouk´aˇzeme pouze na optimalizaˇcn´ı ˇc´ast z m-filu s n´azvem variacnikoeficient.m, kde je n´azornˇe vidˇet zaveden´ı dvou poˇc´ateˇcn´ıch bod˚ u pro jednotliv´e funkce. 52
x0=yh; %%% poˇ c´ ateˇ cn´ ı bod [x,fval] = fmincon(@(x)(std(x)/mean(x)),x0,[],[],[],[],yd,yh); VKmin=fval; x0=yd;
%%% poˇ c´ ateˇ cn´ ı bod
[x,fval] = fmincon(@(x)-(std(x)/mean(x)),x0,[],[],[],[],yd,yh); VKmax=-fval;
Obr.27 Fuzzy variaˇcn´ı koeficient
Posledn´ı v naˇsem modelov´em pˇr´ıkladu, pˇred zn´azornˇen´ım v popisn´e statice, si provedeme v´ ypoˇcet pro Variaˇ cn´ı rozpˇ et´ı. Fuzzy variaˇcn´ı rozpˇet´ı je urˇceno dle maxim´aln´ıho a minim´aln´ıho fuzzy ˇc´ısla, kter´a po nadefinov´an´ı horn´ı a doln´ı funkce urˇc´ıme pomoc´ı funkce minimum a maximum. %%%fuzzy variaˇ cn´ ı rozpˇ et´ ı%%% %%%% u fuzzy variaˇ cn´ ıho rozpˇ et´ ı mus´ ıme pomoc´ ı MS
Excel nadefinovat
matici y, kter´ a se skl´ ad´ a z naˇ sich nadefinovan´ ych fuzzy ˇ c´ ısel n=size(y); x=0:0.01:150; pocet=100; %%%poˇ cet vykreslen´ ych alfa ˇ rez˚ u for a=0:0.01:1 b(round(a*pocet+1))=a; 53
for i=1:1:n(1) yd(i)=y(i,1)+a*(y(i,2)-y(i,1)); yh(i)=y(i,4)-a*(y(i,4)-y(i,3)); end [maxh,I]=max(yh); minh=min(yh); [mind,J]=min(yd); maxd=max(yd); k(round(a*pocet+1))=abs(minh-maxd); if I==J; %%%zde je zaveden pˇ r´ ıpad kdy se indexy rovnaj´ ı ydnew = sort(yd); yhnew = sort(yh); r(1)=maxh-ydnew(2); r(2)=-mind + yhnew(n(1)-1); s(round(a*pocet+1))=max(r); else s(round(a*pocet+1))=maxh-mind; end end
hold on plot(s,b,’k’,k,b,’k’,minh,b,’b’,mind,b,’b’,maxd,b,’r’,maxh,b,’r’) hold off Z tohoto pˇredpisu jde vidˇet, ˇze jako u jedin´e charakteristiky variability zde nelze pouˇz´ıt optimalizaˇcn´ı postup, jako u v´ yˇse uveden´eho fuzzy rozptylu. Naopak jsme zde vyuˇzili a n´aslednˇe poopravili postup pro medi´an dan´ ych fuzzy ˇc´ısel. Je potˇreba zde vych´azet z formul´ı (53), (54), kdy mus´ıme zakomponovat do v´ ypoˇctu fuzzy variaˇcn´ıho rozpˇet´ı i to, ˇze fuzzy maximum i fuzzy minimum nesm´ı poch´azet z´aroveˇ n z jednoho fuzzy ˇc´ısla, jak jsme si pˇredeslali jiˇz na Obr.16. Podrobnˇeji pop´ıˇseme z´apis do MATLABU. Kromˇe nadefinov´an´ı horn´ı a doln´ı funkce jednotliv´ ych fuzzy ˇc´ısel zde stoj´ı za zm´ınku popsat cyklus, kter´ y zaˇc´ın´a 54
pˇr´ıkazem if. Tento cyklus n´am zaruˇcuje pr´avˇe tu podm´ınku, ˇze program nevybere do fuzzy variaˇcn´ıho rozpˇet´ı minimum a maximum z jednoho fuzzy ˇc´ısla, ale pˇri shodˇe index˚ u si po uspoˇr´ad´an´ı tˇechto funkc´ı vybere tu druhou nejvˇetˇs´ı. Pro n´aˇs rozsah fuzzy ˇc´ısel n´am vyˇslo jako fuzzy variaˇcn´ı rozpˇet´ı n´asleduj´ıc´ı fuzzy ˇc´ıslo, kter´e jsme zn´azornili ˇcernou barvou.
Obr.28 Fuzzy minimum, fuzzy maximum a fuzzy variaˇcn´ı rozpˇet´ı
5.3
Grafick´ e zn´ azornˇ en´ı - fuzzy histogram
V t´eto sekci si pop´ıˇseme konstrukci fuzzy histogramu. Jako prvn´ı jsme si vykreslili histogram re´aln´ ych ˇc´ısel, kter´ y n´am pozdˇeji pom˚ uˇze pˇri kontrole, zda je zkonstruovan´ y fuzzy histogram spr´avn´ y. Tento histogram se sestav´ı zcela jednoduˇse v programu R, kdy po naˇcten´ı dat, kter´a uvaˇzujeme jako j´adra naˇsich troj´ uheln´ıkov´ ych fuzzy ˇc´ısel, vyvol´ame pouze pomoc´ı pˇr´ıkazu hist(x).
55
Obr.29 Histogram re´aln´ ych dat
Na obr´azku vid´ıme, ˇze histogram je rozdˇelen do 10 tˇr´ıd. Tento histogram je vˇseobecnˇe zn´am´ y pˇri anal´ yze jak´ ychkoliv re´aln´ ych dat. Jestliˇze mˇeˇren´ı nejsou zcela pˇresn´a nebo nˇekter´a z pozorov´an´ı n´am pˇri anal´ yze chyb´ı, vyuˇzijeme obecnˇejˇs´ıho grafick´eho zn´azornˇen´ı, v naˇsem pˇr´ıpadˇe fuzzy histogramu. Toto zn´azornˇen´ı m˚ uˇzeme vyuˇz´ıt i v pˇr´ıpadˇe, ˇze jsou fuzzy ˇc´ısla zad´ana kvalitativnˇe. N´asledn´a konstrukce fuzzy histogramu vˇsak jiˇz nen´ı tak zcela jednoduch´a jako konstrukce histogramu pro re´aln´a data. Konkr´etn´ı postup zaˇrazen´ı do tˇr´ıd a konstrukci horn´ıch a doln´ıch funkc´ı v jednotliv´ ych tˇr´ıd´ach jsme si jiˇz vysvˇetlili v teoretick´e ˇc´asti zamˇeˇren´e na fuzzy histogram. Nyn´ı je naˇsim u ´kolem uk´azat, jak tento histogram vykreslit pomoc´ı softwaruR. Jelikoˇz tento software pracuje i s form´aty typu .RData, pˇrevedli jsme
56
si naˇse data do tohoto form´atu. Naˇsi matici bod˚ u, kter´a n´am urˇcuje naˇse fuzzy ˇc´ısla, si uloˇz´ıme ve form´atu histograma.txt a d´ale vyp´ıˇseme n´asleduj´ıc´ı pˇr´ıkaz:
A<-read.table("C:\\Documents and Settings\\Pavla\\Plocha\\R\\ histograma.txt", header=FALSE, sep="", na.strings="NA", dec=".", strip.white=TRUE) head(A) n<-100 alpha<-c(0,1,0) XX<-list(length=n) for(i in 1:n){ XX[[i]]<- data.frame(x=as.numeric(A[i,1:3]),alpha=alpha) } save("XX", file = "C:\\Documents and Settings\\Pavla\\Plocha\\R\\ XX.RData") Nyn´ı m´ame fuzzy ˇc´ısla uloˇzena v poˇzadovan´em form´atu pod n´azvem XX.RData. V tomto pˇr´ıkazu m˚ uˇzeme vidˇet, ˇze jiˇz zde m´ame nadefinov´an poˇcet fuzzy ˇc´ısel, α - ˇrezy, kde je i n´aˇs soubor uloˇzen. Nezb´ yv´a n´am neˇz vykreslit poˇzadovan´ y histogram. histogram(XX,limx=NA,npart=10,nl=100,pic=TRUE,pdf=FALSE) Po zad´an´ı tohoto pˇr´ıkazu n´am jiˇz softwareR vykresl´ı fuzzy histogram. Je d˚ uleˇzit´e zm´ınit, jak´e parametry zde do pˇr´ıkazu uv´ad´ıme. histogram(n´ azev souboru, limx= ˇ c´ ıseln´ y vektor d´ elky n, kter´ y n´ am urˇ cuje x-vou oblast, npart=kolik tˇ r´ ıd pro dan´ y histogram zvol´ ıme, nl= v kolika alfa - ˇ rezech v´ ypoˇ cet probˇ ehne, pic=vykreslen´ ı obr´ azku, pdf=vytiˇ stˇ en´ ı obr´ azku pˇ r´ ımo do pdf souboru) 57
Obr.30 Fuzzy histogram pro 100 fuzzy dat
Z obr´azku m˚ uˇzeme vidˇet, ˇze d´ıky tomu, ˇze m´ame zadan´a troj´ uheln´ıkov´a fuzzy ˇc´ısla, m´ame ve stupni pˇr´ısluˇsnosti α = 1 vˇzdy jen jednu hodnotu, kter´a odpov´ıd´a naˇs´ım zadan´ ym re´aln´ ym dat˚ um. Proto pro n´azornost zde uvedeme vedle sebe histogram pro re´aln´a data, a z´aroveˇ n fuzzy histogram, na kter´em jsou vyznaˇceny jeho hodnoty v α = 1 a α = 0.5. Pˇresvˇedˇc´ıme se, ˇze m˚ uˇzeme vidˇet shodu v tˇechto dvou histogramech.
58
Obr.31 Fuzzy histogram s porovn´an´ım histogramu pro re´aln´a data
Na tˇechto obr´azc´ıch lze pouk´azat na souvislost a prov´azanost mezi popisnou statistikou pro re´aln´a a fuzzy data.
59
6
Z´ avˇ er Hlavn´ım c´ılem naˇs´ı pr´ace bylo vytvoˇrit ˇcten´aˇri jasn´ y a struˇcn´ y pˇrehled z´aklad˚ u
z popisn´e statistiky a fuzzy mnoˇzin. Nejd˚ uleˇzitˇejˇs´ı ˇc´ast´ı potom bylo sezn´amit ˇcten´aˇre s metodami zpracov´an´ı fuzzy dat, kde jsme tyto z´aklady upotˇrebili. Tato pr´ace je sp´ıˇse pojata jako pˇrehledn´a pˇr´ıruˇcka pro v´ ypoˇcet jednotliv´ ych ˇc´ıseln´ ych charakteristik v pˇr´ıpadˇe, ˇze data jsou zad´ana ve formˇe fuzzy ˇc´ısel, neˇz jako v´ yˇcet definic a vˇet. Cel´a teorie fuzzy mnoˇzin se st´ale vyv´ıj´ı a poˇr´ad ˇcastˇeji se s n´ı m˚ uˇzeme setkat v re´aln´em ˇzivotˇe. Proto je d˚ uleˇzit´e prohlubovat tyto znalosti a aplikovat teorii fuzzy mnoˇzin i pro statistick´e zpracov´an´ı tˇechto fuzzy dat. V cel´e pr´aci jen nedefinujeme pojmy, ale snaˇzili jsme se, aby byla sp´ıˇse praktickou a vypov´ıdaj´ıc´ı. V naˇs´ı pr´aci jsme dali pˇrednost n´azorn´ ym pˇr´ıklad˚ um, jak na mal´em souboru dat, tak v z´avˇeru i na rozsahu dat mnohem vˇetˇs´ım. Samozˇrejmˇe, ˇze v´ ypoˇcty n´am zjednoduˇsil software Matlab a softwareR, d´ıky nimˇz jsme mohli vykreslit v´ ysledky naˇsich pˇr´ıklad˚ u do pˇrehledn´ ych graf˚ u. D´ıky t´eto pr´aci se mi podaˇrilo prohloubit si znalosti z oblasti fuzzy ˇc´ısel a nauˇcila jsem se l´epe pracovat s programy Matlab a softwarem R a jejich velmi dobˇre zpracovan´ ymi n´apovˇedami. Douf´am, ˇze vypracov´an´ı t´eto pr´ace pro mne bude pˇr´ınosem v praxi.
60
Literatura ´ [1] Cyhelsk´ y, L.: Uvod do teorie popisn´e statistiky, SNTL Praha 1974. [2] Kacrov´a, P.: Fuzzy ˇc´ısla. Bakal´aˇrsk´a pr´ace. Olomouc 2009. [3] Kub´atov´a, J: Statistick´e metody pro ekonomickou praxi. UPOL Olomouc 2004. ´ [4] Kunderov´a, P: Uvod do teorie pravdˇepodobnosti a matematick´e statistiky.UPOL Olomouc 2004. [5] Pavlaˇcka, O: Fuzzy metody rozhodov´an´ı. Disertaˇcn´ı pr´ace. Univerzita Palack´eho v Olomouci, Olomouc 2007. [6] Pavlaˇcka, O., Talaˇsov´a, J.: Fuzzy vectors as a tool for modeling uncertain multidimensional quantities, Fuzzy Sets and Systems 161(2010)1585–1603. [7] Talaˇsov´a, J.: Fuzzy metody v´ıcekriteri´aln´ıho hodnocen´ı a rozhodov´an´ı. Univerzita Palack´eho v Olomouci, Olomouc 2003. [8] Venables W. N., Smith D. M., R Development Core Team, An introduction to R [online], dostupn´e z: http://cran.r- project.org/doc/manuals/R-intro.pdf, [citov´ano 1.3.2011]. [9] Viertl, R., Hareter, D.: Beschreibung und Analyse unscharfer Information. Springer-Verlag, V´ıdeˇ n 2006. [10] dostupn´e z:http : //rgm2.lab.nig.ac.jp/RGM 2/f unc.php?rdi d = SAF D : histogram, [citov´ano 13.3.2011]. [11] dostupn´e z: u12134.f sid.cvut.cz/podklady/RJ/rjz akladys tatistiky2 .pps, [citov´ano 7.1.2011].
61
Seznam pˇ r´ıloh Pˇr´ıloha A - Zadan´e fuzzy ˇc´ısla vypsan´e pomoc´ı trojice bod˚ u Pˇr´ıloha B - Vykreslen´ı zadan´ ych fuzzy ˇc´ısel do grafu
62
Pˇ r´ılohy A. x1 0 1 0 5 4 1 2 3 4 5 8 12 15 12 13 11 16 14 15 15 19 16 20 21 25 23 24 23 20 28 25 25 24
x2 2 11 1 6 6 2 5 11 18 6 9 13 18 13 19 19 18 15 21 24 25 24 24 22 27 26 29 34 21 31 26 27 28
x3 3 19 3 8 12 4 9 17 21 10 14 15 26 15 34 23 19 18 27 38 39 31 29 23 29 28 31 35 23 36 27 29 35
x1 29 30 30 30 31 21 15 12 35 36 30 31 35 35 37 37 39 45 47 47 45 48 42 45 43 47 48 45 49 50 51 56 58
x2 31 32 33 36 35 25 16 16 37 36 33 37 36 41 39 46 41 47 48 48 46 51 46 46 54 51 51 46 51 51 52 62 64
63
x3 36 34 35 39 48 42 23 18 39 37 35 45 40 48 47 51 47 49 50 49 50 56 50 49 59 57 58 49 52 53 54 69 71
x1 53 52 58 54 59 69 68 64 61 61 61 61 64 69 70 70 72 76 75 71 75 78 83 82 85 84 84 84 89 94 93 90 91 95
x2 57 54 59 58 59 69 73 77 64 63 69 62 69 71 81 76 76 77 76 72 79 89 84 83 86 85 89 86 91 96 94 93 92 98
x3 58 56 68 63 67 76 77 79 67 65 72 64 73 72 90 84 83 79 78 81 89 91 85 87 88 87 94 90 94 99 97 100 94 100
B.
Obr.31 Zadan´ ych 100 fuzzy ˇc´ısel
64