Příklady k třetímu testu - Matlab
18. dubna 2013
Instrukce: Projděte si všechny příklady. Každý příklad se snažte pochopit. Pak vymyslete a naprogramujte příklad podobný. Tím se ujistíte, že příkladu rozumíte. Další příklady najdete na stránkách Ivana Nagye nebo Pavly Pecherkové.
Učivo: Práce se statistickým balíčkem. Příkazy typu normal_cdf, poisson_rnd a podobně.
Generování náhodných čísel s daným rozdělením Vygenerujte deset tisíc čísel s exponenciálním rozdělením s parametrem λ = 2. Čísla nechť jsou v řádkovém vektoru. Vykreslete histogram těchto čísel s 30 sloupci.
Zadám do Command Window příkaz „hlp” a pak volbu „3”. Najdeme si nápovědu k exponencálnímu rozdělení - „exponential” a ke generování náhodných čísel - „_rnd”. Zejména si všimněte parametrů a v jakém pořadí se píší. lambda - parametr rozdělení r - počet řádků c - počet sloupečků Mohu do Command Window zadat i příkaz pro nápovědu k funkci: „help exponential_rnd”. Otevřu si editor!
X = exponential_rnd (2 ,1 ,10000);
% lambda , 1 radek , 10000 sloupcu
hist (X ,30);
%30 sloupcu
Výsledek:
1
Vygenerujte deset tisíc čísel s normálním rozdělením se střední hodnotou 5 a rozptylem 3. Čísla nechť jsou v řádkovém vektoru. Vykreslete histogram těchto čísel s 50 sloupci.
Zadám do Comand Window příkaz „hlp” a pak volbu „3”. Najdeme si nápovědu k normálnímu rozdělení - „normal” a ke generování náhodných čísel - „_rnd”. Zejména si všimněte parametrů a v jakém pořadí se píší. m - µ - střední hodnota v - ν - rozptyl r - počet řádků c - počet sloupečků Mohu do Command Window zadat i příkaz pro nápovědu k funkci: „help normal_rnd”. Otevřu si editor!
X = normal_rnd (5 ,3 ,1 ,10000);
% N (5 ,3) , 1 radek , 10000 sloupcu
hist (X ,50);
%50 sloupcu
Výsledek:
2
Vykreslení grafů hustoty pravděpodobnosti a distribuční funkce Vykreslete hustotu pravděpodobnosti pro exponenciální rozdělení s parametrem λ = 2. Rozsah osy x volte 0 až 18, krok 0,01.
Zadám do Comand Window příkaz „hlp” a pak volbu „3”. Najdeme si nápovědu k exponenciálnímu rozdělení - „exponential” a k výpočtu pravděpodobnostní funkce „_pdf”. Zejména si všimněte parametrů a v jakém pořadí se píší. x - vektor hodnot x lambda - parametr rozdělení Mohu do Command Window zadat i příkaz pro nápovědu k funkci: „help exponential_pdf”. Otevřu si editor!
X =0:0.01:18; Y = exponential_pdf (X ,2); plot (X , Y ); Výsledek: Porovnejte tvar křivky a histogram z prvního příkladu.
Vykreslete do jednoho obrázku grafy pravděpodobnostních funkcí pro normální rozdělení: N (0, 1)- normální normované rozdělení - modře N (0, 9)- střední hodnota 0, rozptyl 9, směrodatná odchylka 3 - zeleně N (0, 14 )- střední hodnota 0, rozptyl 14 , směrodatná odchylka
1 2
- fialově
N (4, 1)- střední hodnota 2, rozptyl 1, směrodatná odchylka 1 - červeně Rozsah osy x volte -8 až 8, krok 0,01.
3
X = -8:0.01:8; Y1 = normal_pdf (X ,0 ,1); Y2 = normal_pdf (X ,0 ,9); Y3 = normal_pdf (X ,0 ,0.25); Y4 = normal_pdf (X ,4 ,1); hold on ; plot (X , Y1 , ’b ’); plot (X , Y2 , ’g ’); plot (X , Y3 , ’m ’); plot (X , Y4 , ’r ’); hold off ; Výsledek: Na grafu vidíme, jak parametry µ a ν ovlivňují tvar pravděpodobnostní funkce.
Vykreslete do jednoho obrázku grafy pravděpodobnostní funkce pro: normální rozdělení N (10, 5) - modře binomické rozdělení se stejnou střední hodnotou a rozptylem Bi(20; 12 ) - červenými hvězdičkami. První parametr n v binomickém rozdělení znamená např. počet hodů mincí, druhý parametr p pravděpodobnost hodu jedničky. µ = n.p, σ 2 = ν = n.p. (1 − p) Rozsah osy x volte 0 až 20, krok 0,01.
X =0:0.01:20; Y1 = normal_pdf (X ,10 ,5); Y2 = binomial_pdf (X ,20 ,0.5);
4
hold on ; plot (X , Y1 , ’b ’); plot (X , Y2 , ’ r * ’); hold off ; Výsledek: Vidíte rozdíl mezi podobnými rozděleními, kde ale jedno patří spojité a druhé diskrétní náhodné veličině. Červené hvězdičky v celých číslech leží téměř na modré křivce. Rozmyslete si, že jde o důsledek centrální limitní věty. Vidíme, že i pro dvacet „hodů mincí” je centrální limitní věta dobře splněna. Silná čarvená čára dole je nulová pravděpodobnost pro neceločíselné body. - Při házení mincí nemůžeme hodit tři a půl.
Vykreslete do jednoho obrázku grafy distribuční funkce pro: normální rozdělení N (10, 5) - modře binomické rozdělení se stejnou střední hodnotou a rozptylem Bi(20; 12 ) - červeně První parametr n v binomickém rozdělení znamená např. počet hodů mincí, druhý parametr p pravděpodobnost hodu jedničky. µ = n.p, σ 2 = ν = n.p. (1 − p) Rozsah osy x volte 0 až 20, krok 0,01.
X =0:0.01:20; Y1 = normal_cdf (X ,10 ,5); Y2 = binomial_cdf (X ,20 ,0.5); hold on ; plot (X , Y1 , ’b ’); plot (X , Y2 , ’r ’); hold off ; 5
Výsledek: Vidíte rozdíl mezi podobnými rozděleními, kde ale jedno patří spojité a druhé diskrétní náhodné veličině. Výška každého schodu odpovídá hodnotě pravděpodobnostní funkce v tomto bodě.
Vykreslete do jednoho obrázku grafy pravděpodobnostní a distribuční funkce pro Poissonovo rozdělení s parametrem λ = 10. Tedy průměrný počet úspěchů (např. projetých aut) za jednotku času je 10. Rozsah osy x volte 0 až 20, krok 0,01. Pravděpodobnostní funkci vykreslete jen pro celočíselné hodnoty.
X =0:0.01:20; XX =0:20; Y1 = poisson_pdf ( XX ,10); Y2 = poisson_cdf (X ,10); hold on ; plot ( XX , Y1 , ’ b * ’); plot (X , Y2 , ’r ’); hold off ; Výsledek: Zde vidíme k sobě patřící pravděpodobnostní a distribuční funkci. Výška každého schodu odpovídá hodnotě pravděpodobnostní funkce v tomto bodě.
6
Vykreslete do jednoho obrázku grafy pravděpodobnostních funkcí: pro binomické rozdělení Bi(6, 21 ) - (Šest hodů mincí, pravděpodobnost jedničky je 0,5.
-
Střední hodnota je µ = n.p = 3.) - fialové o pro Poissonovo rozdělení P o(3)- (Střední hodnota je také µ = λ = 3.) - černé +
-
Rozsah osy x volte 0 až 20. Pravděpodobnostní funkce vykreslete jen pro celočíselné hodnoty.
X =0:6; XX =0:20; Y1 = binomial_pdf (X ,6 ,0.5);
% Protoze pri 6 pokusech muzeme v souctu hodit % nejvice 6 , musíme mít definiční obor jen do 6!!! % Pozor na to !!!
Y2 = poisson_pdf ( XX ,3);
% Zde může jít df obor libovolně daleko .
hold on ; plot (X , Y1 , ’ mo ’); plot ( XX , Y2 , ’ k + ’); hold off ; Výsledek: Vidíme, že binomické a Poissonovo rozdělení mají odlišný průběh. Poissonovo rozdělení je sice limitou binomického (pro n → ∞ a p → 0, přičemž ovšem zachováváme střední hodnotu stejnou: µ = n.p = λ), avšak použitý parametr p = 0, 5 je příliš velký. Obě rozdělení používáme tehdy, když je výsledek celočíselný. Binomické rozdělení používáme tehdy, když je maximální možná hodnota omezezená. Např. při šesti hodech mincí mohu hodit maximálně šest.
7
Poissonovo rozdělení používáme tehdy, když maximální možná hodnota není omezezená.Např. na silnici projedou v průměru tři auta za hodinu (µ = λ = 3), ale maximální možný počet projíždějících aut není určen.
Vykreslete do jednoho obrázku grafy pravděpodobnostních funkcí: -
1 pro binomické rozdělení Bi(500, 20 ) - (500 hodů nepoctivou mincí, pravděpodobnost
jedničky je 0,05. Střední hodnota je µ = n.p = 25. Rozptyl σ 2 = ν = n.p. (1 − p) = 23, 75) - fialové o -
pro Poissonovo rozdělení P o(25)- (Střední hodnota je také µ = λ = 25.) - černé +
-
pro normální (= Gaussovo) rozdělení se stejnou střední hodnotou a rozptylem: N (25; 23, 75) - modrá čára
Rozsah osy x volte 0 až 60. První dvě pravděpodobnostní funkce vykreslete jen pro celočíselné hodnoty. Třetí s krokem 0,01.
X =0:60;
% Pro kazdou funkci si pripravime vlastni x
XX =0:60; XXX =0:0.01:60; Y1 = binomial_pdf (X ,500 ,0.05); Y2 = poisson_pdf ( XX ,25); Y3 = normal_pdf ( XXX ,25 ,23.75); hold on ; plot (X , Y1 , ’ mo ’); plot ( XX , Y2 , ’ k + ’); plot ( XXX , Y3 , ’b - ’); hold off ;
8
Výsledek: Vidíme, že všechna tři rozdělení se krásně překrývají. Poissonovo je podobné binomickému, protože mají stejné střední hodnoty (25) a n je velké (500) a p malé (0,05). Binomické je podobné normálnímu, protože mají stejné střední hodnoty (25) a rozptyl (23,75) a n je velké (500). Je to důsledek Centrální limitní věty. Binomické totiž vzniká součtem alternativních veličin, což je přesně situace z CLV.
Kvantily Inteligenční qvocient je definován tak, aby měl normální rozdělení se střední hodnotou 100 a směrodatnou odchylkou 15: N (100, 225). Od jakého IQ začíná nejinteligentnějších deset procent lidí?
Hledáme tedy 90% kvantil. Najdeme si nápovědu k rozdělení „normal” a ke koncovce „_inv”.
X =0.9; Y = normal_inv (X ,100 ,225)
% Chybi strednik
Výsledek: f 0,90 = 119, 2 IQ
Inteligenční qvocient je definován tak, aby měl normální rozdělení N (100, 225). V jakém rozmezí má IQ 90% „obyčejných” lidí?
Hledáme tedy 5% a 95% kvantil. Mezi nimi je oněch 90% „obyčejných” lidí. Najdeme si nápovědu k rozdělení „normal” a ke koncovce „_inv”. 9
X =[0.05 ,0.95]; Y = normal_inv (X ,100 ,225)
% Chybi strednik
Výsledek: f 00,05 = 75, 3 IQ f 0,95 = 124, 7 IQ
Typové příklady k testu Veličina X má exponenciální rozdělení s parametrem λ = 3. Vykreslete do jednoho obrázku příslušnou pravděpodobnostní funkci (modře) a distribuční funkci (červeně). Osu x volte od 0 do 20. Dále spočtěte medián tohoto rozdělení.
Medián je vlastně 50% kvantil!
X =0:0.01:20; Y = exponential_pdf (X ,3); Z = exponential_cdf (X ,3); hold on ; plot (X ,Y , ’b ’); plot (X ,Z , ’r ’); hold off ; Median = exponential_inv (0.5 ,3)
% Chybi strednik
Výsledek: e0,5 = 2, 0794 X
10
Vygenerujte 10 000 hodnot veličiny X1 , která má spojité rovnoměrné rozdělení od 2 do 5. Totéž proveďte pro veličiny X2 až X20 . P20 Získejte 10 000 hodnot Z = i=1 Xi . Vykreslete histogram veličiny Z s 50 sloupci.
Máme na výběr funkci „rand” nebo „uniform_rnd” z balíčku.
X = uniform_rnd (2 ,5 ,20 ,10000);
% Nahodne cislo od 2 do 5 %20 radku , 10000 hodnot % pro kazdou velicinu jeden
Z = zeros (1 ,10000); for i =1:20 Z = Z + X (i ,:); end ; hist ( Z ); Výsledek: Opět hezká ilustrace Centrální limitní věty.
Inteligenční qvocient je definován tak, aby měl normální rozdělení N (100, 225). Vykreslete pravděpodobnostní funkci od 50 do 150 a spočtěte pravděpodobnost, že náhodně vybraný člověk bude mít IQ větší než 140.
Distribuční funkce nám dá pravděpodobnost, že IQ bude menší než 140. Zbytek do 1 je hledaná hodnota.
11
X =50:0.01:150; Y = normal_pdf (X ,100 ,225); plot (X , Y ); XX =140; YY = normal_cdf ( XX ,100 ,225); Pravdepodobnost =1 - YY
% Bez stredniku
Výsledek: Pravděpodobnost, že náhodně vybraný člověk bude mít IQ větší než 140, je 0,0038.
Hmotnost dospělých žen kmene Navaho má normální rozdělení N (58, 127). Jaká je pravděpodobnost, že náhodně vybraná žena bude mít 1. hmotnost do 60 kg. 2. hmotnost mezi 50 a 70 kg. 3. hmotnost nad 80 kg. 4. Do jaké hodnoty bude hmotnost 10% nejlehčích navažských žen?
Spočteme distribuční funkci pro dotazované hmotnosti a příslušný kvantil.
Pravdepodobnost1 = normal_cdf (60 ,58 ,127) Pravdepodobnost2 = normal_cdf (70 ,58 ,127) - normal_cdf (50 ,58 ,127) Pravdepodobnost3 =1 - normal_cdf (80 ,58 ,127) Hmotnost4 = normal_inv (0.1 ,58 ,127) Výsledek: 1. 57 % 12
2. 61,8 % 3. 2,6 % 4. 43,6 kg
13