Vysoká škola Báňská Technická univerzita Ostrava Fakulta elektrotechniky a informatiky
Statistika 1 SEMESTRÁLNÍ PRÁCE Studenti a alkohol
Jméno: Kopecký Ondřej Login:
KOP 205
Skupina:
LB252
Datum: 5.1. 2007
Obsah Úvod:....................................................................................................................................................3 1. Analyzovaná data:............................................................................................................................4 2. Explorační analýza dat:....................................................................................................................5 2.1 Muži................................................................................................................................................5 2.1.1 Rozdělení oblíbenosti piva podle stupně................................................................................5 2.1.2 Rozdělení oblíbenosti piva podle druhu (typu)......................................................................7 2.1.3 Rozdělení oblíbenosti piva podle značky..............................................................................8 2.1.4 Rozdělení podle vypitých piv.................................................................................................8 2.1.5 Rozdělení podle věku............................................................................................................10 2.1.5 Odlehlá pozorování – věk, muži...........................................................................................11 2.2 Ženy..............................................................................................................................................12 2.2.1 Rozdělení oblíbenosti piva podle stupně..............................................................................12 2.2.2 Rozdělení oblíbenosti piva podle druhu (typu).....................................................................13 2.2.3 Rozdělení oblíbenosti piva podle značky.............................................................................14 2.2.4 Rozdělení podle vypitého objemu........................................................................................14 2.2.5 Rozdělení podle vypitých piv...............................................................................................15 2.2.7 Odlehlá pozorování, ženy.....................................................................................................16 2.3 Porovnání mezi muži a ženami.....................................................................................................17 2.3.1 Porovnání oblíbenosti jednotlivých stupňů piv....................................................................17 2.3.2 Porovnání oblíbenosti jednotlivých druhů (typů) piva.........................................................17 2.3.3 Porovnání oblíbenosti jednotlivých značek..........................................................................18 2.3.4 Porovnání věku.....................................................................................................................18 2.3.5 Porovnání vypitých piv.........................................................................................................19 3. Statistická indukce..........................................................................................................................20 3.1 Muži - jednoduchá regrese – řešení závislostí..............................................................................20 3.1.1 Závislost mezi počtem vypitých piv a ročníkem .................................................................20 3.1.2 Závislost mezi počtem vypitých piv a věkem.......................................................................21 3.2 Ženy..............................................................................................................................................22 3.2.1 Závislost mezi počtem vypitých piv a ročníkem .................................................................22 3.2.2 Závislost mezi počtem vypitých piv a věkem.......................................................................23 4. Závěr:..............................................................................................................................................24 Použitá literatura a materiály..............................................................................................................25
Úvod: Vybral jsem si trochu netradiční téma alkoholických nápojů, protože si myslím, že bude velice zajímavé zjistit jak na tom vlastně studenti jsou, jaké mají preference, tzn. kolik toho vypijí, jaké mají rádi značky apod. Vzhledem k tomu, že jedu na víkendovou akci, pořádanou vysokoškolskými studenty, budu mít k tomuto výzkumu výbornou příležitost. Data se pokusím získat pomocí dotazníku. Vybrané osoby oslovím a data za ně doplním. Na akci se chystá přes 100 studentů. Studentů však bylo nakonec poněkud méně a málo z nich bylo ochotno se dělit o tyto informace, byť jsou zpracovány anonymně. Toto se týkalo převážně slečen, které se snažily dost často infomace zkreslovat tím, že uvedly méně než vypily. To samé mi však dělali muži, kteří pro změnu přeháněli. Získaná data tak trpí menším zkreslením, které se pohybuje v rozmezí +,- 2 sklenice piva.
1. Analyzovaná data:
DOTAZNÍK – MUZI Číslo: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
Obecné informace: Věk: Ročník / vzdělání: 22 3 28 5 39 0 21 1 22 1 23 1 24 3 23 0 24 4 22 2 21 1 22 2 24 4 23 3 23 3
Značka: Radegast Plzen Braník Holba Radegast Radegast Plzen Starobrno Plzen Budvar Kozel Kozel Radegast Radegast Primator
Stupňů 12 12 12 12 12 11 12 10 12 11 10 10 12 12 14
Pivní preference: Počet ks běžně za večer Posledne ks: Objem (litr) Preferovaný typ: 5 8 0,5 rezane svetle 6 4 0,5 svetle 4 1 0,5 svetle 7 8 0,5 svetle 2 2 0,5 svetle 6 7 0,5 svetle 5 8 0,5 rezane 8 6 0,5 6 7 0,5 svetle 4 2 0,5 svetle 5 4 0,5 tmave 3 6 0,5 tmave 8 10 0,5 svetle 5 2 0,5 svetle 3 1 0,5 special
DOTAZNÍK – ZENY Číslo: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
Obecné informace: Věk: Ročník / vzdělání: 20 1 26 4 20 1 20 1 22 2 23 2 24 3 23 0 21 1 22 2 21 2 23 3 22 2 24 3 22 1
Značka: Starobrno Ostravar Holba Holba Radegast Radegast Plzen Starobrno Radegast Kozel Radegast Ostravar Ostravar Radegast Radegast
Stupňů 10 14 12 12 12 12 12 10 12 10 12 12 10 12 12
Pivní preference: Počet ks běžně za večer Posledne ks: Objem: ( litr ) 2 0 0,5 3 4 0,3 6 8 0,5 5 7 0,5 2 2 0,5 2 6 0,5 5 5 0,3 8 8 0,5 4 6 0,5 4 3 0,3 3 3 0,5 2 4 0,5 4 3 0,3 3 4 0,5 6 8 0,5
preferovaný typ: svetle special svetle svetle svetle svetle svetle rezane svetle tmave svetle svetle svetle svetle svetle
2. Explorační analýza dat: 2.1 Muži V této části porovnáme a rozebereme základní parametry získaných dat. Nejprve se podívejme na četnosti výskytu dat, tj. kolikrát se daná hodnota vyskytovala v souboru získaných dat.
2.1.1 Rozdělení oblíbenosti piva podle stupně Platí, že čím více chmelového extraktu je v pivu obsaženo, tím více stupňů má. Se zvyšujícím se stupněm se také zvyšuje obsah sladu. Skutečně sladší se ale zdají být spíše více jak 12° piva. Kolikatistupňová piva jsou oblíbenější se dozvíme z následujícího histogramu a koláčového grafu (obr.1 a obr.2).
Obr.1 – Histogram- stupeň piva
Obr.2 – Koláčový graf- stupeň piva
Z výše uvedených grafů vyplývá, že nejvíce je u dotazovaných oblíbená tzv. „dvanáctka“, nebo-li pivo s dvanácti procentním obsahem chmelového extraktu. Tento druh piva je zvláště rozšířen ve velkých městech. Je chuti plnější oproti „slabší desítce“. Obsahuje však více alkoholu než druhá nejoblíbenější desetistupňová piva, ale méně než 14° piva, které tu máme v 7% zastoupení. Jejich oblíbenost je dle mého názoru přímo úměrná rozšířenosti. Nyní si uvědomuji nedostatečnost v mém dotazníku. Zjištěním místa bydliště u dotazovaných by nám mohlo prozradit, zda většina dotazovaných bydlí nebo se vyskytuje v okolí velkých měst, či přímo v nich. Tato skutečnost by nám pak prozradila zda-li je opravdu její oblíbenost přímo úměrná výskytu a rozšířenosti v daném místě. Jedenácti stupňová piva jsou kompromisem mezi 10° a 12° pivy. Nejsou příliš rozšířena, nejsou ale ani takovou vzácností jako piva 14°. Dají se sehnat jak točené tak lahvové. Čtrnáctistupňová piva jsou více méně určena k svátečnímu popíjení. Předurčuje je k tomu vysoký obsah alkoholu v obj., vysoký obsah sladu či jiných sladidel (nejčastěji karamelu u tmavých piv) a neméně i dostupnost vícestupňových speciálů. Dají se sehnat jak točené (v Ostravě například Ostravar Strong a speciál od Budvaru), tak lahvové (např. Primátor Mušketýr, Primátor Weizenbier, apod.). Vícestupňové speciály můžeme potkat i v různých variantách (kvasnicové, nefiltrované, nepasterované- nepasterizace však není výsadou vícestupňových piv, atd.).
Obr.3 – Krabicový graf – stupeň piva
Krabicový graf (obr.3) jsem si nechal jako perličku. Jasně je na něm vidět obliba piv mezi 11° a 12° stupni. Minimum jsou desetistupňová piva a odlehlým pozorováním 14° piva. Odlehlé pozorování bychom za normálních okolností chtěli vypustit, jenže v tomto případě se nejedná o hodnotu rušivou. Poukazuje na fakt, že se nevyrábí piva 13°. Existuje tato stupnice 4°,6°,8°,10°,11°,12°,14°,16°,18°, ale pak až 21° a 24°. Se čtyřmi až osmistupňovými pivy se téměř nesetkáváme. Všimněme si stupňového rozdílu mezi 10°,11°,12° a opět větších skoků (násobků dvou) u více stupňů. Dotazovaní preferovali pouze úzký profil nejrozšířenějších druhů piv. Většího spektra bychom se z největší pravděpodobností dočkali jen dotazováním degustátorů a opravdových znalců piva.
2.1.2 Rozdělení oblíbenosti piva podle druhu (typu) Piva se nerozdělují jen podle stupňů, ale i podle druhů. Pro zjednodušení jsem kategorie rozdělil pouze na světlá, tmavá a speciální. Mezi světlá piva patří všechny běžné výčepní piva (10°, 11°) a ležáky (12°). Není rozdíl jestli čepované nebo lahvové. Tmavá piva jsou převážně dobarvovaná karamelem (např. Krušovice, Zubr...). Jejich výroba je mírně rozdílná od světlých piv (hlavně v použití jiných teplot při zrání). Černá piva byla ještě do konce 2.sv. války v tuzemsku nejoblíbenější, pak se začaly prosazovat světlá piva německého typu a dnes ovládají 90% trhu. Kompromisem a příjemným zpestřením může být kombinace obou druhů- řezané pivo. K řezu nedochází při výrobě, ale až u výčepu. Nakonec jsem všechny jiné druhy (kvasnicové -např. Kvasar od Černé hory, vícestupňové -např. Strong od Ostravaru, pšeničné a další) spojil do jedné kategorie speciál. Tato piva hrála „druhou basu“ vedle dříve oblíbených piv černých. V celé republice existovalo přes 200druhů. Každé město mělo své vytříbené speciály a jejich výrobu si přísně tajily. Historické kořeny můžeme dohledat k dobám kdy ke každému městu patřil měšťanský pivovar a sládci byli váženými měšťany. Jaká je tedy situace dnes? Která piva jsou nejoblíbenější? To nám názorně ukáže následující histogram (obr.4) a koláčový graf (obr.5).
Obr.4 – Histogram – druh piva
Obr.5 – Koláčový graf – druh piva
Jak vidíme, opravdu jsou nejoblíbenější světlá piva, což jde nejlépe vidět na histogramu. 66% není již zmiňovaných devadesát a to nejspíš z toho důvodu, že celkové výsledky vycházejí z prodeje všech piv v tuzemsku, kdežto mé údaje vychází jen z malého počtu respondentů. Druhé místo obsadily řezané a tmavé piva a jen malé procento studentů pije speciály. Znovu bych vysvětlení viděl převážně v rozšířenosti světlých piv. Osobně neznám žádnou hospodu v Ostravě, která by čepovala více druhů piv, protože úspěchem je už najít alespoň jednu, která má v nabídce černé pivo. Může to být také tím, že Moravskoslezskému kraji kralují dvě značky a to Radegast a Ostravar. Ani jedna nemá ve standardní nabídce speciální piva. Speciály tedy pije jen malé procento „fajnšmejkrů“, kteří si své oblíbené dokáží nalézt.
2.1.3 Rozdělení oblíbenosti piva podle značky A jsme u toho... Kterou značku naši studenti mají nejradši? Budou převažovat piva místní? Nebo jsem oslovil studenty ze všech koutů republiky a „skóre“ bude vyrovnané? Opět histogram (obr.6) a koláčový graf (obr.7).
Obr.6 – Histogram – značka piva
Obr.7 – Koláčový graf – značka piva
Grafy ukazují na vysokou oblíbenost nošovického Radagastu a plzeňského Pilsneru Urquellu. Znovu bych se nebál říct, že jde ruku v ruce s oblíbeností světlých piv. Prvenství Radegastu bych směle přirovnal ke kontumačnímu a geografickému. Myslím si že pořadí by bylo obrácené v případě že bych oslovil studenty z ČVUT. Třetí místo Kozla by mohlo odpovídat oblíbenosti černého a řezaného druhu piva, protože právě Kozel je v Moravskoslezském kraji nejčastěji čepovaným černým pivem. Zbylé značky by mohly specifikovat bydliště nebo jiné preference dotazovaných. Například Holba je nejvíce rozšířena na Jesenicku. Starobrno okolí Olomouce a Brna (včetně). Budvar a Primátor vyrábí hodně speciálních piv a se speciály se můžeme často setkat právě s těmito značkami. Překvapuje mě absence Černé hory jakožto specialistu na vícedruhové piva.
2.1.4 Rozdělení podle vypitých piv Podíváme se na to, kolik respondenti uvedli že vypijí za večer a kolik naposled. Výsledky porovnáme (statistickým porovnáním závislosti mezi oběma hodnotami se budu věnovat dále v kapitolách 3.x). Hodnoty obvykle a posledně se na první pohled liší. Obvykle muži vypijí 4-6 piv, kdežto naposled si pamatují že vypili 5-7piv. Hodně mužů uvedlo vypití do dvou piv na poslední akci, ale obvykle jich je 2-4 či 6-8. V představách o vypitém objemu se muži příliš nemýlí a ani neuvádí nepravdivé údaje. Těch 5-6 piv ví, že obvykle vypijí a také že jo... Zdá se vám to hodně? Přesnější by bylo, kdybych tyto
Obr.8 – Histogram- obvyklý počet vypitých piv
Obr.9 – Histogram- počet piv vypitých naposled
hodnoty rozdělil na obvyklý počet 10° a 12°, protože je jasné, že 10° piv se kvůli nižšímu obsahu alkoholu dá vypít více než 12° piv. Ovšem není tomu tak. Jestliže vedle sebe posadíme dva konzumenty, jednoho zvyklého na desítky a jednoho na dvanáctky, vypijí zhruba stejně, protože každý z nich je zvyklý na to svoje. Toto je zkušenost nejen má.
Obr. Histografické porovnání obyklého množství vypitých piv a posledně vypitého množství
Použití názornějšího srovnání v jednom grafu je nasnadě. Spodní část vyjadřuje posledně vypitá piva, horní obvykle.
Obr. Krabicový graf - porovnání obyklého množství vypitých piv a posledně vypitého množství
Podobně využijeme srovnání dvou hodnot tentokrát krabicovými grafy. Pod sebou je lze lépe porovnat. Vidíme, že spektrum vypitých piv se rozšířilo pokud jde o akci poslední. Muži přibližně ví, kolik v průměru vypijí.
2.1.5 Rozdělení podle věku Věkové rozložení studentů mužského pohlaví nám představí následující histogram (obr.10) a krabicový graf (obr.11).
Obr.10 – Histogram – věk, muži
Obr.11 – Krabicový graf – věk,muži
Histogram nám příliš neprozradil, protože jeho „x“ osa nemá dostatečně jemné rozlišení kvůli existenci jednoho či více studentů vyššího věku. Dotazovaní měli tedy převážně 20- 24 let. Krabicový graf je v tomto případě přesnější ve vyjadřování a rovnou z něj můžeme vyčíst, že nejmladší měl 21 let, nejčastěji měli studenti mezi 22- 24 lety, našel se nějaký 28 letý, kterého bychom mohli spolu s 39letým považovat za odlehlé pozorování (tudíž hodnotu, která by nám další rozbory mohla zkreslovat). Na toto podezření se ještě dále znovu podíváme (část 2.1.5).
Porovnejme krabicový graf mužů bez odstraněných vzdálených pozorování (obr.12) a po odstranění (obr.13).
Obr.12 – Krabicový graf- věk s odlehlým pozorováním
Obr.13 – Krabicový graf- věk bez odlehlých pozorování
Nemění se hodnoty, jen měřítko. Po odstranění jedné odlehlé hodnoty se nám stále jako odlehlá nabízí ta s 28letým studentem. Dále viz následující kapitola.
2.1.5 Odlehlá pozorování – věk, muži V předchozích podkapitolách jsme narazili na menší problém v podobě odlehlých pozorování. Jediné hodnoty ze všech zkoumaných, u kterých má smysl odlehlá pozorování hledat a odstraňovat, je věk. Pokud bychom hodnoty odlehlých pozorování ponechali, mohlo by při dalších rozborech dojít k rozmazání či zkreslení výsledků. Jestliže budeme třeba sledovat závislost mezi věkem a počtem vypitých piv (další kapitoly 3.x.x), student který má 39 let by nám rozmazal sledované spektrum dalších 13 studentů, v rozmezí 20-24 let. Proč? Student čtyřicátník je příliš vzdálen věkem od nejpočetnější skupiny respondentů a abychom danou závislost mezi věkem a počtem vypitých piv našli (při ponechání odlehlých pozorování), museli bychom zjistit tuto závislost pro dalších x lidí ve věku mezi 24-39 lety. Pro zajímavost jsem v dalších kapitolách porovnal výsledky s odlehlými pozorováními i bez nich. Pro nalezení těchto abnormalit slouží funkce ve Statgraphicsu „Outlier identification“. Co nám tedy Statgraphics nalezl?
Obr.14 – Odlehlá pozorování, muži
Obr.15 – Tabulka odlehlá pozorování, muži
Z obr.10 vidíme naprosto jasně že jsou zde dvě hodnoty, které se poněkud vzdalují hlavní linii hodnot (okolo nuly, dle označení y-osy, popisky napravo, což je 0-4 * směrodatná odchylka). Avšak pouze jediná hodnota je vzdálena více než třínásobek směrodatné odchylky, což ji identifikuje jako odlehlé pozorování. Tento fakt nám potvrzuje i tabulka (obr.15). Pro lepší přehlednost jsem zakroužkoval hodnotu označenou Statgraphicsem jako odlehlé pozorování.
Na obr.16, tedy krabicovém grafu, lze odlehlé pozorování jasně vidět. Pro jednodušší nalezení a zvýraznění jsem jej zakroužkoval. Obr.16 – Krabicový graf – odlehlá pozorování, muži
2.2 Ženy Nyní nás čeká rozebrání základních dat pro ženskou část populace. Vzhledem k tomu, že jsem se u mužů rozepsal a všechny podrobnosti uvedl k nim, zde se budu zabývat již pouze rozebráním výsledků. Porovnání s muži se bude věnovat samostatná kapitola.
2.2.1 Rozdělení oblíbenosti piva podle stupně
Obr.17 – Histogram – stupeň piva
Obr.18 – Koláčový graf – stupeň piva
Ženy jasně preferují 12° piva. Tento poznatek je pro mne poněkud překvapující. Vždyť takto silné pivo s nimi musí docela „zamávat“. Pijí ho tedy méně? Méně kusů, nebo preferují převážně „malá“ piva? Nechme se překvapit, třeba na to přijdeme v některé z dalších kapitol. Jedním z prvních důvodů, které mě hned napadnou, je již dříve zmíněná vyšší sladovost, jenže pokud by záviselo na ní, preferovaly by ženy piva tmavá, řezaná nebo speciální. Tmavá piva jsou 10°, či 11° a speciální (například sladší a krémovější kvasnicová piva) zase více než 12°, o pivech s lavinovým efektem, které jsou taktéž většinou méně hořká (např. Maestro, Velvet) nemluvě, protože ty se dělají jen v 11° variantě. Všimněme si, že na rozdíl od mužů ani jediná žena neuvedla vícestupňové pivo jako své oblíbené. Dalším důvodem může být stále zmiňovaná rozšířenost hlavně 12° piv (toto se týká Ostravy). Hlavním důvodem ale nejspíš bude v dnešní době velmi nízká chuťová kvalita 10° piv, která platí daň za rychlou produkci (piva nestačí zrát a jejich zrání je různými způsoby urychlováno). Tudíž ženám „hořká a odbytá“ desítka nechutná a uchylují se k pití 12° „kousků“. Ženy věčně bojují se svou váhou (ať už pomyslnou nebo reálnou) a 12° piva jim kvůli své kaloričnosti rozhodně na kráse nepřidají... Nechme soudů, třeba to vědí:)
Krabicový graf je už jen takovým zpestřením. Minimum ukazuje správně na 10°, maximum taktéž. Žádná odlehlá pozorování se nekonají a zjišťování mediánu je v případě přesně definované stupnice piv bezpředmětné. Jeho vypovídací hodnota je nízká, přesto kdybychom z něj chtěli něco vyčíst, pak je to soubor hodnot začínajících přibližně na 11°, končící maximem. Piva nabývající ve stupních těchto hodnot budou ženám lahodit. Obr.19 – Krabicový graf- stupeň piva
2.2.2 Rozdělení oblíbenosti piva podle druhu (typu) Takže jak to tedy je? Mají rády 12° piva, ale jestli uvedou jako nejoblíbenější piva tmavého typu, budou si protiřečit. Nechť promluví histogram a koláčový graf.
Obr.20 – Histogram- typ piva
Obr.21 – Koláčový graf- typ piva
Teď už je jasné, že ženy nelhaly a neprotiřečily si. Dotazované studentky nejsou ani v nejmenším mlsné jazýčky. Naprosto jasně se ukazuje, že preferují světlý typ piva. Tmavé, řezané i speciální typy piva jsou hluboce utopeny v řece světlých piv. Je to překvapivé zjištění.
2.2.3 Rozdělení oblíbenosti piva podle značky Opět se dostáváme k tomu nejzajímavějšímu. Co nám řekne histogram a koláčový graf?
Obr.22 – Histogram- značka piva
Obr.23 – Koláčový graf- značka piva
Radegast vítězí na celé čáře (znovu bych zmínil souvislost s 12° pivem a Ostravou), na druhém místě Ostravar, jehož druhé místo je vzhledem k původu piva nepochopitelným (z hlediska četnosti výskytu a chuti už je to pochopitelnější). Starobrno a Holba svorně na třetím místě a tentokrát bych teorii domova (respondentů) zdůraznil. Holba – Jesenicko, Starobrno – jižní Morava, popř. Olomoucký kraj. Většinu respondentek jsem neznal, ale hodně mých známých ženského pohlaví z Ostravy pochází právě z těchto končin. Na jejich preferencích jsem pak založil svou teorii.
2.2.4 Rozdělení podle vypitého objemu Ani jeden dotazovaný muž nepije „malé“ piva, proto je tato kapitola věnována pouze ženám. Histogram a koláčový graf napoví více.
Obr.24 – Histogram- objem sklenice
Obr.25 – Koláčový graf- objem sklenice
Histogram (obr.24) napovídá, že 11 piv z 15 vypitých jsou „velké“, tedy o objemu sklenice 0,5l. I koláčový graf (obr.25) naznačuje velikou převahu vypitých „půllitrů“ oproti „třetinkám“.
2.2.5 Rozdělení podle vypitých piv Podíváme se na to, kolik respondentky uvedly že vypijí za večer a kolik naposled. Výsledky porovnáme (statistickým porovnáním závislosti mezi oběma hodnotami se budu věnovat dále v kapitolách 3.x).
Obr. 26 – Histogram- počet vypitých piv obvykle, ženy
Obr.27 – Histogram – počet vypitých piv posledně, ženy
Porovnáme-li jednotlivé histogramy, už je nám na první pohled jasný rozdíl. Ženy uvedly, že obvykle vypijí piv méně než jich naposledy vypily. Mezi dvěma až pěti pivy se sice shodují, ale jinak buď nedokáží přesně odhadnout, kolik běžně vypijí nebo nechtějí, nebo měly posledně všechny dámskou jízdu. Vzhledem k vysokému počtu piv bych se nedivil, kdyby spíše informace o počtu vypitých kousků schválně snižovaly.
Obr.28 – Krabicový graf – obvyklý počet vypitých piv, ženy
Obr.29 – Krabicový graf – posledně vypito, ženy
Krabicové grafy (obr.28,29) jsou už jen lepším grafickým srovnáním. Posuďte sami o kolik se posunulo spektrum vypitých piv směrem doprava, tedy k vyšším hodnotám. Zajímavé je, že průměrně jsou to stále 4 piva, které ženy vypijí. Kdybychom chtěli tyto naměřené hodnoty srovnat s lékařskými doporučeními, pak ženy překračují o 3 piva MDDD (Maximální Doporučenou Denní Dávku).
2.2.6 Rozdělení podle věku
Obr.30 – Histogram- věk, ženy
Obr.31 – Krabicový graf- věk, ženy
Nejpočetnější skupinou jsou přibližně 20- 22 leté studentky. Porovnáme- li to s muži, měl jsem si dávat větší pozor při výběru respondentů, ať mám alespoň přibližně stejně početné skupiny. Krabicový graf jasně naznačuje která skupina, přesně, je nejpočetnější (ženy ve věku 21 – 23 let) a nenalézáme v něm žádná odlehlá pozorování.
2.2.7 Odlehlá pozorování, ženy Pro jistotu jsem i ženy otestoval na odlehlá pozorování přímo funkcí k tomu určenou v programu Statgraphics.
Obr.32 – Odlehlá pozorování, ženy
Ani z tabulky ani z krabicového grafu nemáme žádné podezření na vzdálené pozorování. Prozkoumáme-li tento graf, můžeme si všimnout jediné hodnoty, která výrazněji uniká od ostatních a je těsně nad linií +2 * směrodatná odchylka. Program ji však jako vzdálené pozorování neidentifikoval, protože by musela překročit hodnotu 3 * sm. odch. Tuto hodnotu ponecháme na svém místě a budeme s ní nadále počítat.
2.3 Porovnání mezi muži a ženami V této části porovnáme jednotlivé kategorie mezi muži a ženami. Nejzajímavější bude jistě srovnání počtu vypitých piv (kdopak víc pije?:) Někdy použiji k porovnání raději histogram někdy koláčový graf a to podle toho, kde se zrovna budou víc hodit.
2.3.1 Porovnání oblíbenosti jednotlivých stupňů piv
Obr.33 – Histogram- stupeň piva, muži
Obr.34 – Histogram- stupeň piva, ženy
Zde není příliš co porovnávat. U obou pohlaví vítězí 12° piva. Někteří muži si ještě navíc oblíbili 14° pivní speciály. Muži neopovrhují 10° ani 11° pivem a častěji jej uvedli jako své oblíbené oproti ženám, které mají stejně jako muži oblíbené jen 10° pivo. Z patnácti vypitých připadají tři z nich na 10°. O 11° příliš zájem nemají, nebo o něm neví. Poměr 12° ku ostatním je vyšší u žen. Dá se tedy tvrdit, že ženy mají 12° pivo ještě raději než muži.
2.3.2 Porovnání oblíbenosti jednotlivých druhů (typů) piva
Obr.35 – Koláčový graf- typ piva, muži
Obr.36 – Koláčový graf- typ piva, ženy
Zde je opravdové překvapení. Muži v porovnání s ženami uvedli vyšší oblibu tmavých piv, pod které spadají i řezané. Buďto se se zvyšující se cenou stávají z mužů labužníci, nebo se zženšťují a přebírají chutě po ženách. Ženy pak přesně naopak zmužněly a raději než riskovat sáhnou po osvědčené dvanáctce. Možná je v tom ale jen ženská důmyslnost. Osobně bych očekával grafy přesně opačně.
2.3.3 Porovnání oblíbenosti jednotlivých značek
Obr.37 – Histogram- značky piv, muži
Obr.38– Histogram- značky piv, ženy
Radegast vítězí u obou pohlaví. Muži uvedli více značek než ženy. Plzeň je u mužů oblíbenější než u žen a vzhledem k tomu, že muži více pijí černá piva tak je i Kozel u mužů úspěšnější než-li u žen. Zaráží mě naprostá absence Ostravaru u mužů. Zřejmě jsem oslovil spíše „přespolňáky“, tedy ne Ostraváky.
2.3.4 Porovnání věku
Obr.39 – Krabicový graf- věk, muži
Obr.40 – Krabicový graf- věk, ženy
U mužů jsem použil data bez odlehlých pozorování, ať máme data pěkně přehledná. Je vidět moje nevšímavost k správnému věkovému rozložení, kde jsem více hleděl na další data než na věk. Nejmladší muž má 21 let, kdežto žena 20. Hlavní věková skladba u mužů je posunuta doprava od žen tedy od 22 do 24 let, kdežto ženy mi odpovídaly převážně mladší a to od 21 do 23 let. Uvidíme, zda se nám to nějak promítne do výsledků v dalších kapitolách mé práce.
2.3.5 Porovnání vypitých piv Vypijí více muži nebo ženy? Kdo má větší přehled o tom kolik vypije? Více následující histogramy a krabicové grafy.
Obr. Histogram – porovnání mezi obvykle a posledně, muži
Obr. Histogram – porovnání mezi obvykle a posledně, ženy
V přímém porovnání žasnu. Muži jsou vesměs přesní ve znalosti své průměrné spotřeby. Nadhodnocují ale obvyklé čísla. Ženy mají histogram vyrovnaný. Jsou si přibližně vědomy kolik vypijí a také tolik vypijí, větší počty vypitých piv, však nepřiznávají a možná záměrně tají.
Obr. Krabicový graf - porovnání mezi obvykle a posledně, muži
Obr. Krabicový graf – porovnání mezi obvykle a posledně, ženy
Krabicové grafy nám umožňují lépe prozkoumat posuvy zkoumaných spekter a jejich vzájemným porovnáním zjišťujeme u mužů větší rozptyl počtu vypitých piv posledně, ale přibližně stejnou průměrnou hodnotu. U žen je patrný posuv celého spektra doprava.
3. Statistická indukce 3.1 Muži - jednoduchá regrese – řešení závislostí V této části nalezneme konečné odpovědi na otázky, které nám v počátku práce vrtaly hlavou a nad kterými jsem spíše polemizoval. Nacházíme se v kapitolách zabývajících se pokročilou statistikou.
3.1.1 Závislost mezi počtem vypitých piv a ročníkem
Obr.41 – Simple regression – souvislost mezi ročníkem a poč. piv, muži
Graf jednoduché regrese (obr.41) by snad nějakou závislost naznačoval. Vyplývá z něj přibližně fakt, že studenti nižších ročníků pijí více, okolo třetího ročníku (tedy bakalářských zkoušek) studenti spotřebu zredukují a hodnoty by se měly dle zúžených mezí ustálit okolo pěti piv. Od třetího ročníku se meze opět rozjíždějí a počet vypitých je různorodější. Ačkoliv nám stále modrá naznačuje nepatrný růst v celém průběhu studia, děje se tak jen v řádu desetin.
Obr.42 – Tabulka ANOVA
Z tabulky ovšem jasně vyplývá nezávislost našich dvou zkoumaných hodnot. Statgraphics vypočítal hodnotu P-value, která vyjadřuje míru závislosti dvou zkoumaných hodnot. Vyjde-li číslo vyšší než 0,05 , můžeme s 95% pravděpodobností tvrdit, že mezi těmito dvěma hodnotami neexistuje žádná závislost. Nám vyšlo velmi vysoké číslo.
3.1.2 Závislost mezi počtem vypitých piv a věkem
Porovnejme nejprve tyto dva grafy. Obr.43 je zatížen chybou ze vzdáleného pozorování, kdežto obrázek 44 není. Vidíte rozdíl? (najděte alespoň 2 :) Závislost počítaná z prvního obrázku nebere příliš v úvahu studenty nižšího věku i když na druhou stranu na něm můžeme sledovat vyváženost a spíše klesající tendece spotřeby piv. Jenže jak můžeme vědět, že hodnoty odpovídají pravdě a že by opravdu lidé „seděli“ na vypočtenou regresi? Nemůžeme. Proto je vypovídací hodnota naprosto nicotná.
Obr.43 – Simple regression, počet vypitých piv na věk, muži
Obr.44 – Simple regression, počet piv na věk, bez odlehlých pozorování, muži
Z obr.44 můžeme vyčíst stoupající tendence počtu vypitých piv a to dokonce větší než nám vyšlo u porovnávání s ročníkem. Ale i tak nese tento graf s předcházejícím porovnáváním (obr.41) podobné znaky. Ve věku kdy skládá student bakalářské zkoušky, ustálí se jeho spotřeba na pěti pivech, v nižším věku pije přibližně stejně ale spektrum počtu vypitých piv se různí a stejně tak v pozdějším věku. Jak vidíme, je to pouze předpověď, protože program neměl k dispozici žádné údaje.
Obr.45 – Tabulka ANOVA, s odlehlým pozorováním
Obr.46 – Tabulka ANOVA, bez odlehlých pozorování
Porovnáním P- value obou tabulek zjistíme obrovský skok v hodnotě ošetřené od vzdáleného pozorování. Přesto ani jedna nesplňuje podmínku 0,05 , abychom mohli prohlásit, že závislost existuje.
3.2 Ženy 3.2.1 Závislost mezi počtem vypitých piv a ročníkem
Obr. 47 – Simple regression, závislost mezi vypitými pivy a ročníkem
Je jasně naznačená klesající tendence. Zřejmě si ženy více uvědomují obtížnost bakalářských zkoušek, možná stárnutím raději sáhnou po nealku, možná po víně (to by bylo zajímavé zjistit). Spektrum vypitých piv není příliš rozkolísané po celý čas.
Obr. 48 – Tabulka ANOVA, poč. vypitých piv s ročníkem, ženy
P- value je nižší než 0,05 a proto můžeme s 95% pravděpodobností tvrdit, že existuje závislost mezi počtem vypitých piv a ročníkem.
Obr.49 – Výpis ze statgraphics , potvrzená závislost, důležité pasáže jsou zvýrazněny
3.2.2 Závislost mezi počtem vypitých piv a věkem
Obr.50 – Simple regression, závislost mezi pivem a věkem, ženy
Opět klesající tendence, ne však tak výrazná jako u porovnávání s ročníkem. Zpočátku velký rozptyl vypitých kusů piv, v období bakalářských zkoušek útlum a urovnání na cca 4 pivech, opětovný rozptyl ve vyšším věku.
Závislost tentokrát nebyla nalezena, P-Value přesahuje o řád hodnotu 0,05. S 95% pravděpodobností můžeme tvrdit že souvislost s věkem neexistuje.
4. Závěr: Zkoumal jsem a vyhodnocoval ze všech možných úhlů. Snažil jsem se o věrné popsání skutečnosti. Jestli jsem uspěl, jste mohli posoudit sami.
Zjistil jsem tedy následující poznatky. U obou pohlaví boduje 12° pivo. Muži si více vybírají a hledají i nepříliš rozšířené produkty. Ženy si nevybírají a o speciální piva neprojevily mé respondentky zájem. Ani se nepotvrdila fáma, že by ženy více pily tmavé pivo než světlé, naopak jej spíše pijí muži. Nedávají mu ale přednost před světlým. Ženy pijí spíše z půllitrů, ale najde se i pár žen, které raději malé pivo. Muži malá piva nepijí vůbec. Objevil jsem pouze jedinou závislost mezi dvěma hodnotami (jedné dvojice ze zkoumaných čtyř - suma obou pohlaví) a to souvislost s počtem vypitých piv a studovaným ročníkem. Tato závislost se potvrdila pouze u žen. Všechny grafy zkoumaných dvojic měly nějakou vypovídací hodnotu. Zjistili jsme tak, že v období bakalářských zkoušek se počet piv ustálí na přibližně pěti u mužů a čtyřech u žen. Celková tendence vypitých piv je u mužů stoupající a u žen klesající.
Použitá literatura a materiály –
návod k použití programu Statgraphics, autorka Lenka Šimonová
–
skripta do předmětu Statistika 1, autorka Martina Litschmannová
–
www.svetpiva.cz