Gyakorló feladatok statisztikai programcsomagokhoz Az elvégzett tesztek eredményeit és azok magyarázatait mentsük el egy valasz.txt, ha ábra is van, a valasz.xls nev¶ fájlba! 1. Nyissuk meg a kolcson.txt-t!
Adjunk becslést a fedezet eloszlására!
Ábrázoljuk
oszlopdiagramon és kördiagramon is! 2. Nyissuk meg az emberek.txt-t! Ábrázoljuk a magasság s¶r¶séghisztogramját! Exportáljuk ki csak a diagramot egy html le-ba! 3. Nyissuk meg az emberek.txt-t! Adjuk meg a testsúly empirikus eloszlásfüggvényét és adjunk becslést is (ábrával) az eloszlásfüggvényre! Adjunk becslést azon jellemz®k (változók) mediánjára, amelyekre lehet! 4. Nyissuk meg az emberek.txt-t! Hozzunk létre egy ttidx változót, amely az emberek testtömegindexét tartalmazza! (testtömegindex: testtömeg osztva a testmagasság 2 négyzetével kg/m ) Hozzunk létre sulykat változót, amely értéke 1, ha sovány (ttidx<20), 2, ha normál testtömeg¶ (ttidx 20 és 25 között) és 3, ha túlsúlyos (ttidx>25)!
Ábrázoljuk oszlopdiagramon az átlag életkorokat a sulykat változó
szerint csoportosítva! 5. Nyissuk meg az emberek.txt-t!
Ábrázoljuk a férak és n®k testmagasságának
mediánjának becslését oszlopdiagramon!
Ábrázoljuk boxploton is a két csoport
testmagasságát! 6. Nyissuk meg a kolcson.txt-t!
Adjunk becslést azon jellemz®k (változók) várható
értékére és szórására, amelyekre lehet! A várható értékekre adjunk 99%-os megbízhatósági szint¶ kondencia-intervallumot is!
A szórás becslése korrigált vagy
korrigálatlan? 7. Nyissuk meg az emberek.txt-t! Hozzunk létre egy új változót, amely az emberek életkorát tartalmazza! Adjuk meg az életkor empirikus várható értékét és az empirikus szórásnégyzetet! 8. Nyissuk meg az emberek.txt-t! becslést az
E(X|Y = 1)
és
Legyen
E(X|Y = 2)
X
a testmagasság,
Y
a nem.
Adjunk
feltételes várható értékekre! Ábrázoljuk
ezeket az értékeket oszlopdiagramon! 9. Nyissuk meg a brain.sav-ot! Teszteljük azt a nullhipotézist, hogy az intelligencia (FSIQ) várható értéke 100. 10. Nyissuk meg a kolcson.txt-t! Teszteljük le azt a nullhipotézist, hogy a 40 év felettiek jövedelme várhatóan 35. Teszteljük le ugyanezt a hipotézist az egész mintán! Szükséges-e, hogy a minta normális eloszlásból származzon? 11. Hogyan valósíthatjuk meg az egyoldali t-próbát SPSS-ben? 12. Nyissuk meg a brain.sav-ot! Teszteljük azt a nullhipotézist, hogy a verbális intelligencia (VIQ) és performációs intelligencia (PIQ) várhatóan nem tér el egymástól! Teszteljük a két változó különbségének várható értékének 0 voltát egymintás tpróbával is és ellen®rizzük, hogy a két eljárás ugyanazt az eredményt adja!
13. Nyissuk meg a brain.sav-ot! Teszteljük azt a nullhipotézist, hogy a férak és n®k intelligenciájának (FSIQ) várható értéke megegyezik. Teszteljük azt a nullhipotézist is, hogy a férak esetén ez a várható érték 5-tel magasabb! Magyarázzuk meg a kapott eredményeket! 14. Nyissuk meg a kolcson.txt-t! Teszteljük, hogy a házasok és nem házasok munkaviszonyának várható értéke nem tér el egymástól! 15. Generáljunk függetlenül két normális eloszlású mintát r1 és r2 néven. Teszteljük várható értékük egyezését páros és kétmintás t-próbával is!
Tudunk-e mondani
valamit arra vonatkozólag, hogy melyik próbát érdemesebb inkább alkalmazni? 16. Nyissuk meg a kolcson.txt-t!
Tegyük fel, hogy a régi és új ügyfelek csoport-
jaiban a jövedelmek normális eloszlásúak.
Teszteljük, hogy a régi és új ügyfelek
jövedelmének szórása nem tér el egymástól! Ez alapján melyik próba alkalmazható a két csoport várható értékének különbségének tesztelésére? 17. Nyissuk meg a kolcson.txt-t!
Feltehetjük, hogy a jövedelem normális eloszlást
követ. Adjunk becslést a legalább 45 évesek és a 45 alattiak várható jövedelmére! Ellen®rizzük azt a nullhipotézist, amely szerint ezek nem térnek el egymástól! Adjunk 95%-os megbízhatósági szint¶ kondencia-intervallumot a két csoport várható jövedelmének különbségére! 18. Nyissuk meg a calc.sav-ot! Itt kalcium hatását vizsgáják a vérnyomásra. A kutató arra kíváncsi, van-e hatása a kezelésnek. Milyen próbákat alkalmazhatunk? Mik az adott próbák feltételei? Írjuk fel a hullhipotézist és az ellenhipotézist is minden esetben! 19. Nyissuk meg a kolcson.txt-t! Teszteljük azt a nullhipotézist, hogy a status mediánja 2! Oldjuk meg a feladatot a binomiális teszt és a Wilcoxon-próba segítségével is! Teljesülnek-e mindkét próba feltételei? 20. Nyissuk meg az emberek.txt-t! Teszteljük azt a nullhipotézist, hogy a magasság alsó kvartilise (0,25-kvantilise) 170 cm! 21. Nyissuk meg a brain.sav-ot! Teszteljük a
H0 : P(P IQ < V IQ) = 1/2
hipotézist!
Miért nem alkalmas a választott teszt a két változó mediánjának egyenl®ségének tesztelésére? 22. Generáljunk egy 100 elem¶
p = 0,4 paraméter¶ Bernoulli eloszlású véletlen mintát!
Teszteljük le, hogy a minta valóban elfogadható-e véletlennek!
Generáljunk egy
olyan változót, amelyben 0-k és 1-esek váltakozva jelennek meg. Teszteljük, hogy ez elfogadható-e véletlen sorozatnak! 23. Nyissuk meg a kolcson.txt-t!
Teszteljük minden intervallumváltozóra azt a null-
hipotézist, hogy normális eloszlású! Milyen próbákat alkalmazhatunk? Magyarázzuk meg az elvégzett próbák eredményeit a Q-Q ábra segítségével! 24. Nyissuk meg a kolcson.txt-t!
Teszteljük azt a nullhipotézist, hogy a különböz®
statuszok azonos valószín¶ség¶ek! Teszteljük azt a nullhipotézist is, hogy a status 1-es értékének valószín¶sége 1/2, a 2-es és 3-as érték pedig 1/4-1/4 valószín¶ség¶!
[0, 1] intervallumon egyenletes eloszlású álvéletlenszámokat! 3 os2 ztópont segítségével χ -próbával teszteljük, elfogadható-e az így kapott minta [0, 1]
25. Hozzunk létre a
intervallumon egyenletes eloszlásúnak! Mely teszteket használhatjuk még a kérdés eldöntésére? 26. Hogyan tesztelhetjük azt a nullhipotézist, hogy egy minta standard normális eloszlásból származik? 27. Nyissuk meg a kolcson.txt-t! Teszteljük azt a nullhipotézist, hogy azok, akik korábban ügyfelek voltak és akik nem voltak (adostip) életkorának eloszlása megegyezik! Mely teszteket használhatjuk a kérdés eldöntésére? 28. Nyissuk meg a kolcson.txt-t! Teszteljük azt a nullhipotézist, hogy azok, akik korábban ügyfelek voltak és akik nem voltak (adostip) családi állapotának eloszlása megegyezik! 29. Készítsünk gyakorisági táblázatot a kolcson.txt adóstípus és a kölcsön típusa vál2 tozók alapján. Végezzük el a χ próbát. Milyen következtetést von le az eredmény alapján 0,05-ös szinten? Mi itt a nullhipotézis és az ellenhipotézis? 30. Nyissuk meg a kolcson.txt-t! Mondhatjuk-e, hogy a statusok eltérnek a régi és új ügyfeleknél? 31. Nyissuk meg a beteg.sav-ot!
A következ® kérdéseket viszgáljuk: Van-e hatása a
kezelésnek a lázra? Egyformán reagálnak-e a kezelésre a férak és a n®k? Mindkét kérdés esetén írjuk fel a nullhipotéziseket, és végezzünk el minden ezekre vonatkozó vizsgálatot, amit lehet! 32. Nyissuk meg a jegyek.txt-t!
A matematika és zika jegyek összehasonlítására
milyen próbákat alkalmazhatunk?
Milyen következtetéseket vonhatunk le ezek
alapján a matematika és zika jegyekr®l 5%-os szinten? 33. Nyissuk meg a kolcson.txt-t! Tegyük fel, hogy a különböz® családi állapotúak csoportjaiban az életkorok normális eloszlásúak. Teszteljük azt a nullhipotézist, hogy a várható életkor megegyezik minden csoportban.
Ha elvetjük a nullhipotézist,
végezzünk kiegészít® vizsgálatot is! 34. Mutassuk be konkrét példán keresztül, hogy a varianciaanalízis a kétmintás t-próba általánosítása (2 csoport esetén ugyanazt az eredményt adják)! 35. Nyissuk meg a kolcson.txt-t!
Feltehetjük, hogy a jövedelem normális eloszlást
követ. Van-e összefüggés a kölcsön típusa és a jövedelem közt? 36. Nyissuk meg a plastic.sav-ot! Teszteljük azt a nullhipotézist, hogy az anyag er®ssége nem függ az önt®ben töltött id®t®l! 37. Nyissuk meg a munka.sav-ot! Írjuk fel a lineáris regressziós modellt! Teljesülnek-e a modell alkalmazhatóságának feltételei? 38. Nyissuk meg az emberek.txt-t! Mely intervallumváltozók között van lineáris kapcsolat (ha normális eloszlásúnak tekinthetjük ®ket)? Adjuk meg a leger®sebb kapcsolathoz tartozó regressziós egyenes paramétereit!
Ábrázoljuk az egyik változót
a másik függvényében, az ábrán tüntessük fel a regressziós egyenest is! becslést a modell segítségével a hiányzó adatokra!
Adjunk
39. Nyissuk meg az emberek.txt-t!
A testtömegindex kvadratikus kapcsolatra utal
a magasság és súly között, adjunk becslést erre a kapcsolatra!
Adjunk becslést
lineáris kapcsolatra is. Melyik esetben kapjuk a jobb becslést legkisebb négyzetes értelemben? 40. Nyissuk meg a chemical.txt-t! Címkézzük fel az x1 változót a tartályok száma, az x2 változót a hajórakomány súlya és az y változót a kirakodás ideje percekben címkékkel! Ábrázoljuk az y értékeit az x1 és x2 függvényében! Adjunk többváltozós regressziós modellt y függ® és x1 és x2 független változókra (regressziós sík)! Mely együtthatók (változók) hagyhatók el a modellb®l? A többváltozós regressziószámításnál a megoldás egyértelm¶ségének feltétele, hogy a független változók lineárisan függetlenek legyenek. Teljesül-e a feltétel? 41. Nyissuk meg a kolcson.txt-t! A változók közül melyek tekinthet®k függetlennek? 42. Nyissuk meg az országok.xls-t!
A Manhattan-távolságot (Minkowski-távolság 1
hatvánnyal) használva a legközelebbi szomszéd módszerével klaszterezzük hierarchikusan az országokat! Olvassuk le a dendrogramról, mely ország alkot ömnagában egyelem¶ klasztert a legtovább! 43. Nyissuk meg a brain.sav-ot!
Csoportosítsuk k-közép módszerrel az embereket
két csoportba FSIQ, VIQ, PIQ, Weight, Height változók alapján!
Adjuk meg a
klaszterközéppontokat! Hány eset tartozik egy-egy klaszterbe? 44. Nyissuk meg a brain.sav-ot! Klaszterezzük hierarchikusan az embereket centroid módszerrel az euklideszi távolságot használva az intervallumváltozók (scale változók) értékei szerint! Legalább mekkora klaszterszám esetén lesz olyan ember, aki önmagában egy klasztert alkot? 45. Nyissuk meg a brain.sav-ot! Redukáljuk az intervallumváltozókat három korrelálatlan változóra és mentsük el a kapott faktorokat! Adjuk meg a faktorok kovarianciamátrixát! 46. Nyissuk meg az autok.sav-ot! A Kaiser-kritériumot használva végezzünk f®faktoranalízist!
Magyarázzuk meg a tapasztalt jelenséget (faktorok száma) az eredeti
változók korrelációs mátrixának segítségével! 47. Nyissuk meg a brain.sav-ot! Az intervallumváltozók alapján (korrelációs mátrixszal számolva) a Kaiser kritériumot használva (legalább 1 sajátértékhez tartozó vektorok kiválasztása) csökkentsük a változók számát! A faktorok segítségével adjuk meg az els® néhány f®komponenst! Hány dimeniósra redukáljuk így a teret? 48. Nyissuk meg a brain.sav-ot! Az intervallumváltozók alapján hozzunk létre 3 faktort! A faktorok értelmezésének könnyítése érdekében alkalmazzunk forgatást, és csoportosítsuk az így kapott faktorok segítségével az eredeti változókat! 49. Nyissuk meg a brain.sav-ot! Határozzuk meg a nemeket elválasztó diszkriminanciafüggvényt (adjuk meg az együtthatókat) az el®z® feladatbeli faktorok által meghatározott térben! Hány esetben hibás az el®rejelzett csoportbatartozás? 50. Nyissuk meg birth.sav-ot!
Egy anya nem adta meg, dohányzik-e!
Adjunk el®re-
jelzést arra, hogy a dohányzók csoportjába tartozik-e! A használt módszer hány esetet klasszikált rosszul?
51. Nyissuk meg a tulelo.sav-ot!
Adjunk becslést a túlélési függvényre!
Mi lenne a
becslés, ha minden esetben a valódi életkor lenne adva? Tudnánk-e becslést adni, ha egy esetben sem valódi életkor lenne adva? 52. Nyissuk meg a Mouse_survival.sav-ot! Adjunk becslést a túlélési függvényre Coxregresszióval!