Véletlenszám-generátorok 1. Lineáris kongruencia generátor megvalósítása: (a) Készítsen lineáris kongruencia generátort az (a, c, m, x0 ) = (5, 3, 65536, 21159) paraméterekkel, rnd_lcg néven. (b) Nyomtasson ki 20 értéket. A függvény neve print_lcg_results legyen. (c) Ossza fel a [0..65536] intervallumot 32 részre és számolja össze, hogy 100 000 véletlen értékből mennyi esik az egyes intervallumokba. (Körülbelül 31xx.) Legyen a függvény neve test_lcg 2. Binomiális eloszlás-generátor megvalósítása: (a) bincoeff( int n, int k ) néven írjon az hatót megvalósító függvényt!
n k
binomiális együtt-
(b) binomial( int n, float p ) néven kódolja le a binomiális eloszlás-generátort. (Egy n + 2 elemű vec vektort osszon fel az n k p (1 − p)n−k k eloszlásnak megfelelően, majd egy generált véletlen számról döntse el, hogy melyik részintervallumba esik az n + 1-ből. Ez lesz a kimenet.) (c) Generáljon 100 000 elemű mintát az n = 10, p = .5 paraméterek mellett, és nézze meg, hány darab 0, 1, . . . , 10 érték lesz. (d) Generáljon egy 100 elemű mintát a binomial segítségével n = 10, p = .5 paraméterek mellett (Windows alatt az output ablak rendszermenüjéből a Mark menüpont elérhető a minta kimásolásához). Ezt másolja be az SPSS-be, és készítsen hozzá gyakorisági hisztogramot! (Tüntesse fel a haranggörbét is.) (e) A generátor megfelelőségének ellenőrzése. Generáljon B(10, 0.5) eloszlású mintát SPSS-ben. A sajátjának és ennek a különbségét képezze egy harmadik SUBS nevű változóban, majd készítse el ennek gyakorisági diagramját! Ellenőrizze azt a hipotézist, hogy SUBS normális eloszlású.
Paraméteres próbák 1. t-próba: (a) Egy áruház arra gyanakszik, hogy az egyik beszállítója kevesebb lisztet tölt a 100 kg-os zsákokba. A megadott (liszt.txt nevű) fájlban az ellenőrzés során kapott zsáktömegeket találja. Döntse el 90%-os szinten, hogy megalapozott-e a gyanú. 1
(b) Öt gépsoron gyártanak csavarokat. A csavarok tervrajzi átmérője 20 mm ± 0.1 mm. A gyártás során véletlen időközönként kiválasztanak egy-egy alkatrészt, és feljegyzik ezek átmérőjét és a gyártósor számát. A rendelkezésre álló adatok alapján 99%-os szinten döntse el, hogy van-e szükség utánállításra vagy a gépek helyesen működnek. Ha utánállítás szükséges, a gyártósorok sorszámát adja meg! (Az adatokat a csavar.sav SPSS-fájlban találja.) (c) Az előző feladat adatsorában válogassa ki a selejtes csavarokat. (d) Gyógyszerkísérletben két fájdalomcsillapító (X és Y ) hatását mérik 9-9 betegen. A fájdalom megszűnésének időpontjáig eltelt időtartamokat feljegyzik (percben mérve): X : 30, 32, 15, 54, 28, 25, 40, 26, 20, Y : 33, 35, 28, 40, 29, 30, 38, 34, 30. Kérdés: van-e lényeges különbség a két gyógyszer hatása között? Legyen a döntési szint 99%. (e) Futók egy csoportjának újfajta felszerelést adtak. A csapat szeretné tudni, hogy van-e jelentős eltérés az eredményességükben, ezért a csoport másik része a régi felszereléssel versenyez. Az alábbi adatokat összehasonlítva döntse el, hogy szignifikáns javulást eredményez-e a felszerelés használata. (Legyen a döntési szint 90%.) Új: 12.45, 12.37, 11.57, 11.59, 12.13, 12.25, Régi: 12.23, 12.44, 12.51, 11.58, 12.36, 12.26, 12.45, 12.33. (Az adatok a futok.sav SPSS-fájlban is megtalálhatóak.) 2. F -próba: (a) Két automata gépsor tölt egy kilogrammos zacskókat. Ellenőrizzük, hogy a töltőtömeg körüli természetes ingadozás ugyanaz-e a két gépen. (Az adatok a tolt.sav fájlban találhatóak. Legyen a döntési szint 90%.) 3. χ2 -próba: (a) A fenti gépsorokon gyártott terméket akkor tekinthetjük elfogadhatónak, ha a tényleges tömege nem tér el túlságosan a névlegestől, azaz ha a szórás nem nagy. Döntsük el az adatok alapján, hogy a tényleges szórás 5 gramm alatt van-e. (Legyen a döntési szint 90%.)
Nemparaméteres próbák 1. χ2 -próba (illeszkedésvizsgálat):
2
(a) Egy dobókocka szabályosságáról kell döntenünk. A kockát 184 alkalommal dobtuk fel, és rendre a következő gyakoriságokat kaptuk: 1 : 26;
2 : 31;
3 : 31;
4 : 29;
5 : 37;
2 : 30.
Döntsük el 90%-os szinten, hogy a kocka szabályosnak tekinthető-e! (b) Egy benzinkút forgalomszámlálást végez. A vezetés arra kíváncsi, hogy vajon minden nap (hétfőtől vasárnapig) ugyanannyi vevője vane. Azt is szeretnék tudni, hogy vajon van-e különbség a hétvégék és hétköznapok között. Az autósok száma hétfőtől vasárnapig rendre 78, 90, 94, 89, 110, 84, 44. (c) Emberek testmagasságát jegyezték fel: Testmagasság (cm) -156 157-162 163-168 169-174 175-180 181-186 187-192 193-198 199-
Gyakoriság 1 3 36 84 132 98 40 5 1
Elfogadhatjuk-e 90%-os szinten, hogy ez a minta m = 177.5 cm várható értékű σ = 6 szórású normális eloszlásból jön? Az adatok és az előbbi paraméterű normális eloszlás értékei a magassag.sav fájlban találhatók. 2. χ2 -próba (függetlenségvizsgálat): (a) Függetlennek tekinthető-e a szem- és a hajszín az alábbi gyakorisági táblázatban szereplő adatok alapján? P szőke haj barna haj fekete haj kék szem 42 28 3 73 barna szem 17 89 21 127 P 59 117 24 200 (b) Egy gyógyszerhatékonysági vizsgálat után az orvosok arra gyanakodtak, hogy a különböző nemű páciensek nemüktől nem függetlenül kaptak placebot és hatóanyaggal rendelkező gyógyszert. Vizsgáljuk meg a gyanút az alábbi adatok ismeretében: Férfiak Nők
Placebo 3 12
Hatóanyaggal rendelkező gyógyszer 9 7 3
3. χ2 -próba (homogenitásvizsgálat): (a) Két gépsor gyárt ugyanolyan tengelyeket. A gépsorok tipikusan három gyártási hibát “követnek el”: nem megfelelő hossz, átmérő és felületi minőség. Döntsük el az alábbi adatok alapján, hogy a gépsorok ugyanolyan arányban készítenek-e ugyanolyan hibájú alkatrészeket! (Vagy van-e típushiba az egyes gépsorokon.) hosszhiba 15 17 32
1. gépsor 2. gépsor P
átmérőhiba 11 29 40
P
felületi minőség hibája 32 21 53
58 67 125
4. Egymintás előjelpróba: (a) Egy 50 pontos teszt során nyert pontszámokra a következők adódtak: 3, 4, 4, 10, 10, 11, 13 18, 19, 21, 21, 23, 23, 24, 25, 25, 27, 33, 37, 40, 40, 41, 45, 49. Jó becslés-e a mediánra a µ0 = 25? Próbálja ki a µ0 = 22 értéket is! (b) Egy távközlési cég újfajta számla-formátumot vezet be. Kíváncsiak arra, hogy az ügyfelek mennyire elégedettek az új formátummal, ezért felkérnek 50 ügyfelet, hogy válaszoljanak 1-től 5-ig terjedő skálán a következő kérdésre: mennyire elégedettek az új számlával és mennyire felelt meg számukra a régi? Ezek alapján döntse el α = 10%-os szinten, hogy sikeres-e az új formátum! (A válaszok ügyfelenként párosítva a szamla.sav fájlban találhatók. (c) Igazolja, hogy az előző feladat nem oldható meg t-próba segítségével! (Ehhez azt kell látni, hogy a párosított mintaelemek különbsége nem normális eloszlású.) 5. Kétmintás előjelpróba és Wilcoxon-féle rangösszegpróba (a) Egy sportszergyártó cég a legújabb gerely alkalmasságát teszteli. 8 gerelyhajító által elért eredmények a régi és új gerelyekkel az alábbiak:
régi új
1 84.33 79.86
2 78.56 81.42
3 82.44 83.39
4 76.44 79.31
5 80.11 86.42
6 81.31 81.11
7 79.99 79.29
8 81.43 85.39
Vizsgáljuk meg α = 0.1 szinten, hogy van-e különbség a két gerely között. 6. Független mintás próbák (Wald-Wolfowitz- és Mann-Whitney próba) 4
(a) Vizsgálja meg, hogy a legelső feladatban leprogramozott lineáris kongruencia-generátor által adott “véletlen számok” átmennek-e a WaldWolfowitz próbán! Használjon 300 elemű mintát. (Egy generált minta a randomnumbers.sav fájlban található.) (b) Vizsgálja meg, hogy a közel azonos népességű Cseh- és Magyarországnak települései népességszáma ugyanolyan eloszlást követ-e! Ehhez használja a honlapon szereplő, Cseh Statisztikai Hivatal és KSH adatait. (c) Vesse össze az előző adatokat vizuálisan, hisztogramok segítségével is. 7. Kolmogorov-Szmirnov-féle próbák (a) Az Országos Meteorológiai Szolgálat debreceni mérőállomása által 1961 és 1990 között összegyűjtött adatok alapján a havi átlagos csapadékmennyiség az alábbiak szerint alakult (milliméterben): I 37
II 30
III 34
IV 42
V 59
VI 80
VII 65
VIII 61
IX 38
X 31
XI 45
XII 44
Döntse el, hogy ez egyenletes eloszlásúnak tekinthető-e! (Legyen α = 0.2.) (b) Az előző feladat adatai Szombathelyen a jelzett időszakban így alakultak: I II III IV V VI VII VIII IX X XI XII 29 26 34 40 72 77 78 72 52 48 52 31 Döntse el, hogy a csapadékeloszlások egyforma eloszlásúnak tekinthetők-e a két térségben! (Legyen α = 0.2.) 8. Próbák több eloszlás vizsgálatára (a) Egy cég újonnan felvett munkatársait be szeretné tanítani. Azonban háromféle javasolt tanítási módszer van. El szeretnék dönteni, hogy később melyik mellett maradjanak. Ennek érdekében az új dolgozókat három csoportba sorolják és a három csoportot a három módszerrel tanítják be. Az oktatás végén tesztekkel mérik a teljesítményeket. Feltételezve, hogy a három csoportban az egyes dolgozók közel azonos képességűek (ez könnyen lemérhető), döntse el, hogy van-e különbség az egyes módszerek között. (A pontszamok a tanmodsz.sav fájlban találhatók. A döntési szint legyen α = 0.25.) (b) Egy édességipari cég három édesítőszerrel kísérletezett, melyekből kísérleti személyek segítségével szeretné a végső alapanyagot kiválasztani. Az alanyok elé egy-egy (sorszámozott) terméket tesznek a háromféle adalékanyaggal előállított termékből, melyekre 1-5 skálán osztályzatot kell adniuk. A kísérlet végén döntsük el, hogy van-e lényeges különbség a három ízesítőanyag között. (Az osztályzatok az edesitoszer.sav fájlban találhatók.) 5
(c) Egy cég különféle kedvezménycsomagokat szeretne bevezetni a dolgozók ösztönzésére, de előtte kis körben felméri, hogy melyek a “sikeresebbek”, ezért 12 személlyel felmérést végeztetnek és osztályoztatják az egyes csomagokat. Kérdés, hogy van-e különbség az egyes juttatási módok között a “kedveltségben”. (Az osztályzatok a cafeteria.sav fájlban találhatók.) 9. Szórásanalízis (a) Egy diétás kísérletben 23 közel azonos testfelépítésű férfinak 3 típusú diéta egyikét adták. Döntsük el, hogy van-e különbség a diéták hatásossága között. Az egyes súlycsökkenéseket a következő táblázat tartalmazza: I. diéta 9.40 9.48 7.56 11.52 11.56 12.12 11.36 4.60 14.48
II. diéta 22.84 15.32 11.04 17.92 19.68 26.20
III. diéta 17.35 16.36 15.88 14.28 18.60 19.32 14.20 17.52
Figyelem! Ellenőrizze a szórások egyezőségét grafikusan és Levenepróbával is! Ha szükséges, alkalmazzon transzformációt az adatokon. (b) Egy cég egy nem régen piacra bevezetett DVD-lejátszó kedveltségét szeretné felmérni. Vizsgálatot végeznek annak eldöntésére, hogy mely korosztály számára vonzó leginkább a termék. Ehhez megkérdeztek néhány embert különböző korosztályokból, akiknek 1-10 skálán osztályozni kellett a terméket bizonyos szempontok szerint. Az eredményt a dvd.sav fájl tartalmazza. Döntse el, hogy van-e különbség az egyes korcsoportok között. Külön hasonlítsa össze a 32-38 és 39-45 korosztályokat, továbbá a <32 és >45 korosztályokat! (c) Egy gyárban a termelési folyamat időtartamának optimalizálását a munkások mozgásának elemzésével próbálják elvégezni. Hét dolgozó munkafolyamat-elvégzési idejét figyelik meg egy-egy műszakban (az adatok perc.másodperc formátumban vannak feltüntetve az idoszuks.sav fájlban): Van-e különbség az egyes munkások gyorsasága között? Van-e különbség a két műszak között? (d) Vashiányos betegek számára táplálékkiegészítőt vizsgálnak. A vas két ionjának (Fe2+ és Fe3+ ) változatával kísérleteznek. Azt választják, amely hosszabb ideig marad a szervezetben. A kutatók egereket sorolnak 2 nagy csoportba, majd ezeket a csoportokat 3-3 alcsoportba. A két nagy csoport tagjai Fe2+ -t ill. Fe3+ -t kapnak 3-3
6
különböző koncentrációban. A visszamaradó vasmennyiséget megmérik (a beadott mennyiség százalékában). Kérdések: i. A visszamaradt vas mennyiségét befolyásolják-e a vasfajták? ii. A visszamaradt vas mennyiségét befolyásolják-e a koncentrációk? iii. A két tényezőnek van-e együttes hatása? 10. Korreláció- és regressziószámítás (a) A vizsga.sav fájlban található adatok 23 diák felkészülési idejét tartalmazzák egy zárthelyi dolgozat előtt, percben kifejezve. Az adatok mellett az elért eredmény található százalékos formában. Igazoljuk vagy vessük el azt a feltételezést, hogy a felkészülési idő kapcsolatban áll az elért eredménnyel! (b) Egy autó árát befolyásolja az évjárata. Hirdetések alapján adatokat gyűjtünk adott típusú autó különböző évjáratairól. Próbáljuk meg az alább rendelkezésre álló – forintban feltüntetett – adatok alapján eldönteni, hogy igaz-e a kijelentés: az évek számával lineárisan csökken az autó értéke. 3 680 000 3 158 000 2 825 000 2 110 000 1 675 000 1 450 000 1 150 000 850 000
0. 1. 2. 3. 4. 5. 6. 7.
év év év év év év év év
A kapott eredmény segítségével próbáljuk megbecsülni, mennyit fog érni az autó 10 éves korában. (c) Végezzük el az előző feladat számításait a futott kilométerekre vonatkozóan is! (Az adatok ezer kilométerben értendőek.) 3 680 000 3 450 000 3 350 000 3 155 000 3 100 000 2 830 000 2 470 000 2 120 000 1 840 000
0 km 20e km 40e km 60e km 80e km 100e km 120e km 140e km 160e km
(d) Radioaktív bomlási folyamat vizsgálatakor a visszamaradó sugárzó anyag mennyiségére a következő adatok adódtak (molban): 6.17, 3.61, 2.25, 1.17, 0.91, 0.53, 0.32,
7
0.18, 0.14, 0.07, 0.04, 0.03, 0.01, 0.01 A bomlási törvény alakja a megmaradó anyagmennyiségre az idő függvényében: ae−bt . Határozza meg a és b értékét!
8