Statisztikai módszerek gyakorlat - paraméteres próbák A tanult paraméteres próbák: PRÓBA NEVE MIRE SZOLGÁL? Egymintás U próba A val.-i vált. várható értéke egy adott szám-e? (Ismert szórás!) Kétmintás U próba
Két val.-i vált. várható értéke megegyezik-e? (Ismert szórás!)
Egymintás T próba
A val.-i vált. várható értéke egy adott szám-e?
Welch próba (Kétmintás T próba) F próba
Két val.-i vált. várható értéke megegyezik-e?
Grubbs próba
A mérési sorozat legnagyobb vagy legkisebb eleme hozzátartozik- e a sorozathoz?
Abbe próba
A megfigyelés sorozat alatt változott-e a várható érték?
Két normális eloszlású val.-i vált. szórása megegyezik-e?
1. Feladat Egy laboratóriumi mérésen a hallgatók n=4 fős csoportokban dolgoznak. Feltételezzük, hogy a hallgatók IQ-ja is ξ=N(100,15) eloszlást követ (mint ahogy múlt gyakorlaton az emberekről általában feltételeztük). Mekkora a sugarú környezetet kell vennünk M(ξ) körül ahhoz, hogy egy véletlenszerűen kiválasztott csoport átlagos IQ-ja p=90%-os valószínűséggel ebbe a környezetbe essen? Megoldás: Jelölje a négyfős csoportok átlagos IQ-ját modellező valószínűségi változót. Ekkor: M( )=M(ξ) és D( )=D(ξ)/ a kiszámolása:
helyett természetesen 100 is állhatna, p helyett pedig 0,9. Standardizálás után:
Intervallumba esés valószínűsége, (ahol
Szimmetria okokból:
az N(0,1) eloszlásfüggvénye):
Tehát a értéke =INVERZ.STNORM((1+0,9)/2)*15/GYÖK(4) alapján 12,3364 Így ha kiválasztunk véletlenszerűen egy 4-fős laborcsoportot, és meghatározzuk az átlagos IQ-jukat (Jelölje ezt: ), akkor az esetek 90%-ában teljesülni fog, hogy [100-12,3364; 100+12,3364] Ugyanez behelyettesítés előtt:
Átrendezve:
[M(ξ)-
; M(ξ)+
]
[- ; ], ami tehát az esetek 90%-ában teljesül.
2.Feladat Az első feladat kapcsán felmerülhet bennünk, hogy a hallgatók nem reprezentatív részét képezik az emberiségnek így nem jogos rájuk is vonatkoztatni az egész emberiségre érvényes IQ-eloszlást. Vonjuk kétségbe, hogy a hallgatók IQ-ja is 100 várható értékű eloszlást követ (a szórást és a normalitást most ne vitassuk)! Mérjük meg néhány hallgató IQ-ját, és ennek alapján próbáljuk meg eldönteni, hogy jogosan vontuk-e kétségbe, hogy az IQ várható értéke hallgatókra is 100! Összesen 4 hallgatónak mérhettük meg az IQ-ját. Ezek: 117,112,115,108.
Megoldás: Származhatnak ezek az adatok N(100,15) eloszlásból? Természetesen igen. Nem "túl valószínűtlen", hogy az N(100,15) eloszlásból ilyen adatok származzanak? Ez attól függ mit nevezünk "túl valószínűtlennek". (Ezt a feladat szövegének tartalmaznia kell.) Ebben a feladatban nevezzük "túl valószínűtlennek" azt, aminek a bekövetkezési valószínűsége kisebb mint 10%. Stratégia: Számítsuk ki a mérési sorozat átlagos IQ-ját ( =113). Ha úgy találjuk, hogy kevesebb mint 10% annak az esélye, hogy egy N(100,15)-ből származó 4-elemű sorozat átlaga ilyen messze essen 100-tól, akkor azt mondjuk, hogy a hallgatók IQ-jának várható értéke nem 100. Ekkor annak a valószínűsége, hogy rossz döntést hozunk kevesebb mint 10%.
Ha úgy találjuk, hogy több mint 10% annak az esélye, hogy egy N(100,15)-ből származó 4-elemű sorozat átlaga ilyen messze essen 100-tól, akkor elfogadjuk, hogy a hallgatók IQ-ja is N(100,15) eloszlásból származik. Ekkor nem tudjuk mekkora annak az esélye, hogy rosszul döntöttünk. Döntés: Láttuk az előző számítás eredményeként, hogy az esetek 90%-ában teljesülni fog, hogy [100-12,3364; 100+12,3364], így a 113 már "túl valószínűtlen". Döntés az átrendezett alak alapján: Az esetek 90%-ában teljesül, hogy Most
[- ; ].
=1,733333
= 1,644854 mivel
[-
;
] nem teljesül, elvetjük, hogy a hallgatók IQ-jának várható értéke 100.
3.Feladat A "Viscosity Characteristics of Rubber Modified Asphalts", (J. of Materials in Civil Engr., 1996: 153-156) című cikkben 18% gumi hozzáadásával készítettek aszfaltot, és ennek viszkozitását vizsgálták. Vizsgálatuk során 5 ilyen anyag tulajdonságait rögzítették, a szórás ismert. Igaz-e 95%-os biztonsággal, hogy az átlagos viszkozitás várhatóan 2900 cP (centiPoise)? Megoldás: Egymintás U próbát alkalmazunk H0: A viszkozitás várható értéke (p=95) 2900. Írjuk be az adatokat tetszőlegesen választott mezőkbe. (a0, p, n) Számoljunk átlagot. ( ) Számoljuk ki Uakt értékét.
Ukrit értékét a standard =INVERZ.STNORM((p+1)/2)
normális
eloszlásból
kapjuk
(p+1)/2-höz
Ukrit=1,96 Mivel - Ukrit< Uakt< Ukrit a H0 hipotézisünket megtartjuk, tehát az adatok nem mondanak ellent annak, hogy a viszkozitás várható értéke 2900 cP.
pl.:
4.Feladat A mozgásszervi nyak-váll problémák igen gyakoriak azon munkavégzők esetében, akik ismétlésszerű, vizuális kijelző kezelői munkát végeznek. Az „Upper-Arm Elevation During Office Work” c. cikk (Ergonomics, 1996: 1121-1230) egy 16 egyénen végzett kísérlet eredményeit ismerteti. A kísérletben kétszer figyelték meg a dolgozókat, az első alkalommal úgy, hogy a kézmozgásra max. 30°-os szögben volt lehetőségük, a második esetben -18 hónappal későbbúgy, hogy közben javítottak a munkakörnyezeten, és így a dolgozóknak nagyobb tartományban és változatosságban volt lehetőségük karjukat mozogatni. A munkavégzés hatékonyságát úgy mérték le, hogy egy adott munkafolyamatot kellett a dolgozóknak elvégezni egy adott limitidő alatt, és azt nézték, hogy a limitidő hány százalékát használták fel a feladatmegoldásra. Első alkalommal korlátozott kézmozgással, majd második alkalommal kiterjesztett kézmozgással, vagyis jobb körülmények mellett. A 16 dolgozó két alkalommal mért eredményei vannak a következő táblázatban. Alátámasztják-e az adatok a kijelentést 95%-os biztonsággal, miszerint a nagyobb mozgástér biztosítása nem változtatott a munkavégzés hatékonyságán? Megoldás: Egymintás T-próba a minták különbségére H0: A minták különbségének várható értéke 0 (p=95%). Számoljuk ki a két adatsor különbségét a következő oszlopban. Számoljuk a különbség átlagát, korrigált tapasztalati szórását és a mintaelemek számát. ( , s*, n) a0=0 Számoljuk ki takt értékét.
értékét az n-1 szabadságfokú Student féle T eloszlás inverzéből kapjuk , kiszámítása Excelben: =INVERZ.T(1-p;n-1) =2.13 Mivel -tkrit < takt < tkrit nem igaz, azt kell mondanunk, hogy a nagyobb mozgástér változtatott a hatékonyságon.
5.Feladat A következő adatok hegesztéssel ill. hegesztés nélkül készült polimer csövek húzófeszültségét mutatják. („Effect of Welding on High-Density Polyethylene Liner”, J. of Materials in Civil. Eng., 1996:94-100) Egyetért-e a kutatókkal, akik azt állítják, hogy a csövek húzófeszültségén az új technológia nem változtatott? A szignifikancia szintet válasszuk 98%-ra. Megoldás: Welch-próba H0: a minták várható értéke megegyezik (p=98%). Számoljuk ki a két adatsorra az átlag, korrigált tapasztalati szórás és minta elemszám adatokat tetszőlegesen választott mezőkbe ( ). Számoljuk ki értékét.
értékét az f szabadságfokú Student féle T eloszlás inverzéből kapjuk
,
ahol:
kiszámítása Excelben: =INVERZ.T(1-p;f) wkrit=2.60 Mivel -wkrit < wakt < wkrit igazelfogadjuk, hogy a húzófeszültségén az új technológia nem változtatott. F (Fisher)-próba H0: A minták szórása megegyezik (p=95%). Az egyes minták szórásait a feladat a) részében már kiszámoltuk. Számoljuk ki fakt értékét. =1.86 fkrit értékét F eloszlásból (táblázatból) kereshetjük ki (1-p); (nξ-1) és (nη-1)-hez. =INVERZ.F(1-p; -1; -1) fkrit=3.68 Mivel fakt < fkrit teljesül, a hipotézist, miszerint a szórás megegyezik, elfogadjuk.
6. Feladat A sarkvidékeken a leesett hó rétegeket képez, és egy idő után jéggé alakul át a rárakódó újabb rétegek nyomásának hatására. A vastag jég megfúrása és elemzése által múltbeli eseményekre lehet következtetni. Egy fúrásmintában 20 réteget sikerült elkülöníteni és elemezni. Ezek kémhatását tartalmazza az alábbi táblázat. Állítható-e 95%-os biztonsággal, hogy a legsavasabb (legkisebb pH-jú) érték nem magyarázható a véletlen ingadozással, hanem valamilyen rendkívüli esemény (például vulkánkitörés) következménye? Megoldás: Grubbs próba H0: A minimális elem is része az eloszlásnak (p=0.95). Számoljunk átlagot, szórást, illetve keressük meg a minta maximumát és minimumát. A minimum tűnik kiugró értéknek, ezért erre végezzük el a próbát. Számoljuk ki G_akt értékét:
A kritikus értéket a mellékelt táblázatból kell kikeresni az elemszámhoz. (Megj.: nagyobb minta elemszám esetén nem is alkalmazható ez a próba, azért nem nagyobb a táblázat!) Gkrit=2.56 Mivel Gakt > Gkrit, a nullhipotézis elutasítom.
7.Feladat Egy palackokat fröccsöntő gépen rendszeresen ellenőrzik a gép beállításait. Ennek érdekében 40 egymás után fröccsöntött termék tömegét sorozatban mérték. Az adatok alapján megváltozott a gép adagolójának működése (p=95%)? Megoldás: Abbe próba H0: Az adagoló beállításai nem változtak(p=0.95). Képezzük a korr. tap-i szórást.
különbség négyzeteket a D oszlopban. (i=1,2,…,n-1-ig). Számoljunk
Számoljuk ki a köv. mennyiséget: A próba aktuális értéke: A kritikus értéket a próbához (www.hds.bme.hu/mota/sm/abbe.pdf)
tartozó
táblázatból
nézhetjük
ki.
rkrit=0.746 Mivel rakt > rkrit, a nullhipotézist elfogadjuk.