© Typotex Kiadó
Pecze Judit 2012-12-16 14:30:09
4. fejezet
Az átlag és a szórás Nehéz megérteni, hogy a statisztikusok miért korlátozzák vizsgálódásaikat rendszerint az átlagokra, és nem lelik örömüket egy átfogóbb szemléletben. Szellemük oly tompának tűnik a változatosság varázsával szemben, mint Angliánk egyik sík vidékének azon szülöttéé, aki Svájcra visszatekintve úgy nyilatkozott, hogy ha a hegyeket be lehetne lökni a tavakba, egy csapásra két kellemetlenség is megszűnne. —SIR FRANCIS GALTON (ANGLIA, 1822-1911) 1
1. BEVEZETÉS Hisztogram segítségével terjedelmes mennyiségű adatot összesíthetünk. Sokszor ennél drasztikusabb összefoglalást is alkalmazhatunk: csak a hisztogram középpontját, valamint a centrum körüli szóródást adjuk meg. (A „középpont” és a „szóródás” itt köznapi szavak, pontos matematikai jelentés nélkül.) Az 1. ábrán két hisztogram vázlata látható; bejelöltük a középpontot és a szóródást is. A középpont mindkettőnél ugyanaz, de a második szórtabb – nagyobb terület esik a középponttól messzebbre. A statisztikusi munkához pontos definíciókat kell megadnunk, aminek többféleképpen is nekiláthatunk. A középpont megragadására gyakran használjuk az átlagot, de a mediánt is sokszor használjuk.2 Az átlag körüli szóródást méri a szórás nevű mennyiség; a szóródás egy másik mérőszáma az interkvartilis terjedelem. Az 1. ábrán látható hisztogramokat összegezhetjük a középpont és a szóródás megadásával, a dolog azonban nem működik mindig ilyen jól. A 2. ábra például a földfelszín tengerszinthez viszonyított magasságának megoszlását mutatja. A tengerszinthez viszonyított magasság szerepel a vízszintes tengelyen, mérföldben mérve a tengerszint alatt (-), illetve felett (+). A hisztogram alatti terület két magasságérték között megadja, hogy a föld felszínének hány százaléka esik ezen két magasságérték közé. Egyértelmű csúcsok láthatók ezen a hisztogramon. A földfelszín túlnyomó részét vagy tenger borítja, mintegy 3 mérfölddel a tengerszint alatt; vagy pedig kontinentális síkság teszi ki, nagyjából a tengerszint körül. Ha erről a hisztogramról csak a középértéket és a szóródást adnánk meg, nem vennénk észre a két kicsúcsosodást.3
© David Freedman, Robert Pisani, Roger Purves
© Typotex Kiadó
Pecze Judit 2012-12-16 14:30:09
78 II. RÉSZ: LEÍRÓ STATISZTIKA
1. ÁBRA. Középérték és szóródás. A két hisztogram középpontja azonos, de a jobb oldali jobban szóródik.
2. ÁBRA. A föld felszínének megoszlása a tengerszinthez viszonyított magasság szerint a tengerszint fölött (+), illetve alatt (-).
2. AZ ÁTLAG Témánk most az átlag (számtani középnek is nevezik) áttekintése; de beszélni fogunk a keresztmetszeti és a longitudinális kérdőíves felvételek közötti különbségről is. Egy 1976-80 között folytatott, az egészségi állapottal és a táplálkozással foglalkozó amerikai kutatás, a HANES* adatait fogjuk felhasználni. Ennek keretében az 1-74 éves amerikaiak 20 322 fős reprezentatív mintáját vizsgálta a szövetségi Közegészségügyi Hivatal. A cél az volt, hogy alapvető adatokat szerezzenek demográfiai változókról, amilyen az életkor, az iskolázottság, a jövedelem; fiziológiai változókról, mint a testmagasság, a testsúly, a vérnyomás, a koleszterinszint; az étkezési szokásokról; a vérben kimutatható ólom és rovarirtószer szintjéről; különféle betegségek előfordulásáról. A begyűjtött adatok elemzése a változók közötti összefüggésekre összpontosított, és jelentősen befolyásolta az egészségpolitikát is. Például a kutatott időszak végére a HANES adatai szerint 37%-kal csökkent az emberek vér-ólomszintje. A Közegészségügyi Hivatal ennek okát az ólmozatlan üzemanyagok elterjedésében határozta meg. Az ólomadalékokat ezután betiltották.4 Nekünk most csak az a célunk, hogy rövid pillantást vessünk a mintára, miközben átismételjük az átlag fogalmát. * Health and Nutrition Examination Survey
© David Freedman, Robert Pisani, Roger Purves
© Typotex Kiadó
Pecze Judit 2012-12-16 14:30:09
4. fejezet: Az átlag és a szórás 79
Egy számsor átlaga: a számok összege elosztva azzal, ahány számunk van. A 9, 1, 2, 2, 0 számokból álló listában például 5 szám szerepel, az első közülük a 9es, az átlaguk pedig 9 + 1 + 2 + 2 + 0 = 14 = 2,8. 5 5 Vajon hogyan néztek ki a mintában szereplő (18-74 éves) nők és férfiak? A férfiak átlagos testmagassága 5 láb 9 hüvelyk (175,25 cm) volt, átlagos testsúlyuk 171 font (kb.77,5 kg). A nők átlagos testmagassága 5 láb 3,5 hüvelyk (kb. 161 cm), átlagos testsúlyuk 146 font (közelítőleg 66 kg). Kissé dundik voltak. Vajon hogyan függ össze a magasság és a testsúly az életkorral? A 3. ábrán láthatjuk a Közegészségügyi Hivatal által vizsgált különböző korcsoportok magasságés testsúlyátlagát külön a férfiakra és külön a nőkre; az ábrán az átlagokat egyenes vonalakkal kötöttük össze. Hasznos eszköz az átlag az adatok összegzésére – ebbe a négy görbébe is sok-sok hisztogramot sűrítettünk bele. Ám ezt a sűrítést csak úgy érthettük el, hogy figyelmen kívül hagytuk az egyéni eltéréseket. A 18-24 éves férfiak magasságátlaga például 5 láb 10 hüvelyk (178 cm), 10%-uk viszont 6 láb 1 hüvelyknél (185 cm-nél) magasabb; 10%-uk pedig 5 láb 6 hüvelyknél (168 cm-nél) alacsonyabb. Ezt a sokféleséget az átlag elrejti. 3. ÁBRA. Az életkor-specifikus testmagasság- és testsúlyátlagok a HANES mintájában szereplő 18-74 éves férfiakra és nőkre. A bal oldali ábra a testmagasságokat, a jobb oldali a testsúlyokat ábrázolja. (Az eredetileg hüvelykben és fontban mért adatokat itt centiméterben és kilogrammban adjuk meg. A szerk.)
FORRÁS: Az adatokat mágnesszalagon az Inter-University Consortium for Political and Social Research bocsátotta rendelkezésünkre.
© David Freedman, Robert Pisani, Roger Purves
© Typotex Kiadó
Pecze Judit 2012-12-16 14:30:09
80 II. RÉSZ: LEÍRÓ STATISZTIKA
Egy pillanatra most visszatérünk a kutatási elrendezés kérdéséhez (2. fejezet). A 3. ábra szerint a férfiak átlagos testmagassága a 20 éves életkor után csökken, 50 év elteltével körülbelül 5 centiméterrel (2 hüvelykkel). Hasonlót láthatunk a nők esetében is. Azt jelenti ez vajon, hogy az átlagember ilyen mértékben összemegy? Nem igazán. A HANES keresztmetszeti, nem pedig longitudinális vizsgálat. Egy keresztmetszeti vizsgálatban különböző alanyokat hasonlítunk össze egyazon időpillanatban. Longitudinális vizsgálatnál az alanyokat követjük az időben, és saját korábbi adataikkal hasonlítjuk össze őket a különböző időpontokban. A 3. ábrán szereplő 18-24 évesek egészen mások, mint a 65-74 évesek. Az első csoport 1955 körül született, a második 1905 táján. Minden jel arra utal, hogy az idők során az emberek egyre magasabbra nőnek. Akcelerációs tendenciának nevezzük ezt, melynek hatása a 3. ábrán egybemosódik az öregedés hatásával. Az öt centiméter magasságcsökkenés nagy része az akcelerációnak tulajdonítható: a 65-74 éves emberek mintegy 50 évvel korábban születtek a 18-24 éveseknél, és ez az oka, hogy néhány centivel alacsonyabbak náluk.5 Ha egy vizsgálatban az életkor hatásáról vonnak le következtetéseket, figyeljünk oda arra, hogy keresztmetszeti vagy longitudinális adatokkal dolgoztak-e.
„A” feladatsor 1. (a) Az alábbi vízszintes tengelyen bejelöltük a 3-as és az 5-ös számot. Mennyi a két szám átlaga? Jelölje meg egy nyíllal!
(b) Ismételje meg ugyanezt a 3, 5, 5 számokra!
(c) Bejelöltünk két pontot az alábbi tengelyen. Rajzoljon a két szám átlagához mutató nyilat!
2. 10 szám szerepel egy listán. A számok értéke 1, 2 vagy 3 lehet. Hogyan néz ki a lista, ha a számok átlaga 1? És ha 3? Lehet-e 4 az átlag? 3. A következő számsorok közül melyiknek nagyobb az átlaga? Vagy ugyanaz? Próbáljon meg számolás nélkül válaszolni! (i) 10, 7, 8, 3, 5, 9 (ii) 10, 7, 8, 3, 5, 9, 11
© David Freedman, Robert Pisani, Roger Purves
Pecze Judit 2012-12-16 14:30:09
© Typotex Kiadó
4. fejezet: Az átlag és a szórás 81
4. Egy szobában tíz ember tartózkodik, testmagasságuk átlaga 168 cm. Belép egy 195 cm magas férfi. Mennyi lesz most a 11ember magasságátlaga? 5. A teremben tartózkodó huszonegy ember átlagos magassága 168 cm. Belép egy 195 cm magas férfi. Mennyi lesz most a 22 ember magasságátlaga? Vesse össze a megoldást a 4. feladatéval! 6. A teremben tartózkodó huszonegy ember átlagos magassága 168 cm. Belép még valaki. Milyen magasnak kell lennie ahhoz, hogy a magasságátlag 2 centiméterrel megnőjön? 7. Hol található a Sziklás hegység a 2. ábrán: a vízszintes tengely bal széle körül, középen vagy a jobb szél tájékán? Hová esik Florida? És vajon az olyan mélytengeri árkok, mint például a Mariana-árok? 8. Szívproblémákkal kapcsolatban a szisztolés vérnyomásnál jobb indikátornak tekintik a diasztolés vérnyomást. Az alábbi ábrán a HANES felmérésében részt vett 1874 éves férfiak életkor-specifikus diasztolés vérnyomásátlaga látható. Igaz-e, hogy az adatok szerint a férfiak diasztolés vérnyomása nagyjából 55 éves korukig emelkedik, azután pedig csökken? Ha nem igaz: hogyan magyarázhatjuk a görbe menetét? (A vérnyomást higanymilliméterben mérjük.)
9. A munkaügyi statisztikával foglalkozó hivatal (a Bureau of Labor Statistics) havonta kiszámítja az átlagos órabéreket a gazdálkodó szervezetek által bejelentett adatok alapján. Kiszámolják az összes (alkalmazottaknak) kifizetett bért, és elosztják a ledolgozott órák teljes számával. Recesszió idején az átlagórabér tipikusan emelkedik. Ha véget ér a recesszió, az órabérek átlaga többnyire csökkenni kezd. Hogyan lehetséges ez?
© David Freedman, Robert Pisani, Roger Purves
© Typotex Kiadó
Pecze Judit 2012-12-16 14:30:09
82 II. RÉSZ: LEÍRÓ STATISZTIKA
3. AZ ÁTLAG ÉS A HISZTOGRAM Ebben a szakaszban megmutatjuk, hogyan viszonyul az átlag és a medián a hisztogramhoz. Kezdjük egy példával! A 4. ábrán a HANES mintájában szereplő 6588 fő 18-74 éves nő testsúlyának hisztogramját láthatjuk. Függőleges vonal jelöli az átlagot, ami 146 font (= 66,2 kg). Természetesnek tűnik az a tipp, hogy a nők felének súlya ez alatt volt, a felének meg fölötte. Ez azonban nem egészen stimmel. Valójában csak 41% volt súlyosabb az átlagnál, 59% súlya viszont átlagon aluli volt. Az arányok más esetben még ennél is jobban eltérhetnek az 50%-tól. 4. ÁBRA. A HANES mintájában szereplő 6 588 18-74 éves nő testsúlyának hisztogramja. A testsúlyátlagot szaggatott vonal jelöli. Csak 41% testsúlya nagyobb az átlagosnál. (Az adatokat átírtuk font helyett kilogrammra. A szerk.)
FORRÁS: L. a 3. ábránál
Hogyan lehetséges ez? Az egyszerűség kedvéért kezdjük egy hipotetikus példával: legyen a számsorunk 1, 2, 2, 3. Ennek a sorozatnak a hisztogramja ( lásd az 5. ábrát) szimmetrikus a 2-es értékre. És az átlag is 2. Ha egy hisztogram valamely értékre szimmetrikus, akkor ez az érték az átlag; valamint a hisztogram alatti terület fele ettől az értéktől balra, fele jobbra helyezkedik el. (Hogy mit jelent az, hogy szimmetrikus? Képzeljük el, hogy függőleges vonalat rajzolunk a hisztogram középpontján keresztül, és ennek mentén félbehajtjuk az ábrát: a két félnek illeszkednie kell egymásra.) 5. ÁBRA. Az 1, 2, 2, 3 számsor hisztogramja. A hisztogram szimmetrikus a 2-es értékre nézve; a teljes terület 50%-a 2-től balra, 50%-a jobbra helyezkedik el.
© David Freedman, Robert Pisani, Roger Purves
© Typotex Kiadó
Pecze Judit 2012-12-16 14:30:09
4. fejezet: Az átlag és a szórás 83
Mi történik, ha az 1, 2, 2, 3 számokból álló listán a 3-as értéket nagyobbra, mondjuk 5-re vagy 7-re cseréljük? Mint a 6. ábrán látható, az ehhez az értékhez tartozó téglalap jobbra helyeződik, tönkretéve a szimmetriát. Nyíllal megjelöltük az átlagot az egyes hisztogramoknál; ez a nyíl is tolódik jobbra, követve a téglalapot. Hogy jobban átlássuk ezt, képzeljük el, hogy a hisztogram fa építőkockákból áll, melyeket súlytalan, merev deszkára erősítettek. Helyezzük a hisztogramot egy merev pálcára a 6. ábra alsó részén látható módon. Hisztogramunk az átlagnál lesz egyensúlyban.6 Az átlagtól jó messze eső kis téglalap kiegyensúlyozhat egy, az átlaghoz közel fekvő nagy területet, mivel a területek az alátámasztási ponttól mért távolsággal súlyozandók. 6. ÁBRA. Az átlag. Az ábra felső részében három hisztogram látható, az átlagokat nyilak jelölik. Ahogy a besatírozott téglalap tolódik jobbra, az átlagot is húzza maga után. Az átlagtól balra eső terület aránya felmegy 75%-ra. Az ábra alsó részében ugyanezen hisztogramokat merev súlytalan deszkára erősített fatömbökként ábrázoltuk. A hisztogramok az átlagnál alátámasztva lesznek egyensúlyban.
© David Freedman, Robert Pisani, Roger Purves
© Typotex Kiadó
Pecze Judit 2012-12-16 14:30:09
84 II. RÉSZ: LEÍRÓ STATISZTIKA
A hisztogram akkor lesz egyensúlyban, ha az átlagnál támasztjuk alá. A mérleghintán egy kicsi gyerek a középponttól távolabb ül, hogy egyensúlyt tartson a középponthoz közelebb ülő nagyobb gyerekkel. A hisztogram oszlopai is ugyanígy működnek. Ezért van, hogy az átlag egyik oldalára eső esetek aránya eltérhet az 50%-tól.
Egy hisztogram mediánja az az érték, amelytől balra és jobbra is a terület fele található. A 6. ábrán szereplő mindhárom hisztogramnál 2 a medián. A második és a harmadik hisztogram esetében sokkal messzebb van a mediántól jobbra eső terület, mint az attól balra fekvő. Ebből következik, hogy ha a mediánnál próbálnánk meg alátámasztani a hisztogramot, akkor ledőlne jobbra. Általánosabban: az átlag mindig jobbra van a mediánhoz képest, ha a hisztogram jobbra elnyújtott, amint az a 7. ábrán látható. A testsúlyok hisztogramja (lásd a korábbi 4. ábrát) hosszan elnyúlik jobbra; ezért a 66,2 kg-s (146 fontos) átlag nagyobb a mediánnál, ami 62,5 kg (139 font). 7. ÁBRA. A hisztogram ferdesége
© David Freedman, Robert Pisani, Roger Purves
© Typotex Kiadó
Pecze Judit 2012-12-16 14:30:09
4. fejezet: Az átlag és a szórás 85
Vegyünk egy másik példát! 1992-ben a családi jövedelem mediánja 36 800 dollár körül volt az USA-ban. A jövedelemhisztogram jobbra erősen elnyújtott, így ennél magasabb volt az átlag: 44 500 dollár.7 Valamelyik irányban erősen elnyújtott megoszlás esetén érdemes lehet a mediánt használni az átlag helyett, amennyiben az átlagot túlságosan befolyásolják a távoli értékek. „B” feladatsor 1. Három számsor hisztogramját vázoltuk fel. Töltse ki az üresen hagyott helyet mindhárom esetben: Az átlag _______ körül van. Válaszlehetőségek: 25, 40, 50, 60, 75.
2. Egybeesik-e a medián az átlaggal az előző feladatban szereplő hisztogramoknál? Vagy balra esik tőle? Netán jobbra? 3. Lapozzon vissza a cigarettafogyasztás hisztogramjához a 3. fejezetbeli C-4 feladathoz. A medián ________ körül van. Töltse ki az üresen hagyott helyet az alábbi válaszlehetőségek valamelyikével: 10
20
30
40
4. A cigarettafogyasztás hisztogramjánál 15, 20 vagy 25 körül van-e az átlag? 5. Az egyetemekre beiratkozott hallgatók körében melyik nagyobb vajon: az átlagos életkor vagy az életkorok mediánja*? 6. A következő listákon szereplő számok összességükben vajon 1, 5 vagy 10 körül szóródnak? Számolásra nincs szükség. (a) 1,3; 0,9; 1,2; 0,8 (b) 13; 9; 12; 8 (c) 7; 3; 6; 4 (d) 7; -3; -6; 4
* Ez utóbbit közepes életkornak is szokás nevezni, de mi most inkább kerüljük ezt a – sokszor egyébként könnyedebb – szóhasználatot. A ford.
© David Freedman, Robert Pisani, Roger Purves
© Typotex Kiadó
Pecze Judit 2012-12-16 14:30:09
86 II. RÉSZ: LEÍRÓ STATISZTIKA
Kiegészítő megjegyzés: Egy lista mediánját úgy definiáljuk, hogy a számok legalább fele (a fele vagy több) a mediánnál nagyobb vagy azzal egyenlő, és legalább a fele a mediánnál kisebb vagy azzal egyenlő. Négy számsoron mutatjuk be ezt: (a) 1, 5, 7 (b) 1, 2, 5, 7 (c) 1, 2, 2, 7, 8 (d) 8, -3, 5, 0, 1, 4, -1 Az (a) esetben 5 a medián: a három szám közül kettő nagyobb vagy egyenlő 5-tel, kettő pedig kisebb vagy egyenlő 5-tel. A (b) esetben bármely 2 és 5 közötti szám medián; ha egyetlen számot kell megneveznie, a statisztikusok zöme a 3,5-et (a 2 és 5 között félúton lévő számot) választja „a” mediánnak. A (c) lista esetében a medián 2: az öt közül négy szám 2-nél nagyobb vagy azzal egyenlő, három pedig 2-nél kisebb vagy egyenlő. A (d) lista mediánjának meghatározásához rendezzük nagyság szerinti sorba a számokat: -3, -1, 0, 1, 4, 5, 8 Hét számunk van: négy nagyobb vagy egyenlő 1-gyel, négy kisebb vagy egyenlő 1gyel. A medián tehát 1.
4. A NÉGYZETES KÖZÉPÉRTÉK Fejezetünk következő fontos témája az ún. szórás, melyet a szóródás mérésére használunk. Ebben a szakaszban némi matematikai bevezetőt nyújtunk ehhez a 0, 5, -8, 7, -3 számokból álló lista segítségével. Mekkora ez az öt szám? Az átlaguk 0,2, de ez még elég gyengén jelzi a nagyságukat. Annyit jelent csak, hogy a pozitív számok nagyrészt kioltják a negatívakat. A legegyszerűbben úgy járhatnánk el ezzel a problémával, ha elhagynánk az előjeleket, és úgy vennénk az átlagot. A statisztikusok azonban valami mást tesznek: a lista négyzetes középértékét (rövidebben: négyzetes közepét) használják. Némi fantáziával már az elnevezésből is kitalálható, hogyan kell ezt kiszámolni: A számokat NÉGYZETRE emeljük, megszabadulva így az előjelektől. Kiszámoljuk a négyzetek ÁTLAGÁT. Az átlag NÉGYZETGYÖKÉT vesszük. Képletszerűen is kifejezhetjük ezt: egy lista négyzetes közepe = √ a számok négyzeteinek átlaga
© David Freedman, Robert Pisani, Roger Purves
© Typotex Kiadó
Pecze Judit 2012-12-16 14:30:09
4. fejezet: Az átlag és a szórás 87
1.példa. Határozzuk meg a 0, 5, -8, 7, -3 számokból álló lista átlagát, a számok abszolút értékeinek átlagát (az előjelek figyelmen kívül hagyásával számított átlagot) és a lista négyzetes középértékét. Megoldás: Átlag =
0+5-8+7–3 = 0,2 5
Abszolút értékek átlaga = Négyzetes középérték =
√
0+5+8+7+3 5
= 4,6
02 + 52 +(- 8)2 + 72 +(– 3)2 = √ 29,4 ≈ 5,4 5
A négyzetes közép valamivel nagyobb az előjelek figyelmen kívül hagyásával képzett átlagnál. Ez mindig így alakul – kivéve azt a triviális esetet, amikor minden szám ugyanakkora abszolút értékű. A négyzetre emelés és a négyzetgyökvonás nem semlegesítik egymást, hiszen a kettő között elvégezzük az átlagolás műveletét. Hogy 5,4 és 4,6 közül melyiket válasszuk a példában szereplő számok nagyságának átfogó jellemzésére, arra nincsenek nyilvánvaló érvek. A statisztikusok azért használják a négyzetes közepet, mert jobban illeszkedik az általuk végzendő számításokhoz.8 Akár elégedett az Olvasó ezzel a magyarázattal, akár nem – ne aggódjon! Elsőre mindenki utálja a négyzetes közepet, azután nagyon gyorsan megszokja. „C” feladatsor 1. (a) Mennyi az átlaga és a négyzetes közepe a következő számoknak? 1, -3, 5, -6, 3. (b) És a most következőknek? -11, 8, -9, -3, 15. 2. 1, 10 vagy 20 körül van inkább a következő számsorok négyzetes középértéke? Számolásra nincs szükség. (a) 1, 5, -7, 8, -10, 9, -6, 5, 12, -17 (b) 22, -18, -33, 7, 31, -12, 1, 24, -6, -16 (c) 1, 2, 0, 0, -1, 0, 0, -3, 0, 1 3. (a) Mennyi a négyzetes középértéke a következő számsornak: 7, 7, 7, 7 ? (b) És ennek: 7, -7, 7, -7 ? 4. 103, 96, 101, 104. Mind a négy szám értéke 100 körül van, de valamivel eltérnek attól. Mennyi az eltérések négyzetes közepe?
© David Freedman, Robert Pisani, Roger Purves
© Typotex Kiadó
Pecze Judit 2012-12-16 14:30:09
88 II. RÉSZ: LEÍRÓ STATISZTIKA
5. Mennyi a következő számsor átlaga: 103, 96, 101, 104 ? Mindegyik szám valamelyest eltér az átlagtól. Mennyi az eltérések négyzetes közepe? 6. Egy számítógépes programnak az a feladata, hogy megjósolja a teszteredményeket, összehasonlítsa ezeket a tényleges pontszámokkal, és kiszámolja a kettő közötti eltérések (a becslési hibák) négyzetes középértékét. A kinyomtatott listára pillantva azt látjuk, hogy a becslési hibák négyzetes közepe 3,6, az első tíz vizsgázó pedig a következő pontszámokat érte el: Becsült pontszám: 90 90 87 80 42 70 67 60 83 94 Elért pontszám: 88 70 81 85 63 77 66 49 71 69 Hihetőnek tűnik az eredmény, vagy valami hiba lehet a programmal?
5. A SZÓRÁS Sokszor érdemes úgy gondolkodnunk, hogy egy listában szereplő számok az átlaguk körül szóródnak – amint azt a fejezet elején szereplő idézet is sugallja. Ezt a szóródást többnyire a szórásnak nevezett mennyiséggel mérjük. A szórás az átlagtól való eltérések nagyságát méri: egyfajta átlagos eltérés az átlagtól. A következőkben először valós adatok esetében fogjuk értelmezni a szórást, azután majd megnézzük a kiszámítás módját is. A HANES mintájában 6588 fő 18-74 éves nő szerepel (lásd a 2. szakaszt). Átlagos testmagasságuk 161cm (63,5 hüvelyk), a szórás pedig 6,3 cm (2,5 hüvelyk). Az átlagból megtudjuk, hogy a nők többségének magassága valahol 161 cm körül volt. De akadtak eltérések az átlagtól. Voltak az átlagosnál magasabb, és az átlagosnál alacsonyabb hölgyek is. Mekkorák voltak ezek az eltérések? Na, itt jön be a szórás. A szórás megmutatja, milyen messze esnek egy lista számai az átlaguktól. A számok többsége nagyjából egy szórásnyi távolságon belül van az átlagtól. Csak nagyon kevés esik két vagy három szórásnyi távolságnál messzebb. Abból, hogy a szórás 6,3 cm, megtudjuk, hogy a HANES vizsgálatában résztvevő nők közül sokan 2 - 8 cm-rel tértek el az átlagtól: 2 cm fél szórásnál kevesebb, a 8 cm egy és két szórás között van. Kevesen tértek el 13 cm-nél (két szórásnál) jobban az átlagtól. Létezik egy gyakorlatban alkalmazott szabály, amely számszerűsíti ezt a gondolatot, és sok adatsorra érvényes: Egy lista számainak durván 68%-a (háromból kettő) az átlagtól egy szórásnyin belül esik, a többi 32% ennél távolabb. Durván 95% (20-ból 19) az átlagtól két szórásnyin belül esik, a maradék 5% van ennél távolabb. Sok adatsorra igaz ez, de nem mindegyikre.
© David Freedman, Robert Pisani, Roger Purves
© Typotex Kiadó
Pecze Judit 2012-12-16 14:30:09
4. fejezet: Az átlag és a szórás 89
A 8. ábrán láthatjuk a HANES-ben résztvevő 18-74 éves nők magassághisztogramját. Függőleges vonal jelzi az átlagot, és besatíroztuk az átlagtól egy szórásnyin belül eső területet. Ez a satírozott terület jelenti azokat a nőket, akik legfeljebb egy szórásnyival tértek el az átlagtól. A terület 67% körül van. A nők körülbelül 67%-a legfeljebb egy szórásnyival tért el az átlagtól. 8. ÁBRA. A szórás és a hisztogram: a HANES vizsgálatában résztvevő 6588 fő 18-74 éves nő testmagassága. Szaggatott függőleges vonal jelzi az átlagot (161 cm). Az egy szórásnyin belüli területet besatíroztuk: a nők 67%-a tért el legfeljebb egy szórásnyival (legfeljebb 6,3 cm-rel) az átlagtól. (A hisztogram adatait hüvelyk helyett centiméterben adjuk meg. A szerk.)
A 9. ábrán ugyanezt a hisztogramot láthatjuk. Most a két szórásnyin belüli területet satíroztuk be. Ez a besatírozott rész azokat a nőket jelenti, akik legfeljebb két szórásnyival tértek el az átlagtól. A terület nagyjából 94%. A nők körülbelül 94%-a tért el legfeljebb két szórásnyival az átlagos testmagasságtól. (A hisztogram adatait hüvelyk helyett centiméterben adjuk meg. A szerk.)
© David Freedman, Robert Pisani, Roger Purves
© Typotex Kiadó
Pecze Judit 2012-12-16 14:30:09
90 II. RÉSZ: LEÍRÓ STATISZTIKA
9. ÁBRA. A szórás és a hisztogram: a HANES vizsgálatában részt vevő 6588 fő 18-74 éves nő testmagassága. Szaggatott függőleges vonal jelzi az átlagot (161 cm). A két szórásnyin belüli területet besatíroztuk: a nők 94%-a tért el legfeljebb két szórásnyival (legfeljebb 13 cm-rel) az átlagtól.
Röviden összegezve: a nők körülbelül 67%-a legfeljebb egy szórásnyival, 94%-a legfeljebb két szórásnyival különbözött az átlagtól. Mindössze egyetlen nő akadt a mintában, aki négy szórásnyinál többel tért el az átlagtól. Erre az adatsorra egész jól működik a 68%-95%-os szabály. De vajon honnan jön ez a 68 és 95%? A kérdésre a következő fejezetben válaszolunk.9
A HANES felmérésben résztvevő nők kétharmada legfeljebb egy szórásnyival tért el az átlagtól
© David Freedman, Robert Pisani, Roger Purves
© Typotex Kiadó
Pecze Judit 2012-12-16 14:30:09
4. fejezet: Az átlag és a szórás 91
„D” feladatsor 1. A Közegészségügyi Hivatal számításai szerint a HANES felmérésében részt vevő 11 éves fiúk átlagos magassága 146 cm volt, a szórás pedig 8 cm. Töltse ki az üresen hagyott helyeket! (a) Az egyik fiú 170 cm volt. Ő az átlagnál ________ szórásnyival volt magasabb. (b) Egy másik fiú 148 cm magas volt. Ő az átlagnál __________ szórásnyival volt magasabb. (c) Egy harmadik fiú 1,5 szórásnyival alacsonyabb volt az átlagnál. Ő ________ cm magas volt. (d) Ha egy fiú magassága az átlagtól vett 2,25 szórásnyin belül volt, akkor legalább ________ cm és legfeljebb _________ cm magas volt. 2. Az 1. feladat folytatása. (a) Íme négy fiú testmagassága: 150 cm, 130 cm, 165 cm, 140 cm. Melyik leírás illik rájuk az alábbiak közül? (Van olyan leírás, amely kettőre is illik.) szokatlanul alacsony
nagyjából átlagos
szokatlanul magas
(b) A vizsgálatban szereplő 11 éves fiúknak körülbelül hány százaléka volt 138154 cm között? Hány százalék volt 130-162 cm között? 3. A következő listák mindegyikének 50 az átlaga. Melyiknél a legnagyobb a szóródás az átlag körül? Melyiknél a legkisebb? (i) 0, 20, 40, 50, 60, 80, 100 (ii) 0, 48, 49, 50, 51, 52, 100 (iii) 0, 1, 2, 50, 98, 99, 100 4. A következő listák mindegyikének 50 az átlaga. Tippelje meg mindegyiknél, hogy 1, 2 vagy 10 körül van-e inkább a szórás! (Számolásra nincs szükség.) (a) 49, 51, 49, 51, 49, 51, 49, 51, 49, 51 (b) 48, 52, 48, 52, 48, 52, 48, 52, 48, 52 (c) 48, 51, 49, 52, 47, 52, 46, 51, 53, 51 (d) 54, 49, 46, 49, 51, 53, 50, 50, 49, 49 (e) 60, 36, 31, 50, 48, 50, 54, 56, 62, 53 5. A HANES mintájába bekerült emberek életkorának szórása ________ körül volt. Töltse ki az üresen hagyott helyet az alábbi válaszlehetőségek valamelyikével. Adjon rövid magyarázatot is! (A felvételről részletesebben szóltunk a 2. szakaszban; az életkorok 1-74 év között voltak.) 5 év
20 év
50 év
6. Felvázoltuk három adatsor hisztogramját. Melyik leírás tartozik az egyes ábrákhoz? (Nem lehet mindegyiket felhasználni.) Adjon magyarázatot is mindegyik esetben!
© David Freedman, Robert Pisani, Roger Purves
© Typotex Kiadó
Pecze Judit 2012-12-16 14:30:09
92 II. RÉSZ: LEÍRÓ STATISZTIKA
(i) átlag ≈ 3,5; szórás ≈ 1 (ii) átlag ≈ 3,5; szórás ≈ 0,5 (iii) átlag ≈ 3,5; szórás ≈ 2
(iv) átlag ≈ 2,5; szórás ≈ 1 (v) átlag ≈ 2,5; szórás ≈ 0,5 (vi) átlag ≈ 4,5; szórás ≈ 0,5
7. (Kitalált példa). Klinikai vizsgálatoknál az adatgyűjtés általában azzal kezdődik, hogy véletlenszerűen kísérleti, és kontrollcsoportba sorolják a részt vevőket. Az adatgyűjtés az utókövetés befejezéséig folyik. Két, a szívinfarktus megelőzésével foglalkozó klinikai kísérlet vezetői beszámolnak a kiinduló testsúlyadatokról, az alábbiak szerint. Az egyik kísérletnél rosszul sikerült a véletlenszerű besorolás. Melyiknél? Miért?
(i)
Kísérleti Kontroll
Személyek száma 1012 997
Átlagos testsúly 83 kg 64 kg
Szórás 11 kg 11,5 kg
(ii)
Kísérleti Kontroll
995 1017
74 kg 73 kg
12 kg 11 kg
8. Egy kutató 100 fős mintát vesz egy bizonyos város 18-24 éves férfi lakosai közül. Egy másik kutató 1000 fős mintát vesz ugyanezen sokaságból. (a) Melyik kutató mintájában lesz nagyobb a férfiak magasságátlaga? Vagy nagyjából ugyanakkora lesz? (b) Melyik kutató mintájában lesz nagyobb a testmagasságok szórása? Vagy nagyjából ugyanakkora lesz? (c) Melyik kutató mintájában fog szerepelni valószínűleg a legmagasabb férfi? Vagy mindkét kutatónak egyforma az esélye erre? (d) Melyik kutató mintájában fog szerepelni valószínűleg a legalacsonyabb férfi? Vagy mindkét kutatónak egyforma az esélye? 9. A HANES mintájában a férfiak magasságátlaga 175 cm volt, a szórás pedig 7,6 cm. Mondjuk holnap véletlenszerűen kiválasztunk egy férfit a mintából. Önnek meg kell tippelnie a magasságát. Hogyan tippelne? Nagyjából háromból egy az esélye annak, hogy ________ centiméternél többet téved. Töltse ki az üresen hagyott helyet! Válaszlehetőségek: 1 cm, 8 cm, 13 cm. 10. A 9. feladathoz képest most annyi a különbség, hogy egy egész sor férfit választunk ki véletlenszerűen. Ahogy egy férfi megjelenik, összevetjük tényleges testma-
© David Freedman, Robert Pisani, Roger Purves
© Typotex Kiadó
Pecze Judit 2012-12-16 14:30:09
4. fejezet: Az átlag és a szórás 93
gasságát a tippel, és megnézzük, mekkora az eltérés. Az eltérések négyzetes középértéke _______ lesz. Töltse ki az üresen hagyott helyet! (Javaslatunk: Vessen egy pillantást a 6. szakasz bekeretezett mondatára!)
6. A SZÓRÁS KISZÁMÍTÁSA Egy számsor szórásának kiszámításához nézzük egyenként a számokat. Valamilyen mértékben mindegyik eltér az átlagtól, esetleg 0-val: átlagtól való eltérés = szám – átlag A szórás ezeknek az eltéréseknek a négyzetes középértéke. szórás = az átlagtól való eltérések négyzetes középértéke 2. példa. Mennyi a következő számsor szórása: 20, 10, 15, 15 ? Megoldás: Az első lépés az átlag kiszámítása: átlag =
20 + 10 + 15 + 15 = 15. 4
A második lépés az átlagtól való eltérések kiszámítása: egyszerűen kivonjuk az átlagot a számokból. Az eltérések: 5 -5 0 0 Az utolsó lépés az eltérések négyzetes középértékének kiszámolása: szórás = = =
√ √ √
52 + (-5) 2 + 02 + 02 4 25 + 25 + 0+ 0 4 50 = 4
√ 12,5 ≈ 3,5
Ezzel kész is a számítás. A szórásnak ugyanaz lesz a mértékegysége, mint amiben az adataink vannak. A testmagasságot mondjuk centiméterben mértük. A köztes lépésben, amikor négyzetre emelünk, a mértékegység négyzetcentiméterre változik, de a gyökvonással az eredmény újra visszakerül az eredeti mértékegységbe.10 Ne keverjük össze egy számsor szórását a számok négyzetes középértékével! A szórás az átlagtól vett eltérések négyzetes közepe, nem pedig az eredeti számoké!
© David Freedman, Robert Pisani, Roger Purves
© Typotex Kiadó
Pecze Judit 2012-12-16 14:30:09
94 II. RÉSZ: LEÍRÓ STATISZTIKA
„E” feladatsor 1. Tippelje meg, melyik számsor szórása nagyobb! Ellenőrzésképpen számolja is ki a szórásokat! (i) 9, 9, 10, 10, 10, 12 (ii) 7, 8, 10, 11, 11, 13 2. Következőképpen mondja el valaki, hogyan kell kiszámítani az 1, 2, 3, 4, 5 számsor szórását: Az átlag 3, az átlagtól való eltérések tehát: -2 -1 0 1 2 Hagyjuk el az előjeleket. Az átlagos eltérés 2+1+0+1+2 = 1,2 5 Ez a szórás. Igaza van-e? Magyarázza is meg a válaszát! 3. Következőképpen mondja el valaki, hogyan kell kiszámítani az 1, 2, 3, 4, 5 számsor szórását: Az átlag 3, az átlagtól való eltérések tehát: -2 -1 0 1 2 A 0 nem számít, tehát az eltérések négyzetes középértéke
√
4 + 1+ 1 + 4 = 1,6 4
Ez a szórás. Igaza van-e? Magyarázza is meg a válaszát! 4. Három oktató összehasonlítja a vizsgájukon elért pontszámokat; mindegyiküknek 99 hallgatója volt. Az A csoport hallgatói közül egy diáknak 1 pontja volt, egy másik 99 pontot kapott, a többiek 50 pontot. A B csoportban 49 hallgató kapott 1 pontot, egy fő 50 pontot, 49 pedig 99 pontot. A C csoportban egy diák kapott 1 pontot, egy másik 2 pontot, egy harmadik 3 pontot, és így tovább, egészen 99 pontig. (a) Melyik csoportban a legmagasabb az átlag? Vagy egyformák az átlagok? (b) Melyik csoportban a legnagyobb a szórás? Vagy ugyanakkorák? (c) Melyik csoportban a legnagyobb a pontszámok terjedelme? Vagy ugyanakkorák?
© David Freedman, Robert Pisani, Roger Purves
© Typotex Kiadó
Pecze Judit 2012-12-16 14:30:09
4. fejezet: Az átlag és a szórás 95
5. (a) Az alábbi számsorok mindegyikére számítsa ki az átlagot, az átlagtól való eltéréseket és a szórást! (i) 1, 3, 4, 5, 7 (ii) 6, 8, 9, 10, 12 6. Hajtsa végre az 5. feladat utasításait a következő számsorokra is: 1, 3, 4, 5, 7 3, 9, 12, 15, 21 7. Hajtsa végre az 5. feladat utasításait a következő számsorokra is: 5, -4, 3, -1, 7 –5, 4, -3, 1, -7 8. (a) Kalifornia állam kormányzója azt javasolja, hogy minden állami alkalmazott kapjon egységesen havi 70 dollár fizetésemelést. Hogyan befolyásolná ez az állami alkalmazottak átlagjövedelmét? És a szórást? (b) Hogyan befolyásolná az átlagjövedelmet és a szórást, ha 5%-os fizetésemelést kapna mindenki? 9. Mekkora a következő számsor négyzetes középértéke: 17, 17, 17, 17, 17 ? Mennyi a szórása? 10. A 107, 98, 93, 101, 104 számsor esetében melyik a nagyobb: a négyzetes középérték vagy a szórás? Számolásra nincs szükség. 11. Lehet-e negatív szám a szórás? 12. Vegyünk egy pozitív számokból álló számsort! Nagyobb lehet-e a szórás az átlagnál? Kiegészítő megjegyzés: A szórás kiszámításának van egy másik módja is, mely bizonyos esetekben kényelmesebb lehet:11 szórás =
√ a számok négyzetének átlaga – a számok átlagának négyzete
7. A SZÁMÍTÁS STATISZTIKAI FUNKCIÓKKAL ELLÁTOTT SZÁMOLÓGÉPPEL A statisztikai funkciókkal ellátott számológépek többsége nem a szórást számítja ki, hanem egy másik, picivel nagyobb mennyiséget: a korrigált szórást. (A szórás és a korrigált szórás közti különbséget gondosan elmagyarázzuk majd a 26. fejezet 6. szakaszában.) Ha ki akarjuk deríteni, hogy saját kalkulátorunk melyiket számolja, üssük be a –1, 1 számokat; ha a gép 1-et ad eredményül, akkor szórással dolgozik; ha 1,41...-et ír ki, akkor korrigált szórással. Ha a korrigált szórást kapjuk meg, de mi
© David Freedman, Robert Pisani, Roger Purves
© Typotex Kiadó
Pecze Judit 2012-12-16 14:30:09
96 II. RÉSZ: LEÍRÓ STATISZTIKA
a szórást szeretnénk, akkor szoroznunk kell még egy tényezővel. Ennek nagysága attól függ, hány szám szerepel a listán. Tíz szám esetében √ 9/10 a faktor. Húsz szám esetén √19/20. Általánosságban: szórás =
√
a listán szereplő számok száma –1 · (korrigált szórás) a listán szereplő számok száma
8. ISMÉTLŐ FELADATSOR Az ismétlő feladatok a korábbi fejezetek anyagait is felhasználhatják. 1. (a) Mennyi az átlaga és a szórása a következő számsornak: 41, 48, 50, 50, 54, 57? (b) Mely számok esnek közülük az átlagtól 0,5 szórásnyin belül? Melyek 1,5 szóráson belül? 2. (a) A következő számsorok átlaga 50. Melyiknek kisebb a szórása? Miért? Számolásra nincs szükség. (i) 50, 40, 60, 30, 70, 25, 75 (ii) 50, 40, 60, 30, 70, 25, 75, 50, 50, 50 (b) Ugyanezek a kérdések a következő két listával kapcsolatban is: (i) 50, 40, 60, 30, 70, 25, 75 (ii) 50, 40, 60, 30, 70, 25, 75, 99, 1 3. Íme egy lista: 0,7 1,6 9,8 3,2 5,4 0,8 7,7 6,3 2,2 4,1 8,1 6,5 3,7 0,6 6,9 9,9 8,8 3,1 5,7 9,1 (a) Tippelje meg mindenfajta számolás nélkül, hogy az átlag inkább 1, 5 vagy 10 körül van-e! (b) Tippelje meg mindenfajta számolás nélkül, hogy a szórás inkább 1, 3 vagy 6 körül van-e! 4. A 25 éven felüli amerikai népesség jövedelmét tekintve vajon az átlag vagy a medián a nagyobb? És a befejezett iskolai osztályok számát nézve? 5. A HANES felmérésben részt vevő 18-24 éves férfiak szisztolés vérnyomásának átlaga 124 hgmm, a szórás 14 hgmm volt.12 Az alábbi vérnyomásértékek szokatlanul magasnak, szokatlanul alacsonynak vagy nagyjából átlagosnak számítanak-e: 80 hgmm 115 hgmm 135 hgmm 210 hgmm
© David Freedman, Robert Pisani, Roger Purves
Pecze Judit 2012-12-16 14:30:09
© Typotex Kiadó
4. fejezet: Az átlag és a szórás 97
6. Felvázoltuk három adatsor hisztogramját. (a) Az átlagok növekvő sorrendben: 40, 50, 60. Párosítsa össze a hisztogramokat a saját átlagukkal! (b) Melyik hisztogramhoz tartoznak a következő leírások? A medián kisebb az átlagnál A medián az átlag körül van A medián nagyobb az átlagnál (c) 5, 15 vagy 50 körül van-e inkább az (iii) hisztogram szórása? (d) Igaz-e, hogy az (i) hisztogramnak sokkal kisebb a szórása, mint az (iii) hisztogramnak? Miért?
7. Egy főiskolai hallgatók körében folytatott vizsgálatban a férfiak átlagos testsúlya körülbelül 66 kg, a szórás körülbelül 9 kg volt. A nőknél az átlagos testsúly 55 kg, a szórás 9 kg. (a) Mennyi az átlag és a szórás fontban számolva? (1 kg = 2,2 font) (b) Elég egy durva becslés: vajon a férfiak hány százaléka volt 57 és 75 kg között? (c) Ha a férfiakat és a nőket együtt tekintjük, akkor a testsúlyok szórása 9 kg-nál kevesebb lesz, több lesz annál, vagy 9 kg körül lesz? Miért? 8. A HANES mintájában a fiúk átlagos magassága 9 éves korban 136 cm, 11 éves korban 146 cm volt. 11 éves kornál az összes gyerekre vonatkozó magasságátlag 147 cm.12 (a) Átlagosan véve magasabbak-e a fiúk a lányoknál 11 éves korban? (b) Becsülje meg a 10 éves fiúk magasságátlagát! 9. A kutató egy vizsgálatban megkérdezett 1000 ember családi jövedelmeit tartalmazó adatfájllal dolgozik. A jövedelmek évi 5800 dollártól 98 600 dollárig terjednek. Véletlenségből elírták a legmagasabb jövedelem értékét 986 000 dollárra. (a) Befolyásolja ez az átlagot? Ha igen, mennyire? (b) Befolyásolja ez a mediánt? Ha igen, mennyire? 10. Az egyik jogi egyetemen a frissen bekerült hallgatók felvételi teszt* pontszámainak átlaga 163 pont, a szórás 8 pont volt. Holnap véletlenszerűen kiválasztunk közülük valakit. Önnek most kell megtippelnie az illető pontszámát; ezt majd összehasonlítják az illető tényleges eredményével és megnézik, mennyit tévedett. Minden * LSAT (Law School Aptitude Test), emeltszintű érettségi, illetve központi felvételi vizsga jogból. A ford.
© David Freedman, Robert Pisani, Roger Purves
© Typotex Kiadó
Pecze Judit 2012-12-16 14:30:09
98 II. RÉSZ: LEÍRÓ STATISZTIKA
egyes pontnyi tévedés 1 dollárjába kerül. (Ha például 158-at tippel, a tényleges pontszám pedig 151, akkor 7 dollárt kell fizetnie.) (a) Melyikre érdemes tippelni: 150, 163 vagy 170? (b) Kb. háromból egy az esélye, hogy _________ dollárnál többet veszít. Töltse ki az üres helyet! A lehetőségek: 1$, 8$, 20$. (A teszt lehetséges pontszámai 120-tól 180-ig terjednek; a teszt összes kitöltőjére vonatkozó átlag 150, a szórás pedig 9 körül van. A tesztet elég gyakran felülvizsgálják, ezek az adatok az 1993-as változatra vonatkoznak.) 11. Ugyanaz történik, mint az előző feladatban, csak most egy egész sor hallgatót választunk ki. A veszteségek négyzetes közepe _________ körül lesz. Töltse ki az üresen hagyott helyet! 12. Sokak véleménye szerint az amerikai társadalomban létezik egy zárt alsóosztály – a szegények többsége évről évre a szegények között marad. Az 1970-1990 közötti időszakban meglepően állandó volt a szegénységben élők részaránya az amerikai népességen belül, mintegy 12%. Az egyes évek jövedelemadatai a rendszeres népességfelmérés adott év márciusi felvételéből származnak; a szegénységi küszöbök a hivatalos definíciókon alapulnak.13 Milyen mértékben támasztják alá ezek az adatok a zárt alsóosztályról szóló elméletet? Elemezze röviden!
9. ÖSSZEFOGLALÁS 1. Egy tipikus adatsor összefoglalható az átlaggal és a szórással. 2. A számsor átlaga =
a számok összege a számok darabszáma
3. Az átlag kijelöli a hisztogram közepét abban az értelemben, hogy az átlagnál „alátámasztva“ lesz egyensúlyban a hisztogram. 4. A hisztogram alatti terület fele a mediántól balra, a fele attól jobbra esik. A medián a hisztogram közepének egy másfajta meghatározása. 5. Egy számsor négyzetes középértéke azt méri, hogy mekkorák ezek a számok az előjeleket figyelmen kívül hagyva. 6. Egy számsor négyzetes közepe = √ a számok négyzetének átlaga. 7. A szórás az átlagtól való távolságot méri. A listán szereplő számok valamenynyire eltérnek az átlagtól. A szórás ezeknek az eltéréseknek egyfajta átlaga. Konkrétan: a szórás az átlagtól való eltérések négyzetes középértéke.
© David Freedman, Robert Pisani, Roger Purves
Pecze Judit 2012-12-16 14:30:09
© Typotex Kiadó
4. fejezet: Az átlag és a szórás 99
8. A listán szereplő számok durván 68%-a az átlagtól számított egy szórásnyin belül esik, 95%-uk pedig két szórásnyin belül. Ez sok esetben igaz, de nem mindig. 9. Ha egy vizsgálat az életkor hatásáról tesz megállapításokat, nézzük meg, hogy keresztmetszeti vagy longitudinális adatokkal dolgoztak-e.
© David Freedman, Robert Pisani, Roger Purves