Statistische Intelligentie
De samenhang ontdekken Exploratie van bivariaat cijfermateriaal
Deel 2. Kruistabellen b. Werktekst voor de leerling
Sofie Bogaerts Herman Callaert
© 2004, L. U. C. Diepenbeek (België), Statistische Intelligentie Niets in deze uitgave mag worden verveelvoudigd en/of openbaar gemaakt door middel van druk, fotokopie, microfilm of op welke andere wijze ook zonder voorafgaande schriftelijke toestemming van de uitgever. Het is toegestaan aan leerkrachten om deze tekst te reproduceren voor gebruik in de klas. Hierbij dient steeds het project “Statistische Intelligentie” en de namen van de auteurs te worden vermeld.
Kruistabellen
Werktekst voor de leerling
Kruistabellen : voorbeelden uit de praktijk
1. Is er een samenhang tussen het dragen van een gordel en het geslacht van de bestuurder Tijdens een verkeerscontrole werden 1024 automobilisten gecontroleerd op het al dan niet dragen van een gordel. Van de 1024 gecontroleerde automobilisten waren er 464 mannen en 560 vrouwen. Van de 464 mannen droegen er in totaal 192 een gordel. Van de 560 vrouwen waren dit er 284. Vat deze gegevens samen in een kruistabel. Welke categorische veranderlijken heb je, en hoeveel categorieën telt elke veranderlijke? Welke kruistabel krijg je dus? …………………………………………………………………………………………………………………………………………….. …………………………………………………………………………………………………………………………………………….. …………………………………………………………………………………………………………………………………………….. …………………………………………………………………………………………………………………………………………….. Zet je de veranderlijke ‘geslacht’ in de rijen, en ‘dragen van een gordel’ in de kolommen, dan krijg je de volgende tabel: Dragen van een gordel Totaal Geslacht Totaal Tabel 1:
Wil je nu onderzoeken of er een samenhang bestaat tussen het geslacht van de bestuurder en het dragen van een gordel, dan kan je op twee manieren te werk gaan. 1ste manier: verschil in proporties Maak op basis van je kruistabel, de tabellen die de marginale informatie over ‘geslacht’ en ‘dragen van een gordel’ bevatten. Marginale informatie:
Centrum voor Statistiek
1
Kruistabellen
Werktekst voor de leerling
Hoeveel percent van de gecontroleerde automobilisten droeg een gordel? …………………………………………………………………………………………………………………………………………….. …………………………………………………………………………………………………………………………………………….. Stel nu dat er geen samenhang zou bestaan tussen het dragen van een gordel en het geslacht van de bestuurder. Van hoeveel procent van de vrouwen verwacht je dan dat ze een gordel zouden dragen? En van de mannen? Stel op basis hiervan de ‘ideale’ kruistabel op, waarbij je conditioneert op het geslacht. …………………………………………………………………………………………………………………………………………….. …………………………………………………………………………………………………………………………………………….. …………………………………………………………………………………………………………………………………………….. …………………………………………………………………………………………………………………………………………….. …………………………………………………………………………………………………………………………………………….. . In tabelvorm (geconditioneerd op geslacht):
Tabel 2: de ideale kruistabel
Maar wat gebeurde er nu in werkelijkheid? Bereken nu voor de geobserveerde gegevens eveneens de proporties waarbij je conditioneert op geslacht. Krijg je hier ook dezelfde proporties zoals in tabel 2? Wat kan je nu besluiten over de samenhang tussen het dragen van een gordel en het geslacht van de bestuurder?
Tabel 3: werkelijke tabel
…………………………………………………………………………………………………………………………………………….. …………………………………………………………………………………………………………………………………………….. …………………………………………………………………………………………………………………………………………….. …………………………………………………………………………………………………………………………………………….. ……………………………………………………………………………………………………………………………………………..
Centrum voor Statistiek
2
Kruistabellen
Werktekst voor de leerling
2de manier: bepalen van het relatief risico Een tweede manier om te bepalen of er al dan niet een samenhang bestaat tussen het geslacht van de automobilist en het dragen van een gordel, is te kijken naar het relatief risico. Als je het “niet dragen van een gordel” als risico beschouwt, dan bereken je het relatief risico als volgt:
relatief risico =
proportie ' niet gordel dragers' bij de mannen proportie ' niet gordel dragers' bij de vrouwen
Bereken het relatief risico. Wat kan je hier uit besluiten? Relatief risico = …………………………………………………………………………………………………………………………………………….. …………………………………………………………………………………………………………………………………………….. ……………………………………………………………………………………………………………………………………………..
2. Huisdieren en allergie Bestaat er een verband tussen het houden van een kat als huisdier, en het lijden aan een allergie voor huisstofmijt. 1500 personen namen deel aan het onderzoek. De resultaten zijn samengevat in de onderstaande 2x2 kruistabel.
Allergie Kat
Ja Nee Totaal
Ja 592 118 710
Nee 253 537 790
Totaal 845 655 1500
Haal uit deze tabel de marginale informatie over de veranderlijken allergie en huisdier. Marginale informatie:
Je kan nu aflezen dat van de 1500 ondervraagde personen, 47.33% een allergie voor huisstofmijt heeft. Zo zie je ook dat 43.67% geen kat als huisdier heeft…
Centrum voor Statistiek
3
Kruistabellen
Werktekst voor de leerling
Stel nu op basis van deze marginale tabellen de ‘ideale’ kruistabel op, die je zou krijgen indien er tussen een allergie voor huisstofmijt en het houden van een kat, geen samenhang bestaat. Conditioneer hierbij op de veranderlijke ‘kat’. …………………………………………………………………………………………………………………………………………….. …………………………………………………………………………………………………………………………………………….. …………………………………………………………………………………………………………………………………………….. …………………………………………………………………………………………………………………………………………….. …………………………………………………………………………………………………………………………………………….. …………………………………………………………………………………………………………………………………………….. …………………………………………………………………………………………………………………………………………….. De ‘ideale’ tabel ziet er dan als volgt uit:
Maar wat gebeurde er in werkelijkheid? Stel nu de werkelijke tabel op, waarbij je eveneens conditioneert op de veranderlijke kat. Is er een samenhang tussen het houden van een kat als huisdier en het hebben van een allergie voor huisstofmijt? De werkelijke tabel wordt:
…………………………………………………………………………………………………………………………………………….. …………………………………………………………………………………………………………………………………………….. …………………………………………………………………………………………………………………………………………….. …………………………………………………………………………………………………………………………………………….. …………………………………………………………………………………………………………………………………………….. …………………………………………………………………………………………………………………………………………….. ……………………………………………………………………………………………………………………………………………..
Centrum voor Statistiek
4
Kruistabellen
Werktekst voor de leerling
Bekom je dezelfde conclusie indien je het relatief risico berekent? …………………………………………………………………………………………………………………………………………….. …………………………………………………………………………………………………………………………………………….. …………………………………………………………………………………………………………………………………………….. …………………………………………………………………………………………………………………………………………….. …………………………………………………………………………………………………………………………………………….. Herhaal nu de vorige drie vragen, maar ipv te conditioneren op de veranderlijke ‘kat’, conditioneer je nu op de veranderlijke ‘allergie’. Welke resultaten bekom je? …………………………………………………………………………………………………………………………………………….. …………………………………………………………………………………………………………………………………………….. …………………………………………………………………………………………………………………………………………….. …………………………………………………………………………………………………………………………………………….. ……………………………………………………………………………………………………………………………………………..
Conditioneren we de werkelijke tabel op de veranderlijke allergie, dan krijgen we:
…………………………………………………………………………………………………………………………………………….. …………………………………………………………………………………………………………………………………………….. …………………………………………………………………………………………………………………………………………….. …………………………………………………………………………………………………………………………………………….. …………………………………………………………………………………………………………………………………………….. …………………………………………………………………………………………………………………………………………….. …………………………………………………………………………………………………………………………………………….. ……………………………………………………………………………………………………………………………………………..
Centrum voor Statistiek
5
Kruistabellen
Werktekst voor de leerling
3. Snurken en hartziektes Is er een samenhang tussen snurken en lijden aan een hartziekte? Onderzoekers onderzochten 2484 personen, en vatten de gegevens samen in de onderstaande kruistabel:
Niet
Hartziekte
Ja Nee
24 1355
Snurken Occasioneel Bijna elke nacht 35 21 603 192
Elke nacht 30 224
Conditioneel op snurken kan je nu de proporties uitrekenen van de personen die een hartziekte hebben. Doe dit nu voor de gegeven kruistabel. Waarmee begin je? …………………………………………………………………………………………………………………………………………….. ……………………………………………………………………………………………………………………………………………..
Kijk nu conditioneel per kolom, en vergelijk de voorwaardelijke percentages. Zit er veel verschil op? Wat kan je nu besluiten over de samenhang tussen snurken en hartziekte? …………………………………………………………………………………………………………………………………………….. …………………………………………………………………………………………………………………………………………….. …………………………………………………………………………………………………………………………………………….. …………………………………………………………………………………………………………………………………………….. …………………………………………………………………………………………………………………………………………….. ……………………………………………………………………………………………………………………………………………..
Centrum voor Statistiek
6
Kruistabellen
Werktekst voor de leerling
4. Is er leven na de dood? Is er samenhang tussen het geslacht van een persoon en het geloof in een leven na de dood? We onderzoeken dit nu voor jouw klas. Beantwoord de volgende vragen: Wat is jouw geslacht? Man Vrouw Geloof je in een leven na de dood? Ja Neen Welke categorische veranderlijken heb je? We hebben twee categorische veranderlijken namelijk “geslacht” en “geloof”. Vat de antwoorden van iedereen in de klas samen in een kruistabel. Welke soort kruistabel krijg je? …………………………………………………………………………………………………………………………………………….. ……………………………………………………………………………………………………………………………………………..
Onderzoek nu op twee manieren of er een samenhang bestaat tussen het geslacht van een persoon en of deze persoon gelooft in een leven na de dood. 1ste manier: verschil in proporties Marginale tabellen:
……………………………………………………………………………………………………………………………………………..
Centrum voor Statistiek
7
Kruistabellen
Werktekst voor de leerling
…………………………………………………………………………………………………………………………………………….. …………………………………………………………………………………………………………………………………………….. …………………………………………………………………………………………………………………………………………….. …………………………………………………………………………………………………………………………………………….. De ideale kruistabel zou er dus als volgt uitzien:
In werkelijkheid hebben we echter de volgende tabel:
…………………………………………………………………………………………………………………………………………….. …………………………………………………………………………………………………………………………………………….. …………………………………………………………………………………………………………………………………………….. …………………………………………………………………………………………………………………………………………….. …………………………………………………………………………………………………………………………………………….. …………………………………………………………………………………………………………………………………………….. …………………………………………………………………………………………………………………………………………….. 2de manier: bepalen van het relatief risico
relatief risico =
................................ = .................................
…………………………………………………………………………………………………………………………………………….. …………………………………………………………………………………………………………………………………………….. …………………………………………………………………………………………………………………………………………….. …………………………………………………………………………………………………………………………………………….. ……………………………………………………………………………………………………………………………………………..
Centrum voor Statistiek
8
Kruistabellen
Werktekst voor de leerling
5. Zakgeld tellen Is er een samenhang tussen de hoeveelheid zakgeld die je krijgt, en de manier waarop je je GSM-gebruik betaalt? Beantwoord de volgende vragen: Hoe betaal jij je GSM gebruik? Herlaadbare kaart Abonnement Heb geen GSM Hoeveel zakgeld krijg je per week? Geen Tussen 0 en 10 euro Tussen 10 en 20 euro Meer dan 20 euro Welke categorische veranderlijken heb je? Vat de antwoorden van iedereen in de klas samen in een kruistabel. Welke soort kruistabel krijg je? …………………………………………………………………………………………………………………………………………….. …………………………………………………………………………………………………………………………………………….. …………………………………………………………………………………………………………………………………………….. …………………………………………………………………………………………………………………………………………….. ……………………………………………………………………………………………………………………………………………..
Breid de tabel uit met de rij- en de kolomtotalen, en leid hieruit de marginale informatie af voor elke veranderlijke afzonderlijk.
Centrum voor Statistiek
9
Kruistabellen
Werktekst voor de leerling
…………………………………………………………………………………………………………………………………………….. …………………………………………………………………………………………………………………………………………….. ……………………………………………………………………………………………………………………………………………..
…………………………………………………………………………………………………………………………………………….. …………………………………………………………………………………………………………………………………………….. …………………………………………………………………………………………………………………………………………….. …………………………………………………………………………………………………………………………………………….. Krijgen leerlingen die geen GSM toestel hebben ongeveer een zelfde hoeveelheid zakgeld, als de leerlingen die hun GSM-kosten met een abonnement betalen? Hoe kan je dit nagaan? …………………………………………………………………………………………………………………………………………….. …………………………………………………………………………………………………………………………………………….. ……………………………………………………………………………………………………………………………………………..
…………………………………………………………………………………………………………………………………………….. …………………………………………………………………………………………………………………………………………….. …………………………………………………………………………………………………………………………………………….. …………………………………………………………………………………………………………………………………………….. ……………………………………………………………………………………………………………………………………………..
Centrum voor Statistiek
10
Kruistabellen
Werktekst voor de leerling
Is er een samenhang tussen de manier waarop de leerlingen hun GSM kosten betalen en de hoeveelheid zakgeld die ze wekelijks krijgen? Hoe kan je dit nagaan? …………………………………………………………………………………………………………………………………………….. …………………………………………………………………………………………………………………………………………….. ……………………………………………………………………………………………………………………………………………..
…………………………………………………………………………………………………………………………………………….. …………………………………………………………………………………………………………………………………………….. …………………………………………………………………………………………………………………………………………….. …………………………………………………………………………………………………………………………………………….. …………………………………………………………………………………………………………………………………………….. …………………………………………………………………………………………………………………………………………….. .
Nota: De voorbeelden met kleine aantallen (zoals opmetingen in een klas) zijn nuttig om op verschillende manieren informatie in kruistabellen te leren ontdekken. De aantallen zijn echter te klein om op basis van deze observaties waardevolle statistische besluiten te kunnen trekken.
Centrum voor Statistiek
11