Stoeien met Statistiek
Havo 4: Statistiek op grote datasets
Dit materiaal is gemaakt binnen de Leergang Wiskunde schooljaar 2013/14
Dit materiaal is gemaakt binnen de Leergang Wiskunde schooljaar 2013/14
2
Inhoudsopgave Achtergrondinformatie ......................................................................................................................... 4 Docentenhandleiding ............................................................................................................................ 5 Inleiding voor leerlingen ....................................................................................................................... 6 Opdracht 1 ............................................................................................................................................ 7 Opdracht 2 ............................................................................................................................................ 8 Opdracht 3 ............................................................................................................................................ 9 Opdracht 4 ............................................................................................................................................10 Opdracht 5 ........................................................................................................................................... 11 Bonusopdracht .................................................................................................................................... 13
Dit materiaal is gemaakt binnen de Leergang Wiskunde schooljaar 2013/14
3
Achtergrondinformatie
Auteurs: Sandra van de Kamp (Sondervick College) Klaas Beurskens (Valuascollege) Chantal Gubbels-‐Theelen (Blariacumcollege)
[email protected] [email protected] [email protected]
Doel van het materiaal: We willen een praktische opdracht maken rond grote datasets. Het idee hierachter is dat niet alle scholen faciliteiten hebben om grote datasets in de les aan te bieden (gebrek aan computers, programma’s, netwerkmogelijkheden, geld enz.). Als leerlingen hier thuis zelfstandig (of eventueel op school) mee aan de slag kunnen gaan, wordt een aantal van deze problemen ondervangen.
Randvoorwaarden: -‐ Welke ICT faciliteiten zijn er bij jou op school? (computerlokalen, programma’s om met grote datasets te werken, geld om eventueel programma’s aan te schaffen, enz.) -‐ Zijn er gratis programma’s om (eventueel online) met grote datasets te werken? -‐ Welke voorkennis wordt verondersteld en hoe wordt deze aangeboden? -‐ Welke (kern)doelen hebben leerlingen behaald aan het einde van de praktische opdrachten?
Dit materiaal is gemaakt binnen de Leergang Wiskunde schooljaar 2013/14
4
Docentenhandleiding
Opzet en doel De opzet van deze lessenserie is leerlingen uit havo vier actief met statistiek in aanraking te laten komen. Vandaar dat we gekozen hebben voor een door leerlingen (vierde klassers van het havo/vwo van de vier bovengenoemde scholen) zelf ingevulde dataset. Hierbij is gekozen om vragen te stellen over de leerlingen zelf (zie excel document). De voorkennis betreft de lesstof van het domein statistiek uit havo 3. De leerlingen gaan met Excel aan de slag. Hiervoor is enige basiskennis noodzakelijk. Hierbij moet gedacht worden begrippen als rij, kolom, tabblad en is het handig als leerlingen ervaring hebben met het tekenen van grafieken en diagrammen in Excel. Hierbij kan met de indeling van de groepen eventueel rekening gehouden worden. Het doel van de opdrachten is leerlingen kennis te laten maken met grote datasets en kritisch worden bij het verwerken van gegevens en het trekken van conclusies. Daarom hebben de opdrachten met opzet een open karakter, zodat ze leerlingen zichzelf kan ontplooien. Met het oog daarop achten wij het niet noodzakelijk dat een leerling veel kennis heeft van Excel, maar deze kennis zelf ontwikkelen door gebruik te maken van de help-‐functie in Excel of zoeken via Google.
De lessenreeks:
Duur van de lessenserie: -‐ 3 lessen voor het uitwerken van de opdracht, eigen inbreng en het maken van de presentatie. -‐ 1 of 2 lessen voor de presentatie. Om privacy redenen hebben we de vier scholen A, B, C en D genoemd. De klas wordt opgesplitst in groepjes van drie á vier personen. Elk groepje krijgt een opdracht over een deel van de bovengenoemde gegevens. Deze opdracht mag de groep naar eigen inzicht uitvoeren en eventueel uitbreiden. Er wordt gebruik gemaakt van het programma Excel. Voorkennis van dit programma is niet vereist. De opdracht bestaat uit twee delen: het uitwerken van de vragen in een verslag en het presenteren hiervan. We verwachten van de leerlingen een kritische houding ten opzichte van de resultaten die voortkomen uit de opdrachten. Dus niet te snel conclusies trekken, kijken of er genoeg gegevens beschikbaar zijn en of de antwoorden die de leerlingen in de enquête gegeven hebben realistisch zijn. In het verslag moet dit bovenstaande terugkomen.
Dit materiaal is gemaakt binnen de Leergang Wiskunde schooljaar 2013/14
5
Inleiding voor leerlingen De komende lessen gaan we ons bezighouden met het statistisch verwerken van gegevens. We maken hierbij gebruik van gegevens van leerlingen uit de vierde klas van 4 scholen (om privacy redenen A, B, C en D genoemd) die via een enquête zijn verkregen. De klas wordt opgesplitst in groepjes van drie á vier personen. Elk groepje krijgt een opdracht over een deel van de bovengenoemde gegevens. Deze opdracht mag de groep naar eigen inzicht uitvoeren en eventueel uitbreiden. Er wordt gebruik gemaakt van het programma Excel. Voorkennis van dit programma is niet vereist. De opdracht bestaat uit twee delen: het uitwerken van de vragen in een verslag en het presenteren hiervan. We verwachten van jullie een kritische houding ten opzichte van de resultaten die voortkomen uit jullie opdrachten. Trek niet te snel conclusies. Denk hierbij aan het wel/niet representatief zijn van een steekproef. Discussieer eerst als groep over de resultaten, probeer bijzonderheden te verklaren en leg deze discussiepunten ook vast in je verslag. Beoordelingspunten voor verslag: weging Titelblad 1 Introductie 1 Uitwerking 4 Uitbreiding 2 Reflectie 2 Het eindcijfer wordt bepaald door: weging Groepsproces 2 Verslag 5 Presentatie 3
Dit materiaal is gemaakt binnen de Leergang Wiskunde schooljaar 2013/14
6
Opdracht 1
1
2 3. 4. 5. 6.
Onderzoek het keuze gedrag van mannen en vrouwen m.b.t. wiskundevakken op havo en VWO. Kopieer eerst de kolommen: Naam van school, geslacht, niveau en soort wiskunde naar een nieuw bestand. Eerst bekijken we de keuzes van de mannen op de havo. Kies tabblad gegevens en sorteer de kolommen zo dat je voor de havo bij de mannen per school kunt bekijken hoeveel mannen kiezen voor de verschillende wiskunde vakken. Verwerk deze m.b.v. cirkeldiagrammen per school en voor het totale populatie (absolute aantallen of procenten?). Beschrijf de keuzes en let op de verschillen tussen de scholen. Zou een ander diagram ook kunnen? Welke? Nu bekijken we de keuzes van de vrouwen op de havo. Herhaal hiervoor de stappen 2, 3, 4 en 5. Vergelijk de keuzes van de mannen met de keuzes van de vrouwen. Beschrijf de verschillen/overeenkomsten in het totaal en per school.
Doe ditzelfde onderzoek voor het VWO.
Dit materiaal is gemaakt binnen de Leergang Wiskunde schooljaar 2013/14
7
Opdracht 2 1
2 3 4 5 6. 7
Onderzoek de reisafstand van huis tot school. Kopieer eerst de kolommen: Naam van school en reisafstand in kilometers. Eerst bekijken we de reisafstand voor de totale populatie. Kies tabblad gegevens en sorteer de kolommen zo dat je voor de totale populatie de afstanden in oplopende grootte krijgt staan. Bereken met Excel de gemiddelde reisafstand per school. Bepaal daarnaast de kleinste afstand, het eerste kwartiel, de mediaan, het derde kwartiel en de grootste afstand. Teken een boxplot (Met Excel?) Zou een ander diagram ook kunnen? Welke? Wellicht een klassen indeling maken? Nu bekijken we de reisafstand per school. Verdeel de gegevens in 4 porties en herhaal de stappen 2, 3, 4 en 5 voor elke school. Vergelijk de verschillende boxplots en kijk of je de verschillen/ overeenkomsten kunt verklaren. Bij enkele scholen zit er een (of enkele) uitzonderlijk grote afstand bij. Laat deze weg en bereken gemiddelde en mediaan opnieuw. Hoeveel verandert het gemiddelde en hoeveel de mediaan? Kun je dat verschil verklaren?
Dit materiaal is gemaakt binnen de Leergang Wiskunde schooljaar 2013/14
8
Opdracht 3
1
2 3. 4. 5. 6.
Onderzoek de verdeling van de profielen per school Kopieer eerst de kolommen: Naam van school, niveau, profiel Eerst bekijken we de keuzes op havo Maak per school een tabel waar de aantallen per profiel staan beschreven. Beschrijf hoe je dit doet m.b.v. Excel (laat Excel ook de aantallen uitrekenen). Verwerk deze m.b.v. cirkeldiagrammen per school en voor de totale populatie (absolute aantallen of procenten?). Beschrijf de keuzes en let op de verschillen tussen de scholen. Zou een ander diagram ook kunnen? Welke? Nu bekijken we de keuzes op het vwo. Herhaal hiervoor de stappen 2, 3, 4 en 5. Vergelijk de keuzes van de mannen met de keuzes van de vrouwen. Beschrijf de verschillen/overeenkomsten in het totaal en per school.
Dit materiaal is gemaakt binnen de Leergang Wiskunde schooljaar 2013/14
9
Opdracht 4
1
2 3 4
5 6 7
Onderzoek de samenhang tussen de resultaten van verschillende vakken. Kopieer eerst de kolommen: Naam van school, niveau, profiel. Huidig gemiddelde voor Nederlands, Engels, wiskunde en natuurkunde. Eerst bekijken we de resultaten op de havo. Bereken per school het gemiddelde per vak. Beschrijf hoe je dit doet met Excel. Zie je verschillen? Bereken per profiel de gemiddeldes per vak (neem alle scholen samen). Beschrijf hoe je dit doet met Excel. Zie je verschillen? Hoe zou je kunnen onderzoeken of er samenhang is tussen bijvoorbeeld de resultaten van Nederlands en Engels? (Bijvoorbeeld: scoren leerlingen die goed scoren voor Nederlands ook goed bij Engels? Of zijn de leerlingen die goed zijn in taal slecht in wiskunde?) Hoe zou je dat kunnen doen? Beschrijf je werkwijze? Welke manier van weergave past hier bij? Doe ditzelfde onderzoek voor het VWO. Herhaal de stappen 2, 3 en 4 ook voor het vwo. Zie je ook verschillen tussen de resultaten op havo en op vwo niveau? Zelf samenhang onderzoeken Onderzoek zelf ook samenhang tussen bepaalde resultaten. Je mag alle kolommen gebruiken. Beschrijf duidelijk wat je hebt gedaan.
Dit materiaal is gemaakt binnen de Leergang Wiskunde schooljaar 2013/14
10
Opdracht 5 Hieronder zie je een puntenwolk waarbij de lengte van een groep jongens vergeleken wordt met de gemiddelde lengte van hun ouders. De lengtes zijn gegeven in meters.
Opgave 1 Kun je uit de puntenwolk concluderen dat er een verband is tussen de lengte van een zoon en de gemiddelde lengte van zijn ouders? Een ruige schatting van hoe lang een jongen uiteindelijk gaat worden kun je krijgen door de volgende formule: 𝑠𝑐ℎ𝑎𝑡𝑡𝑖𝑛𝑔 𝑙𝑒𝑛𝑔𝑡𝑒 𝑧𝑜𝑜𝑛 =
!"#$%" !"#$%!!"#$%" !"#$#% !
+0.03
Opgave 2 Teken de lijn die hoort bij deze schatting in de puntenwolk in de uitwerkbijlage.
Dit materiaal is gemaakt binnen de Leergang Wiskunde schooljaar 2013/14
11
Opgave 3 Ga er vanuit dat de jongens in de onderzochte groep uitgegroeid zijn. Geeft de bovenstaande formule een goed schatting voor hun lengte? De trendlijn die hoort bij bovenstaande puntenwolk is getekend in onderstaande grafiek.
Opgave 4 Geef met behulp van deze lijn een nieuwe formule voor de schatting van de uiteindelijke lengte van een zoon.
Dit materiaal is gemaakt binnen de Leergang Wiskunde schooljaar 2013/14
12
Bonusopgave In de dataset staan nog veel meer gegevens over de leerlingen van de vier scholen. Maak zelf een opgave (en de bijbehorende uitwerking) van andere de gegevens die verwerkt zijn in de dataset. Denk aan de volgende onderdelen: -‐ Realistische opgave -‐ Samenhang -‐ Excel vaardigheden (en het beschrijven van de stappen) -‐ Gebruik van juiste diagrammen en grafieken
Dit materiaal is gemaakt binnen de Leergang Wiskunde schooljaar 2013/14
13