Statistiek met Excel
Schoolexamen en Uitbreidingsopdrachten
Dit materiaal is gemaakt binnen de Leergang Wiskunde schooljaar 2013/14
Dit materiaal is gemaakt binnen de Leergang Wiskunde schooljaar 2013/14
2
Inhoudsopgave
Achtergrondinformatie ........................................................................................................................... 4 Schoolexamen Wiskunde VWO: Statistiek met grote datasets .............................................................. 5 Uibreidingsopdrachten vwo 5 ............................................................................................................... 6 Schoolexamen Wiskunde HAVO: Statistiek met ICT .............................................................................. 12 Handleiding voor docenten: Analyse van gegevens met Excel voor VWO ............................................ 13
Dit materiaal is gemaakt binnen de Leergang Wiskunde schooljaar 2013/14
3
Achtergrondinformatie Auteurs: Lonneke Boels;
[email protected] Anne van Bodegraven;
[email protected] Patrick Hamersma;
[email protected]
Doelgroep: Wij hebben ons gericht op 5 vwo wiskunde A. Omdat we meer verwachten van vwo is er een kleine aanvulling op het hiervoor genoemde document gemaakt.
Voorkennis: Leerlingen moeten al kennis hebben van het de normale verdeling. Ook moeten ze de verschillende soorten grafieken die worden behandeld kennen en de begrippen “gemiddelde, maximum, minimum, mediaan, modus en standaardafwijking”.
Waaruit bestaat het materiaal? Dit materiaal bestaat uit een schoolexamen voor het vwo (dit moet in 3 uur geheel zelfstandig gemaakt worden) en een uitbreidingsdocument (voor het vwo) op het materiaal dat gemaakt is door de werkgroep Statistiek Zwolle voor de havo. Er is ook een schoolexamen voor havo opgesteld.
Wat was de aanleiding om dit te ontwerpen? Er is een document gemaakt door werkgroep Statistiek Zwolle in het kader van de leergang wiskunde voor het aanleren en toetsen van statistische vaardigheden bij grote datasets met behulp van ICT. Dit document gaf als advies nog een schoolexamen te ontwerpen. Het ontwerpen van een schoolexamen hebben wij als doel gesteld.
Wat zijn de ervaringen met dit materiaal? Het reeds bestaande document voor de havo is uitgetest in 4vwo. Dit is in twee lesuren door te werken tot en met het onderdeel “het maken van een gegevensanalyse beschrijvende statistiek”. De aanvulling voor VWO is ook uitgetest in 4vwo. Dit is in één lesuur door te werken. Tot slot hebben deze leerlingen één uur gewerkt aan de eerste vijf vragen van het schoolexamen. Vooral het maken van de grafieken was nog te ingewikkeld op dat moment.
Wat zijn de aanbevelingen voor verdere ontwerpen? Bespreek met de leerlingen bij welke data welke grafieken zinvol zijn en welke niet. Laat leerlingen voorbeelden zien van slechte grafieken en laat ze uitleggen waarom deze niet zinvol zijn. Laat de leerlingen ook de opgaven over de grote dataset van het havomateriaal maken en laat de leerlingen daarna nadenken welke bewerkingen van de dataset zinvol zouden zijn om nog andere grafieken te kunnen maken (bijv gemiddelde per …., gegevens opsplitsen naar jaar/profiel/…) en bespreek dit. Oefen ook nog minimaal 2 uur met het nadenken over mogelijke regressies (verbanden) met het verrijkingsmateriaal uit het bestaande document. Neem voldoende de tijd voor onder begeleiding maken en nadenken over datasets. Het schoolexamen moeten ze zelfstandig doen dus ze moeten al eerder dezelfde soort vragen gezien hebben.
Dit materiaal is gemaakt binnen de Leergang Wiskunde schooljaar 2013/14
4
Schoolexamen Wiskunde VWO: Statistiek met grote datasets
Je krijgt een dataset van je docent. Beantwoord daarover de volgende vragen. Je hebt hiervoor 3 lesuren de tijd. Gebruik hiervoor Excel. Zet in het Excelbestand tekst met antwoorden op de vragen. Totaal 65 punten. Cijfer = 9 * score/65 +1 1 Onderzoek of de data “fouten” bevat met behulp van je spreidingsplot en haal deze er eventueel uit. (5p) 2 Bereken het gemiddelde, de mediaan, de modus en de standaardafwijking. Leg uit welke waarde het meest nuttig is en waarom de andere waarden niet nuttig zijn/geen betekenis hebben. (5p) 3 Bedenk en bereken een andere maat dan de hiervoor genoemde. Wat zou je hieraan kunnen hebben? Is deze maat beter dan bijvoorbeeld het gemiddelde of de mediaan? (5p) 4 Bespreek alle grafische weergaven bij een door jou gekozen kolom. Zorg ervoor dat de zinnige weergaven duidelijk worden getoond en leg bij de weergaven die je niet gebruikt uit waarom deze niet zinnig zijn. De weergaven die moeten worden bekeken zijn: Lijngrafiek, staafdiagram of stapeldiagram, cirkeldiagram, spreidingsplot en boxplot. (15p) 5 Bekijk de grafieken die je gemaakt hebt. Welke conclusies kun je hieruit trekken? (5p) Voor de vragen hieronder moet je de “Analysis Toolpak” gebruiken die niet standaard in Excel geactiveerd is. 6 Maak een correlatie matrix. Geef in de matrix met een kleurtje aan welke waarden relevant zijn. (5p) 7 Kies zelf twee geschikte variabelen (kolommen) waarvan je de regressie uit laat rekenen. Leg vooraf uit waarom je denkt dat er een oorzakelijk verband tussen deze twee variabelen zou kunnen bestaan. (10p) 8 Kies een variabele waarvan je vermoedt dat die normaal verdeeld kan zijn. Onderzoek dit: • Bereken het gemiddelde, de mediaan en de modus en vergelijk die. • Maak een histogram, neem het gemiddelde en bouw daaromheen je klassengrenzen op. • Bereken de scheefheid en de (excess-‐) kurtosis. (15p) Sla je document op en lever het in bij je docent.
EINDE
Dit materiaal is gemaakt binnen de Leergang Wiskunde schooljaar 2013/14
5
Uitbreidingsopdrachten VWO 5 A.Correlatiematrix
* Klik in de bovenste balk “Gegevens” aan en vervolgens: “Gegevensanalyse”.
* Selecteer in het schermpje dat je krijgt “Correlatie” en klik op “OK”.
* Je krijgt nu bovenstaand scherm. Klik op het vakje met het rode pijltje achter “Invoerbereik”. En selecteer de kolommen van de klassen en het totaal in de tabel:
Dit materiaal is gemaakt binnen de Leergang Wiskunde schooljaar 2013/14
6
* En klik vervolgens weer op het vakje met het rode pijltje en je komt weer terug in het eerdere schermpje:
* Vink het vakje “Labels in de eerste rij aan” en typ achter “Nieuw werkblad”: correlatie. Klik vervolgens op ok. Nu krijg je een tabblad correlatie in je onderbalk:
Dit materiaal is gemaakt binnen de Leergang Wiskunde schooljaar 2013/14
7
B. Regressie Bij een hoge waarde in de correlatiematrix kan het de moeite zijn om een regressie uit te voeren. * Ga hiervoor eerst terug naar het tabblad “Gegevens 1”, onder in het scherm.
* Klik nu in de bovenste balk opnieuw “Gegevens” aan en vervolgens: “Gegevensanalyse”.
* Selecteer in het schermpje dat je krijgt “Regressie” en klik op “OK”.
* Klik op het rode pijltje naast “Invoerbereik Y” en selecteer de kolom “Totaal” en ga daarna met het rode pijltje weer terug naar bovenstaand schermpje. * Klik dan op het rode pijltje naast “Invoerbereik X” en selecteer de kolom “1e klas” en ga weer terug met het rode pijltje naar bovenstaand schermpje.
Dit materiaal is gemaakt binnen de Leergang Wiskunde schooljaar 2013/14
8
* Vink het vakje “Labels” aan en typ achter “Nieuw werkblad”: “Regressie”. Vink ook het vakje “Grafiek voor lijnen” aan.
* En klik nu op “OK”. Nu krijg je een tabblad “Regressie” in je onderbalk:
* Je ziet nu dat de kopjes niet in de vakjes passen. Dubbelklik daarom op de scheidingslijnen tussen de letters A t/m I, de vakjes worden nu automatisch zo breed dat de woorden en getallen er goed in passen.
Dit materiaal is gemaakt binnen de Leergang Wiskunde schooljaar 2013/14
9
C. Histogram Om te kunnen controleren of gegevens normaal verdeeld zijn, is het handig om een histogram te maken. We gaan dit uitvoeren aan de hand van de gegevens in het tabblad “Parijs”. * Je hebt al de opdracht “Beschrijvende statistiek” uitgevoerd en dit opgeslagen in het tabblad “Statistische gegevens”. Hieruit kun je al veel gegevens aflezen: het gemiddelde, de mediaan, de modus, het maximum en minimum, de kurtosis en de scheefheid. * Typ nu 0 in het tabblad “Parijs” in vakje K3 en 2 in vakje K4. Selecteer deze twee vakjes. Klik nu op het kleine zwarte vierkantje rechtsonder deze twee vakjes en sleep dit naar beneden tot er 20 naast staat, Excel zet nu automatisch 0, 2, 4, …, 20 in deze vakjes. * Klik weer in de bovenste “Gegevens” aan en vervolgens “Gegevensanalyse”.
* Klik hiervoor in de bovenste balk opnieuw “Gegevens” aan en vervolgens: “Gegevensanalyse”.
* Selecteer in het schermpje dat je krijgt “Histogram” en klik op “OK”. * Klik op het rode pijltje naast “Invoerbereik” en selecteer B3 t/m B33 en ga daarna met het rode pijltje weer terug.
Dit materiaal is gemaakt binnen de Leergang Wiskunde schooljaar 2013/14
10
* Klik dan op het rode pijltje naast “Verzamelbereik” en selecteer K3 t/m K13 en ga weer terug met het rode pijltje naar. * Vink het vakje “Labels” nu niet aan, want de namen van de kolommen dit keer niet geselecteerd. Typ achter “Nieuw werkblad”: “Histogram”. Vink ook het vakje “Grafiek maken” aan. En klik tot slot op OK. Je krijgt nu een histogram en een tabel met de frequenties. Wat betekenen deze frequenties?
Dit materiaal is gemaakt binnen de Leergang Wiskunde schooljaar 2013/14
11
Schoolexamen HAVO 4: Statistiek met ICT De “Database MTcars.xls” bevat de gegevens die nodig zijn bij het uitvoeren van onderstaande opdrachten. 12p Opdracht 1. Bespreek alle grafische weergaven bij een door jou gekozen kolom. Zorg ervoor dat de zinnige weergaven duidelijk worden getoond en leg bij de weergaven die je niet gebruikt uit waarom deze niet zinnig zijn. De weergaven die moeten worden bekeken zijn: Lijngrafiek, staafdiagram of stapeldiagram, cirkeldiagram, spreidingsplot en boxplot. 6p Opdracht 2. Bekijk de grafieken die je gemaakt hebt. Welke conclusies kun je hieruit trekken? 8p Opdracht 3. Bereken het gemiddelde, de mediaan, de modus en de standaardafwijking. Leg uit welke waarde het meest nuttig is en waarom de andere waarden niet nuttig zijn/geen betekenis hebben. 4p Opdracht 4. Bedenk en bereken een andere maat dan de hiervoor genoemde. Wat zou je hieraan kunnen hebben? Is deze maat beter dan bijvoorbeeld het gemiddelde of de mediaan? Sla alles op (ook tussendoor) en lever je eindbestand in.
Dit materiaal is gemaakt binnen de Leergang Wiskunde schooljaar 2013/14
12
Handleiding voor docenten: Analyse van gegevens met Excel voor vwo.
Voor geavanceerde toepassingen van Excel is de Analysis ToolPak handig. Deze installeer je als volgt. Klik op een tabblad met rechtermuisknop. Bijvoorbeeld op tabblad invoegen. Er verschijnt dan dit menu:
Kies hier Werkblad snelle toegang aanpassen…. Er verschijnt een pop-‐up waarin je invoegtoepassingen kiest. Kies hier Analysis ToolPak en klik op start.
Klik dus hier op start (bij beheren Excel-‐invoegtoepassingen) dat ongeveer midden-‐onder in de pop-‐up staat. Er komt een nieuwe pop-‐up. Vink hier Analysis ToolPak aan. Klik op OK.
Dit materiaal is gemaakt binnen de Leergang Wiskunde schooljaar 2013/14
13
In het werkblad gegevens is er nu een extra opdracht bijgekomen: gegevensanalyse.
Boxplot tekenen Eerst moeten de kwartielen worden berekend (incl. min. En max.). Typ ergens in een cel de tekst =kwar er verschijnt nu een pop-‐up waarin alle mogelijke kwartielberekeningen staan.
Kies de derde optie (kwartiel) en klik hier met de rechtermuisknop dubbel op.
Selecteer de gegevens met je muis. Let op dat je één kolom met gegevens selecteert. Typ daarna een ; en vervolgens het getal dat hoort bij dat kwartiel (zie ook uitleg van Excel).
Typ daarna de sluithaak en enter en de waarde van het gewenste kwartiel verschijnt. Analyse mogelijke fouten Wat gaat er mis? Vreemde grafiek of grafiek is horizontale lijn Controleer of de getallen met een komma zijn geschreven. Mogelijk oorzaak: als de getallen met een punt zijn geschreven (NL versie van Excel) dan herkent Excel ze niet als getal. Oplossing: met zoek en vervang alle punten in komma’s veranderen.
Dit materiaal is gemaakt binnen de Leergang Wiskunde schooljaar 2013/14
14
Spreidingsplot lukt niet Spreidingsplot is niet mogelijk of geeft geen spreiding. Mogelijk oorzaak: voor een spreidingsplot moeten zowel de x als y rationale of reële getallen zijn (in statistiekprogramma’s wordt dit vaak ratio. genoemd). Een categorienaam (nominaal of ordinaal) werkt dus niet. Boxplot tekenen lukt niet De methode die in de basiscursus Excel staat beschreven, werkt alleen voor oudere versies van Excel. Voor de nieuwere versies van Excel (in elk geval Excel 2013) moet een andere truc worden bedacht. Hiervoor wordt een gestapeld staafdiagram gebruikt met foutgrenzen. De foutgrenzen berekenen we zelf (whiskers genoemd). Zie de Engelstalige handleiding op google drive Boxplot maken in Excel 2013.pdf of de docentenhandleiding voor het vwo wiskunde A.
Dit materiaal is gemaakt binnen de Leergang Wiskunde schooljaar 2013/14
15