Statistiek met Excel
Dit materiaal is gemaakt binnen de Leergang Wiskunde schooljaar 2013/14
1
Dit materiaal is gemaakt binnen de Leergang Wiskunde schooljaar 2013/14
2
Inhoudsopgave Achtergrondinformatie ........................................................................................................................... 4 Statistiek met Excel ................................................................................................................................ 10 Het toepassen van de vaardigheden uit “Statistiek met Excel” op grote bestanden ............................ 21 Verrijkingsopdrachten ........................................................................................................................... 24 Verslag werken met grote datasets in HAVO4 ...................................................................................... 25
Dit materiaal is gemaakt binnen de Leergang Wiskunde schooljaar 2013/14
3
Achtergrondinformatie Auteurs
Marc Bouman; e-‐mail:
[email protected] Jossy Carmelia; e-‐mail: j.carmelia@osg-‐erasmus.nl Marian Gall; e-‐mail: m.gall@rsg-‐sneek.nl Bert Kraai; e-‐mail:
[email protected] Jan Mostert; e-‐mail:
[email protected] Eva Vermeulen; e-‐mail:
[email protected] Yde van Wieren; e-‐mail:
[email protected] Inleiding In de voorlopig vastgestelde examenprogramma's Wiskunde A (Havo en VWO) en Wiskunde C (VWO) is het domein Statistiek uitgebreid, vanuit de wens om leerlingen beter voor te bereiden op vervolgstudies op HBO en Universitair niveau. De belangrijkste veranderingen zijn: 1. het domein Statistiek wordt ook bij het centraal examen getoetst; 2. de nadruk verschuift van reproductie van kennis en opgaven, naar inzicht en productieve vaardigheden; 3. leerlingen dienen statistische vaardigheden toe te kunnen passen bij grote datasets met behulp van ICT en deze praktische vaardigheden dienen getoetst te worden bij het schoolexamen. Probleemstelling werkgroep Statistiek Zwolle Voor de lespraktijk is al nieuw pilot lesmateriaal ontwikkeld. Hoewel dit lesmateriaal nog verder beproefd en bijgewerkt kan worden, heeft de werkgroep Zwolle haar aandacht gericht op: het aanleren en toetsen van statistische vaardigheden bij grote datasets met behulp van ICT. Daarbij kwamen de volgende vragen naar boven: 1. Welke statistische basiskennis is er nodig voordat een leerling aan de slag kan met statistiek op een grote dataset? 2. Welke statistische software is er beschikbaar voor het werken met grote datasets? Welk pakket leent zich voor gebruik in het voortgezet onderwijs? 3. Welke instructie hebben leerlingen nodig voor het gebruik van deze software? Welke zijn reeds beschikbaar? 4. Welke datasets zijn beschikbaar? Welke lenen zich voor gebruik in het voortgezet onderwijs? 5. Welke leerlijn kan het beste gekozen worden, over de leerjaren heen? 6. Hoe dient de lesstof didactisch opgebouwd te worden? Welke ervaringen (best practices) zijn beschikbaar? 7. Hoe kan de lesstof praktisch getoetst worden, zowel tussentijds als bij het schoolexamen? Doelstelling werkgroep Statistiek Zwolle Lesmateriaal ontwikkelen zodat leerlingen kunnen kennismaken met het werken met een grote dataset en docenten hier ervaring mee op kunnen doen. Doelgroep De werkgroep Statistiek Zwolle heeft besloten zich in eerste instantie te richten op Havo wiskunde A, om de volgende redenen:
Dit materiaal is gemaakt binnen de Leergang Wiskunde schooljaar 2013/14
4
a. Dit is de eerste groep leerlingen die in 2017 examen gaat doen in dit vernieuwde examenonderdeel Statistiek. b. Dit lesmateriaal kan waarschijnlijk ook gebruikt worden bij VWO wiskunde A/C. Mogelijk biedt het zelfs een basis om op door te bouwen.
Verantwoording activiteiten en gemaakte keuzes 1. Benodigde basiskennis De werkgroep is van mening dat in de Havo-‐onderbouw de volgende statistische kennis en vaardigheden aan bod dienen te komen, om in de Havo-‐bovenbouw het gewenste niveau te kunnen bereiken: a. het verzamelen van statistische gegevens in een turfstaat, (cumulatieve) frequentietabel en kruistabel b. het zowel handmatig als met behulp van een eenvoudig ICT-‐programma (bv. Excel) weergeven van statistische gegevens in een dotplot, staafdiagram, histogram, cirkeldiagram, steelbladdiagram, lijndiagram, (relatieve) cumulatieve frequentiepolygoon, boxplot, puntenwolk c. de centrummaten gemiddelde, mediaan en modus. 2. Beschikbare statistische software De werkgroep heeft de volgende statistische software onderzocht: 1. VU Statistiek voor Windows. De nieuwste versie van VUStat is geschikt voor het werken met grote databestanden en kan Excel-‐bestanden te importeren. Voordeel: zeer gebruikersvriendelijk, werkt intuïtief. Nadeel: niet gratis (zie de site van VUSoft Amsterdam), wel een demoversie beschikbaar. 2. Excel. Het kan de meest voorkomende statistische berekeningen uitvoeren en grafieken en diagrammen weergeven. Voordeel: staat bij vrijwel alle scholen standaard geïnstalleerd op Windows PC's, dus 'gratis'. Nadeel: het maken van de diagrammen is bewerkelijk en soms gekunsteld (m.n. boxplot). 3. R. Open source software voor statistiek. De apart verkrijgbare R commander zorgt voor een menustructuur. Met de scripttaal kunnen tevens simulaties worden uitgevoerd. Voordeel: gratis, wordt bovendien op steeds meer vervolgopleidingen gebruikt. Nadeel: is vrij geavanceerd en voor Havo wiskunde A te hoog gegrepen (mogelijk wel geschikt voor VWO wiskunde D). 4. TI nSpire. Deze opvolger van de TI-‐84 beschikt over uitgebreide statistische functies. Nadeel: het intern geheugen van deze machine is nog onvoldoende voor het werken met grotere databestanden (beperkt aantal kolommen en rijen). Conclusies: 1. Zowel VUStat als Excel komen in aanmerking voor gebruik in het voortgezet onderwijs. 2. Het is wenselijk om het lesmateriaal zo te schrijven dat dit zoveel mogelijk onafhankelijk blijft van de te gebruiken software, omdat technische ontwikkelingen wellicht op korte termijn nieuwe alternatieven bieden (bv. smartphone). De werkgroep Zwolle heeft lesmateriaal ontwikkeld voor gebruik met Excel, zodat iedere school hier direct mee aan de slag kan.
Dit materiaal is gemaakt binnen de Leergang Wiskunde schooljaar 2013/14
5
3. Benodigde instructies leerlingen bij de software Bij het programma VUStat is nauwelijks instructie nodig voor het gebruik van de software. Als leerlingen vertrouwd zijn met de theoretische begrippen, diagrammen en rekentechnieken, zullen zij snel de verschillende mogelijkheden herkennen en onder de knie krijgen. Het programma Excel vraagt om meer instructie voor gebruik. Allereerst is het belangrijk om de inhoud van kolommen numeriek te coderen, anders kan Excel hier niet mee rekenen. Verder is het opletten geblazen bij het sorteren en selecteren van gegevens: hierbij worden gemakkelijk fouten gemaakt. Ook het aanmaken van diagrammen vereist iedere keer een (groot) aantal handelingen. En tenslotte is voor geavanceerdere statistische technieken een aparte invoegtoepassing vereist. De werkgroep Zwolle heeft er voor gekozen om een aparte instructie te ontwikkelen voor het gebruik van Excel. 4. Beschikbare datasets De werkgroep heeft aan een dataset de volgende eisen gesteld: tenminste 15 kolommen (variabelen) en tenminste 1000 records. Bij het zoeken naar een geschikte dataset hebben wij de volgende bronnen geraadpleegd: • De oefenbestanden die meegeleverd worden bij installatie van het programma R. Deze bestanden zijn veel te klein en bovendien gericht op het volwassen Amerikaanse publiek. • Daarnaast zijn er publieke sites die deels gratis en deels betaald datasets aanbieden. Dit vraagt nader onderzoek. Enkele voorbeelden: o CBS, http://www.cbs.nl/nl-‐NL/menu/informatie/onderwijs/home/default.htm, zie tevens bijlage. Deze site bevat een grote dataset over de beroepsbevolking voor gebruik in het voortgezet onderwijs, inclusief lesmateriaal. o KNMI, zie http://www.knmi.nl/klimatologie/. o Google Public Data, zie http://www.google.com/publicdata/directory met onder andere een doorverwijzing naar databases van Eurostat. o Amazon, zie http://aws.amazon.com/publicdatasets/. o http://opendatanederland.org/ o http://www.amsterdamopendata.nl/data?category=educatie-‐jeugd-‐diversiteit o http://www.kadaster.nl/web/Themas/Open-‐data.htm o https://twitter.com/Opendatanl Uiteindelijk hebben wij besloten om zelf een dataset samen te stellen op basis van leerlinggegevens in Magister. Deze dataset sluit aan bij de belevingswereld van de leerlingen: het bevat immers gegevens over henzelf. Het maken van zo'n dataset bleek echter minder eenvoudig dan gedacht. Om te beginnen moesten persoonlijke gegevens en cijfergegevens apart worden gedownload en vervolgens weer worden gecombineerd. Omwille van de privacy zijn de gegevens in sommige kolommen versleuteld, zoals leerlingnummer en postcode. Verder bleek dat er een validatieslag nodig was, omdat er gegevens (met name cijfers) ontbraken. Conclusies: 1. Het door leerlingen zelf laten samenstellen van een grote dataset op basis van eigen onderzoek is te tijdrovend. Deze optie valt af. 2. De met statistische software meegeleverde oefendatasets zijn over het algemeen te klein. Ook deze optie valt af. 3. Datasets van onderzoeksbureaus en publieke instellingen zijn niet altijd bruikbaar voor het voortgezet onderwijs, omdat de thematiek niet altijd aansluit bij de belevingswereld van
Dit materiaal is gemaakt binnen de Leergang Wiskunde schooljaar 2013/14
6
leerlingen, of omdat er veel specifieke vakkennis vereist is. Daarnaast worden grotere datasets veelal tegen betaling aangeboden. 4. Het zelf samenstellen van een grote dataset op basis van binnen de school beschikbare gegevens is een behoorlijk tijdrovende klus. 5. Het bouwen van een dataset met behulp van simulaties biedt een reëel alternatief. De werkgroep Zwolle heeft er voor gekozen om de ontbrekende gegevens in de dataset met leerlinggegevens aan te vullen met gesimuleerde data. 5. Het kiezen van een leerlijn over de jaren heen Het is de mening van de werkgroep Zwolle dat het aanleren van praktische statistische vaardigheden het beste incrementeel kan plaatsvinden. Iedere loop in deze leerspiraal bestaat uit: 1. exploreren van een nieuwe onderzoeksvraag en dit vertalen naar statistisch onderzoek; 2. aanleren van statistische vaardigheden voor de analyse van gegevens, het benoemen van kengetallen en het weergeven van resultaten; 3. het praktisch uitvoeren van onderzoek, waaronder het leren gebruiken van statistische software; 4. het kritisch evalueren van de wijze waarop de gegevens zijn verzameld, geanalyseerd en gepresenteerd en tevens nagaan hoe valide en betrouwbaar de gevonden resultaten zijn. Als je dit uitzet op een horizontale tijdslijn, ontstaan als het ware golfbewegingen waarbij bij iedere loop van de spiraal (en bij iedere stap) start met divergeren en eindigt met convergeren:
Het is belangrijk dat leerlingen deze manier van denken en werken aanleren. Dit kan bijvoorbeeld door het aanleren van praktische statistische vaardigheden over meerdere practica verdeeld over meerdere leerjaren aan te bieden. Een voorbeeld van een mogelijke leerlijn: 1. Basiskennis statistiek: turfstaten en frequentietabellen, gemiddelde/modus/mediaan, boxplot. Handmatig maken van eenvoudige diagrammen als lijn-‐, staaf-‐ en cirkeldiagrammen. 2. Bij bestaande tabellen met een beperkt aantal rijen en kolommen maken van diagrammen en boxplots met behulp van Excel. 3. Zelf uitvoeren van een statistisch onderzoekje onder een beperkte populatie, de resultaten verzamelen in een (gecodeerde) tabel in Excel en weergeven m.b.v. diagrammen. Bewust maken van het belang van betrouwbaarheid van onderzoeksgegevens. Bewust maken wat het effect is een beperkte omvang van de populatie of de steekproef op de validiteit van conclusies. In plaats hiervan voorzichtig hypotheses leren formuleren en omvormen tot onderzoeksvragen. 4. Basiskennis normale verdeling: standaardafwijking, vuistregels, kansen en grenswaarden berekenen.
Dit materiaal is gemaakt binnen de Leergang Wiskunde schooljaar 2013/14
7
5. Basiskennis statistisch onderzoek: soorten variabelen (nominaal, ordinaal, interval, ratio), verschillende soorten onderzoeksvragen (frequentie, verschil, samenhang). 6. Starten met een bestaande dataset, formuleren van bijpassende onderzoeksvragen, formuleren van hypotheses, toetsen van deze hypotheses op basis van de beschikbare gegevens. 7. Starten met een eigen onderzoeksvraag, op zoek gaan naar een daarbij passende dataset (of het zelf samenstellen van een dataset door het combineren van bestaande tabellen, of zelf genereren van data met behulp van simulatie). Formuleren en toetsen van hypotheses. 6. Didactische opbouw van de lesstof Door de werkgroep Zwolle is het volgende ontwikkeld: 1. Basiscursus Excel voor het leren tekenen van diagrammen en boxplots. 2. Dataset leerlinggegevens met bijbehorende opdrachtenserie. Enkele tips uit de eerste pilots met dit lesmateriaal: • Wissel theorie af met praktijk. Start bijvoorbeeld een blokuur met een stukje theorie, laat leerlingen vervolgens hiermee aan de slag gaan en sluit af met een reflectie op wat is geleerd. • Bouw opdrachten op in moeilijkheidsgraad en vrijheidsgraad. Geef snelle leerlingen ook de gelegenheid om zelf variaties op opdrachten te bedenken en uit te voeren. • Maak leerlingen zelf verantwoordelijk voor het uitzoeken van de technische details van Excel. Stel eventueel experts aan. • Beperk je als docent tot de instructie vooraf, klassenmanagement tijdens het uitvoeren van de opdracht, beantwoorden van vakinhoudelijke vragen en klassengesprek aan het eind. • Bewaak de voortgang door middel van een afvinklijst. 7. Het praktisch toetsen van de lesstof, zowel tussentijds als bij het schoolexamen Hierbij zijn door de werkgroep Zwolle de volgende werkwijzen toegepast: A. Eén school heeft de praktische opdrachten als afvinkonderdeel opgenomen. B. Een andere school heeft besloten om de uitwerkingen van leerlingen te waarderen met een cijfer op de volgende manier. Het basiscijfer van de opdracht is een 7, maar dat kan hoger of lager uitvallen. Dit heeft te maken met inzet, creativiteit en de uitwerking van de gemaakte opdrachten. Het is duidelijk dat dit onderdeel nog verdere uitwerking en beproeving in de praktijk behoeft. Vervolgstappen De werkgroep Zwolle heeft een eerste aanzet gegeven voor het ontwikkelen van lesmateriaal, zodat leerlingen kunnen kennismaken met het werken met een grote dataset en docenten hier ervaring mee op kunnen doen. Daarmee zijn we nog niet op het niveau dat wij de exameneisen volledig af kunnen dekken. Hiervoor zijn nog een aantal vervolgstappen nodig: • de didactische lijn en opdrachten verder ontwikkelen in de praktijk, bijvoorbeeld t.a.v. de normale verdeling. • de didactiek: hoe laat je leerlingen zoveel mogelijk zelf ontdekken, hoe monitor je als docent dit leerproces en welke mogelijkheden heb je om bij te sturen? • het tussentijds toetsen van deze praktijkvaardigheid • het ontwerpen van een praktisch schoolexamen • ervaring opdoen met VU Statistiek, als alternatief voor Excel
Dit materiaal is gemaakt binnen de Leergang Wiskunde schooljaar 2013/14
8
•
VWO A/C: het zelfstandig opzetten en uitvoeren van onderzoek, het toetsen van hypothesen.
Geraadpleegde bronnen
•
•
•
•
• •
•
Voorlopig vastgestelde examenprogramma's (juli 2013): http://www.leergangwiskunde.nl/docs/lesstof/Algemeenvoorlopig%20vastgestelde%20exame nprogrammas%20nieuwe%20wiskunde_wijzigingen%20tov%20geaccordeerde%20versie%20j uli%202013.pdf Concept syllabi centraal examen 2017 (veldraadpleging oktober 2013): https://www.cve.nl/item/conceptsyllabi_wiskunde_a_b_en_c Pilot lesmateriaal http://www.leergangwiskunde.nl/documenten.html Workshop A5 (ledenvergadering NVvW) over steekproeven (Carel van de Giessen) https://www.nvvw.nl/16820/jaarvergaderingen/downloads-‐2013 bevat tevens een proeflicentie VU Statistiek VU Statistiek is te bestellen via http://www.vusoft2.nl/ http://www.nrc.nl/nieuws/2012/02/14/statistiek-‐saai-‐cbs-‐cijfers-‐komen-‐tot-‐leven-‐op-‐een-‐ kaart/ http://nieuws.hum.uu.nl/2013/02/18/utrecht-‐data-‐school-‐studenten-‐analyseren-‐grote-‐ datasets-‐van-‐bedrijven-‐en-‐instellingen/
Bijlage
Mailbericht 14 januari 2014 Wat leuk dat u in uw lesprogramma ook aandacht wil besteden aan het materiaal van het CBS! Voor scholen heeft het CBS een speciale website gemaakt met informatie: CBS in de klas (http://www.cbs.nl/nl-‐NL/menu/informatie/onderwijs/home/default.htm) . Het Centrum voor Beleidsstatistiek kan alleen onder strikte voorwaarden data aan onderzoekers ter beschikking stellen en scholieren komen hiervoor niet in aanmerking (bovendien hangt er per onderzoek een behoorlijk prijskaartje aan). Op de website van CBS in de klas wordt wel speciaal voor leerkrachten en scholieren een groot databestand van de Enquête Beroepsbevolking ter beschikking gesteld. Het databestand en lesmateriaal kunt u hier downloaden: http://www.cbs.nl/nl-‐NL/menu/informatie/onderwijs/gereedschappen/wiskunde/databestand-‐ ebb.htm . Op deze website staat daarnaast nog andere informatie die u mogelijk kunt gebruiken in uw lessen. Met vriendelijke groet, Ineke Bottelberghs Account manager microdataservices
Dit materiaal is gemaakt binnen de Leergang Wiskunde schooljaar 2013/14
9
Statistiek met Excel In deze basiscursus Statistiek met Excel maak je verschillende opdrachten over statistiek. In deze handleiding ga je aan de hand van gegevens een lijngrafiek,stapeldiagram, cirkeldiagram, spreidingsplot en een boxplot maken. Lees deze handleiding goed en volg de stappen precies zoals omschreven. Krijg je niet de grafiek zoals deze bedoeld is, wis de grafiek en start opnieuw. Zorg ervoor dat je het gemaakte bestand tussendoor opslaat onder je eigen naam op een voor jou bekende plaats, zodat je het later kunt inleveren. Gegevens 1 Maak de lijngrafiek, het stapeldiagram, het cirkeldiagram, spreidingsplot en het boxplot in het betreffende tabblad met gegevens 1.
Figuur 1
1.Lijngrafiek Je gaat een lijngrafiek maken waarin het totale aantal leerlingen is uitgezet tegen het schooljaar. Dit gaat als volgt: • Selecteer de gegevens die in de lijngrafiek moeten komen, dus de schooljaren en de totalen. Doe dit als volgt: Selecteer eerst de schooljaren. Houd [Ctrl] ingedrukt terwijl je vervolgens de totalen selecteert. Zie figuur 1. •
Ga naar Invoegen: Grafieken. Klik op lijn en kies lijn met gegevensmarkeringen.
•
De lijngrafiek verschijnt en knip en plak deze naar het werkblad lijngrafiek.
•
We gaan deze lijngrafiek verfraaien: !
Op de lijngrafiek klikken en dan verschijnt Hulpmiddelen voor grafieken:Indelingen
!
Gebruik deze indelingen om precies de volgende grafiek te krijgen door o.a. de astitels te benoemen, gegevenslabels in te voeren, rasterlijnen,
Dit materiaal is gemaakt binnen de Leergang Wiskunde schooljaar 2013/14
10
!
De schaal kun je aanpassen door te dubbelklikken op de verticale as:
•
as opmaken: minimum vast 600 en sluiten
!
Niet alle aantallen bij de punten zijn goed zichtbaar. Verplaats de aantallen door op het getal bij een punt te klikken en het getal te verslepen.
!
Zet in deze grafiek een lineaire trendlijn en maak deze op qua lijnkleur en lijnstijl
!
Je kunt de grafiek qua kleur nog verfraaien
Na al deze handelingen moet je de volgende lijngrafiek (figuur 2) hebben:
Totaal aantal leerlingen 800
780
780 760 740 713
Aantal
720
689 700
678
Totaal
677
680
Linear (Totaal)
663
660 640
621
620 600 03-‐04
04-‐05
05-‐06
06-‐07
07-‐08
08-‐09
09-‐10
schooljaar
Figuur 2 Sla het bestand op.
Dit materiaal is gemaakt binnen de Leergang Wiskunde schooljaar 2013/14
11
2.Stapeldiagram Je maakt als volgt een stapeldiagram: ! Selecteer de gegevens die in het stapeldiagram komen(zie figuur 3).
Figuur 3 ! Benoem de assen en zorg ervoor dat je het stapeldiagram krijgt,zoals in figuur 4.
Aantal leerlingen
Aantal
900 800 700 600
6e klas 5e klas
500
4e klas
400
3e klas
300
2e klas
200
1e klas
100 0 03-‐04
04-‐05
05-‐06
06-‐07
07-‐08
08-‐09
09-‐10
Schooljaar
Figuur 4 ! Je kunt het stapeldiagram nog verfraaien qua kleur.
Dit materiaal is gemaakt binnen de Leergang Wiskunde schooljaar 2013/14
12
3. Cirkeldiagram Je maakt als volgt een cirkeldiagram voor het schooljaar 2009-‐2010: ! Selecteer de gegevens die in het cirkeldiagram komen(zie figuur 5).
Figuur 5 ! Benoem de titel en via indeling gegevenslabels kun je de gegevenslabels opmaken en in percentage laten tonen(zie figuur 6).
Schooljaar 2009-‐2010
9%
20%
1e klas 2e klas
20%
3e klas 17%
4e klas 5e klas 6e klas
17% 17%
Figuur 6
Dit materiaal is gemaakt binnen de Leergang Wiskunde schooljaar 2013/14
13
Parijs * Ga naar het werkblad: Parijs Hierin is het temperatuurverloop in Parijs in de maand maart van 2012 en 2013weergegeven. Verplaats je de aanwijzer naar beneden, dan verdwijnt de bovenste kop van het beeldscherm. Dat is te voorkomen. * Zet de aanwijzer in cel B3 * Ga naar Beeld: Blokkeren en kies titels blokkeren. 4.Spreidingsplot We gaan een spreidingsplot maken in het werkblad spreidingsplot bij de minimum temperatuur en het aantal mm neerslag. Zo zouden we bijvoorbeeld kunnen zien dat er meer neerslag valt als de minimum temperatuur laag is. * Selecteer de cellen C3 t/m C33 en E3 t/m E33. * Klik op invoegen en bij grafieken op spreiding. * Bij het menu indeling kun je verticale rasterlijnen aanzetten zodat je een beter beeld krijgt. * As titels maken: Labels, astitels. Zet horizontaal “minimum temperatuur” en verticaal “neerslag”. * Grafiektitel: Geef de grafiek de titel: “neerslag bij minimum temperatuur”. Formules in Excel Excel heeft de mogelijkheid om met ‘kant-‐en-‐klare’ formules te werken. We noemen dit functies. Er zijn verschillende manieren om functies in te voeren: In dit onderdeel behandelen we enkele veel gebruikte functies. Voor dit onderdeel heb je het werkblad Parijs, Cijfers en Excellent nodig. Om in Excel een formule in te voeren moet je in de gewenste cel beginnen met het intikken van een =. Op deze manier kan Excel een formule herkennen. Gebruik de vulgreep: het vierkantje in de rechter benedenhoek van de cel. Als je er met de muis naar toe gaat verschijnt een zwart kruisje. Deze kun je verslepen,zodat je niet voor elke cel een formule hoeft in te tikken. Excel past de formule wel aan. Onderaan de tabel moet je de maandtotalen van het aantal uren zon en de neerslag uitrekenen * Zet in cel A35: Totaal * Ga naar D35 en dan naar Formules en klik op functie invoegen * Selecteer :SOM en druk op OK. * Nu kun je de cellen aangeven, waarvan de som moet worden berekend D3:D33 en druk op OK. * Met de knop kun je het aantal cijfers achter de komma veranderen (deze staat bij Start). Zorg dat je een cijfer achter de komma krijgt. * Bereken zo het totaal aantal uren zon en de neerslag in deze maand.
Dit materiaal is gemaakt binnen de Leergang Wiskunde schooljaar 2013/14
14
De functie GEMIDDELDE Ook het gemiddelde aantal uren zon kun je berekenen met een functie. * Zet in cel A36: Gemiddeld * Zet de aanwijzer in cel D36 * Klik op de knop fx (Functie plakken) of als die er niet is via menukeuze: Invoegen en fx Functie Je krijgt het volgende venster:
* *
Selecteer het: GEMIDDELDE en druk op OK Nu kun je de cellen aangeven, waarvan het gemiddelde moet worden berekend bij Getal 1 staat: D3:D35, verander dat in D3:D33 en druk op OK Het antwoord is 5,637097 . Met de knop kun je het aantal cijfers achter de komma veranderen. Zorg dat in D36 nu 5,6 staat * Bereken op dezelfde manier het gemiddelde aantal mm neerslag, maar ook het gemiddelde van de maximum en minimum temperaturen Laat afronden op 1 decimaal. De functies MAX en MIN Je kunt ook het maximum en het minimum laten bepalen. Ook daarvoor kunnen we een functie gebruiken * Zet in cel A37: Maximum * Maak in cel B37 met fx de functie: = MAX(B3:B33) Ook de laagste temperatuur kun je met een functie bepalen. * Zet in cel A38: Minimum * Maak in cel C38 met fx een functie om de laagste temperatuur te bepalen. Van de andere gegevens moet je ook het maximum en minimum bepalen.
Dit materiaal is gemaakt binnen de Leergang Wiskunde schooljaar 2013/14
15
5. Boxplot Voor 2012 en 2013 ga je een boxplot maken van de maximum temperatuur. Daarvoor moet je eerst de kwartielen berekenen met de formule in het werkblad boxplot. * Maak in cel B2 met fx de functie: = KWARTIEL * Druk op OK
*
Op het blokje bij matrix klikken, naar het werkblad Parijs en B3:B33 selecteren
*
Enter en bij kwartiel 3 invullen
* * * * * *
Druk op OK Op dezelfde manier zet je de mediaan=kwartiel 2 in de tabel en kwartiel 1. Max en min van de maximum temperatuur kun je kopiëren(die had je al). Maak de tabel af met de kwartielen,mediaan,max/min van 2013 Deze gegevens gaan we in een boxplot zetten: Maak van de tabel een lijngrafiek met gegevensmarkeringen, dus met puntjes De volgende grafiek is het resultaat:
Dit materiaal is gemaakt binnen de Leergang Wiskunde schooljaar 2013/14
16
* * *
* *
Bij het ontwerpen kies je dan voor “Rijen en kolommen omdraaien”.
Je krijgt dan
Klik hier op een van de gegevenspunten en klik op de rechtermuisknop. Kies hier voor Gegevensreeks opmaken. Kies voor lijnkleur en vervolgens “Geen lijn”. Doe dat voor alle vijf lijnen afzonderlijk.
Als alle tussenlijnen zijn verwijderd, markeer je weer een gegevenspunt en kies in het menu ‘Indeling’ voor ‘Lijnen’ en vervolgens voor ‘Hoog/laag lijnen’.
Excel trekt nu twee verticale lijnen door de gegevens Door nu te kiezen voor Omhoog/omlaag balken voegt Excel boxen toe
Dit materiaal is gemaakt binnen de Leergang Wiskunde schooljaar 2013/14
17
* Wanneer je op de box gaat staan en op de rechtermuisknop klikt, krijg je een menu waarmee je de opmaak van de box kunt aanpassen. Kies hiervoor ‘Dalingsbalk opmaken’. Je kunt kiezen voor geen vulling * Sla deze boxplot op. Gegevensanalyse Je moet eerst Toolpak installeren en dat doe je als volgt: * Ga naar bestand, Dan naar opties vervolgens invoegtoepassingen,selecteer Analysis Toolpak zie hieronder
*
Druk op Start bij Beheren: Excel-‐invoegtoepassingen zie hierboven
Dit materiaal is gemaakt binnen de Leergang Wiskunde schooljaar 2013/14
18
*
Bij invoegtoepassingen aanvinken Analysis Toolpak, dan Ok
In de bovenste balk staat Gegevens, klik deze aan en klik op Gegevensanalyse. * Selecteer eerst B3 t/m E33 uit het werkblad Parijs * in de Gegevensanalyse Beschrijvende statistiek selecteren, dan ok, * *
Vink "Samenvattingsinfo" aan.
Dit materiaal is gemaakt binnen de Leergang Wiskunde schooljaar 2013/14
19
Als je op ok drukt krijg je een overzicht van allerlei statistische gegevens. Voor ons zijn van belang het gemiddelde, de mediaan, de modus, de standaarddeviatie, enz. Voor dit overzicht wordt een nieuw tabblad aangemaakt. Noem deze "statistische gegevens”. Sla het bestand op !!
Dit materiaal is gemaakt binnen de Leergang Wiskunde schooljaar 2013/14
20
Het toepassen van de vaardigheden uit “Statistiek met Excel” op grote bestanden Dataset Leerlinggegevens Jullie hebben de basiscursus “Statistiek met Excel” doorgewerkt. Hierin is nog geen sprake van grote datasets. Met kleine al voorbewerkte bestanden werd geoefend om met Excel deze gegevens grafisch te verwerken. Hierbij moest je al wel soms onderdelen van een wat uitgebreider databestand selecteren en apart zetten zodat je er mooie plaatjes mee kon maken. Om bij de onderstaande opdrachten telkens de juiste gegevens bij elkaar te krijgen kun je een kolom te selecteren en op kenmerken van deze kolom sorteren. Door dit na elkaar in een bepaalde volgorde te doen voor verschillende kolommen kun je de gewenste gegevens bij elkaar krijgen. Dit oplopend sorteren en aflopend sorteren staan in de menubalk van Excel. Maak telkens elke opdacht op een nieuw tabblad. Na het maken van een grafische voorstelling krijg je vaak wat vragen Zet de antwoorden op deze vragen onder de spreidingsplot op het tabblad. Op deze manier heb je een mooie tekst bij de gemaakte grafische voorstelling. Sla telkens het resultaat op.
Dit materiaal is gemaakt binnen de Leergang Wiskunde schooljaar 2013/14
21
Opdrachten Middelen die nodig zijn bij deze opdracht: • Je krijgt een groot Excelbestand met de leerlinggegevens van een school. Met deze gegevens ga je aan de slag. Opdracht 1 Maak een spreidingsplot waarbij op de horizontale as de cijfers voor het vak Ned (Nederlands). staan en op de verticale as de cijfers voor het vak Eng (Engels). Doe dit voor klas 11. Selecteer de betreffende kolommen en kopiëer deze naar het tabblad “opdracht 1”. Benoem de assen en geef de grafiek een titel. Zet in de grafiek een lineaire trendlijn. Vragen: Waarom zou je zo’n grafische voorstelling willen maken? Welke conclusie kun je trekken uit de grafische voorstelling die je hebt gemaakt? Opdracht 2 We gaan cirkeldiagrammen maken die de keuze voor de profielen laten zien. Maak een cirkeldiagram voor: • havo jongens • havo meisjes • vwo jongens • vwo meisjes Je krijgt dus 4 cirkeldiagrammen. Zorg dat de verschillende profielen telkens dezelfde kleuren krijgen Door eerst te selecteren op profiel, daarna op schooltype en tenslotte op geslacht, krijg je alle 16 soorten (categorieën) netjes bij elkaar om te verwerken. Bij deze selectievolgorde heb je alle havo jongens bij elkaar staan enz Ook andere volgordes van selectie leveren de verschillende groepen op, maar vaak niet zo netjes geordend. Ga dit na. De laatste ordening levert de hoofdordening M/V op, binnen de hoofdordening zie vervolgens de eerdere ordeningen terug komen, eerst havo/vwo en daarbinnen weer de profielen. De havo-‐jongens staan dus mooi bij elkaar. Als je de groepn bij elkaar hebt staan kun je tellen en een tabel maken waaruit je het cirkeldiagram laat ontstaan. Zoals je al eerder hebt gezien. Let er wel op dat bij het op volgorde zetten telkens de gehele rij (horizontaal) wordt meegenomen. Vragen: Waarom zou je zo’n cirkeldiagram willen maken? Welke conclusie kun je trekken uit cirkeldiagrammen die je hebt gemaakt? Opdracht 3 Je hebt nu na opdracht 2 het data bestand zo geordend dat je voor elk van de 16 categorieën (bijvoorbeeld Havo-‐ CM-‐ M ) kunt berekenen wat de gegevens voor de boxplots zijn van de cijfers voor het vak Nederlands. Maak de boxplots voor de 8 Havo categorieën. Zet deze boxplots bij elkaar in één grafiek. Vragen: Waarom zou je zo’n grafische voorstelling willen maken? Welke conclusie kun je trekken uit de grafische voorstelling die je hebt gemaakt?
Dit materiaal is gemaakt binnen de Leergang Wiskunde schooljaar 2013/14
22
Opdracht 4 Maak nu boxplots van de cijfers van de drie kernvakken: ne, eng, wi voor de leerjaren 1,2 en 3 Zet deze negen boxplots in één of meerdere figuren, maak zelf keuzes. Vragen: Waarom zou je zo’n grafische voorstelling willen maken? Welke conclusie kun je trekken uit de grafische voorstelling die je hebt gemaakt? Zet telkens bij de figuren welke conclusie je kunt trekken uit jou gekozen figuur. Opdracht 5a In een boxplot verdeel je de reeks getallen in vier groepen met elk 25% van de getallen. Je hebt in het boekje “Statistiek met Excel” ook geleerd hoe je van een rij getallen de standaarddeviatie kunt berekenen. Veel frequentieverdelingen hebben een nette symmetrische klokvorm, zeker als het veel gegevens betreft. Voorbeelden daarvan zijn de verdeling van de lengtes van een grote groep mensen, de gewichten van volle pakken suiker, de inhoud van een grote groep colaflessen van dezelfde soort en maat, enzovoorts... Bij dit soort verdelingen kan de standaard deviatie kan gebruikt worden voor een indeling van de groep getallen in zes onderdelen: het gemiddelde geven we aan met ‘μ’ en de standaarddeviatie met ‘σ’. Hier zie je een histogram van de lengtes van een groep soldaten op een bepaalde kazerne.
De vuistregel voor de normale verdeling Grenzen ", μ-‐2σ μ-‐2σ "μ-‐σ μ -‐σ "μ μ# μ+σ μ+σ# μ+2σ μ+2σ, # % 2.5% 13.5% 34% 34% 13.5% 2,5% soldaten ",168 168-‐175 175-‐182 182-‐189 189-‐196 196,# Voor meer uitleg over de normale verdeling zie bv.: http://www.math4all.nl/website/view.php?page=overzichten/havo-‐45-‐ a&repo=m4a&item=introduction Voor de boxplot gelden de percentages 25% telkens precies omdat de boxplot zo is gemaakt. De onderverdeling m.b.v. de μ en de σ geldt ongeveer, maar steeds beter bij grotere bestanden. Vraag/opdracht : Bereken het gemiddelde en standaarddeviatie van de cijfers voor het vak Engels in het tweede leerjaar. En ga na of deze onderverdeling ook een beetje klopt voor de cijfers voor het vak Engels in het tweede leerjaar. Opdracht 5b Geef een schatting voor grenzen van de middelste 68% van de cijfers voor het vak Engels in het tweede leerjaar. Gebruik hierbij de systematiek uit opgave 5a. Geef een schatting van de grenzen voor de laagste 16% van de cijfers op het van Engels in het tweede leerjaar.
Dit materiaal is gemaakt binnen de Leergang Wiskunde schooljaar 2013/14
23
Verrijkingsopdrachten Opdracht A. Bereken m.b.v. Excel de gemiddelde cijfers per leerjaar voor het vak wiskunde uitgesplitst naar de verschillende schooltypen. Zet deze gegevens uit in een grafiek (grafieken), kies zelf hoe. Welke conclusie kun je hieruit trekken? Welke vraag komt er naar boven bij het zien van deze gemiddelden? Opdracht B. Op welke manier kun je de prestaties voor het vak wiskunde voor de jongens en de meisjes in beeld brengen? Voer je plan uit. Welke conclusies denk je te kunnen trekken? Opdracht C. Bereken m.b.v. Excel voor de verschillende vakken en leerjaren per schooltype de percentages onvoldoenden. Breng deze percentages in beeld. Maak eventueel verschillende plaatjes. Welke conclusies kun je trekken? Welke vraag komt er in je op bij het zien van de gegevens?
Dit materiaal is gemaakt binnen de Leergang Wiskunde schooljaar 2013/14
24
Verslag werken met grote datasets in HAVO4 In december ben ik gedurende zeven maal anderhalf uur bezig geweest om het materiaal uit te testen in mijn Havo 4 groep die bestond uit 36 leerlingen. De basiskennis van deze groep bestond uit kennis van Hoofdstuk 4 – Wiskunde A deel 1 van de methode Getal en Ruimte. Binnen deze groep was voor 80% geen ervaring met Excel. De rest had een zeer beperkte kennis. Doelstelling: • Ophalen en uitbreiden van de basisbegrippen statistiek. • Aanbrengen basisvaardigheden Excel en speciale aandacht voor statistische functies in Excel • Aanbrengen vaardigheden om binnen grote datasets elementair statistisch onderzoek te doen met behulp van Excel. Mijn lessen hadden steeds dezelfde structuur: 1. 10 minuten -‐Terughalen en samenvatten van de belangrijkste leerpunten tot dan toe. 2. 20 minuten -‐ Plenaire behandeling van een specifiek item, bijvoorbeeld de boxplot, de normale verdeling, etc. 3. 50 minuten – Zelfstandig /in tweetallen werken achter de PC. Hier was voor de leerlingen de mogelijkheid om zowel in tempo als in niveau te verschillen. Hier stuurde ik voornamelijk op in mijn begeleiding. Technische zaken (hoe doe je….) moesten ze met elkaar uitknobbelen en uitleggen aan elkaar. 4. 10 minuten – Terugblik op de les. De laatste les hebben we besteed aan het bespreken van de opdrachtenserie over de grote dataset. Eerst in groepen van zes leren komen tot een gezamenlijk standpunt voor elke vraag. Deze werd door elke groep op het bord geschreven. Daarna hebben we klassikaal gekeken neer de verschillen in de standpunten en hierover gediscussieerd. Daarna was er tijd om alles in het schrift uit te werken en de lessen te evalueren. Opbrengsten: • Lesonderdeel 1 en 2 – Door met de klas een samenvatting in een onderwijsleergesprek te maken kreeg men zicht op de samenhang. De theorie werd gebruikt om te verfrissen en tevens om nieuwe theorie te behandelen. Hiervan werden aantekeningen gemaakt die thuis in het schrift werden uitgewerkt. • Lesonderdeel 3 -‐ Oefeningen werden afgetekend. Daarna mochten ze verder aan een volgende oefening. • Lesonderdeel 4 – Met hun feedback kon ik zo nodig aanpassingen maken in de leerlijn, bijvoorbeeld door een ander onderwerp te kiezen in lesonderdeel 2 voor de volgende dag. Het materiaal Het ontwikkelde materiaal voldeed uitstekend. Het was zelfsturend en de leerlingen konden er utstekend mee uit de voeten. Boxplots maken met Excel is “gedoe” maar juist daardoor leerzaam. De leerlingen krijgen zo ook zicht op wat eigenaardige zaken in het programma. Aan de laatste opdrachten verrijkingsopdrachten bij de grote dataset zijn de leerlingen niet meer toegekomen. Terugblik Persoonlijk ben ik erg tevreden. Mijn doelstellingen zijn gehaald. Enkele opmerkingen van de leerlingen: • “Ik heb veel geleerd over Excel. Het programma is handiger dan ik eerst dacht”
Dit materiaal is gemaakt binnen de Leergang Wiskunde schooljaar 2013/14
25
• • • •
“De tweede oefening was veel moeilijker dan de eerste. Maar toen ik eenmaal doorhad hoe je in selecties kon tellen was het weer makkelijker.” “Excel is veel makkelijker om de mediaan en de kwadranten te berekenen dan je GR” “Dat grote bestand was verwarrend. Het waren gewoon te veel getallen om overzicht te krijgen.” “Het was fijn dat we zoveel samen konden werken. Vooral van anderen leer ik erg veel.”
Marc Bouman, Vrijschool Zutphen V.O.
Dit materiaal is gemaakt binnen de Leergang Wiskunde schooljaar 2013/14
26