Beschrijvende sta/s/ek met Geogebra 5 Brecht Dekeyser Dag van de wiskunde 14 november 2015 KU Leuven Kulak Kortrijk
Beschrijvende sta/s/ek met Geogebra 5 Brecht Dekeyser Dag van de wiskunde 14 november 2015 KU Leuven Kulak Kortrijk
Nieuw in GeoGebra 5 (t.o.v. GeoGebra 3.2) • Sinds september 2014 : vs. 5 van het programma • Sinds december 2014 : vs. 5 van de Tablet-app • In ontwikkeling: app voor slimme telefoons • Tal van kleine verbeteringen: Schermindeling, layout & LaTeX • GeoGebraTube • Invoervelden - dynamisch • 3D • FuncPeonderzoeker - StaPsPek & kansrekening • CAS (computeralgebra)
Inhoud • Gegevens verzamelen: • Uit databestand • Met random data • Gegevens verwerken (discreet & conPnu) • FrequenPetabel • Grafieken • Centrum- en spreidingsmaten • Uitschieters • Boxplot
Gegevens verzamelen
• Uit databestand • Kopiëren • Plakken
Gegevens verzamelen • Random Data • Dynamische gegevens genereren voor leerlingen • Toevalsgetal (discreet) • ToevalsgetalTussen (vb. 200x gooien met teerling) • ToevalsgetalBinom (vb. punten van 200 leerlingen) • Toevalsgetal (conPnu) • ToevalsgetalNormaal (vb. 200 lichaamslengtes)
Gegevens verzamelen
• ToevalsgetalTussen • ToevalsgetalBinom • ToevalsgetalNormaal
Uniform verdeelde data
ToevalsgetalTussen[1,6]
Gegevens verzamelen
• ToevalsgetalTussen • ToevalsgetalBinom • ToevalsgetalNormaal
Binomiaal verdeelde data
ToevalsgetalBinom[10,0.6]
Gegevens verzamelen
• ToevalsgetalTussen • ToevalsgetalBinom • ToevalsgetalNormaal
Normaal verdeelde data
ToevalsgetalNormaal[100,15]
Gegevens verzamelen
• Creëer Lijst • Herbereken - Ctrl-R • Sorteer
Datasort=Sorteer[
] KolomVullen[11,Datasort]
Discrete gegevens verwerken • FrequenPetabel : commando’s en manueel • Staafdiagram met knop “Onderzoek 1 variabele”
Discrete gegevens verwerken
• FrequenPetabel commando • FrequenPetabel manueel
Freq.: Frequentietabel[Data]
Cum. Freq.: Frequentietabel[true,Data]
Discrete gegevens verwerken
Telals[x==K2,data]
• FrequenPetabel commando • FrequenPetabel manueel
L2/$L$13
Discrete gegevens verwerken
• Staafdiagram via knop “Onderzoek 1 variabele”
Staafdiagram[ Data , breedte staaf ]
Con/nue gegevens verwerken • FrequenPetabel : manueel en via knop “Onderzoek 1 variabele” • Grafieken: • Histogram • Ogief
Continue gegevens verwerken
• Manueel • Knop “Onderzoek 1 variabele”
Continue gegevens verwerken
• Manueel • Knop “Onderzoek 1 variabele”
Centrum- en spreidingsmaten • Centrum- en spreidingsmaten: commando’s en via knop “Onderzoek 1 variabele” • Grafieken: • Box-plot met uitschieters
Centrum- en spreidingsmaten
• Manueel • Knop “Onderzoek 1 variabele”
Centrum- en spreidingsmaten
• Manueel • Knop “Onderzoek 1 variabele”
Uitschieters en Boxplot
• Uitschieters vinden en uit data verwijderen
En dan vergeten we nog... •Bivariate en mulPvariate beschrijvende staPsPek •Lineaire regressie, veeltermregressie, ... •Kansverdelingen (Normale, Binomiale,…): 18 maart 2015 Pedic •Meer info: www.geogebraboek.be (InteracPef boek voor iPad/Mac)
HOOFDSTUK 1
Statistiek met het rekenblad Dit hoofdstuk komt uit het boek “Wiskunde met GeoGebra 5”. Je kan het bekijken op: • Interactief op je tablet of PC met filmpjes. • Als fysiek boek met links naar filmpjes Meer info: www.geogebraboek.be Het boek behandelt oa.: 1. De voornaamste vernieuwingen 2. De functieonderzoeker 3. De CAS (Computer Algebra Systeem) - module 4. De nieuwe mogelijkheden voor statistiek en kansrekenen 5. Zelf dynamische werkbladen maken 6. GeoGebra integreren in Smartschool 7. GeoGebra op je Tablet 1
SECTIE 1
Univariate beschrijvende statistiek In deze sectie:
3.1.1 Gegevens verzamelen en opmaken
1. Gegevens verzamelen en opmaken
Je kan in het Rekenblad je gegevens 1 voor 1 intikken. Het is echter een stuk eenvoudiger om de data uit een rekenblad-bestand te halen.
2. Random- data genereren 3. Gegevens verwerken (beschrijvende statistiek)
Film 1.1 Demo: gegevens invoeren
Je kan bij rekenblad-programma’s als Excel en OpenOffice Calc de gewenste cellen selecteren en kopiëren met ctrl-C , waarna je in de een cel gaat staan in het rekenblad van GeoGebra en kiest voor plakken (of ctrl-V). Dit is veruit de eenvoudigste manier om gegevens in GeoGebra te importeren. Dit kan je ook met het online rekenblad van Google Drive. Het grote voordeel van het gebruik van een online rekenblad is dat je samen (en tegelijk) met je leerlingen kan werken aan een document. Verder is het gebruik van Google Drive volledig gratis (http://drive.google.com) en compatibel met tablet/iPad. Je kan ook gegevens importeren uit een databestand, door met je rechtermuistoets in een cel te klikken en Importeer databestand te kiezen. Dit kan enkel met .txt, .dat en .cvs-bestanden, dus niet met de gewone .xls-bestanden uit Excel. Gegevensopmaak gebeurt in het Rekenblad door op het driehoekje links bovenaan te klikken. Hier kan je onder andere formules invoeren, gegevens vet of cursief zetten, centreren, rechts of links uitlijnen en de celranden en celkleur aanpassen.
2
Film 1.2 ToevalsgetalTussen
3.1.2 Random data genereren Het is mogelijk om je eigen data te genereren in het Rekenblad. We bekijken hier 3 commando’s: • ToevalsgetalTussen[<min>,<max>]: genereert een willekeurig getal tussen 2 waarden. De discrete data die je hiermee genereert zal uniform verdeeld zijn. Voorbeelden: Gooien met 1 dobbelsteen (ToevalsgetalTussen[1,6])
Film 1.3 ToevalsgetalBinom
Gooien met een muntstuk(ToevalsgetalTussen[1,2])
• ToevalsgetalBinom[,]: genereert willekeurige binomiaal (discreet) verdeelde data. Voorbeelden: Aantal keer munt bij 200 worpen (ToevalsgetalBinom[200,1/2]) Aantal keer 6 ogen bij 200 worpen (ToevalsgetalBinom[200,1/6]) Film 1.4 ToevalsgetalNormaal • ToevalsgetalNormaal[,<standaardafwijking>]: genereert willekeurige normaal verdeelde data. Deze data is continu. Voorbeeld: IQ van 200 personen (ToevalsgetalNormaal[100,15])
3
3.1.3 Gegevens verwerken We maken in dit stuk gebruik van de variabele “cijfwis”, die het resultaat weergeeft van een test wiskunde in een klas van 25 leerlingen. Om een univariaat onderzoek uit te voeren, selecteer je eerst de gegevens in het Rekenblad en klik je op Onderzoek één variabele. In het venster Gegevens bron kan je de data-bron kiezen: Bruto-data of een frequentietabel (met of zonder klassen). Wij kiezen voor de bruto data uit het rekenblad.
cijfwis 7 8 7 7 8 7 7 7 5 6 6 6 6 8 8 8 8 7 6 8 9,5 7 6 6 6
Het venster Data Analyse verschijnt.
Met het icoon rechts bovenaan kan je de kenmerken van je histogram aanpassen. Hier kan je:
Bij het Histogram (een staafdiagram zou voor deze data natuurlijk beter zijn) kan je het aantal klassen heel eenvoudig vergroten en verkleinen met de schuifbalk.
• Manueel bepalen wat je klassengrenzen zijn (linkergrens ingeven en klassenbreedte) • Een cumulatief staafdiagram maken (of cumulatief frequentiepolygoon) (vink Cumulatief aan) • Een histogram met relatieve frequentie (of een relatief cumulatief frequentiepolygoon) maken (kies Relatief) • Een frequentietabel (klassentabel) maken of een cumulatieve frequentietabel (absoluut of relatief) (vink Frequentietabel aan)
4
Leerlingen uit de tweede graad kunnen hiermee heel eenvoudig een frequentietabel volledig aanvullen en een histogram opstellen. Het blijft uiteraard noodzakelijk dat ze dit eerst manueel kunnen uitvoeren (zie ook 3.4.3), maar GeoGebra kan zeker een hulp zijn bij de controle of het aanpakken van complexere oefeningen of grotere databestanden. Je kan het commando Frequentietabel ook gebruiken in een cel van het rekenblad.
Opmerking: Met Histogram is het enkel mogelijk om je gegevens in klassen te verdelen om een frequentietabel op te stellen. Onze gegevens zijn echter duidelijk discreet. Om toch een discrete klassentabel te verkrijgen kan je eerst het invoerveld tonen door in het menu Beeld bij Invoerveld Toon aan te vinken.
Je kan er ook voor kiezen om de leerlingen zelf een frequentietabel te laten opstellen, zoals in 3.4.3.
In het invoerveld kan je met het commando Frequentietabel [ ] een discrete frequentietabel bekomen. Zo vermijd je dat leerlingen fouten maken bij het turven van grote gegevensbestanden. Na het invoeren van het commando verschijnt de frequentietabel in het Tekenvenster. 5
Boven het venster Data Analyse kan je nog 4 knoppen vinden:
Film 1.5 Gegevens verwerken (beschrijvende statistiek)
•Toon Data Bron: Geeft je het venster Gegevens Bron •Toon Data: dit is handig als je enkele gegevens uit je data wil werpen, bijvoorbeeld de uitschieters. Als je de uitschieters afvinkt, wordt je grafische voorstelling of je frequentietabel direct aangepast. •Toon statistiek: toont je bijvoorbeeld de centrum- en spreidingsmaten. •Toon tweede grafiek: hiermee kan je een tweede grafiek weergeven van je data, zoals een boxplot onder het histogram.
6
SECTIE 2
Bivariate en multivariate statistiek In deze sectie
3.2.1 Regressie-analyse
1. Regressie
We gaan als voorbeeld de lineaire regressie onderzoeken van de variabelen gewicht en lengte van onze klas van 25 leerlingen.
2. Multivariate analyse
Om een regressie-analyse uit te voeren op de twee variabelen, selecteer je de gegevens in het Rekenblad en druk je op de knop Regressieanalyse. Er verschijnt een nieuw venster met een spreidingsdiagram (Scatterplot) van de twee variabelen. Wil je de rol van X en Y omwisselen dan vind je bovenaan de knop . In ons geval is het inderdaad beter om lengte als onafhankelijke variabele te kiezen. Bij Regressiemodel kan je het gewenste regressiemodel selecteren. GeoGebra geeft dan telkens de gepaste grafiek en de bijbehorende vergelijking. Geef je een x-waarde in, dan kan je de ywaarde bij dit model snel laten berekenen.
7
Bovenaan staan een aantal interessante knoppen voor regressieanalyse: •
•
3.2.2 Multivariate analyse We vergelijken als voorbeeld de resultaten van de 25 leerlingen voor wiskunde en voor alle vakken samen. We zouden nog meer variabelen kunnen toevoegen en vergelijken, maar de werkwijze blijft hetzelfde.
Toon Data: hier kan je weer data (bv. uitschieters) afvinken. De grafiek wordt echter niet direct aangepast. Hiervoor dien je even je grafische voorstellingen te wisselen en daarna opnieuw op Scatterplot te zetten. De statistieken (zie hieronder) worden wel aangepast.
Om een multivariaat onderzoek uit te voeren, selecteer je de gegevens in het Rekenblad en druk je op de knop Onderzoek meerdere variabelen. Er verschijnt een nieuw venster met de box-plot van elke variabele onder elkaar. Onderaan kan je de centrum- en spreidingsmaten van alle variabelen zien.
Toon Statistieken: berekent een aantal maten (gemiddelde, standaardafwijking, correlatiecoëfficiënt, covariantie,...) om bijvoorbeeld tussenresultaten bij de regressieanalyse te controleren.
Film 1.6 Regressie
Het is hier voor gevorderde statistiek ook mogelijk om een ANOVA-analyse en t-testen uit te voeren.
8
Alle grafieken onder de knop Statistiek kunnen heel eenvoudig naar het Tekenvenster overgebracht worden door op de grafiek met je rechtermuistoets te drukken. Door Kopieer naar tekenvenster te kiezen worden de grafieken weergegeven in het tekenvenster.
Film 1.7 Multivariate analyse
9
SECTIE 3
Kansrekenen en kansverdelingen Zowel in het Rekenblad als in het Tekenvenster kan je de knop Waarschijnlijkheidsrekening vinden. Deze knop opent een nieuw venster, waarin je discrete en continue kansverdelingen kan laten tekenen. Bij Verdeling kan je je gewenste type kansverdeling (bv. Normale, Student, Chi, F, Exponentiële, Binomiale, Poisson, Hypergeometrische,...) aanduiden en de kenmerkende parameters invoeren. Onderaan is het mogelijk om een bepaald interval, een rechter- of een linker-grens te bepalen om de bijbehorende kans te berekenen. Je kan de waarden van je grenzen zowel manueel aanpassen, als grafisch door de pijltjes te verslepen.
Een grens bij een gegeven kans vinden (Invers Normale) is ook mogelijk door bijvoorbeeld Links te kiezen en een kans van 0.95 in te geven. Door op Enter te drukken, krijg je de grens waarvan 95% van de waarden van de variabele links gelegen zijn (1,64) Ook de cumulatieve verdelingsfunctie kan je laten tekenen. Hiervoor druk je op de knop naast de benaming van de verdeling en kies je voor Cumulatief. Ook hier kan je bij Kansen zowel een grenswaarde ingeven als een kans.
10
Ook hier kan je kiezen om te werken met een cumulatieve kansverdeling.
Film 1.8 De binomiale kansverdeling
Je kan de grafiek overbrengen naar het Tekenvenster zoals beschreven in 3.2.2. Dit kan bijvoorbeeld interessant zijn om de binomiale verdeling te benaderen met een normale verdeling. De best passende normale verdeling kan je tekenen door bovenaan de knop
te kiezen.
Bij discrete kansverdelingen wordt tevens de kansverdeling in tabelvorm weergegeven. Je kan deze kansverdeling kopiëren naar het rekenblad door alles te selecteren en Ctrl-C te drukken en dan in het Rekenblad met CtrlV te plakken. Kansen bepalen kan zowel door in de tabel te selecteren, op de grafiek aan te duiden als onderaan bij Kansen je grenzen manueel in te voeren. Een grens bepalen kan door een kans onderaan in te voeren. De dichtstbijzijnde discrete waarde van de stochast wordt dan gegeven. 11
SECTIE 4
Berekeningen in het rekenblad In deze sectie:
3.4.1 De knop “Maken”
1. De knop “Maken”
Selecteer eerst de gewenste gegevens in het Rekenblad. Zorg dat ook het Algebravenster en het Tekenvenster wordt weergegeven. Binnen de knop “Maken” vind je volgende onderdelen:
2. De knop “Rekenen” 3. Frequentietabellen manueel in het rekenblad 4. Manueel een histogram maken.
Figuur 1.1 De knop Maken Maak een lijst
Maak een lijst van punten
Maak een matrix
Maak een tabel
Maak een veelhoeklijn
12
3.4.2 De knop “Rekenen”
3.4.3 Frequentietabellen manueel in het rekenblad
Je kan heel wat eenvoudige berekeningen die je normaal in een rekenblad-programma zou uitvoeren nu ook berekenen met het Rekenblad in GeoGebra. De meest gebruikte commando’s worden weergegeven onder de knop “Rekenen”.
Eén van de doelstellingen van de beschrijvende statistiek in de tweede graad is dat de leerlingen zelf een frequentietabel kunnen opstellen en interpreteren. Aan het manueel ‘turven’ van de absolute frequentie mag er niet te veel tijd besteed worden. Binnen GeoGebra kan dit immers geautomatiseerd berekend worden. Toch is het belangrijk dat de leerlingen weten hoe ze uit de absolute frequenties, de relatieve frequenties, cumulatieve absolute en relatieve frequenties kunnen berekenen. Een demo van een frequentietabel bij het gooien met een dobbelsteen kan je in Film 3.9 bekijken. Film 1.9 Demo Discrete frequentietabel
Je selecteert eerst een cel waarin je het resultaat wil tonen, daarna gebruik je de knop Rekenen om de Som, het gemiddelde, het aantal geselecteerde cellen en het maximum of het minimum van de selectie te bepalen. Je kan deze commando’s bijvoorbeeld gebruiken om een frequentietabel manueel op te stellen in het rekenblad (zie 3.4.3).
Als voorbeeld van een frequentietabel met klassen zullen we werken met de gewichten van de 25 leerlingen en deze in 6 klassen verdelen.
13
1. Klassengrenzen bepalen
3. Frequenties bepalen
We zoeken de maximale en minimale waarde van onze variabele, door gebruik te maken van de knop Rekenen en gebruik te maken van de menu-items voor maximale en minimale waarde.
De absolute frequentie kan je vinden door het commando TelAls te gebruiken. Let er op dat je werkt met een vast bereik van gegevens door gebruik te maken van het dollarteken $. Je kan natuurlijk ook een lijst Data maken, door de gegevens te selecteren en een lijst aan te maken.
Door het verschil van deze waarden te delen door het aantal gewenste klassen, vinden we 4,67 of afgerond een klassenbreedte van 5.
De formule kan opnieuw naar onder getrokken worden en in het menu Bereken vind je het commando de som van deze AF te nemen.
De eerste ondergrens is x_min, en daar tellen we telkens de klassenbreedte 5 bij op. Je kan deze formule naar onder trekken door de 2 eerste ondergrenzen te selecteren en het kleine vierkantje onderaan naar beneden te slepen. Het zelfde kan je doen met de bovengrenzen.
om
De RF, CAF en RAF kan je bekomen door de gekende formules in de velden in te tikken en naar onder te trekken. Let weer op de dollartekens om de AF telkens door 25 te delen.
2. Klassenmiddens bepalen Je eerste klassenmidden kan je bepalen door eerst in de juiste cel te klikken en dan het gemiddelde te gebruiken van de knop Rekenen. Nu selecteer je de onder- en de bovengrens en je krijgt het gemiddelde. Door opnieuw de formule naar onder te trekken vervolledig je de kolom van klassenmiddens.
14
4. Commando Frequentietabel voor klassen Je kan ook elk van de kolommen AF, RF, CAF en CRF laten berekenen door het commando Frequentietabel te gebruiken. GeoGebra schrijft dan een volledige frequentietabel in deze cel. • Voor de absolute frequentie gebruik je Frequentietabel[ , , false , 1] . Het derde element (dichtheid?) kan je ook op true zetten als je de hoogte van de rechthoeken in het histogram wil weergeven. De absolute frequentie in een histogram is immers de oppervlakte van elke rechthoek. • Voor de cumulatieve absolute frequentie zet je voor het eerste element (cumulatief?) true Frequentietabel[true, , , false , 1] . • Voor de relatieve frequentie gebruik je Frequentietabel[ , , true , klassenbreedte/n]. waarbij n de steekproefgrootte is. Wil je opnieuw de hoogte van de rechthoeken in het histogram weergeven, dan gebruik je als laatste argument 1/n . • Voor de cumulatieve relatieve frequentie zet je voor het eerste element opnieuw true. Frequentietabel[true, , , true , klassenbreedte/n].
15
3.4.4 Manueel een histogram maken Hierbij kan je een demo vinden over het maken van een histogram in het rekenblad. Om een histogram te tekenen maak je eerst een frequentietabel zoals bij 4. en gebruik je het commando Histogram.
Film 1.10 Manueel een histogram maken
16