Place your own product logo here and modify the layout of your print manual/PDF: In Help & Manual, click "Tools" > "Print Manual Designer" and open this manual template to edit it.
Title page 1 Use this page to introduce the product by Enter your company name
This is "Title Page 1" - you may use this page to introduce your product, show title, author, copyright, company logos, etc. This page intentionally starts on an odd page, so that it is on the right half of an open book from the readers point of view. This is the reason why the previous page was blank (the previous page is the back side of the cover)
All rights reserved. No parts of this work may be reproduced in any form or by any means - graphic, electronic, or mechanical, including photocopying, recording, taping, or information storage and retrieval systems - without the written permission of the publisher. Products that are referred to in this document may be either trademarks and/or registered trademarks of the respective owners. The publisher and the author make no claim to these trademarks. While every precaution has been taken in the preparation of this document, the publisher and the author assume no responsibility for errors or omissions, or for damages resulting from the use of information contained in this document or from the use of programs and source code that may accompany it. In no event shall the publisher and the author be liable for any loss of profit or any other commercial damage caused or alleged to have been caused directly or indirectly by this document. Printed: december 2010 in (whereever you are located)
Publisher ...enter name... Managing Editor ...enter name... Technical Editors ...enter name... ...enter name... Cover Designer ...enter name... Team Coordinator ...enter name... Production ...enter name...
Special thanks to: All the people who contributed to this document, to mum and dad and grandpa, to my sisters and brothers and mothers in law, to our secretary Kathrin, to the graphic artist who created this great product logo on the cover page (sorry, don't remember your name at the moment but you did a great work ), to the pizza service down the street (your daily Capricciosas saved our lives), to the copy shop where this document will be duplicated, and and and... Last not least, we want to thank EC Software who wrote this great help tool called HELP & MANUAL which printed this document.
Contents
5
Table of Contents Foreword
Part I Algemeen
2
1 Aan................................................................................................................................... de slag 2 2 Profielen: ................................................................................................................................... VU-Statistiek aanpassen 3 3 Printen ................................................................................................................................... 4
Part II Data analyse
8
1 Invoer ................................................................................................................................... van data 8 2 Menu-opties ................................................................................................................................... 9 Bestand ......................................................................................................................................................... 9 Data ......................................................................................................................................................... 10 Variabelen.................................................................................................................................................. 10 Sorteren .................................................................................................................................................. 11 Splitsen in.................................................................................................................................................. deelgroepen 11 Splitsing opheffen .................................................................................................................................................. 12 Selectiefilter .................................................................................................................................................. 12 Één steekproef .................................................................................................................................................. trekken 13 Veel steekproeven .................................................................................................................................................. trekken 14 Omrekenen .................................................................................................................................................. 14 Hercoderen .................................................................................................................................................. 14 Toevoegen.................................................................................................................................................. records 15 Verw ijderen .................................................................................................................................................. records 15 Beeld ......................................................................................................................................................... 15 Grafiek ......................................................................................................................................................... 16 Dotplot .................................................................................................................................................. 16 Staafdiagram .................................................................................................................................................. 17 Cirkeldiagram .................................................................................................................................................. 18 Lijndiagram .................................................................................................................................................. 19 Boxplot .................................................................................................................................................. 20 Puntenw olk .................................................................................................................................................. 21 Tijdreeks .................................................................................................................................................. 23 Lorentz kromme .................................................................................................................................................. 23 Dataplot .................................................................................................................................................. 24 Show all .................................................................................................................................................. 24 Kentallen ......................................................................................................................................................... 24 Tabel ......................................................................................................................................................... 25 Frequentie-tabel .................................................................................................................................................. 25 Kruistabel .................................................................................................................................................. 26 Steelblad .................................................................................................................................................. 27 Meer Statistiek ......................................................................................................................................................... 28 Correlatiematrix .................................................................................................................................................. 28 Multipele regressie .................................................................................................................................................. 28 Stat. Proces .................................................................................................................................................. Controle 28 Discriminant .................................................................................................................................................. analyse 28 Paarsgew .................................................................................................................................................. ijze verschillen 29 Onafhanklijke .................................................................................................................................................. steekproeven 29
6 Kendall's tau .................................................................................................................................................. en Spearman's rho 29 Variantie-analyse .................................................................................................................................................. (een factor) 29 Opties ......................................................................................................................................................... 30 Importeren.................................................................................................................................................. 30 Importeren.................................................................................................................................................. Excel bestand 30 Exporteren.................................................................................................................................................. 31 Aggregatie.................................................................................................................................................. 31 Tekstvariabele .................................................................................................................................................. 32 Multipunt .................................................................................................................................................. 32
3 Popup ................................................................................................................................... menu 32
Part III Dataplot
36
Part IV Kansrekenen
40
1 Boomdiagram ................................................................................................................................... 40 Vrij boom diagram ......................................................................................................................................................... 41 Regelm atig ......................................................................................................................................................... boom diagram 42 Vaasm odel ......................................................................................................................................................... 43
2 Bord ................................................................................................................................... van Galton 43 3 Frequentieraster ................................................................................................................................... 44 4 Rooster ................................................................................................................................... 45 5 Tabel ................................................................................................................................... en boom 46 6 Markov................................................................................................................................... en Leslie-processen 46 7 Slim ................................................................................................................................... tellen 48 8 Call ................................................................................................................................... en put opties 48
Part V Simulaties
52
1 Random ................................................................................................................................... generator 52 2 Munten ................................................................................................................................... 53 3 Reactiesnelheid ................................................................................................................................... 54 4 Dobbelstenen ................................................................................................................................... 55 5 Regressielijnen ................................................................................................................................... 55 6 Randomized ................................................................................................................................... Response 57 7 Steekproeven ................................................................................................................................... 58 8 Toevalsregen ................................................................................................................................... 60
Part VI Toegepaste simulaties
64
1 Snackbar ................................................................................................................................... 64 2 Roken ................................................................................................................................... 64 3 Monopoly ................................................................................................................................... 65 4 Metronoom ................................................................................................................................... 66 5 Reserveringen ................................................................................................................................... 66 6 Roulette ................................................................................................................................... 67 7 Fruitautomaat ................................................................................................................................... 67
Contents
7
8 Banken ................................................................................................................................... 68 9 De................................................................................................................................... computer voorspelt 69
Part VII Kansverdelingen
72
1 Binomiale ................................................................................................................................... verdeling 72 2 Hypergeometrische ................................................................................................................................... verdeling 72 3 Normale ................................................................................................................................... verdeling 73 4 Poisson ................................................................................................................................... verdeling 73 5 Diverse ................................................................................................................................... verdelingen 74 6 Centrale ................................................................................................................................... Limietstelling 75
Part VIII Hypothesen toetsen
78
1 Test ................................................................................................................................... met twee alternatieven 78 2 Binomiale ................................................................................................................................... toets 78 3 t-toets ................................................................................................................................... 79 4 z-toets ................................................................................................................................... 79 5 Poisson ................................................................................................................................... toets 80 6 Betrouwbaarheidsintervallen ................................................................................................................................... 81 7 Onderscheidend ................................................................................................................................... vermogen 82
Index
83
Foreword
This is just another title page placed between table of contents and topics
Top Level Intro This page is printed before a new top-level chapter starts
Part
I
2
1
Algemeen VU-Statistiek Overzicht en Inleiding
1.1
Aan de slag Aan de slag met VU-Statistiek, het Hoofdmenu VU-Statistiek is meer dan alleen een statistiekprogramma. Naast het statistiekdeel vind je verschillende rubrieken die met statistiek en kansrekening te maken hebben. Hieronder staan de rubrieken, met een klik op de button krijg je een korte toelichting. In veel schermen kom je de infobutton situatie van dat scherm
tegen. Daarmee krijg je speciale informatie bij de
Data analyse Met VU-Stat kun je op een eenvoudige manier statistisch onderzoek doen. Dat kan met kant-enklare bestanden, maar je kunt ook zelf een enquête houden en de resultaten in VU-Statistiek invoeren. Van de uitkomsten kun je allerlei grafieken maken. Een uitgebreide optie om statistische plaatjes te maken vind je in Dataplot Dataplot Met Dataplot kun je grafieken van frequentietabellen te maken. Dat kunnen simpele grafieken maar ook 3 dimensionale grafieken zijn. Je kunt zelf de vormgeving doen. Kansrekenen Deze rubriek heeft enkele opties die handig zijn bij telproblemen en kansproblemen, zoals boomdiagrammen en tabellen. Het vervelende tekenen is een werk dat de computer voor je kan doen. Simulaties Met VU-Statistiek kun je allerlei experimenten, bijvoorbeeld het gooien met een munt, en spellen nabootsen. De uitkomsten krijg je als een tabel of grafiek en in sommige gevallen als een bestand dat je in de rubriek Statistiek kunt bewerken. Kansverdelingen Hier vind je een elektronisch tabellenboek. Naast de tabel zie je de grafiek van de kansverdeling, daarin zie je wat een waarde uit de tabel betekent. Er zijn vier afzonderlijke verdelingen: binomiaal, hypergeometrisch, normaal en poisson. Met de optie Diverse verdelingen kun je verschillende verdelingen tegelijk in één figuur plotten.. Bovendien bevat deze rubriek een demonstraties van de centrale limietstelling. Hypothese toetsen In deze rubriek wordt het toetsen van een hypothese met behulp van een grafiek toegelicht. Je ziet als het ware hoe de toets werkt. De conclusie van de toets wordt apart geformuleerd en kun je afdrukken of in een tekstbestand inlezen.
Algemeen
3
Er zijn vier toetsen: binomiaal toets, t-toets, z-toets en poissontoets. Bovendien bevat deze rubriek demonstraties van betrouwbaarheidsintervallen en onderscheidend vermogen. Profielen VU-Statistiek is zo gemaakt dat het afgestemd kan worden op de leerling/gebruiker die met het programma gaat werken. In deze rubriek kun je het programma fijnregelen. Je kunt opties en menu-onderdelen ‘afplakken’. Ze zijn dan niet meer zichtbaar. Een profiel is een combinatie van instellingen. Daar geef je een naam aan en die naam komt als keuzebutton op het openingsscherm. of Ctrl-P geeft toegang tot Profielen
1.2
Profielen: VU-Statistiek aanpassen Profielen: Instellingen van VU-Statistiek De rubriek Instellingen, toegankelijk via , is voor docenten bedoeld. In deze rubriek kan VU-Statistiek als maatwerk op de doelgroep worden afgestemd. Hier kunnen allerlei programma-onderdelen aan- of uitgezet, opstartbestanden ingesteld, een website ingevuld worden, enz Alle instellingen worden in een profiel verzameld. Sneltoets Het is mogelijk de button op het voorscherm uit te schakelen. De rubriek is dan alleen toegankelijk via de sneltoets Ctrl-P. Dit gaat in het tabblad Menu, onder de kop Hoofdmenu. Wachtwoord Een wachtwoord is bedoeld om het instellingendeel af te schermen van niet geautoriseerde gebruikers. Het wachtwoord is niet zwaar beveiligd, maar voldoet in de schoolse omgeving. Een wachtwoord kun je weer opheffen door de invulregel leeg te maken.Bij het wegraken weet elke systeembeheerder wel een truc om dat probleem op te lossen. Afplakken Je kunt rubrieken van het hoofdmenu afplakken. Ook kun je in de rubrieken zelf weer onderdelen afplakken, dus feitelijk weglaten. Zo kun je bijvoorbeeld de multipunt afplakken, voor beginners zijn vaak de variabelen ‘geheel getal’, ‘kommagetal’, ‘label’ en ‘tekst’ voldoende. Naast de afplakmogelijkheden worden hierna er nog enkele specifieke instelopties beschreven. Pagina Algemeen Op deze pagina twee handige bestandsopties. Je kunt de rubriek Data analyse laten opstarten met een bestand in plaats van met een lege datatabel. Zo’n opstartbestand geeft de zekerheid dat alle leerlingen met dezelfde data werken. Je kunt een map, een directory, opgeven waarin je de databestanden wilt laten opslaan. Pagina Data analyse Deze pagina bevat een insteloptie voor de standaarddeviatie (standaardafwijking) en het aantal decimalen. De standaarddeviatie kan met gebruikmaking van n (het aantal data) of van n -1 berekend worden.
4 n wordt gewoonlijk gebruikt bij populaties n -1 wordt gewoonlijk gebruikt bij steekproeven Profielen Een profiel bestaat uit een aantal pagina’s met instellingen.
1.3
Printen Printen Je kunt tekst, tabellen en grafieken printen. Ook heb je de mogelijkheid om je naam op te geven in de rubriek Data analyse onder Opties. Op de print komt dan je naam te staan. Dat kan handig zijn als meer mensen van dezelfde printer gebruik maken. De afmetingen van de afbeelding die geprint wordt kun je door slepen instellen. In plaats van het direct printen kun je de grafiek eerst op het klembord zetten om de grafiek later bijvoorbeeld in een tekstdocument te plakken. Op het klembord plaatsen gaat met de button Printen van data Je kunt data ook uitvoeren naar een bestand of naar het klembord om ze bijvoorbeeld in een tekstbestand op te nemen. Je kunt eventueel eerst een keuze maken uit de variabelen en records door middel van filteren/ selecteren. Een databestand dat je wilt opnemen in een ander programma, bijvoorbeeld een spreadsheet, moet je uitvoeren in de rubriek Statistiek via Opties Exporteren Printen van afbeeldingen Bijna iedere afbeelding kan geprint worden. Soms is er een keuze van met of zonder rand. Van belang is dat de printer goed geïnstalleerd is. Welke instellingen je kunt wijzigen hangt af van het type printer. In het printmenu kun je de printerdefinitie aanpassen aan je wensen. Let er op de printer als grafisch in te stellen als je plaatjes wilt printen. Ook kan meestal de kwaliteit van de afdruk worden ingesteld. Je kunt kiezen tussen rasteren: grof tot zeer fijn (de afbeelding wordt dan opgebouwd uit grove of zeer fijne blokjes) of geen raster. Bovendien kan in dit venster de intensiteit van de afdruk worden veranderd (normaal is een intensiteit van 100) en de afdrukkwaliteit: normaal of snel. Het uitvoermenu kent een drietal opties Printen De tekening wordt direct naar de printer gestuurd Bestand De tekening kun je als bit-map in een bestand opslaan. Klembord De tekening wordt op het klembord geplaatst. Je kunt de tekening vervolgens manipuleren en bewerken. Bijvoorbeeld in een tekstverwerker of tekenprogramma. Instelling printer Van belang is dat de printer goed geïnstalleerd is. Welke instellingen je kunt wijzigen hangt af van het type printer. Via de setup kun je in het printmenu de printerdefinitie aanpassen aan je wensen. Let er op de printer als grafisch in te stellen.
Algemeen
5
Ook kan meestal de kwaliteit van de afdruk worden ingesteld. Je kunt kiezen tussen rasteren: grof tot zeer fijn (de afbeelding wordt dan opgebouwd uit grove of zeer fijne blokjes) of geen raster. Bovendien kan in dit venster de intensiteit van de afdruk worden veranderd (normaal is een intensiteit van 100) en de afdrukkwaliteit: normaal of snel. Problemen Moderne printers kunnen door diverse printerdrivers worden aangestuurd en hebben vaak veel instelopties. Over het algemeen kun je bij problemen met het printen door een andere driver en/of andere instellingen te kiezen de problemen oplossen. Bij hardnekkige problemen biedt de helpdesk van de printerfirma meestal wel een oplossing.
Top Level Intro This page is printed before a new top-level chapter starts
Part
II
8
2
Data analyse Data analyse Met VU-Stat kun je op een eenvoudige manier statistisch onderzoek doen. Dat kan met kant-enklare bestanden, maar je kunt ook zelf een enquête houden en de resultaten in VU-Statistiek invoeren. Van de uitkomsten kun je allerlei grafieken maken. . Een uitgebreide optie om statistische plaatjes te maken vind je in Dataplot. Data analyse is een omgeving voor statistisch onderzoek. Je kunt data invoeren, bewerken en op verschillende manieren analyseren. Het resultaat van een analyse kun je uitvoeren in de vorm van tabellen en grafieken. De datatabel De data, geordende in rijen en kolommen, kun je in de tabel bewerken Invoer van data Data kun je op verschillende manieren invoeren: zelf verzamelde data, kant en klare data uit een bestand, data uit een ander programma. Data bewerken Data kun je op veel manieren bewerken. Je kunt grafieken en tabellen maken, maar ook data filteren, met data rekenen en zelfs nieuwe data maken. Uitvoer van data Data, tabellen en grafieken kun je op verschillende manieren uitvoeren: naar een printer, naar Word, naar een bestand, naar een ander programma exporteren.
2.1
Invoer van data Invoer van data Invoer van data met toetsenbord Voordat je eigen data gaat invoeren moet je eerst een datatabel voorbereiden. Dat wil zeggen dat je een nieuwe lege tabel moet hebben en dat je een aantal variabelen moet opgeven. nieuwe tabel of menu-optie Bestand Nieuw Bestand databestanden openen of menu-optie Bestand Openen De Data analyse-omgeving werkt met records en is bedoeld voor analyse van data. De Dataplotomgeving is bedoeld voor grafische vormgeving van frequentietabellen. Importeren Met de menu-optie Opties Importeren kun je ASCII bestanden met verschillende scheidingstypen inlezen, met name bestanden die vanuit Excel zijn geëxporteerd. Koppelen Met de menu-optie Opties Koppelen kun je een databestand, dat geopend is (dus zichtbaar in de
Data analyse
9
datatabel) aanvullen met een ander bestand dat dezelfde structuur heeft. Eenzelfde structuur wil zeggen dat precies dezelfde variabelen, in dezelfde volgorde voorkomen. Door deze optie kun je bestanden, bijvoorbeeld een enquête, die in delen zijn gemaakt, samenvoegen tot één groot bestand. Aggregatie Met Opties Aggregatie kun je verschillende statistische resultaten die zijn onderverdeeld naar de waarden van één bepaalde variabele, maken en samenvoegen in een bestand.
2.2
Menu-opties Menu-opties In het menu tref je alle mogelijke opties van Statistiek aan, veel gebruikte opties zijn echter ook via de muis of buttons toegankelijk.
2.2.1
Bestand
Bestand Nieuw bestand Bij de keuze voor een nieuw bestand krijg je een lege tabel. Je moet variabelen aanmaken en data invoeren. Je kunt variabelen aanmaken en wijzigen op twee manieren: - in de datatabel - in Data Variabelen Bestand Openen Met deze optie kun je een bestand laden dat op schijf staat. Een bestand dat je wilt openen moet de extensie vus hebben, bijvoorbeeld myfile.vus Bestanden met een ander type kun je openen via Opties Importeren Bestand Opslaan Met deze optie kun je een bestand bewaren. Het wordt bewaard onder de oorspronkelijke naam van het bestand en op de oorspronkelijke plaats. Wil je een andere naam of een andere plaats kiezen dan gebruik je de optie Opslaan bestand Bestand Opslaan als Met deze optie kun je een bestand bewaren onder een nieuwe naam of op een nieuwe plaats, of allebei.. Bestandsinfo Een bestand hoort gedocumenteerd te zijn. Voor een juiste interpretatie van de gegevens is het van belang dat bekend is wat voor data gebruikt zijn. Daarbij kun je denken aan de bron, waar komen de data vandaan, wanneer het bestand gemaakt is en of de data vrij beschikbaar zijn. Dit soort gegevens kun je op deze plaats opslaan Sluiten Bestand wordt gesloten. De datatabel wordt grijs .
10
Uitvoer Je kunt selecteren welke variabelen je in de uitvoer wilt opnemen. De uitvoer kan naar printer, bestand, klembord of Word. Printer Setup Je kunt een printer selecteren en instellen voorzover de gebruikte printer instelmogelijkheden heeft. Hoofdmenu Je keert terug naar het hoofdmenu. Een geopend bestand blijft aanwezig. Daar kun je dus weer naar teruggaan.
2.2.2
Data
Data tabel Statistische gegevens heten ook wel data. De data staan geordend in de rijen en kolommen van de datatabel, elke cel bevat een gegeven. Op de bovenste rij staan de variabelen, in de eerste kolom staan de volgnummers. Een kolom hoort dus bij een bepaalde variabele. Alle gegevens van één rij vormen een record. Een ster (*) in een cel geeft aan dat daar een gegeven ontbreekt. In berekeningen tellen dergelijke ontbrekende gegevens niet mee. Je kunt een cel actief maken door linksklikken. De cel wordt dan blauw. Ook met de pijltoetsen kun je door de rijen en de kolommen lopen. Boven in het scherm staat naast de buttonbalk informatie over de actieve variabele. Onder in het scherm staat het aantal records vermeld. De menuopties en buttons kun je gebruiken voor het bewerken en analyseren van de data. Als de cursor op een volgnummer staat en je klikt met de rechter muisknop dan wordt een rij met record actief. Je krijgt een werkmenu voor invoegen en verwijderen van records. Als de cursor in een cel staat en je klikt met de rechter muisknop dan wordt de kolom met variabele actief. Je krijgt een werkmenu bij de actieve variabele.
2.2.2.1
Variabelen
Variabelen Elke variabele heeft een aantal kenmerken: - naam; vaak een afkorting om de betekenis van de variabele aan te geven; - type; geheel getal, kommagetal, label, tekst of multipunt ; - toelichting; zo’n toelichting is niet verplicht, maar bevordert wel het overzicht. - volgnummer; dat volgnummer ligt vast door de invoervolgorde. Er zijn vijf typen variabelen: Kommagetal Geheel getal Tekst
Data analyse
11
Label Multipunt
Variabelen wijzigen of maken in Data Variabelen Je krijgt een ontwerptabel voor de variabelen Je typt de naam van de variabele in en geeft het type op. Een toelichting is niet verplicht maar wel handig omdat de toelichting in diverse schermen bij de variabele getoond wordt. Nieuwe variabelen kun je tussenvoegen met de + button of toevoegen door naar de onderkant van de lijst te gaan. Variabelen wijzigen of maken in de datatabel In de datatabel kun je in een lege kolom rechtsklikken. Je krijgt dan een venster om een variabele in te voeren. Met rechtsklikken in de kolom van een bestaande variabele krijg je diverse opties onder andere om die variabele te wijzigen of te verwijderen. Variabelen selecteren Je kunt op de volgende manieren een selectie van de variabelen maken. - In het menu Beeld Variabelen in beeld een keuze uit de variabelen die je ziet in de datatabel - In het menu Bestand Uitvoer een keuze uit de variabelen die je uit wilt voeren naar printer of bestand. Speciale opties In het menu Opties Tekstvariabelen staan enkele speciale opties om tekstvariabelen om te zetten. Met name het omzetten naar labels is handig bij geïmporteerde data. 2.2.2.2
Sorteren
Sorteren Met Sorteren worden de gegevens van een variabele op volgorde gezet. Numerieke gegevens, getallen en labelcodes, worden van klein naar groot of andersom gesorteerd. Alfanumerieke gegevens, letters en tekst, worden alfabetisch op volgorde gezet. Oplopend is van a naar z. Aflopend is van z naar a. Indien in een bestand een selectie is gemaakt, komen eerst de geselecteerde records en daarna de niet geselecteerde records aan de beurt. Records met een ontbrekende waarde (*) worden achteraan gezet.. 2.2.2.3
Splitsen in deelgroepen
Splitsen Opsplitsen in groepen Met de splits-optie kun je de data in een bestand opsplitsen in deelgroepen. Je kunt bijvoorbeeld een bestand van leerlingen splitsen in een groep meisjes en een groep jongens. Bij een tabel of een grafische representatie van een andere variabele wordt deze opsplitsing dan in beeld gebracht. Bij Staafdiagram zijn er drie representatievormen bij splitsing. Deze vormen zijn:
12 - grafieken naast elkaar. - één grafiek, staven gestapeld. - één grafiek, staven naast elkaar. Bij Dotplot zijn er twee representatievormen bij splitsing. De dots hebben voor elke deelgroep een andere kleur Deze vormen zijn: - één grafiek. - grafieken apart. Bij Cirk eldiagram wordt voor elke groep een apart diagram gemaakt. Bij Lijndiagram zijn er drie representatievormen bij splitsing. Deze vormen zijn: - grafieken naast elkaar. - één grafiek, staven gestapeld. - grafieken in één figuur. Bij Boxplot wordt voor elke groep een aparte boxplot gemaakt. Bij Puntenwolk zijn er twee representatievormen - voor elke groep een aparte wolk. - of alle data in één wolk getekend met kleuraanduiding van de splitsing. Bij Tabel wordt voor elke groep een aparte kolom gemaakt Bij Kruistabel bestaan er drie mogelijkheden. - voor elke groep een tabel - voor elke groep aparte kolommen - voor elke groep aparte rijen Opheffen van een splitsing. Na een splitsing is de optie Splitsing Opheffen actief in de datatabel (rechts klikken), in het menu Data en in het splitsvenster. 2.2.2.4
Splitsing opheffen Opheffen van een splitsing. Na een splitsing is de optie Splitsing Opheffen actief in de datatabel (rechts klikken), in het menu Data en in het splitsvenster. Een eerder gemaakte splitsing in groepen wordt ongedaan gemaakt
2.2.2.5
Selectiefilter
Selecteren van records Met deze optie kun je uit een groot bestand precies die gegevens lichten die aan bepaalde criteria moeten voldoen. In de datatabel zijn de niet-geselecteerde records te herkennen aan de grijze celkleur en aan het doorgestreepte recordnummer. In een gefilterd bestand kun je weer verder filteren Er zijn twee filtermethoden: filter, formulefilter.
Data analyse
13
Filter Een eenvoudige maar veel gebruikte filtering is op het criterium gelijk of ongelijk. Van de gekozen variabele zie je een verdelingsoverzicht met behulp waarvan je het criterium kunt bepalen Als filter kun je kiezen uit gelijk, ongelijk, combinaties daarvan of niet bestaand. Je kunt ook een variabele uit de dropdown lijst kiezen. Voor multipunt-variabelen krijg je een aangepast filter.
Formulefilter Een gevorderde filtermethode werkt met een filterformule De criteria moet je als een formule opgeven. Daarvoor kun je de “rekenmachine” gebruiken. In de formules gelden de normale regels voor wiskundige uitdrukkingen. Met haakjes geef je de voorrang in een berekening aan. Variabelen staan tussen rechte haken, zo dus [variabele]. Bij aanklikken gaat dat vanzelf, bij intypen moet je de haken niet vergeten. Er is ook een aantal Speciale functies die je kunt gebruiken, onder meer MIN, MAX, als-dan. Ook de logische operatoren AND en OR zijn toegestaan. De speciale functies zijn in een aantal categorieën verdeeld en kun je per categorie uit een dropdown lijst selecteren.
Opheffen selectie Na een splitsing is de optie Selectie Opheffen actief in de datatabel (rechts klikken), in het menu Data en in het filtervenster.
Verwijderen van records die niet geselecteerd zijn Met de optie Verwijder niet geselecteerde records in het menu Data of het werkvenster kun je niet geselecteerd records van het scherm en uit het bestand verwijderen. Op die manier kun je een deelbestand maken waarin de data aan bepaalde voorwaarden voldoen.
Voorbeelden - Selecteer de leerlingen die langer zijn dan 162 cm. Het filter is: [lengte]>162 - Selecteer de leerlingen die langer zijn dan 162 cm en tevens minder wegen dan 56 kg. Je kunt twee keer na elkaar filteren. Het kan ook in een keer met de formule: [lengte]>162 AND [gewicht]<56 - Selecteer de leerlingen die een lengte tussen de 160 en 170 cm hebben. De formule is :[ lengte]<170 AND [lengte]>160 - Selecteer de leerlingen die langer zijn dan 162 cm of minder wegen dan 56 kg. De formule is: [lengte]>162 OR [gewicht]<56 2.2.2.6
Één steekproef trekken
Eén steekproef trekken Je kunt opgeven hoe groot de steekproef moet zijn. De steekproef wordt in de datatabel weergegeven. Met rood wordt gewaarschuwd dat een steekproef wordt weergegeven. Door de tabel te verlaten of te sluiten keer je terug naar de oorspronkelijk dataset.
14 2.2.2.7
Veel steekproeven trekken Veel steekproeven trekken Je kunt opgeven hoe groot de steekproeven moeten zijn en hoeveel steekproeven getrokken moeten worden. Daarnaast moet je selecteren welke variabelen in de steekproef meegenomen worden. In een keuzelijst kun je aanvinken welke kentallen weergegeven moeten worden. De meeste spreken voor zich. De optie “Verschil gemiddelde” laat het verschil zien tussen het steekproef gemiddelde en het gemiddelde van het complement van die steekproef. Deze optie is bedoeld voor het uitvoeren van een zgn. randomisatie toets. Voor het vergelijken van twee onbekende populaties A en B worden twee kleine steekproeven, één uit A en één uit B, genomen. De twee steekproeven worden bij elkaar gevoegd tot één set. Uit deze set wordt een groot aantal steekproeven genomen. Het verschil van de gemiddelden van de steekproef en diens complement is de toetsvariabele V. De waarde van het verschil van de gemiddelden in de oorspronkelijke steekproeven kan beoordeeld worden in de verdeling van V. De resultaten worden in de datatabel weergegeven. Met rood wordt gewaarschuwd dat een steekproef wordt weergegeven. Door de tabel te verlaten of te sluiten keer je terug naar de oorspronkelijk dataset.
2.2.2.8
Omrekenen
Omrekenen van variabelen Met deze optie kun je met behulp van bestaande variabelen een nieuwe variabele definiëren of aan een bestaande variabele nieuwe waarden toekennen. Een nieuwe variabele kun je aanmaken met
in de dropdown lijst. Voor het echte omrekenen geef je een formule op. Daarvoor kun je de “rekenmachine”gebruiken. In de formules gelden de normale regels voor wiskundige uitdrukkingen.Met haakjes geef je de voorrang in een berekening aan. Variabelen staan tussen rechte haken, zo dus [variabele]. Bij aanklikken gaat dat vanzelf, bij intypen moet je de haken niet vergeten. Er is ook een aantal Speciale functies die je kunt gebruiken, onder meer @MIN, @MAX, @GEM, @SD. Ook de logische operatoren AND en OR zijn toegestaan. De speciale functies zijn in een aantal categorieën verdeeld en kun je per categorie uit een dropdown lijst selecteren.
Voorbeeld gemiddelde = ([schoolex] + [centraalex])/2 .
2.2.2.9
Hercoderen
Hercoderen Met deze optie is het gemakkelijk om een getalvariabele op te splitsen in categorieën. Voorbeeld In een bestand met variabele lengte wil je de mensen langer dan 180 cm de label Lang geven, de mensen tussen 160 cm en 180 cm de label Normaal en de mensen kleiner dan 160 cm de label Kort .
Data analyse
15
De bronvariabele is lengte De doelvariabele is een nieuwe variabele. Kies bij doelvariabele voor en maak een variabele categorie van het type label met de drie labels aan. Daarna maak je de codeformules voor de gewenste indeling. Zet elke codeformule met de button Voeg toe in de lijst Als lengte<160 dan categorie = 1 Als lengte<180 dan categorie = 2 Als lengte>=180 dan categorie = 3 Het programma werkt de lijst af en zet die zonodig op volgorde. Zodra het record aan de eis voldoet wordt de bijhorende opdracht uitgevoerd. Als het record aan geen enkele eis voldoet verandert de variabele niet van waarde. Je kunt ook niet bestaande waarden * hercoderen, dat kan bijvoorbeeld handig zijn als je records met niet bestaande waarden wilt selecteren. 2.2.2.10 Toevoegen records
Toevoegen records Je kunt een aantal records toevoegn. Bij invoer via de datatabel wordt steeds het aantal records uitgebreid zodat er steeds 10 lege records aan het einde staan. 2.2.2.11 Verwijderen records
Verwijderen records Je kunt records verwijderen door de volgnummers op te geven. Deze optie is geschikt een groot aantal records tegelijk te verwijderen. Je kunt een enkel record ook verwijderen door het eerst in de nummerkolom met een rechter muisklik te selecteren.
2.2.3
Beeld
Beeld In deze menuoptie kun je regelen wat je wel of niet op het scherm te zien krijgt. Records/Datatabel Records geeft elk record weer in een verticale tabel. Dat kan handig zijn bij de invoer als er veel variabelen zijn. Bijvoorbeeld bij een enquête. Datatabel laat de gehele datatabel zien. Autofit Aanpassing van de kolombreedte aan de data in de kolom Labels Bij gelabelde variabelen kun je kiezen of de labels dan wel de codegetallen in de datatabel komen te staan. Bijvoorbeeld “0/1” of “jongen/meisje”. Vaste eerste kolom
16 De variabele van de eerste kolom in de datatabel wordt vastgezet. Als bijvoorbeeld de eerste variabele de naam van de leerling is, kun je deze naam steeds lezen ook al loop je door de andere variabelen van het bestand heen (scrollen). Variabelen in beeld Je kunt kiezen welke variabelen je wel of niet op het scherm wilt zien. Dat kan bijvoorbeeld handig zijn als het aantal variabelen groot is. Het selecteren van variabelen voor bestand of printen kan in Bestand Uitvoer. Het verwijderen van variabelen kan in het werkvenster van de datatabel of in Data Variabelen
2.2.4
Grafiek
2.2.4.1
Dotplot
Dotplot Bij deze optie moet je eerst kiezen bij welke variabele je een dotplot wilt maken. Klik je op een dot dan zie je linksboven alle informatie van het bijhorende record Dotplots zijn niet geschikt voor hele grote aantallen. Bij meer dan 1000 data word je gewaarschuwd. Een staafdiagram is dan meer geschikt. Rechts op het scherm staat een aantal keuzemogelijkheden en buttons. Variabele Hiermee kun je een andere variabele kiezen. Splitsen Met de splitsoptie kun je de data opsplitsen in deelgroepen. Je kunt bijvoorbeeld een bestand van leerlingen splitsen in een groep meisjes en een groep jongens. Je krijgt dan twee grafiekvormen die je met knoppen onderaan kunt kiezen: - één grafiek, dots onderscheiden door kleuren. - grafieken naast elkaar. Titel Hiermee kun je een titel bij de afbeelding zetten. Dat is bijvoorbeeld handig als je een afbeelding uitprint. Beeld De dots kun je weglaten, bijvoorbeeld handig als je een boxplot maakt. De afmetingen van de dots kun je instellen. Intervalschuiven Met intervalschuiven kun je de set indelen. Links en rechts van de schuiven zie je het aantal of het percentage dots. Een schuif kun je plaatsen door ergens op de as links te klikken. Je verwijdert een schuif door rechts te klikken. Je verplaatst een schuif door het groene driehoekje te slepen, de aantallen of percentages passen zich vanzelf aan. Boxplot Een boxplot vat de dataset in een diagram samen. De lengte van de box heet de Inter Kwartiel Afstand, kortweg IKA. Een punt dat meer dan 1,5xIKA vanaf de box ligt heet een uitschieter.
Data analyse
17
Je kunt die uitschieters laten zien. Buttons Met de printbutton krijg je behalve een printoptie de uitvoermogelijkheden om de datatabel op het klembord zetten, naar Word te sturen, of als bestand op te slaan. Geeft hulp bij het onderdeel waar je mee bezig bent Je verlaat het actieve scherm en komt in het vorige scherm De grafiek wordt direct in Word opgenomen. 2.2.4.2
Staafdiagram
Staafdiagram Bij deze optie moet je eerst kiezen bij welke variabele je een staafdiagram wilt hebben. Rechts op het scherm staat een aantal keuze-mogelijkheden en buttons. Variabele Hiermee kun je een andere variabele kiezen. Splitsen Met de splits-optie kun je de data opsplitsen in deelgroepen. Je kunt bijvoorbeeld een bestand van leerlingen splitsen in een groep meisjes en een groep jongens. Je krijgt dan drie grafiekvormen: - grafieken naast elkaar. - één grafiek, staven gestapeld. - één grafiek, staven naast elkaar. Indeling Er is een standaard klassenindeling, maar je kunt er ook zelf een maken. Titel Hiermee kun je een titel bij de afbeelding zetten. Dat is bijvoorbeeld handig als je een afbeelding uitprint. Norm.papier Met normaal waarschijnlijkheidspapier kun je beoordelen hoe goed de verdeling van de data een normale verdeling benadert. Hoe beter de punten op een lijn liggen des te beter de benadering. Procenten De frequenties worden in procenten weergegeven Cumulatief Hiermee kies je voor een staafdiagram of een cumulatief staafdiagram. Gemiddelde Hiermee wordt de plaats van het gemiddelde op de as aangegeven. Mediaan Hiermee wordt de plaats van de mediaan op de as aangegeven.
18 Norm.Verd. Hiermee wordt een grafiek van de normale verdeling (klokvorm) getekend die zo goed mogelijk bij het staafdiagram past. Dataplot De basisgrafiek wordt in de vormgeving van dataplot geopend. Menubalk In de menubalk onder Staafdiagram staan de opties ook opgenomen. Daar kun je de balk aan de rechterkant uitzetten Buttons Met de printbutton krijg je behalve een printoptie de uitvoermogelijkheden om de datatabel op het klembord zetten, naar Word te sturen, of als bestand op te slaan. Geeft hulp bij het onderdeel waar je mee bezig bent Je verlaat het actieve scherm en komt in het vorige scherm De grafiek wordt direct in Word opgenomen.
2.2.4.3
Cirkeldiagram
Cirkeldiagram Bij deze optie moet je eerst kiezen bij welke variabele je een cirkeldiagram wilt hebben. Rechts op het scherm staat een aantal keuze-mogelijkheden en buttons. Variabele Hiermee kun je een andere variabele kiezen. Splitsen Met de splits-optie kun je de data opsplitsen in deelgroepen. Je kunt bijvoorbeeld een bestand van leerlingen splitsen in een groep meisjes en een groep jongens. Je krijgt dan aparte grafieken per deelgroep. Indeling Er is een standaard klassenindeling, maar je kunt er ook zelf een maken. Titel Hiermee kun je een titel bij de afbeelding zetten. Dat is bijvoorbeeld handig als je een afbeelding uitprint. 3D Hiermee krijg je een drie-dimensionale afbeelding van het cirkeldiagram Rond Hiermee kun je een ovale of ronde vorm kiezen.
Data analyse
19
Bijschrift Hiermee krijg je diverse mogelijkheden voor het soort informatie bij het cirkeldiagram uitprint. Dataplot De basisgrafiek wordt in de vormgeving van dataplot geopend. Menubalk In de menubalk onder Cirkeldiagram staan de opties ook opgenomen. Daar kun je de balk aan de rechterkant uitzetten Buttons Met de printbutton krijg je behalve een printoptie de uitvoermogelijkheden om de datatabel op het klembord zetten, naar Word te sturen, of als bestand op te slaan. Geeft hulp bij het onderdeel waar je mee bezig bent Je verlaat het actieve scherm en komt in het vorige scherm De grafiek wordt direct in Word opgenomen. 2.2.4.4
Lijndiagram
Lijndiagram Bij deze optie moet je eerst kiezen bij welke variabele je een lijndiagram wilt hebben. Rechts op het scherm staat een aantal keuzemogelijkheden en buttons. Variabele Hiermee kun je een andere variabele kiezen. Splitsen Met de splitsoptie kun je de data opsplitsen in deelgroepen. Je kunt bijvoorbeeld een bestand van leerlingen splitsen in een groep meisjes en een groep jongens. Je krijgt dan drie grafiekvormen: - grafieken naast elkaar. - grafieken in één figuur - één grafiek, diagram gestapeld. Indeling Er is een standaard klassenindeling, maar je kunt er ook zelf een maken. Titel Hiermee kun je een titel bij de afbeelding zetten. Dat is bijvoorbeeld handig als je een afbeelding uitprint. Procenten De frequenties worden in procenten weergegeven Cumulatief
20 Hiermee kies je voor een staafdiagram of een cumulatief staafdiagram. Gemiddelde Hiermee wordt de plaats van het gemiddelde op de as aangegeven. Mediaan Hiermee wordt de plaats van de mediaan op de as aangegeven. Norm.Verd. Hiermee wordt een grafiek van de normale verdeling (klokvorm) getekend die zo goed mogelijk bij het staafdiagram past. Dataplot De basisgrafiek wordt in de vormgeving van dataplot geopend. Menubalk In de menubalk onder Staafdiagram staan de opties ook opgenomen. Daar kun je de balk aan de rechterkant uitzetten Buttons Met de printbutton krijg je behalve een printoptie de uitvoermogelijkheden om de datatabel op het klembord zetten, naar Word te sturen, of als bestand op te slaan. Geeft hulp bij het onderdeel waar je mee bezig bent Je verlaat het actieve scherm en komt in het vorige scherm De grafiek wordt direct in Word opgenomen. 2.2.4.5
Boxplot
Boxplot Na het kiezen van deze optie wordt eerst gevraagd variabelen te kiezen, tenzij er maar één geschikte variabele aanwezig is. Je kunt ook meerdere, zelfs alle, variabelen tegelijk selecteren met de >> button. Rechts op het scherm staat een aantal keuze-mogelijkheden en buttons. De grenzen van de boxplot zijn de laagste en hoogste waarde, de kwartielen en de mediaan. Voor de mediaan, en dus ook de kwartielen, zijn verschillende definities in omloop. Vooral bij kleine aantallen data levert dat verschillen op. In de Profielen kan of de officiële definitie (Tukey) of de voor de onderbouw gehanteerde definitie ingesteld worden. Variabele Hiermee kun je een andere variabele kiezen. Splitsen Met de splits-optie kun je de data opsplitsen in deelgroepen. Je kunt bijvoorbeeld een bestand van leerlingen splitsen in een groep meisjes en een groep jongens. Je krijgt dan voor elk deelgroep een boxplot. Titel Hiermee kun je een titel bij de afbeelding zetten. Dat is bijvoorbeeld handig als je een afbeelding uitprint.
Data analyse
21
Horizontaal De boxplot(s) worden horizontaal getekend Verticaal De boxplots worden verticaal getekend Uitschieters Je kunt kiezen of uitschieters wel of niet in de boxplot opgenomen worden. Uitschieters worden als een kruis aangegeven. Met een uitschieter wordt hier een waarneming bedoeld die meer dan anderhalve kwartielafstand van de kwartielgrens afwijkt. Menubalk In de menubalk onder Boxplot staan de opties ook opgenomen. Daar kun je de balk aan de rechterkant uitzetten Buttons Met de printbutton krijg je behalve een printoptie de uitvoermogelijkheden om de datatabel op het klembord zetten, naar Word te sturen, of als bestand op te slaan. Geeft hulp bij het onderdeel waar je mee bezig bent Je verlaat het actieve scherm en komt in het vorige scherm De grafiek wordt direct in Word opgenomen. 2.2.4.6
Puntenwolk
Puntenwolk De puntenwolk biedt de mogelijkheid het verband tussen grootheden te onderzoeken. Na het kiezen van deze optie wordt eerst gevraagd een horizontale variabele en verticale variabele te kiezen. Daarna opent het scherm met de puntenwolk en diverse opties. Bovenaan staat de modelformule en de kentallen. Je kunt uit vier regressiemodellen kiezen: lineair, kwadratisch, exponentieel en macht. Het lineaire model kun je zelf proberen te vinden met de optie Zoek passende lijn. Deze optie werkt niet bij deelgroepen. Rechts op het scherm staan instelmogelijkheden en buttons. Variabelen (horizontaal en verticaal) Hiermee kun je andere variabelen kiezen. Splitsen Met de splitsoptie kun je de data opsplitsen in deelgroepen. Je kunt bijvoorbeeld een bestand van leerlingen splitsen in een groep meisjes en een groep jongens. Je kunt dan kiezen uit één puntenwolk met kleuronderscheid van de deelgroepen of uit meerdere puntenwolken, voor elke deelgroep één. Alle modelinformatie wordt nu gesplitst naar deelgroep weergegeven. Titel grafiek Hiermee kun je een titel bij de afbeelding zetten. Dat is bijvoorbeeld handig als je een afbeelding uitprint.
22 Toetsen Er zijn twee toetsen opgenomen. De eerste toets is een toets op coëfficiënten. Deze parameters zijn t-verdeeld. Het aantal vrijheidsgraden is afhankelijk van de situatie. In het lineaire en het exponentiele model is dat het aantal paren minus 2. In het kwadratische model is dat het aantal paren minus 3. De belangrijkste hypothese die onderzocht kan worden is of een parameter nul kan zijn. De tweede toets gaat na of het gehele model een goed model is. De nul hypothese is dat alle coëfficiënten gelijk zijn aan nul. De alternatieve hypothese is dat minstens één coëfficiënt ongelijk aan nul is. Hier vind je schattingen van de parameters en de bijhorende ANOVA-tabel. Regressiek romme De regresiekromme wordt weergegeven Banden Het betrouwbaarheidsinterval is het gebied waarin het voorspelde gemiddelde kan liggen. Het betrouwbaarheidsinterval (voor het gemiddelde) wordt groen getekend. Het voorspellingsinterval is het gebied waarin een y-waarde ligt als de x-waarde gegeven is. Het voorspellingsinterval wordt rood getekend. De waarde kun je opgeven en staat standaard op 0.95. Voorbeeld voor het geval van lengte en gewicht. Het betrouwbaarheidsinterval doet een uitspraak over het gemiddelde gewicht van personen met een zekere lengte. Het voorspellingsinterval doet een uitspraak over het mogelijke gewicht van deze personen. Puntenwolk De puntenwolk wordt weergegeven Residu Residu is het verschil tussen de waarneming en de fit.
Model Hier kun je een modeltype selecteren. Buttons Met de printbutton krijg je behalve een printoptie de uitvoermogelijkheden om de datatabel op het klembord zetten, naar Word te sturen, of als bestand op te slaan. Geeft hulp bij het onderdeel waar je mee bezig bent
Je verlaat het actieve scherm en komt in het vorige scherm De grafiek wordt direct in Word opgenomen.
Data analyse 2.2.4.7
23
Tijdreeks
Tijdreeks In een tijdreeks wordt nagegaan of er een regelmaat te vinden is in de ontwikkeling van een variabele in de loop van de tijd. Een variabele moet daarom een tijdsaanduiding bevatten. De waarden van deze tijd-variabele moeten bestaan uit een reeks opeenvolgende getallen, dus met gelijke intervallen. Bij dit onderdeel verschijnt een scherm waarin je een aantal opties kunt opgeven. Je moet in elk geval de tijd-variabele en de afhankelijke variabele opgeven . De 'periode' is de periode waarover het voortschrijdend gemiddelde wordt berekend. Dit kan volgens het multiplicatieve of volgens het additieve model berekend worden. Er zijn drie tabbladen. Variabelen Hier stel je het model in. De variabelen, de tijdsperiode en het modeltype. Er zijn de volgende modeltypen: additief, multiplicatief, geen. Grafiek Je krijgt een tijdgrafiek en een grafiek van het voortschrijdend gemiddelde. Het voortschrijdende gemiddelde wordt berekend over een periode die je op het tabblad Variabelen kunt opgeven. Tabel De informatie over de tijdreeks in tabelvorm Het voortschrijdende gemiddelde wordt berekend over een periode die je op het tabblad Variabelen kunt opgeven. Voorbeeld Een goed voorbeeld kun je maken met het bestand KLIMAAT.VUS 2.2.4.8
Lorentz kromme
Lorentzkromme Een Lorentz-kromme geeft aan welk percentage van de onderzochte populatie hoort bij het percentage van de gevraagde variabele. Daarom hoef je maar variabele op te geven Variabele Hiermee kun je een andere variabele kiezen. Splitsen Met de splits-optie kun je de data opsplitsen in deelgroepen. Je kunt bijvoorbeeld een bestand van leerlingen splitsen in een groep meisjes en een groep jongens. Je krijgt dan per deelgroep een grafiek: Titel Hiermee kun je een titel bij de afbeelding zetten. Dat is bijvoorbeeld handig als je een afbeelding uitprint. Menubalk In de menubalk onder Lorentzkromme staan de opties ook opgenomen. Daar kun je de balk aan de rechterkant uitzetten
24
Buttons Met de printbutton krijg je behalve een printoptie de uitvoermogelijkheden om de datatabel op het klembord zetten, naar Word te sturen, of als bestand op te slaan. Geeft hulp bij het onderdeel waar je mee bezig bent Je verlaat het actieve scherm en komt in het vorige scherm De grafiek wordt direct in Word opgenomen.
2.2.4.9
Dataplot
Dataplot Met de optie dataplot heb je de mo0gelijkheidvan meerdere variabelen tegelijk een grafiek te maken. Je kiest een horizontale en een of meer verticale variabelen en kunt dan de grafiek(en) bewerken. 2.2.4.10 Showall
Showall De optie Showall laat van een variabele meerdere grafieken en kengetallen tegelijk zien. De grafische afbeeldingen zijn: Staafdiagram, Cirkeldiagram, Lijndiagram en Boxplot. De kengetallen vind je in een Frequentietabel en een tabel met Centrummaten. Je kunt zo uitzoeken welke representatievorm het meest geschikt is in een bepaalde situatie. Je kunt de afbeeldingen per stuk verwijderen. In de menubalk staan nog opties zowel per grafiek als algemeen. Onder algemeen kun je een andere variabele kiezen, een klassenindeling maken, splitsen in deelgroepen en laten printen, waaronder de afbeelding kopiëren naar het klembord en naar Word sturen.
2.2.5
Kentallen
Kentallen Na het kiezen van deze optie wordt eerst gevraagd een variabele te kiezen. Het is mogelijk meerdere variabelen tegelijk te selecteren, met de >> button zelfs alle variabelen in één keer. Het scherm kent een aantal instelmogelijkheden en buttons. Variabele Hiermee kun je een andere variabele kiezen. Splitsen Met de splits-optie kun je de data opsplitsen in deelgroepen. Je kunt bijvoorbeeld een bestand van
Data analyse
25
leerlingen splitsen in een groep meisjes en een groep jongens. De kentallen worden per deelgroep aangegeven.
Printen Je kunt de centrummaten direct printen, op het klembord zetten of als een bestand wegschrijven. Mediaan, kwartielen, standaardafwijking Voor kwartielen, zijn verschillende definities in omloop. Vooral bij kleine aantallen data levert dat verschillen op. In de Profielen kun je kiezen om de mediaan wel of niet mee te laten tellen bij de berekening van de kwartielen. De standaarddeviatie wordt ook vaak standaardafwijking genoemd. Omdat vaak de afkorting sd (standarddeviation) wordt gebruikt is hier voor standaarddeviatie gekozen.
2.2.6
Tabel
Tabel Je kunt data overzichtelijk in diverse tabellen weergeven. 2.2.6.1
Frequentie-tabel
Frequentietabel Na het kiezen van deze optie wordt eerst gevraagd een variabele te kiezen, behalve als er maar één variabele aanwezig is. Rechts op het scherm staat een aantal keuze-mogelijkheden en buttons. Variabele Hiermee kun je een andere variabele kiezen. Splitsen Met de splits-optie kun je de data opsplitsen in deelgroepen. Je kunt bijvoorbeeld een bestand van leerlingen splitsen in een groep meisjes en een groep jongens. Je krijgt dan tabellen per deelgroep. Indeling Er is een standaard klassenindeling, maar je kunt er ook zelf een maken. Titel Hiermee kun je een titel bij de afbeelding zetten. Dat is bijvoorbeeld handig als je een afbeelding uitprint. Procenten De frequenties worden in procenten weergegeven Cumulatief Hiermee kies je voor een cumulatieve tabel. Dataplot/Export De tabel wordt naar Dataplot geëxporteerd. Je kunt dan een grafiek bij de frequentietabel maken.
26 Met deze button kun je heen en weer gaan tussen Dataplot en Statistiek. Menubalk In de menubalk onder Frequentietabel staan de opties ook opgenomen. Daar kun je de balk aan de rechterkant uitzetten Buttons Met de printbutton krijg je behalve een printoptie de uitvoermogelijkheden om de datatabel op het klembord zetten, naar Word te sturen, of als bestand op te slaan. Geeft hulp bij het onderdeel waar je mee bezig bent Je verlaat het actieve scherm en komt in het vorige scherm De grafiek wordt direct in Word opgenomen. 2.2.6.2
Kruistabel
Kruistabel In een kruistabel kun je de samenhang tussen twee variabelen bekijken. Na het kiezen van deze optie wordt eerst gevraagd een rij-variabele en een kolom- variabele te kiezen. Rechts op het scherm staat een aantal keuze-mogelijkheden en buttons. Variabelen Hiermee kun je andere variabelen kiezen. Splitsen Met de splits-optie kun je de data opsplitsen in deelgroepen. Je kunt bijvoorbeeld een bestand van leerlingen splitsen in een groep meisjes en een groep jongens. Je krijgt dan drie tabelvormen: - kruistabellen per deelgroep. - Rijen per deelgroep. - Kolommen per deelgroep. Daarbij kun je de subtotalen laten zien. Indeling Er is een standaard klassenindeling, maar je kunt er ook zelf een maken. Voor elk van de beide variabelen kun je een indeling maken. Titel Hiermee kun je een titel bij de afbeelding zetten. Dat is bijvoorbeeld handig als je een afbeelding uitprint. Tabel en boom Hiermee exporteer je de tabel naar de module Tabel en boom voor verdere analyse. Chi-kwadraat Op een niet gesplitste kruistabel kun je de chi-kwadraat toets uitvoeren mits aan de voorwaarden is voldaan.
Data analyse
27
Aantallen De absolute aantallen en totalen Rijpercentages De waarde van elke rij is op 100% gesteld. Kolompercentages De waarde van elke kolom is op 100% gesteld Totaalpercentages Het totaal wordt op 100% gesteld. Menubalk In de menubalk onder Kruistabel staan de opties ook opgenomen. Daar kun je de balk aan de rechterkant uitzetten De optie Groepen is van toepassing als de data gesplitst zijn op een variabele Is er niet gesplitst dan is de optie Inhoud Cel van toepassing. Buttons Met de printbutton krijg je behalve een printoptie de uitvoermogelijkheden om de datatabel op het klembord zetten, naar Word te sturen, of als bestand op te slaan. Geeft hulp bij het onderdeel waar je mee bezig bent Je verlaat het actieve scherm en komt in het vorige scherm De grafiek wordt direct in Word opgenomen.
2.2.6.3
Steelblad Steelbladdiagram Na het kiezen van deze optie wordt eerst gevraagd een variabele te kiezen. Voor dit type diagram zijn alleen positieve gehele getallen geschikt. In een steelbladdiagram staan bijvoorbeeld de tientallen voor de verticale streep en de eenheden erachter
Variabele Hiermee kun je een andere variabele kiezen. Splitsen Met de splits-optie kun je de data opsplitsen in deelgroepen. Je kunt bijvoorbeeld een bestand van leerlingen splitsen in een groep meisjes en een groep jongens. Je krijgt dan tabellen per deelgroep. Dubbelblad Gesplitste tabellen kun je hiermee tegen elkaar zetten.
28
2.2.7
Meer Statistiek
Meer statistiek Geavanceerde statistische opties 2.2.7.1
Correlatiematrix
Correlatiematrix In een correlatie matrix worden de correlatie-coëfficiënten van een aantal gekozen variabelen weergegeven in een tabel. De variabelen staan zowel horizontaal als verticaal afgebeeld. Meestal is het alleen zinvol variabelen van het type geheel getal in een correlatie-matrix op te nemen. Labelvariabelen kunnen eventueel ook meedoen, op voorwaarde dat er sprake is van meting op een intervalschaal. Uit de matrix is snel af te lezen tussen welke variabelen een statistisch verband bestaat. Alleen de records die voor elke geselecteerde variabele een waarde hebben, worden in de berekening opgenomen (listwise deletion). Het tabblad Cronbach’s alfa Cronbach’s alfa is een maat voor de betrouwbaarheid van een toets. Cronbach’s alfa meet de “interne” consistentie van een test. Als de items hetzelfde meten moet er een hoge correlatie zijn. De gestandariseerde alfa is de alfa die je krijgt door alle variabelen te standariseren naar de standaarddeviatie 1. 2.2.7.2
Multipele regressie
Multipele regressie Bij multipele regressie wordt nagegaan hoeveel door een aantal onafhankelijke variabelen wordt bijgedragen aan de 'verklaring' van één afhankelijke variabele. Eerst moet je de afhankelijke ('te verklaren') variabele en de onafhankelijke ('verklarende') variabele selecteren. De uitvoer van dit onderdeel bestaat uit de regressie-vergelijking, de multipele correlatie-coëfficiënt en de variantie-analyse. Daarnaast wordt de nauwkeurigheid van de parameterschattingen gegeven.
2.2.7.3
Stat. Proces Controle
Statistische Proces Controle 2.2.7.4
Discriminant analyse
Discriminant analyse Bij de lineaire discriminant analyse is het doel onderscheid te maken tussen twee groepen op basis van gegevens van een multivariaat karakter. Allereerst moeten twee populaties gedefinieerd worden. VU-Stat levert dan een discriminant-functie, die is gebaseerd op de multivariate metingen voor elk afzonderlijk record. Deze discriminant-functie is een lineaire functie die op een 'optimale' wijze
Data analyse
29
onderscheid maakt tussen de twee groepen. De gewichten zijn zo gekozen, dat de totale som van de absolute waarden van de gewichten gelijk is aan 1. De variabele waarop je wilt splitsen moet je opgeven evenals de ondergrens en bovengrens van de eerste groep en die van de tweede groep. Ook moet je de variabelen opgeven die in de analyse mee moeten doen. VU-Stat berekent de gewichten die aan iedere variabele toegekend moet worden om de twee groepen zoveel mogelijk te splitsen . Ook kan ook de score van elk afzonderlijk record afgedrukt worden.
2.2.7.5
Paarsgewijze verschillen
Paarsgewijzeverschillen (t-toets) De Wilcoxon's rangsomtoets (ook wel bekend onder de naam Mann-Whitney toets) is een nonparametrische toets, dat wil zeggen dat niet hoeft te worden uitgegaan van een normaalverdeling van de onderzoekspopulatie. Dergelijke toetsen zijn, in tegenstelling tot de parametrische toetsen, ook uit te voeren op labelvariabelen waarvan de waarden een volgorde aangeven (ordinale variabelen), bijvoorbeeld in samenhang met een getalvariabele met twee nominale waarden (dichotomie). De test gaat uit van de aanname dat de twee steekproeven onafhankelijk van elkaar zijn getrokken. 2.2.7.6
Onafhanklijke steekproeven
Onafhankelijke steekproeven De rangtekentoets en de t-toets voor paarsgewijze verschillen De rangtekentoets is een non-parametrische toets. Bij deze toets worden waarnemingen paarsgewijs vergeleken. Een goed voorbeeld uit de onderwijspraktijk van de toepassing van deze toets is de vraag naar verschillen tussen de leerlingresultaten in het schoolonderzoek en de resultaten in het centraal schriftelijk eindexamen.
2.2.7.7
Kendall's tau en Spearman's rho
Kendall’s tau en Spearman’s rho Kendall's tau en Spearman's rho zijn beide varianten op de correlatie- coëfficiënt. Deze maten kunnen ook berekend worden bij getalvariabelen en labelvariabelen, die zijn gemeten op een ordinale schaal. De berekeningen zijn te vinden in Lehmann, Non-parametric Statistics paragraaf 7.3 2.2.7.8
Variantie-analyse (een factor)
Variantie analyse (één factor) Variantie-analyse is een techniek om verschillen tussen meer dan twee groepen aan te tonen. Kruskal-Wallis is hiervan de non-parametrische variant. Variantie-analyse gaat uit van de veronderstelling dat er geen verschil is tussen de groepen. Als dat het geval is kan op grond van de variantie binnen de groepen uitspraken gedaan worden over de variantie tussen de groepen. Indien de waarnemingen hiermee niet in overeenstemming zijn, kan er vanuit gegaan worden dat er wel verschil is tussen de groepen. De Kruskal-Wallis test kijkt naar de gemiddelde rang per groep. Indien er geen
30 verschil is tussen de groepen mag verwacht worden dat deze gemiddelde rang niet veel verschil zal laten zien.
2.2.8
Opties
Opties Naam op printuitvoer Een naam die je hier opgeeft komt op de printuitvoer te staan Bulkuitvoer Deze optie gebruik je als je een eerste indruk wilt krijgen van de resultaten. Je kunt bulkuitvoer krijgen van frequentietabellen, centrummaten en kruistabellen. Deze uitvoer kun je sturen naar het klembord, naar een printer of naar een bestand. Merk op dat het klembord een beperkt geheugen heeft van ongeveer 32000 tekens. Daarnaast zijn er nog een aantal opties voor externe communicatie 2.2.8.1
Importeren
Importeren Met deze optie kun je databestanden binnenhalen die met een ander programma, bijvoorbeeld een spreadsheet, zijn gemaakt. Dit kunnen ASCII-files (meestal TXT-files) zijn of bestanden die gemaakt zijn met een vorige versie van VU-Stat. De tekstfile wordt naar een datatabel omgezet. Eerste rij. In het tekstbestand kunnen op de eerste regel wel of niet de namen van de variabelen staan. Dat moet je hier opgeven. Als het niet bekend is moet je er door maar gewoon proberen lachter komen. Indien er in het tekstbestand geen variabelen zijn worden in de datatabel variabelen V1, V2 enzovoort geplaatst. Later kun je die dan aanpassen. Als er wel variabelen zijn is het verstandig het type te controleren. Via Variabelen wijzigen kun je de aanpassingen doen. Scheidingstekens Om de waarden in een tekstfile van elkaar te kunnen onderscheiden zijn scheidingstekens nodig. Veel voorkomende scheidingstekens zijn bijvoorbeeld tabs en puntkomma’s. Je kunt aanvinken met welk scheidingsteken rekening gehouden moet worden. Ontbrekende waarden In datasets komen ook records voor die waarden missen. In tekstbestanden worden zulke ontbrekende waarden vaak gecodeerd aangegeven, bijvoorbeeld met 999. Deze code dient bekend te zijn opdat een ontbrekende waarde in VU-Statistiek ook correct als een ontbrekende waarde wordt aangegeven met **. 2.2.8.2
Importeren Excel bestand Via google-forms kun je ook enquetes via internet afnemen. De resulaten van Google forms kun je inladen in VUStat
Data analyse 2.2.8.3
31
Exporteren
Exporteren Een bestand dat in VU-Statistiek is gemaakt of bewerkt kun je met deze optie exporteren zodat het gelezen kan worden met andere programma’s. De mogelijkheden zijn: -een ASCII-file Het resultaat is een ASCII-bestand met elke record op een nieuwe regel en de waarden van een record gescheiden door tabs. -een ASCII-SPSS-file Het resultaat is een file die in SPSS kan worden gelezen. -een VU-Stat versie 1.0 file het bestand kan nu in een vorige versie van VU-Statistiek worden gelezen. Excel Met de Excel button wordt een datatabel direct in Excel ingelezen. 2.2.8.4
Aggregatie
Aggregatie Met deze optie kun je verschillende statistische resultaten die zijn onderverdeeld naar de waarden van één bepaalde variabele, samenvoegen in een bestand. Voorbeeld (begin.vus) Je wilt van jongens en meisjes de gemiddelde lengte, de gemiddelde leeftijd, en de procentuele vrijetijdsbesteding met elkaar vergelijken. De aggregatievariabele is de labelvariabele jm, met als labels jongen en meisje. In de kruislijst kies je het gemiddelde (Gem) van de variabele lengte, ook van de variabele leeftijd en van de variabele vrijetijd het %Cat.. De aggregatievariabele kan elk type variabele zijn, maar de aggregatie-optie is vooral geschikt bij labelvariabelen. De uitvoermogelijkheden (kruisjes) bij de variabelen zijn: Gem het gemiddelde Som de som van de waarden Aantal het aantal, de frequentie Tel cat geeft het aantal per categorie bij een label- of multipunt-variabele % cat geeft het percentage per categorie bij een label- of multipunt-variabele Door in de kop van de kruisjeslijst te klikken plaats je direct alle kruisjes in de betreffende kolom, of verwijderd ze weer. Na klikken op ok krijg je het resultaat in een tabel. Van die tabel kun je direct in Dataplot een grafiek maken Het resultaat kan ook nog op een variabele worden gesplitst. Doe dat met de nodige aandacht want de situatie kan dan wel complex worden.
32 2.2.8.5
Tekstvariabele
Manipulatie van tekstvariabelen Datum naar getal Met deze optie kun je laten uitrekenen hoeveel dagen er sinds een bepaalde datum zijn verstreken of tot aan een bepaalde datum zullen verstrijken. Een datum wordt meestal geschreven als een drietal getallen met streepjes ertussen. Er zijn diverse conventies voor wat betreft de volgorde dag, maand, jaar. Dat is het formaat. Nodig zijn: de variabele in het bestand die de datum aangeeft en het formaat dat daarbij is gebruikt. de referentiedatum de variabele waarin het aantal dagen gezet gaat worden. Tekst naar labels Tekstvariabelen kun je naar labels om laten zetten. De labelcodes worden automatisch gegenereerd. De doelvariabele kan een bestaande of nieuwe variabele zijn. Deze optie is geschikt als je data hebt geïmporteerd en labels wilt aanbrengen. Tekst vinden Een handige optie om een record te vinden waar een bepaalde naam in voorkomt. 2.2.8.6
Multipunt Omzetten van/naar een multipunt variabele Omzetting van een multipunt naar ja/nee labelvariabelen Deze omzetting wordt automatisch uitgevoerd. Uiteraard kan na de omzetting de labelvariabelen nog worden gewijzigd. Het ja/nee slaat op het al of niet aanwezig zijn in het record van de bewuste labelwaarde. Een ja wordt met 1, een nee met een 0 gecodeerd. Omzetting van labelvariabelen naar een multipunt Meerdere labelvariabelen kunnen naar een multipunt worden omgezet. Door omzetting worden als het ware de aanwezigheid van labelcodes in een record verzameld. Welke labels dat zijn kun je in het overzicht opgeven. Standaard worden de eerste codes neergezet, maar dat kun je wijzigen. De procedure is als volgt: -selecteer met Kies variabelen de variabelen die je in de multipunt wilt opnemen -controleer de omzetregels en wijzig zo nodig codes, letters en labels -kies de multipuntvariabele of definieer een nieuwe -laat de omzetregels uitvoeren, de labels en codes worden in de nieuwe variabele opgenomen De nieuwe multipuntvariabele is nu in de datatabel opgenomen.
2.3
Popup menu Popup menu Sorteren Met Sorteren worden de gegevens van een variabele op volgorde gezet. Numerieke gegevens, getallen en labelcodes, worden van klein naar groot of andersom gesorteerd.
Data analyse
33
Alfanumerieke gegevens, letters en tekst, worden alfabetisch op volgorde gezet. Oplopend is van a naar z. Aflopend is van z naar a. Indien in een bestand een selectie is gemaakt, komen eerst de geselecteerde records en daarna de niet geselecteerde records aan de beurt. Records met een ontbrekende waarde (*) worden achteraan gezet. Splitsen Met de splits-optie kun je de data in een bestand opsplitsen in deelgroepen. Je kunt bijvoorbeeld een bestand van leerlingen splitsen in een groep meisjes en een groep jongens. Bij een tabel of een grafische representatie van een andere variabele wordt deze opsplitsing dan in beeld gebracht. Filter Een eenvoudige maar veel gebruikte filtering is op het criterium gelijk of ongelijk. Van de gekozen variabele zie je een verdelingsoverzicht met behulp waarvan je het criterium kunt bepalen Als filter kun je kiezen uit gelijk, ongelijk, combinaties daarvan of niet bestaand. Je kunt ook een variabele uit de dropdown lijst kiezen. Voor multipunt-variabelen krijg je een aangepast filter. Formulefilter Een gevorderde filtermethode werkt met een filterformule De criteria moet je als een formule opgeven. Daarvoor kun je de “rekenmachine” gebruiken. In de formules gelden de normale regels voor wiskundige uitdrukkingen. Met haakjes geef je de voorrang in een berekening aan. Variabelen staan tussen rechte haken, zo dus [variabele]. Bij aanklikken gaat dat vanzelf, bij intypen moet je de haken niet vergeten. Er is ook een aantal Speciale functies die je kunt gebruiken, onder meer MIN, MAX, als-dan. Ook de logische operatoren AND en OR zijn toegestaan. De speciale functies zijn in een aantal categorieën verdeeld en kun je per categorie uit een dropdown lijst selecteren. Invoegen voor variabele Je krijgt het venster om een nieuwe variabele op te geven. Deze nieuwe variabele komt te staan voor de actieve kolom. Invoegen na een variabele Je krijgt het venster om een nieuwe variabele op te geven. Deze nieuwe variabele komt te staan achter de actieve kolom.
Top Level Intro This page is printed before a new top-level chapter starts
Part
III
36
3
Dataplot Dataplot Dataplot is een kleine statistische omgeving waarin je vooral goed met frequentietabellen kunt werken. Met Dataplot kun je fraaie statistische representaties, grafieken en diagrammen, zelf vormgeven. De optie is daarmee zeer geschikt voor de onderbouw en voor gebruik bij andere vakgebieden. Je kunt kiezen uit drie typen grafieken: staafgrafiek, cirkeldiagram en lijngrafiek, zowel twee als driedimensionaal. Dataplot kiest zelf de assen bij twee variabelen of als de eerste variabele een tekstvariabele is, bij meer variabelen kun je dat zelf opgeven. Invoer van data Data kun je op verschillende manieren invoeren: met de hand, uit een bestand, vanuit de statistiekomgeving, importeren. Vormgeving Na de keuze van een grafiekbutton krijg je de grafiek in een venster met daarop de button Vormgeving. Met deze button krijg je een werkset waarmee je de grafieken naar eigen inzicht kunt bewerken en vormgeven. De datatabel De data, geordende in rijen en kolommen, kun je in de tabel bewerken. De rechtermuisknop opent de opties. Menu en buttons Data Onder deze optie staan mogelijkheden die je ook met de rechter muisknop in de datatabel krijgt. Sorteren en verwijderen van records. Grafiek Er zijn drie grafiektypen die je bij Vormgeving overigens weer kunt wijzigen. Zie Opties Nieuwe variabele. Opties Centrummaten Gemiddelde, mediaan en spreiding worden berekend. Omdat in Dataplot meestal met frequentietabellen gewerkt wordt moet je opgeven welke variabele de waarnemingsgetallen bevat en welke variabele de frequenties. Indien de data bestaan uit klassen moet je nog een tabel met klassenmiddens maken. Bij frequentietabellen zijn de data vaak in klassen ingedeeld. Het is dan nodig als waarnemingsgetallen de klassenmiddens te hanteren. Relatieve frequentie Bij het vergelijken van data bestaat er vaak behoefte aan relatieve frequenties. Met deze optie maak je een variabele aan die meteen de frequenties van de geselecteerde variabele in procenten berekent. Normale benadering Bij het bestuderen van verdelingen is het vaak handig om de verdeling met een normale verdeling te vergelijken. Deze optie maakt een normale verdeling op grond van de parameters gemiddelde en standaardafwijking van de gekozen variabele. Naam op printuitvoer is handig als meerdere mensen dezelfde printer gebruiken. Autofit is de aanpassing van de kolombreedte aan de data in de kolom. Importeren
Dataplot
37
Data files van verschillende opmaak kun je via Importeren inlezen. Exporten van data om in andere programma’s in te lezen gaat als ASCII bestand.
Met de printbutton krijg je het volledige beeld en heb je de mogelijkheid om dat op het klembord te zetten, naar Word te sturen of direct te printen.
aanpassing van de kolombreedte aan de data in de kolom geeft het aantal waarnemingen, de mediaan, het gemiddelde, en de spreiding van de waarnemingsgetallen van de geselecteerde variabele. Dit kan met of zonder rekening te houden met de frequenties.
stuurt de datatabel naar de spreadsheet Excel, te zien aan het icoon in de taakbalk. wisselt tussen Dataplot- en Statistiek-omgeving
Top Level Intro This page is printed before a new top-level chapter starts
Part
IV
40
4
Kansrekenen Kansrekenen Deze rubriek heeft enkele opties die handig zijn bij telproblemen en kansproblemen, zoals boomdiagrammen en tabellen. Het vervelende tekenen is een werk dat de computer voor je kan doen.
4.1
Boomdiagram Boomdiagrammen Een boomdiagram is een goed hulpmiddel bij telproblemen en kansproblemen. Een boomdiagram doorloop je in stappen, na elkaar dus. Bij elke stap moet je een keus uit mogelijkheden maken, dat zijn de takken. Er zijn verschillende soorten boomdiagrammen. Vrije of onregelmatige bomen en regelmatige bomen. Bij vrije bomen kunnen stappen stoppen terwijl andere stappen doorgaan. Ook het aantal takken kan per stap geheel verschillend zijn. Een voorbeeld van een vrije boom is het onderstaande boomdiagram.
Van regelmatige bomen zijn er twee soorten. Boomdiagrammen waarbij het aantal mogelijkheden per stap steeds hetzelfde is en boomdiagrammen waarbij het aantal bij elke stap één minder wordt. Omdat je deze boomdiagrammen kunt zien als een grafiek van ballen die uit een vaas gepakt (trekken heet dat) worden heet dit wel een vaasmodel. De twee manieren heten: trekken met terugleggen en trekken zonder terugleggen. Bij het Trekken met terugleggen krijg je een zogenaamde machtsboom. Het aantal takken blijft bij elke stap hetzelfde. Een voorbeeld staat hieronder Voor dit soorten bomen is er ook een aparte module Regelmatig boomdiagram.
Kansrekenen
41
Bij het Trekken zondert terugleggen krijg je een zogenaamde faculteitsboom. Het aantal takken wordt bij elke stap eentje minder. Zie het voorbeeld. Voor dit soorten bomen is er ook een aparte module Vaasmodel.
4.1.1
Vrij boomdiagram
Vrije boomdiagram Een boomdiagram maken Je kunt een boomdiagram op verschillende manieren maken. -een bestand met een boomdiagram openen -via de knop -op het scherm met de hand Op het scherm staat altijd een boom om te beginnen. Zet de aanwijspijl (cursor) op een knooppunt en druk de linker muisknop in. Je kunt nu het knooppunt en daarmee de takken die erachter zitten verslepen. Klik je op de rechter muisknop dan krijg je het volgend menu. Tak toevoegen Klik en vul de naam van de nieuwe tak in. Tak verwijderen Klik en bevestig. De tak tot aan het vorige knooppunt en alles wat erna komt verdwijnt. Kopiëren en Plakken Alles wat na het knooppunt komt kun je kopiëren en op een ander knooppunt plakken. Knippen Alles wat na het knooppunt komt verdwijnt. Instelmogelijkheden en buttons Beeld Met Aantallen kun je aan het begin een hoeveelheid opgeven die dan verdeeld wordt over de
42 verschillende uitkomsten. In de Tabel zie je de uitkomsten en bijhorende kansen als die zijn aangezet. Afmetingen Het aantal stappen en het aantal takken bepalen de afmetingen van het boomdiagram De afmetingen worden snel zo groot dat het scherm of een vel papier niet groot genoeg is. Je kunt dan met schuifbalken werken om alles in beeld te krijgen. Kansen Bij de takken kun je een kans invullen, dat kan als een breuk, decimale breuk of als een percentage. Op papier Handout Het tekenen van boomdiagrammen is een tijdrovende klus. Met handout kun je de inhoud van het boomdiagram aanpassen en dan laten printen. Nette boom Door slepen met takken kan het boomdiagram wat onoverzichtelijk worden. Met deze button wordt het diagram weer netjes getekend. Voorbeelden en snel bomen maken. Je kunt hier de samenstelling van een boom invullen zonder takken met de hand te tekenen. Voor elke stap kun je namen en kansen van de mogelijkheden invullen. Als de boom getekend is kun je nog aanpassingen maken, bijvoorbeeld bepaalde takken weghalen. Met de button Schoon wordt alle invoer gewist. Een nieuw boomdiagram, de beginboom verschijnt
Openen van een bestaand boomdiagram.
Een boomdiagram als bestand bewaren. Met de printbutton krijg je het volledige beeld en heb je de mogelijkheid om dat op te slaan, op het klembord te zetten, naar Word te sturen of direct te printen. Met de infobutton krijg je informatie bij dit speciale scherm.
4.1.2
Regelmatig boomdiagram
Regelmatige boomdiagrammen Instelmogelijkheden en buttons De eerste stap en de takken van de eerste stap kun je een naam geven. Die namen worden bij de volgende stappen en takken herhaald of afgekort herhaald. Afmetingen Het aantal stappen en het aantal takken bepalen de afmetingen van het boomdiagram De afmetingen worden snel zo groot dat het scherm of een vel papier niet groot genoeg is. De afmetingen zijn daarom begrensd. Kansen Bij de takken kun je een kans invullen, dat kan als een breuk, decimale breuk of als een percentage. Beeld In de Tabel zie je de uitkomsten en bijhorende kansen Met Aantallen kun je aan het begin een hoeveelheid opgeven die dan verdeeld wordt over de
Kansrekenen
43
verschillende uitkomsten. Handout Het tekenen van boomdiagrammen is een tijdrovende klus. Met handout kun je de inhoud van het boomdiagram aanpassen en dan laten printen. Een nieuw boomdiagram. Alle invoer wordt gewist
Openen van een bestaand boomdiagram.
Een boomdiagram als bestand bewaren. Met de printbutton krijg je het volledige beeld en heb je de mogelijkheid om dat op te slaan, op het klembord te zetten, naar Word te sturen of direct te printen.
4.1.3
Vaasmodel
Vaasmodel Instelmogelijkheden en buttons Je stelt eerst de vaas samen door van elke kleur een aantal ballen op te geven. Vervolgens geef je aan hoeveel ballen er zonder terugleggen, achter elkaar of tegelijk dat komt op hetzelfde neer, of met terugleggen gepakt moeten worden. Kansen De kansen volgen uit de samenstelling van de vaas. Indien zonder terugleggen gepakt wordt verandert de samenstelling na elke stap (gepakte bal). De kansen in breukvorm zijn echte breuken omdat ze afhangen van het aantal ballen. Beeld In de Tabel zie je de uitkomsten en bijhorende kansen. Met de printbutton krijg je het volledige beeld en heb je de mogelijkheid om dat op het klembord te zetten, naar Word te sturen of direct te printen.
4.2
Bord van Galton Bord van Galton In het fysieke bord van Galton vallen kogeltjes op pinnen die in rijen onder elkaar staan. Elke rij heeft een pin meer dan de vorige rij. Elk kogeltje valt op elke pin of naar rechts of naar links. De kans daarop is 0,5 in normale omstandigheden, hou je het bord echter scheef dan verandert daarmee die kans. Het bord van Galton betreft dus een binomiaal kansexperiment. Elk kogeltje valt n keer op een pin met kans p om naar rechts te vallen. De kansvariabele (stochast) X is het aantal keren dat het kogeltje naar rechts valt. X is binomiaal verdeeld met parameters n en p. Het vakje waar een kogeltje invalt geeft aan hoe vaak het kogeltje naar rechts is gevallen. Meerdere kogeltjes betekent een herhaald binomiaal experiment waarvan het resultaat een benadering van de binomiale verdeling in
44 beeld brengt. In de digitale simulatie kun je zelf een Galtonbord definiëren met: het aantal rijen, de kans om naar rechts te vallen en het aantal kogels. Het resultaat van de simualtie kun je steeds vergelijken met de theorie die in geel wordt weergegeven. Dat kan in een tabel of in een staafdiagram. Instelmogelijkheden en buttons Je stelt eerst het bord samen door aantal rijen, aantal kogels en kans op te geven. Beeld Met Aantal zie je de resultaten in tabelvorm. Met Grafiek zie je de resultaten in de vorm van een staafdiagram. Met Theorie komt de theoretische verwachting in beeld. Tempobalk Met de tempobalk kun je de snelheid waarmee een experiment wordt gesimuleerd instellen maar ook tijdens een simulatie veranderen. Met Stap kun je gedetailleerd volgen hoe een experiment verloopt Een experiment wordt 1 keer uitgevoerd. Snel is bedoeld om veel data te maken. Onderbreken/Doorgaan Met de spatiebalk kun je de simulatie onderbreken of hervatten Met de printbutton krijg je het volledige beeld en heb je de mogelijkheid om dat op het klembord te zetten, naar Word te sturen of direct te printen.
4.3
Frequentieraster Frequentieraster Het frequentieraster biedt een intuïtieve overgang van frequenties naar de begrippen kans en voorwaardelijke kans. Ter inleiding een voorbeeld over visvangst. Voorbeeld Open het bestand visvangst. Een vijver bevat 170 vissen, aangeduid door de blauwe cellen. In een eerste vangst zijn 75 vissen gevangen, gemerkt en weer teruggezet. Deze vissen zijn aangeduid met een kruis. De in een tweede vangst gevangen vissen zijn aangeduid door een cirkel. Er zijn dus zes gemerkte vissen gevangen. De resultaten kun je op twee manieren presenteren in een frequentieboom of in een kruistabel. Met een button kun je in de frequentieboom de volgorde wijzigen en percentages bij de overgangen zetten. In de kruistabel kun je zowel aantallen als percentages zetten. Een vraag zou kunnen zijn of je op grond van deze resultaten zo mogen zeggen dat vissen een “vangstgeheugen” hebben Het raster Het raster bestaat uit cellen vastgelegd door het aantal rijen en kolommen. Markeringen Je kunt in de cellen van een frequentieraster vijf markeringen toepassen. Drie kleuren, blauw, groen en wit, die niet tegelijk toegepast kunnen worden. Een kruis en een cirkel, die wel tegelijk met andere markeringen toegepast kunnen worden. De markeringen staan voor kenmerken of eigenschappen en kun je een naam geven. Je plaatst markeringen door een markering aan te stippen en vervolgens in het raster een cel te selecteren door klikken of een aantal cellen door slepen.
Kansrekenen
45
Instelmogelijkheden en buttons Namen Kleurmarkering hebben een naam. De kruis- en cirkelmarkering kunnen simultaan worden toegepast daarom is er een naam voor het wel of niet aanwezig zijn van deze markeringen. Sorteren De markeringen worden gesorteerd zodat het makkelijk is ze te tellen en te plaatsen. Randomiseer De markeringen worden willekeurig over het raster verdeeld. Frequentieboom Overzicht van de resultaten in de vorm van een boom. Er zijn drie lagen mogelijk. wisselt de lagen één voor één.
geeft de overgangskansen in procenten. Kruistabel Een kruistabel is tweedimensionaal. Met de pull-downs kun je de verschillende categorieën in beeld brengen. De aantallen kun je absoluut of relatief laten zien op diverse manieren. Toelichting Een toelichtende tekst en achtergrondinformatie bij het frequentieraster kun je hier opgeven De toelichting wordt bewaard bij het raster en kun je later aanpassen of uitbreiden. Een nieuw frequentieraster maken.
Frequentieraster openen.
Frequentierasters bewaren. Met de printbutton krijg je het volledige beeld en heb je de mogelijkheid om dat op te slaan, op het klembord te zetten, naar Word te sturen of direct te printen.
4.4
Rooster Roosterdiagram Een roosterdiagram is een hulpmiddel voor het tellen van routes en voor het maken van binomiale kansverdelingen. Routes Je ziet hoe de routes vanaf Start naar een punt in het rooster tot stand komen. Elke route bestaat uit een aantal stappen, waarvan sommige naar rechts en sommige omhoog in het rooster. Alle mogelijke routes bij een aantal stappen levert de zogenaamde driehoek van Pascal. Binomiale kansen Een rooster is een visueel model voor de binomiale kansverdeling. De parameter p wordt de kans op succes genoemd, de parameter n is het aantal stappen in het rooster. De stochast X is het aantal successen bij n stappen. Instelmogelijkheden en buttons Je stelt eerst het rooster samen door aantal stappen en kans op te geven.
46 Met de tempobalk start je de simulatie en zie je routes en kansen dynamisch tot stand komen. Beeld Met Routes krijg je de aantallen routes te zien, zoals bij de Pascaldriehoek Met Routetabel zie je de routes in detail weergegeven. Met Kanstabel komt de binomiale verdeling met formule en al in beeld. Met Grafiek komt de binomiale verdeling als staafdiagram in beeld. Tempobalk Met de tempobalk kun je de snelheid waarmee een experiment wordt gesimuleerd instellen maar ook tijdens een simulatie veranderen. Met Stap kun je gedetailleerd volgen hoe een experiment verloopt Een experiment wordt 1 keer uitgevoerd. Snel is bedoeld om veel data te maken. Onderbreken/Doorgaan Met de spatiebalk kun je de simulatie onderbreken of hervatten Met de printbutton krijg je het volledige beeld en heb je de mogelijkheid om dat op het klembord te zetten, naar Word te sturen of direct te printen.
4.5
Tabel en boom Tabel en boom De informatie die in de getallen in een kruistabel ligt opgesloten kun je op verschillende manieren interpreteren. Een boomdiagram is een geschikt middel om die informatie weer te geven. In de tabel kun je naast absolute aantallen ook percentages op diverse niveau’s laten zien. In de boom laat je zien hoe de informatie trapsgewijs is opgebouwd. In de tabel kun je zowel de variabelen als de getallen aanpassen of een geheel nieuwe tabel maken. De ingevoerde namen en getallen worden in de boom zichtbaar. Interessant is om de volgorde van de boom te wisselen. Het product van de overgangskansen geeft het resultaatpercentage. Instelmogelijkheden en buttons met de nieuw-button krijg je een lege tabel. Je kunt ook de bestaande tabel aanpassen.
bewaart de tabel in een bestand. zet de tabel en de boom in een word document geeft enkele uitvoermogelijkheden
4.6
Markov- en Leslie-processen Markov- en Leslie-processen Belangrijke overgangsprocessen die met een matrix en/of graaf zijn te beschrijven zijn Markovprocessen en Leslie-processen.
Kansrekenen
47
Een Markov-proces beschrijft een proces dat stapsgewijze overgangen vertoont van de ene naar de andere (of dezelfde) toestand. De specifieke Markov-eigenschap houdt in dat de overgangen slechts afhangen van de huidige toestand en niet van de weg waarlangs deze toestand tot stand is gekomen. Een Markov-proces wordt beschreven in de vorm van een matrix of graaf met overgangskansen. Het totaal van een kolom is dus altijd gelijk aan 1. Een Leslie-matrix is een type overgangsmatrix dat veel in de biologie wordt gebruikt. Dit matrixmodel houdt rekening met de leeftijdsklassen in een populatie. De zogenaamde voortplantingsfactoren per klasse staan op de eerste rijen. De overlevingskansen van de ene naar een volgende klasse staan op de volgende rijen in opeenvolgende kolommen. De toestand van een populatie kan als volgt verlopen: uitsterven, periodiek gedrag, toenemen. Op het scherm staat standaard een 4x4 matrix en een beginvector die je beide kunt aanpassen. Een nieuwe matrix maak je met de nieuw-button. Je kiest daar voor het type matrix en de dimensie, hogere dimensies zijn mogelijk. De naam van de matrix verschijnt op een tabblad. Zo kun je als het ware een matrix stapsgewijs uitbreiden. De vector (toestand/populatie) vul je op het scherm in. De ontwikkeling van een proces kun je op verschillende manieren volgen. in het venster met de vectoren in de graaf in grafieken als functie van de processtappen (tijdgrafieken), elke rubriek heeft een eigen grafiek als machten van de overgangsmatrix Instelmogelijkheden en buttons Beeld Diagram geeft het proces in een graaf weer Machten toont de ontwikkeling van de matrix^n Grafiek toont de tijdgrafieken, uitgedrukt in tijdseenheden die bij de matrix passen. Som geeft het totaal van de vectorkolom. Hiermee is de groei van een totale populatie te volgen. Toelichting. Je kunt een proces beschrijven en documenteren. De toelichting wordt bewaard bij het matrixbestand. met de nieuw-button krijg je een scherm om een nieuwe matrix op te geven. Je kunt ook de bestaande matrix aanpassen.
bewaart de matrix in een bestand. verwijdert een resultaat steeds één stap terug geeft enkele uitvoermogelijkheden Tempobalk Met de tempobalk kun je de snelheid waarmee een experiment wordt gesimuleerd instellen maar ook tijdens een simulatie veranderen. Met Stap kun je gedetailleerd volgen hoe een experiment verloopt Een experiment wordt 1 keer uitgevoerd. Snel is bedoeld om veel data te maken die je in een bestand kunt bewaren. Onderbreken/Doorgaan Met de spatiebalk kun je de simulatie onderbreken of hervatten
48
4.7
Slim tellen Slim Tellen nog maken als optie gereed is
4.8
Call en put opties Call en put opties Call en put opties zijn het recht om een aandeel te kopen of te verkopen op een van tevoren vastgesteld tijdstip tegen een eveneens van tevoren vastgestelde prijs. Een Call-optie is het recht om het aandeel te kopen, een Put-optie het recht om het aandeel te verkopen. Zulke rechten zijn geld waard en worden op de beurs verhandeld. Een boomdiagram is een hulpmiddel om uit te rekenen welke waarde een optie heeft. Uitgangspunt daarbij is een maximale en minimale marktontwikkeling. Het boomdiagram bestaat uit een aantal stappen (lagen, layers) en splitst steeds in twee takken (binaire boom). Elke stap geeft een periode aan waarna gehandeld kan worden. Bij een meerlaagse situatie mag je bij iedere laag handelen. Dat wil zeggen aandelen kopen en verkopen tegen de dan geldende prijs. Het boommodel laat zien welke waarde een optie heeft op een bepaald moment, dus hoe je moet handelen om zonder verlies te werken. Tegen iedere andere waarde van de optie kun je zonder risico geld verdienen. Overzicht van de begrippen Vanwege het gangbare engelse vakjargon is het computermodel ook in het engels gesteld. call recht op koop van een aandeel put recht op verkoop van een aandeel Stock aandeel Bond obligatie Bond interest rate rente op obligaties, 1=100% Price Stock prijs aandeel Expiration price uitoefenprijs Good stock maximale marktontwikkeling Bad stock minimale marktontwikkeling Real value nominale waarde Present value contante waarde Port folio portfolio, samenstelling stock en bound Cox, Ross en Rubenstein Het boommodel beschrijft een discreet proces. In werkelijkheid is het proces van prijsontwikkeling echter continu. Onder de button vind je de parameters waarmee volgens Cox, Ross en Rubenstein het discrete proces goed benaderd wordt. Voorbeeld van het vaststellen van de waarde van een optie. Uitgangspunten in dit voorbeeld zijn de volgende: Good stock 0,3 Bad stock – 0,1 Bond interest rate 0 Prijs aandeel 100
Kansrekenen
49
Uitoefenprijs 100 Gebruikte letters: p aantal aandelen b bedrag dat geleend wordt om de aandelen te financieren Call-optie Na één periode zijn er twee mogelijkheden: bij positieve marktontwikkeling is de waarde van het aandeel 130, de restwaarde van de optie is 30 bij quitte spelen geldt de vergelijking: p*130 – b = 30 bij negatieve marktontwikkeling is de waarde van het aandeel 90, de restwaarde van de optie is 0, de calloptie is immers een recht en geen plicht tot kopen. bij quitte spelen geldt de vergelijking: p*90 – b = 0 Uit het stelsel van de vergelijkingen p*130 – b = 30 en p*90 – b = 0 volgt p=0,75 en b=67,5 De betekenis hiervan is dat om quitte te spelen 0,75 aandeel gekocht moet worden dus 75 en 67,5 geleend. Het verschil hiertussen 7,50 is de waarde van de optie. Put-optie Het principe is hetzelfde als bij de call-optie. De vergelijkingen zijn nu echter p*130 – b = 0 en p*90 – b = 10 Opmerking Dit voorbeeld is slechts bedoeld om de rekenprincipes duidelijk te maken. Uiteraard is de bondinterest nooit 0 en kunnen aandelen geen negatieve waarde krijgen. Voorbeeld Voorbeeld van het vaststellen van de waarde van een optie.
Top Level Intro This page is printed before a new top-level chapter starts
Part
V
52
5
Simulaties
5.1
Random generator Random generator In allerlei simulaties waar het toeval een rol speelt zijn willekeurige getallen, zogenaamde random getallen nodig. Vroeger werden daarvoor tabellen gebruikt, tegenwoordig worden random getallen met de computer gemaakt. Omdat er en rekenregel nodig is om deze getallen met de computer te maken zijn het geen echte randomgetallen en heten ze ook wel pseudo random getallen. Randomgetallen moeten geheel willekeurig zijn, dat wil zeggen dat elk getal een even grote kans heeft om voor te komen. Randomgetallen moeten vaak wel aan bepaalde eisen voldoen. Zo moeten randomgetallen voor een dobbelsteensimulatie komen uit de gehele getallen 1 tot en met 6, en moet bij een groot aantal simulaties elk van de zes even vaak voorkomen. Er kunnen dus zogenaamde verdelingseisen gelden voor de randomgetallen. In de randomgenerator kun je daartoe uit verschillende verdelingen kiezen. De resultaten van de simulatie zie je als een tabel en als een grafiek. De waarde van het randomgetal staat verticaal. Als de grafiek een patroonvorming te zien zou geven wil dat zeggen dat de getallen niet at random tot stand zijn gekomen. Een lijst met willekeurige getallen kun je hier maken en bewaren om elders te gebruiken. De randomgetallen die je maakt kun je ook in formules opnemen. Met die formules maak je data die je statistisch kunt bewerken en verwerken. Daartoe zijn er enkele handige bewerkingen mogelijk. Bij de optie Analyse zijn er mogelijkheden om een gemaakte verzameling randomgetallen nader onder de loep te nemen. Instelmogelijkheden en buttons Instellingen Op het instellingenscherm kies je een verdeling en bijpassende parameters. In plaats van een verdeling te keizen kun je ook zelf een lijst met getallen invoeren. Uit die lijst kan met of zonder terugleggen worden getrokken. Elk experiment bestaat uit minimaal 1 getal. Maar je kunt een experiment ook uit meer getallen laten bestaan. In dat geval kun je het gemiddelde van dat experiment laten zien door middel van een rood streepje. Ook kun je dan de boxplot laten zien om een indruk van de spreiding te krijgen Tempobalk Met Stap kun je gedetailleerd volgen hoe een experiment verloopt. Onderbreken/Doorgaan Met de spatiebalk kun je de simulatie onderbreken of hervatten wist alle resultaten
bewaart de resultaten met daarbij statistische waarden in een bestand met de naam RAND…… Dat bestand kun je in de rubriek Statistiek openen en bewerken.
zet de resultaten in een Excelbestand, op de taakbalk verschijnt een link.
Simulaties
53
Analyse geeft een histogram van de resultaten. geeft een frequentietabel van de resultaten. geeft een tabel met gemiddelde, standaarddeviatie, minimum en maximum en kwartielen.
bewaart de resultaten in een bestand.
5.2
Munten Munten Bij deze simulatie bestaat elk experiment uit een aantal worpen met een of twee munten. De simulatie laat het aantal kop en het aantal munt in een experiment zien. Je kunt het resultaat van een simulatie op verschillende manieren zien. In de vorm van een staafdiagram, in de vorm een grafiek met het percentage kop of in de vorm van een frequentietabel. Hoewel deze simulatie een muntensimulatie heet, gaat het in feite over zogenaamde alternatieven. In plaats van kop/munt kun je elke ja/nee, goed/fout of succes/mislukking situatie zetten. Het is dus in feite een binomiale simulatie. Instelmogelijkheden en buttons Trechter In de grafiek rechtsonder wordt de relatieve frequentie van het aantal kop ten opzichte van het aantal worpen getoond. De grafiek is zo samengesteld dat na iedere worp de relatieve frequentie wordt berekend en als puntenrij getekend wordt. Hierdoor wordt de relatieve stabiliteit van de relatieve frequentie aanschouwelijk gemaakt, een voorbeeld van de wet van de grote aantallen. Anderzijds laat de grafiek ook zien dat er regelmatig uitzonderingen zijn ( 25, 50 en 100 zijn geen grote getallen). De trechter geeft het gebied aan waarbinnen de relatieve frequenties meestal liggen. Aantal worpen Hier geef je op uit hoeveel worpen een experiment bestaat. Tempobalk Met de tempobalk kun je de snelheid waarmee een experiment wordt gesimuleerd instellen maar ook tijdens een simulatie veranderen. Met Stap kun je gedetailleerd volgen hoe een experiment verloopt Een experiment wordt 1 keer uitgevoerd. Snel is bedoeld om veel data te maken die je in een bestand kunt bewaren. Onderbreken/Doorgaan Met de spatiebalk kun je de simulatie onderbreken of hervatten
een boxplot om de spreiding van de uitkomsten te volgen Je ziet alle grafieken of maar één grafiek tegelijk.
bewaart de resultaten in een bestand.
54 Dat bestand kun je in de rubriek Statistiek openen en bewerken.
5.3
Reactiesnelheid Reactiesnelheid Met deze optie kun je meten hoe snel je reageert. Dat gaat met de spatiebalk (eenvoudig) of de muis (beetje lastiger) of beide door elkaar (lastig). De resultaten kun je in een bestand bewaren. Spatiebalk Je moet met de spatiebalk reageren op een groter wordende cirkel. Muis Je moet met de muis klikken op een muis die ergens op het scherm verschijnt. Je kunt van meerdere personen na elkaar de reactietijden meten. Je vult dan in het vakje de naam in. De resultaten van herhalingen worden bij elkaar gevoegd. Met de resultatenanalyse kun je vaststellen wie het beste reageert. verwijdert de tot dan gemeten scores.
bewaart de resultaten in een bestand. Dat bestand kun je in de rubriek Statistiek openen en bewerken. Analyse resultaten Je kunt de meetresultaten op verschillende manieren bekijken en vergelijken. Als je op naam splitst worden de resultaten van de verschillende deelnemers naast elkaar gezet. Om een goede keus te maken is er de mogelijkheid alles tegelijk op het scherm te zetten.
Simulaties
5.4
55
Dobbelstenen Dobbelstenen Bij deze simulatie bestaat elk experiment uit een aantal worpen met een, twee of drie dobbelstenen. De simulatie laat in de vorm van een staafdiagram of een tabel zien hoe vaak een bepaald ogentotaal in een experiment is voorgekomen. In de frequentietabel kun je de worpen op de voet volgen. Instelmogelijkheden en buttons Aantal worpen Hier geef je op uit hoeveel worpen een experiment bestaat. Tempobalk Met de tempobalk kun je de snelheid waarmee een experiment wordt gesimuleerd instellen maar ook tijdens een simulatie veranderen. Met Stap kun je gedetailleerd volgen hoe een experiment verloopt Een experiment wordt 1 keer uitgevoerd. Snel is bedoeld om veel data te maken die je in een bestand kunt bewaren. Onderbreken/Doorgaan Met de spatiebalk kun je de simulatie onderbreken of hervatten
bewaart de resultaten in een bestand. Dat bestand kun je in de rubriek Statistiek openen en bewerken.
5.5
Regressielijnen Regressielijnen Door middel van een puntenwolk, gebaseerd op gepaarde waarnemingen, kun je nagaan of er een (statistisch) verband tussen de twee variabelen bestaat. Anders gezegd of er tussen die variabelen een zogenaamde correlatie bestaat. Hoe smaller de puntenwolk hoe sterker het verband. De correlatiecoëfficiënt is een maat voor de sterkte van dit verband. Is er geen enkele correlatie dan is de waarde van de correlatiecoëfficiënt gelijk aan nul. Liggen de punten van de puntenwolk precies op een rechte lijn dan is de correlatiecoëfficiënt gelijk aan 1 als de lijn stijgt, en gelijk aan –1 als de lijn daalt. In de praktijk ligt de waarde van de correlatiecoëfficiënt tussen –1 en 1 in.
Tabblad Punten Met deze demonstratie kun je bestuderen welke invloed het verplaatsen of toevoegen van een punt aan de puntenwolk heeft op de correlatie. Aan de puntenwolk op het scherm kun je punten toevoegen en verwijderen door klikken met de rechter muisknop. Met de linker muisknop kun je een punt verslepen. Het rode punt is het centrale punt van de wolk, dat is het punt met de coördinaten (x-gemiddeld , ygemiddeld). Regressielijn De zwarte lijn in de wolk heet de regressielijn van y op x. De formule van de lijn staat op het scherm.
56 Met behulp van een regressieformule van y op x kun je de waarde van y (bijvoorbeeld het gewicht) voorspellen als de waarde van x (bijvoorbeeld de lengte) bekend is. Door middel van een aankruisvakje krijg je ook de regressielijn van x op y en de formule van deze regressielijn. Deze lijn is groen. De regressielijn van y op x wordt berekend met de methode van de kleinste kwadraten. Je kunt de kwadraten door aanvinken zichtbaar maken. De kwadratensom en de correlatiecoëfficiënt worden vermeld. Centrale lijn De centrale (rode) lijn die je daarbij ziet is de zogenaamde centrale lijn. Deze lijn is een symmetrie-as van de ovaal die je om de puntenwolk kunt trekken. De richtingscoëfficiënt van deze lijn is het quotiënt van de standaardafwijkingen van de y- en xwaarden van de gepaarde punten.
Tabblad Simulatie Deze optie is bedoeld om te laten zien hoe goed de regressielijn van een steekproef aansluit bij de regressielijn van de populatie. Eerst geef je de regressielijn van de populatie op met behulp van de parameters helling en constante. Ook de spreiding (SD) van de y-waarden om de regressielijn geef je op.
Bij een simulatie wordt op zes plaatsen met een vaste x-waarde random een punt geplaatst. De ycoordinaat van elk punt is berekend met een normale verdeling met als gemiddelde de y-waarde van het punt op de groene lijn en als standaarddeviatie de ingevulde SD - waarde. Bij het aldus verkregen zestal punten wordt de regressielijn (op basis van lineaire regressie) getekend in het rood. Bij herhalen van de simulatie worden de “oude” regressielijnen in grijs getekend. Tempobalk Met de tempobalk kun je de snelheid van de simulaties instellen maar ook tijdens een simulatie veranderen. Met Stap kun je gedetailleerd volgen hoe een experiment verloopt Snel is bedoeld om veel data te maken die je in een bestand kunt bewaren. Onderbreken/Doorgaan
Simulaties
57
Met de spatiebalk kun je de simulatie onderbreken of hervatten
Tabblad Zoeken beste lijn In deze optie kun je proberen zelf de regressielijn te vinden bij een gegeven puntenwolk. Met de button Nieuwe punten krijg je een nieuwe set punten. Met de schuifbalken kun je de lijn verplaatsen en draaien. Let daarbij op de waarde van de kwadratensom. Met Beste lijn kun je nagaan of je de goede lijn gevonden hebt.
5.6
Randomized Response Randomized Response Op de vraag “Heb je wel eens een winkeldiefstal gepleegd” zal niet iedereen openlijk een eerlijk antwoord geven. Randomized response is een vraagtechniek om betrouwbare antwoorden te krijgen op vragen die over een gevoelig onderwerp gaan. Er worden bij Randomized response twee soorten ja-nee-vragen gesteld: echte vragen en alternatieve vragen. De antwoorden op de echte vragen moeten een beeld geven van de ja-nee-verdeling bij het (gevoelige)onderwerp. Van de alternatieve vragen (bijvoorbeeld: gooi met een dobbelsteen, kwam er een 2 boven?) is de ja-nee-verdeling bekend. Als het percentage alternatieve vragen bekend is, kan achteraf uit de resultaten worden afgeleid welke verdeling voor de echte ja-nee-vragen geldt. De simulatie laat zien hoe deze techniek uitpakt bij verschillende waarden van de parameters. Die parameters zijn: * het aantal ondervraagden * de kans op ja bij een echte vraag; in de praktijk is dit dus de gezochte waarde * het percentage alternatieve vragen * de kans op ja bij een alternatieve vraag In de tabel Verwacht staan de theoretische waarden. De scores van de simulaties worden op verschillende manieren bijgehouden. in een overzichtstabel. Daar gaat het om de Schatting op grond van het experiment * in een (stapel)staafdiagram. Het donkere gedeelte betreft de ja-antwoorden op de echte vraag * in Alle experimenten wordt bijgehouden de resultaten van de ja-antwoorden op de echte vraag over het totaal van alle experimenten * Instelmogelijkheden en buttons Instellingen Op het instellingenscherm kies je waarden voor de parameters. Tempobalk Met de tempobalk kun je de snelheid waarmee een experiment wordt gesimuleerd instellen maar ook tijdens een simulatie veranderen. Met Stap kun je gedetailleerd volgen hoe een experiment verloopt Een experiment wordt 1 keer uitgevoerd. Onderbreken/Doorgaan Met de spatiebalk kun je de simulatie onderbreken of hervatten
bewaart de resultaten in een bestand. Dat bestand kun je in de rubriek Statistiek openen en bewerken
58
5.7
Steekproeven Steekproeven In de praktijk moet vaak een kenmerk van een populatie worden vastgesteld. Bijvoorbeeld het aantal voorstanders bij een opiniepeiling. Om diverse redenen worden niet alle personen ondervraagd, te duur, maar slechts een relatief klein aantal, de steekproef. Die steekproef wordt dan gebruikt als afspiegeling van de populatie. Het is dus van belang dat deze afspiegeling betrouwbaar is. Uiteraard zal niet elk steekproef exact hetzelfde beeld laten zien en treden variaties op die toevallig dan wel systematisch kunnen zijn. In deze simulatie kun je op diverse niveaus bestuderen hoe nauwkeurig het trekken van een steekproef is. Op een groot raster staan rechthoekjes met verschillende kleur. Je moet schatten hoe groot het geheime, maar wel tevoren instelbare, percentage blauwe rechthoekjes is. Tellen is erg tijdrovend. De aangewezen methode is om het percentage met behulp van een steekproef te schatten. Om te bepalen hoe nauwkeurig de steekproefmethode is kan het trekken herhaald worden. Via het menu kan onderscheid gemaakt worden tussen trekken met en zonder terugleggen. Ook kunnen de rechthoekjes opnieuw over het raster worden verdeeld. Er zijn vier tabbladen mogelijk: Steekproef, Resultaten, Betrouwbaarheidsintervallen, Hypothese toetsen. In het menu en op de tabbladen zijn diverse instelmogelijkheden, ze worden hierna besproken. Geavanceerde opties kunnen bij Profielen Simulatie Steekproef worden ingesteld en in een ini-file worden opgeslagen. Veel op het scherm kan gewijzigd worden. In onderstaande beschrijving wordt er van uitgegaan dat geen opties verborgen zijn. Zij de opties niet zichtbaar dan zijn ze mogelijk bij Profielen uitgezet.
Algemeen Alvorens simulaties uit te voeren dienen de omvang van de populatie en de steekproef, het aantal steekproeven en de proportie blauw opgegeven te worden. Tempobalk Met de tempobalk kun je de snelheid waarmee wordt gesimuleerd instellen maar ook tijdens het simuleren veranderen. Met Stap kun je gedetailleerd volgen hoe een experiment verloopt.Een experiment wordt 1 keer uitgevoerd. Snel is bedoeld om veel data te maken die je in een excelbestand kunt bewaren. Onderbreken/Doorgaan Met de spatiebalk kun je de simulatie onderbreken of hervatten Buttons zet de resultaten in een Excelbestand, op de taakbalk verschijnt een link. Met de printbutton verschijnt een venster om een printafdruk te maken. Met de infobutton verschijnen korte toelichtingen op het scherm. Tabblad Steekproef Rechtsboven toont een staafdiagram het aantal gekleurde rechthoekjes in de steekproef. Rechtsonder worden de resultaten van meerdere steekproeven verzameld. Het resultaat, de proportie blauwe rechthoekjes bij een steekproef, wordt met een stip aangegeven De kleuren kunnen door vinken verborgen worden. De populatie kan in meer of mindere mate met een schuif geclusterd worden. Dat wil zeggen dat de gekleurde rechthoekjes meer of minder in groepen bij elkaar zitten. Je kunt zo nagaan of dit effect heeft op het steekproefresultaat. Links staat een tabel met de resultaten. De tabel kan oplopende gesorteerd worden. Tabblad Resultaten
Simulaties
59
Op dit blad worden de resultaten nader bekeken. De weergave van een resultaat kan door middel van een stip of blokje (rond rechthoekig) Zie het menu. Bij kleine aantallen steekproeven worden de resultaten gepresenteerd in klassen. Als de optie foutenmarge aanstaat is het mogelijk dat sommige steekproeven in dezelfde klasse binnen de foutenmarge vallen en andere steekproeven erbuiten. Bij grotere aantallen steekproeven worden bij rechthoek de intervallen gesplitst. Waardoor de situatie die hierboven beschreven wordt minder vaak voorkomt. Aangegeven staat de foutenmarge. De foutenmarge is de afwijking van de steekproef ten opzichte van het werkelijke percentage. Het percentage van de steekproeven dat binnen de foutenmarge valt wordt aangegeven. De normale verdeling wordt pas getoond bij voldoende groot aantal steekproeven. Tabblad Betrouwbaarheidsintervallen Op dit tabblad wordt bij iedere steekproef aangegeven of het werkelijke percentage binnen het betrouwbaarheidsinterval ligt. De betrouwbaarheid kan worden ingesteld. Met een button krijg je informatie over de rekenmethodiek Tabblad Hypothesen toetsen Het vierde tabblad gaat over hypothese toetsen. Nulhypothese De nulhypothese gaat uit van de werkelijke proportie blauwe rechthoekjes. In het menu kan significantie aangezet worden. De steekproefresultaten die in het kritieke gebied vallen worden rood gekleurd en de andere groen. Ook verschijnt een knop waarmee het significantie niveau kan worden ingesteld. Toets Hier kan het karakter van de toets worden opgegeven. Vergelijken Hier kun je onderzoeken in hoeverre een op te geven steekproefresultaat afwijkt van het werkelijke percentage blauwe rechthoekjes en welk percentage van de steekproeven nog verder afwijkt. Onder het diagram wordt dit met een blauwe balk aangegeven. Menu Bestand Excel De resultaten van de steekproeven worden naar Excel gestuurd. Printen Het scherm wordt geprint. Simuleren Met teruglegging/Zonder teruglegging Indien gekozen wordt voor het trekken van steekproef zonder teruglegging moet de populatie aanzienlijk groter zijn dan de steekproef. Nieuwe populatie Het raster wordt opnieuw gevuld waarbij het aantal blauwe rechthoekjes niet gewijzigd wordt. Alleen de posities van de blauwe rechthoekjes zijn opnieuw bepaald. Beeld Algemeen Omvang populatie De omvang van de populatie kan gewijzigd worden. Bij Profielen kan de omvang van de populatie waarmee het programma start worden vastgesteld. Aantal steekproeven Het aantal steekproeven kan worden vastgesteld. Bij Profielen kan de omvang van de populatie waarmee het programma start worden vastgesteld.
60 Rond/Rechthoek De vorm waarin de resultaten worden gepresenteerd. Bij kleine aantallen steekproeven worden de resultaten gepresenteerd in klassen. Als de optie foutenmarge aanstaat is het mogelijk dat sommige steekproeven in dezelfde klasse binnen de foutenmarge vallen en andere steekproeven erbuiten. Bij grotere aantallen steekproeven worden bij rechthoek de intervallen gesplitst. Waardoor de situatie die hierboven beschreven wordt minder vaak voorkomt. Steekproef Clustering. Wel of niet instelbaar door de gebruiker. Resultaten Foutenmarge. Toont de foutenmarge. De foutenmarge gaat na voor welke waarde van f het interval [p - f; p + f] een zeker percentage (vaak 95%) van alle steekproefresultaten bevat, p is de proportie blauw in de populatie. Normale verdeling Wel of niet de normale benadering laten zien Hypothese toetsen Zichtbaar Het vierde tabblad kan hier onzichtbaar worden gemaakt. Vergelijken Dit geeft gelegenheid om te onderzoeken hoe extreem een bepaalde waarneming is door deze te vergelijken met de resultaten van het totaal van de steekproeven. Significantie. Indien de significantie aan staat worden de steekproefresultaten die in het kritieke gebied vallen rood gekleurd en de andere groen. Ook verschijnt de knop waarmee het significantie niveau kan worden ingesteld. Instellingen (Profielen Simulaties Steekproef) Bij het opstarten kan een goot aantal opties worden meegegeven. De meeste keuzemogelijkheden zijn waarschijnlijk duidelijk. Ingewikkeld is de keuzemogelijkheid theorie en geen theorie. Bij de optie theorie wordt voor betrouwbaarheidsinterval en kritieke gebied uitgegaan van de theoretische waarden die men op grond van de normale benadering kan verwachten. Bij de optie theorie zijn de waargenomen uitkomsten zelf de bron van de criteria. Dus pas als alle steekproeven gedaan zijn, is het mogelijk om betrouwbaarheidsintervallen en kritieke gebieden te bepalen (bootstrap methode). Deze resultaten gelden dan ook alleen voor de situatie waarbij de steekproeven genomen zijn.
5.8
Toevalsregen Toevalsregen Als het regent vallen er niet overal evenveel, of gelijkmatig verdeeld druppels op de grond. Regen is als het ware een toevalsproces. Omgekeerd kun je een toevalsproces vorm geven met een gebied waarop druppels (punten) vallen. het oppervlak kun je indelen. De druppels vallen willekeurig (random) verspreid over het gebied, ze kunnen ook op elkaar terecht komen.
Simulaties
61
De analyse van het toevalsproces wordt makkelijk gemaakt doordat je het gebied in cellen kunt indelen en deze kunt kleuren. Daarnaast is er een tabel als hulpmiddel bij de analyse. Punten op scheidslijnen vallen aan het gebied toe waar het grootste deel van de druppel terecht is gekomen. Instelmogelijkheden en buttons Aantal rijen/kolommen/cellen geeft de indeling van het gebied. Aantal punten is het aantal druppels dat per simulatie valt. geeft enkele uitvoermogelijkheden Tempobalk Met de tempobalk kun je de snelheid waarmee een experiment wordt gesimuleerd instellen maar ook tijdens een simulatie veranderen. Met Stap kun je gedetailleerd volgen hoe een experiment verloopt Een experiment wordt 1 keer uitgevoerd. Snel is bedoeld om veel data te maken die je in een bestand kunt bewaren. Onderbreken/Doorgaan Met de spatiebalk kun je de simulatie onderbreken of hervatten.
Top Level Intro This page is printed before a new top-level chapter starts
Part
VI
64
6
Toegepaste simulaties
6.1
Snackbar Snackbar Iedereen staat wel eens in de rij voor een kassa of een loket te wachten. Wachten is een probleem dat met capaciteit en kosten te maken heeft. Is de capaciteit groot genoeg dan hoeft niemand te wachten. Maar dat is een dure oplossing. Is de capaciteit te klein dan lopen er klanten weg en dat kost ook weer geld. Veel problemen zijn te herleiden tot een probleem van een wachtrij. Met een simulatie kun je deze problematiek goed bestuderen. In deze snackbarsimulatie komen er klanten binnen die door het personeel geholpen worden of daarop moeten wachten. Als een klant naar zijn zin te lang moet wachten loopt hij door. Er zijn verschillende variabelen die je kunt instellen. In de simulatie zie je onder meer hoeveel klanten er worden geholpen en of het personeel al of niet wat te doen heeft. Je kunt daar eventueel nog een prijskaartje aanhangen om zo je eigen virtuele snackbar te managen. Instelmogelijkheden en buttons Tempobalk Met de tempobalk kun je de snelheid waarmee een experiment wordt gesimuleerd instellen maar ook tijdens een simulatie veranderen. Met Stap kun je gedetailleerd volgen hoe een experiment verloopt Een experiment wordt 1 keer uitgevoerd. Onderbreken/Doorgaan Met de spatiebalk kun je de simulatie onderbreken of hervatten.
6.2
Roken Roken Een simulatie om het verband tussen roken en levensverwachting te bestuderen. Je bekijkt steeds twee groepen elk bestaande uit 100 jongeren van 15 jaar. De simulatie voorspelt op welke leeftijd iemand uit die groep overlijdt. De gegevens die dit simulatieprogramma gebruikt zijn ontleend aan wetenschappelijk onderzoek naar de gevolgen van het roken voor de volksgezondheid. Simulatie Het resultaat van de simulatie zie je als een steelbladdiagram. In dat diagram hebben de personen die aan de gevolgen van roken zijn overleden, een rode kleur. De uitkomsten van een simulatie worden samengevat. Deze blijft staan bij het volgende simulatie zodat je de simulaties onderling kunt vergelijken. Grafiek Bij een ander rookgedrag hoort een andere levensverwachting. De verschillen in levensverwachting kun je vergelijken met behulp van overlevingsgrafieken. In zo’n grafiek zie je het verband tussen de leeftijd en het percentage overledenen. Je kunt de overlevingsgrafieken naar keuze laten zien.
Toegepaste simulaties
65
Instelmogelijkheden en buttons Tempobalk Met de tempobalk kun je de snelheid waarmee een experiment wordt gesimuleerd instellen maar ook tijdens een simulatie veranderen. Met Stap kun je gedetailleerd volgen hoe een experiment verloopt. Een experiment wordt 1 keer uitgevoerd. Snel is bedoeld om veel data te maken die je in een bestand kunt bewaren. Onderbreken/Doorgaan Met de spatiebalk kun je de simulatie onderbreken of hervatten
bewaart de resultaten in een bestand. Dat bestand kun je in de rubriek Statistiek openen en bewerken.
6.3
Monopoly Monopoly Een simulatie van het bekende spel. Op het speelveld zie je de worp met twee dobbelstenen, op welke plek je terecht bent gekomen bent en vanaf welke plek je bent vertrokken. VU-Statistiek houdt het aantal beurten bij, het aantal worpen (soms mag je vaker werpen in een beurt), het aantal posities (straten) en hoe vaak je langs Start bent gekomen. Op elke straat wordt bijgehouden hoe vaak je er was, desgewenst in procenten. Spelregels In het kort de belangrijkste regels van het spel: * Je begint op Start. * Als je dubbel gooit moet je nog een keer gooien. Gooi je drie keer dubbel dan moet je naar de gevangenis. Als je in de gevangenis zit kun je kiezen uit betalen of drie keer gooien. Bij dubbel gooien moet je uit de gevangenis. In deze simulatie is gekozen voor betalen. Kansk aart en Algemene Fonds Bij de zestien kanskaarten zijn er zeven die invloed hebben op de plaats 1) Ga verder naar Heerestraat 2) Reis naar Station West 3) Ga verder naar Start 4) Ga verder naar Kalverstraat 5) Ga drie plaatsen terug 6) Ga direct naar de Gevangenis, en 7) Ga verder naar Barteljorisstraat Bij het Algemene Fonds zijn er drie kaarten die invloed hebben op de plaats 1) Ga verder naar de Gevangenis 2) Ga terug naar Dorpsstraat, en 3) Ga verder naar Start. Instelmogelijkheden en buttons Tempobalk Met de tempobalk kun je de snelheid waarmee een spel wordt gesimuleerd instellen maar ook tijdens het spel veranderen. Met Stap kun je gedetailleerd volgen hoe een spel verloopt. Een spel wordt 1 keer uitgevoerd. Percentages Het aantal keren dat je op een straat komt kan als absoluut aantal of als percentage getoond worden. Onderbreken/Doorgaan Met de spatiebalk kun je de simulatie onderbreken of hervatten
66
6.4
Metronoom Metronoom Deze module is bedoeld om “eigen” data te maken. Het basisidee van de metronoom als datagenerator is afkomstig van Dr. Wolfgang Riemer (Keulen). Een speler moet een bepaald metronoom tempo zo goed mogelijk vasthouden door de maat op de spatiebalk te tikken. Het “spel” verloopt als volgt. De speler kiest een tempo, bijvoorbeeld Lento, neemt dat in zich op door te kijken of te luisteren naar de metronoom. Vervolgens gaat hij of zij de maat tikken op de spatiebalk. Na elke tik wordt de bpm-waarde (beats per minute), een geheel getal, berekend en als een dot weergegeven. Al spelende verschijnt er een dotplot van de scores. Na verloop van tijd is het spel afgelopen. Een verticale lijn geeft het ingestelde tempo weer. Het spel kan vervolgd worden bijvoorbeeld door een andere speler of in een ander tempo. Daarmee ontstaat een dataset waar nog meer aan te beleven valt. Tot slot kun je overzicht met diverse representaties bekijken of de dataset opslaan om die later te analyseren. De diverse instelmogelijkheden spreken voor zichzelf. Met de optie Muziek kun je een muziekbestand afspelen en daarbij de maat slaan. Uit de dataset kun je dan herleiden in welk tempo het muziekstuk is gespeeld. Maar je kunt bij muziek ook ritmes tikken en statistisch analyseren. De dataset wordt automatisch geopend in de module Statistiek. Je krijgt de gebruikelijke datatabel. De doelvariabele is bpm, beats per minute, oftewel het aantal tikken per minuut. Daarnaast zie je nog enkele kenmerken/variabelen. Het volgnummer die als tijdsvariabele gebruikt kan worden. De variabele speler bevat de ingevoerde namen, en de variabele tempo, de tempi die gespeeld zijn. Er zijn dus twee kwantitatieve en twee kwalitatieve variabelen in de dataset. Vooral de kwalitatieve variabelen zijn interessant om deelgroepen op te maken en zo verbanden te laten zien. Meerdere datasets kun je samenvoegen. Stel dat leerlingen thuis een aantal keren spelen en de gegevens opslaan. Je kunt dan een grote dataset krijgen, waarin via de naam van de speler elke dataproducent valt te identificeren. Een mooie dataset als uitgangspunt voor het leren van statistiek.
6.5
Reserveringen Reserveringen Bij sommige vliegtuigmaatschappijen komt wel 20% van de passagiers die gereserveerd hebben niet opdagen (no-show). Dit is voor de vliegtuigmaatschappijen een enorme verliespost. Sommige maatschappijen doen daarom aan overboeking: er worden meer stoelen verkocht dan er beschikbaar zijn. In het geval er voor een vlucht teveel passagiers komen opdagen wordt er een afkoopsom aangeboden van bijvoorbeeld 400 euro,- als tegemoetkoming aan die reizigers die bereid zijn om een later vliegtuig te nemen. Als er teveel wordt overboekt kost dat dus geld, maar als er niet overboekt wordt ook. Er bestaat een optimale situatie die je kunt bekijken in de optie Grafiek. In die grafiek kun je het verband tussen het bedrag dat de maatschappij misloopt en het aantal overboekingen bestuderen. Simulatie Je ziet het resultaat van elke simulatie en in de tabel een overzicht van alle uitgevoerde simulaties. Grafiek
Toegepaste simulaties
67
In de grafiek kun je het verband tussen het verwachte verlies en het aantal overboekingen bestuderen. Instelmogelijkheden en buttons Tempobalk Met de tempobalk kun je de snelheid waarmee een experiment wordt gesimuleerd instellen maar ook tijdens een simulatie veranderen. Met Stap kun je gedetailleerd volgen hoe een experiment verloopt. Een experiment wordt 1 keer uitgevoerd. Onderbreken/Doorgaan Met de spatiebalk kun je de simulatie onderbreken of hervatten
6.6
Roulette Roulette Bij deze simulatie spelen tien spelers en/of speelsters tot ze blut zijn. Je kunt volgen hoe snel een speler blut gaat. Van een speler die blut is zie je hoe vaak die speler heeft meegedaan. Zo gauw een speler blut is doet hij of zij niet meer mee en wordt het aantal worpen vermeld. Wijs je met de cursor een speler aan dan krijg je informatie over de speelwijze. Instelmogelijkheden en buttons Speelkeuzes Je kunt je diverse speelkeuzes opgeven: - het speelbedrag waar elke speler mee begint. - voor elke speler de inzet per spel - het speeltype; op het speelveld kun je dat nog preciezer aangeven door op een veld te klikken Enkele en dubbele nul Er komen twee roulette systemen voor, met één nul en met dubbele nul. Dit kun je instellen bij Profielen. Tempobalk Met de tempobalk kun je de snelheid waarmee het spel wordt gesimuleerd instellen maar ook tijdens het spelen veranderen. Met Stap kun je gedetailleerd volgen hoe een experiment verloopt. Een experiment wordt 1 keer uitgevoerd. Snel is bedoeld om veel data te maken die je in een bestand kunt bewaren. Onderbreken/Doorgaan Met de spatiebalk kun je de simulatie onderbreken of hervatten
6.7
Fruitautomaat Fruitautomaat De fruitautomaat uit deze simulatie heeft drie rollen. Hoe die rollen zijn samengesteld en hoe groot de prijs is die op een combinatie valt, kun je zelf instellen. Van elk symbool op een rol geef je op hoe vaak dat symbool voorkomt. Verder kun je prijzen op de combinaties van symbolen invullen. Met deze instellingen ligt theoretisch vast hoe groot het verwachte uitkeringspercentage is. Bij een bepaald aantal spelen per uur ligt dus ook het bedrag vast dat waarschijnlijk in een uur verloren of gewonnen wordt.
68 Op het speelscherm zie je de fruitautomaat draaien. In de tabel ernaast kun je zien hoe vaak een bepaalde combinatie is voorgekomen. Achtergrond informatie is beschikbaar Instelmogelijkheden en buttons Instellingen Op het instellingenscherm stel je de fruitautomaat in. Hoe de rollen zijn samengetseld en welke prijs op welke combinatie valt. Tempobalk Met de tempobalk kun je de snelheid waarmee een experiment wordt gesimuleerd instellen maar ook tijdens een simulatie veranderen. Met Stap kun je gedetailleerd volgen hoe een experiment verloopt. Een experiment wordt 1 keer uitgevoerd. Onderbreken/Doorgaan Met de spatiebalk kun je de simulatie onderbreken of hervatten. wist de tot dan behaalde resultaten
6.8
Banken Banken Banken is een dobbelspel voor zes deelnemers en drie dobbelstenen. De vraag is, zoals bij alle gokspelen, of het spel eerlijk is. Dat wil zeggen dat de kans op winst en verlies even groot is. De spelregels zie je op het scherm als je stap voor stap speelt. Spelregels - Iedere speler kiest een vak - Vaknummer en ogental gelijk + 1 punt - Vaknummer en ogental ongelijk – 1 punt - Vaknummer gelijk aan twee ogentallen + 2 punten - Vaknummer gelijk aan drie ogentallen + 3 punten De winst en verliesrekening wordt per speler zowel per spel als over het totaal bijgehouden. Instelmogelijkheden en buttons Instellingen De positie van de spelers kan gewijzigd worden als het spel is gestopt. Tempobalk Met de tempobalk kun je de snelheid waarmee een experiment wordt gesimuleerd instellen maar ook tijdens een simulatie veranderen. Met Stap kun je gedetailleerd volgen hoe een experiment verloopt Een experiment wordt 1 keer uitgevoerd. Onderbreken/Doorgaan Met de spatiebalk kun je de simulatie onderbreken of hervatten
Toegepaste simulaties
6.9
69
De computer voorspelt De computer voorspelt Kunstmatige intelligentie Ieder mens vertoont onwillekeurig in zijn gedrag regelmatige patronen. Als die regelmaat opgespoord kan worden dan kun je met die kennis het gedrag voorspellen. Zo ook bij het intikken van nullen en enen op de computer. In deze simulatie probeert de computer je gedrag bij het intikken van nullen en enen te voorspellen. Eerst moet je zonder nadenken veertig nullen en enen intikken. Dit is de basis waarmee de computer een eerste indruk van je tikgedrag heeft gekregen. In de Tikafdeling tik je, zonder nadenken, nullen en enen in. De computer voorspelt van elke tik of het een 0 of een 1 wordt. Ook houdt de computer bij hoeveel tikken goed voorspeld zijn. Op de onderste helft van het scherm kun je zien welke strategie de computer volgt bij de voorspellingen. Strategie De computer houdt bij hoe vaak na een bepaald drietal een 1 is ingetikt. De daaruit volgende frequentieverdeling gebruikt de computer om de volgende tik te voorspellen. Boven dat scherm kun je volgen hoe goed de voorspellingen op grond van deze strategie zijn. Vaak zie je dat het percentage goede voorspellingen toeneemt naarmate het aantal tikken groter wordt. Zo gauw je niet meer willekeurig intikt, dus je gedragspatroon zich wijzigt, loopt het percentage weer terug, zelfs tot onder de 50%.
Top Level Intro This page is printed before a new top-level chapter starts
Part
VII
72
7
Kansverdelingen Kansverdelingen Hier vind je een elektronisch tabellenboek. Naast de tabel zie je de grafiek van de kansverdeling, daarin zie je wat een waarde uit de tabel betekent. Er zijn vier afzonderlijke verdelingen: binomiaal, hypergeometrisch, normaal en poisson. Met de optie Diverse verdelingen kun je verschillende verdelingen tegelijk in één figuur plotten.. Bovendien bevat deze rubriek een demonstraties van de centrale limietstelling.
7.1
Binomiale verdeling Binomiale verdeling Een binomiale verdeling is gedefinieerd door twee parameters, n en p. Het aantal experimenten is n. Elk experiment kan maar twee uitkomsten hebben: succes of mislukking. De kans op succes is p. De kansverdeling , de verwachtingswaarde en de standaarddeviatie (standaardafwijking) hangen alleen van de parameters n en p af. P(X=k) is de kans op k successen. De kansverdeling van de stochast (de kansvariabele) X zie je in de vorm van een staafdiagram en in de vorm van een tabel. In de tabel zie je ook de cumulatieve kans P(X<=k) en de kans P(X>=k). Door te klikken in een vakje van de tabel zie je in de grafiek het bijpassende deel in het rood. Instelmogelijkheden Cumulatief De staafgrafiek wordt cumulatief getekend. De kleurkoppeling tussen grafiek en tabel werkt nu niet Normale benadering De normale of cumulatief normale verdeling die het best past wordt getekend.
7.2
Hypergeometrische verdeling Hypergeometrische verdeling Bij het trekken zonder terugleggen van een steekproef uit een populatie die is samengesteld uit twee deelgroepen, heb je te maken met een hypergeometrische verdeling. Een hypergeometrische verdeling is gedefinieerd door drie parameters: -de omvang van de populatie N -de omvang van de deelgroep D -de omvang van de steekproef n P(X=k) is de kans dat er in de steekproef k successen (afkomstig uit de deelgroep D) voorkomen. De kansverdeling van de stochast (de kansvariabele) X zie je in de vorm van een staafdiagram en in de vorm van een tabel. In de tabel zie je ook de cumulatieve kans P(X<=k) en de kans P(X>=k). Door te klikken in een vakje van de tabel zie je in de grafiek het bijpassende deel in het rood.
Kansverdelingen
73
Instelmogelijkheden Cumulatief De staafgrafiek wordt cumulatief getekend. De kleurkoppeling tussen grafiek en tabel werkt nu niet Normale benadering De normale of cumulatief normale verdeling die het best past wordt getekend.
7.3
Normale verdeling Normale verdeling Een normale verdeling is gedefinieerd door twee parameters, µ (mu) het gemiddelde en σ (sigma) de standaarddeviatie of standaardafwijking. De kansverdeling is een symmetrische continue verdeling waarbij alleen kansen als P(X<=g) of P (X>=g) zinvol zijn. De normale verdeling met µ = 0 en σ = 1 heet de standaardnormale verdeling. Deze verdeling is het uitgangspunt maar je kunt µ en σ elke andere waarde geven, de x-as past zich daar bij aan. Je kunt de grenzen tussen het blauwe en gele gebied verslepen. Je kunt de waarde van µ aanpassen door invullen of door verslepen van het rode rondje. Je kunt de waarde van σ aanpassen door invullen of door verslepen van het groene rondje. In principe geldt P(X<=grens | µ; σ) = kans aangegeven met het blauwe gebied. Er is een verband tussen de vier parameters: grens, kans, µ en σ. Dit verband zie je bij verslepen/ veranderen van een van de elementen. Steeds is één van de waarden onbekend. Dat is dus de gezochte waarde die volgt uit de waarden die je aan de andere parameters geeft door slepen of invullen. Instelmogelijkheden Aanpassen grafiek Dit is bedoeld om de grafiek in beeld te houden. z-as Een tweede horizontale as, de z-as, is van toepassing op de standaard normale verdeling, de verdeling met µ = 0 en σ = 1. De getekende verdeling kun je dan daarmee vergelijken. Een button om snel de uitgangssituatie te herstellen. In het onderdeel Profielen kan om didactische redenen Kans dan wel Oppervlakte worden gekozen.
7.4
Poisson verdeling Poisson verdeling Een Poisson verdeling is gedefinieerd door één parameter. Deze parameter heeft diverse namen: lambda, gemiddelde, intensiteit, dichtheid. Hiermee wordt bedoeld het aantal gebeurtenissen dat gemiddeld per tijdseenheid plaats vindt. Met de Poissonverdeling vind je de kans op een bepaald aantal gebeurtenissen per tijdseenheid. De Poissonverdeling is onder meer van belang bij simulatie van wachtrijen. De kansverdeling van de stochast (de kansvariabele) X zie je in de vorm van een staafdiagram en in de vorm van een tabel.
74 In de tabel zie je de cumulatieve kans P(X<=k) en de kans P(X>=k). Door te klikken in een vakje van de tabel zie je in de grafiek het bijpassende deel in het rood. Instelmogelijkheden Cumulatief De staafgrafiek wordt cumulatief getekend. De kleurkoppeling tussen grafiek en tabel werkt nu niet Normale benadering De normale of cumulatief normale verdeling die het best past wordt getekend.
7.5
Diverse verdelingen Diverse verdelingen Bij deze optie is het mogelijk om verschillende verdelingen met elkaar te vergelijken.. Dit kan zowel door de tabellen als de grafieken te vergelijken. De verdelingen die gekozen kunnen worden zijn: -Binomiale verdeling -Normale verdeling -Hypergeometrische verdeling -Geometrische verdeling -Exponentiële verdeling -Student’s t-verdeling -Chi-kwradaat verdeling -F-verdeling Instelmogelijkheden en buttons Kies verdeling Kies een verdeling door de parameters op t geven Gevulde rechthoeken Optie om de staven van een verdeling vol gekleurd te tekenen Toevoegen De gekozen verdeling wordt aan de lijst toegevoegd, de grafiek wordt getekend. Kleur Een kleur voor de gekozen verdeling selecteren. Assen Instellen van de assen en de indeling van de assen Verwijderen Verwijderen van een in de lijst geselecteerde verdeling Tabel In de tabel geef je de x-waarde en gewenste nauwkeurigheid op.
Openen Een bestand met verdelingen openen. Het bestand heeft het format *.dst
Bewaren Bewaren van een bestand met verdelingen. Handig voor een demonstratie is dat de verdelingen bewaard kunnen worden, zodat het lastige intikken voor publiek overbodig is. Het bestand krijgt de extensie dst.
Kansverdelingen
7.6
75
Centrale Limietstelling Centrale Limietstelling De centrale limietstelling wordt gepresenteerd aan de hand van een dobbelsteen. De kansverdeling van de som of het gemiddelde van de ogen bij een aantal worpen van de dobbelsteen wordt berekend. Bijna altijd convergeert de verdeling naar de normale verdeling. Bij een onregelmatige instelling kan bij een groot aantal worpen de verdeling als lijnstukjes weergegeven worden. Dat normale verdeling dan een stuk lager is, heeft met de kansdichtheid te maken. Instelmogelijkheden en buttons. Aantal worpen Kans 1/6 Een eerlijke dobbelsteen Scheef links Een oneerlijke dobbelsteen, VU-Stat doet een voorstel maar je kunt ook zelf andere kansen opgeven. Scheef rechts Een oneerlijke dobbelsteen, VU-Stat doet een voorstel maar je kunt ook zelf andere kansen opgeven. Som De som van het aantal ogen wordt getoond Gemiddelde Het gemiddelde van de ogen wordt getoond Normale verdeling De best passende normale verdeling wordt getekend In plaats van aan de ogen op een dobbelsteen kun je ook een andere stochast formuleren met maximaal zes waarden. Bij minder waarden neem je voor de rest een kans=0.
Top Level Intro This page is printed before a new top-level chapter starts
Part
VIII
78
8
Hypothesen toetsen
8.1
Test met twee alternatieven Test met twee alternatieven De theorie van het toetsen van hypothesen blijkt vooral in het begin lastig onder de knie te krijgen. Een geschikte eerste kennismaking is de Test met twee (binomiale) alternatieven. De belangrijke begrippen worden duidelijk en interactief in beeld gebracht. Illustratief is om de toets te vergelijken bij verschillende aantallen van n, bijvoorbeeld n = 100 en n = 1000. Instelmogelijkheden en buttons Hypothesen De nul-hypothese en de alternatieve hypothese kun je opgeven. De resulaten op het scherm worden gerelateerd, zoals gebruikelijk, aan de nul-hypothese. Parameters De verdelingen zijn binomiale verdelingen, de waarde van p komt overeen met p0 en p1. De waarde van n, het aantal experimenten, geef je hier op. De beslisgrens is het aantal successen waarbij een beslissing voor p0 of p1 wordt genomen. De grens is de verticale lijn, die je aan/uit kunt zetten. Met de keuze van de beslisgrens ligt de grootte van de fouten van eerste en tweede soort vast. Beeld Grens toont de lijn die je kunt slepen. Fouten toont de fouten van eerste en tweede soort in de grafiek, de kleuren komen overeen met de tabel Beslissingsgebied toont onder de verdelingsgrafieken de ligging van de waarden waarbij de nulhypothese wordt verworpen/geaccepteerd. Foutentabel toont de tabel met fouten van eerste en tweede soort, de kleuren komen overeen met de grafiek geeft enkele uitvoermogelijkheden
8.2
Binomiale toets Binomiale toets Bij het formuleren van een toets gaat het om een aantal vaste elementen. Bij de binomiale toets zijn dat: -de nulhypothese p=… -linkszijdige, rechtszijdige of tweezijdige toets -het significantieniveau (alfa) -de grootte van de steekproef -het aantal successen in de steekproef (een succes is een uitkomst in overeenstemming met de nulhypothese) Het aantal successen in de steekproef is met een verticale lijn in de verdeling aangegeven. Door invullen of door die lijn te slepen kun je het aantal successen in de steekroef aanpassen.
Hypothesen toetsen
79
Instelmogelijkheden Overschrijdingskans In de verdeling worden de staven bij eenzelfde of extremer aantal successen rood gekleurd. Kritiek gebied In de verdeling worden de staven waarbij het aantal successen dat tot verwerpen van de nulhypothese aanleiding geeft, rood gekleurd. Normale benadering De best passende normale verdeling wordt getekend Conclusie Met deze optie krijg je een uitgebreid geformuleerde conclusie. Het vermelden van het kritiek gebied is optioneel en kun je via Instellingen in het hoofdmenu regelen. De tekst van de conclusie kan worden uitgevoerd als een RTF bestand. Vrijwel iedere gangbare tekstverwerker kan een RTF bestand inlezen.
8.3
t-toets T-toets Bij het formuleren van een toets gaat het om een aantal vaste elementen. Bij de T-toets toets zijn dat: -de nulhypothese, mu =… -linkszijdige, rechtszijdige of tweezijdige toets -het significantieniveau (alfa) -de grootte van de steekproef -het gemiddelde van de steekproefwaarnemingen -de standaarddeviatie van de steekproefwaarnemingen De getekende verdeling is de verdeling die bij de nulhypothese hoort De waarde van de toetsingsgrootheid is met een verticale lijn in de verdeling aangegeven. Door invullen of door die lijn te slepen kun je steekproefgemiddelde aanpassen. Instelmogelijkheden Overschrijdingskans In de verdeling wordt het gebied bij eenzelfde of extremer waargenomen gemiddelde rood gekleurd. Kritiek gebied In de verdeling wordt het gebied waarbij het waargenomen gemiddelde tot verwerpen van de nulhypothese aanleiding geeft, rood gekleurd. Conclusie Met deze optie krijg je een uitgebreid geformuleerde conclusie. Het vermelden van het kritiek gebied is optioneel en kun je via Instellingen in het hoofdmenu regelen. De tekst van de conclusie kan worden uitgevoerd als een RTF bestand. Vrijwel iedere gangbare tekstverwerker kan een RTF bestand inlezen.
8.4
z-toets Z-toets Bij het formuleren van een toets gaat het om een aantal vaste elementen. Bij de Z-toets toets zijn dat:
80 -de nulhypothese, µ =… en σ =… (mu en sigma) -linkszijdige, rechtszijdige of tweezijdige toets -het significantieniveau (alfa) -de grootte van de steekproef -het gemiddelde van de steekproefwaarnemingen De getekende verdeling is de verdeling die bij de nulhypothese hoort Het gemiddelde van de steekproef waarnemingen is met een verticale lijn in de verdeling aangegeven. Door invullen of door die lijn te slepen kun je steekproefgemiddelde aanpassen. Instelmogelijkheden Overschrijdingskans In de verdeling wordt het gebied bij eenzelfde of extremer waargenomen gemiddelde rood gekleurd. Kritiek gebied In de verdeling wordt het gebied waarbij het waargenomen gemiddelde tot verwerpen van de nulhypothese aanleiding geeft, rood gekleurd. Conclusie Met deze optie krijg je een uitgebreid geformuleerde conclusie. Het vermelden van het kritiek gebied is optioneel en kun je via Instellingen in het hoofdmenu regelen. De tekst van de conclusie kan worden uitgevoerd als een RTF bestand. Vrijwel iedere gangbare tekstverwerker kan een RTF bestand inlezen.
8.5
Poisson toets Poisson toets Bij het formuleren van een toets gaat het om een aantal vaste elementen. Bij de Poisson toets zijn dat: -de nulhypothese , gemiddelde =… (lambda, intensiteit, dichtheid) -linkszijdige, rechtszijdige of tweezijdige toets -het significantieniveau (alfa) -het aantal waarnemingen in een periode Het aantal waarnemingen in een periode is met een verticale lijn in de verdeling aangegeven. Door invullen of door die lijn te slepen kun je steekproefgemiddelde aanpassen. Instelmogelijkheden Overschrijdingskans In de verdeling worden de staven bij eenzelfde of extremer aantal successen rood gekleurd. Kritiek gebied In de verdeling worden de staven waarbij het aantal successen dat tot verwerpen van de nulhypothese aanleiding geeft, rood gekleurd. Normale benadering De best passende normale verdeling wordt getekend Conclusie Met deze optie krijg je een uitgebreid geformuleerde conclusie. Het vermelden van het kritiek gebied is optioneel en kun je via Instellingen in het hoofdmenu te regelen. De tekst van de conclusie kan worden uitgevoerd als een RTF bestand. Vrijwel iedere gangbare tekstverwerker kan een RTF bestand inlezen.
Hypothesen toetsen
8.6
81
Betrouwbaarheidsintervallen Betrouwbaarheidsintervallen Het schatten van het gemiddelde van een normale verdeling of de p-waarde (proportie) van een binomiale verdeling is een toevalsexperiment. De vraag is welk populatiegemiddelde of welke proportie aanvaardbaar is. Op grond van de steekproef kan een schattingsinterval berekend worden waar de gezochte waarde met een zekere kans in ligt. Dit interval heet een …%betrouwbaarheidsinterval. De betrouwbaarheid wil zeggen dat bij veel herhalingen in 95% van de gevallen de gezochte waarde in het interval zal liggen en in 5% van de gevallen niet. Met de simulatie kun je dat nagaan. Bij de normale verdeling kun je zowel het gemiddelde als de standaarddeviatie wijzigen. Bij de binomiale verdeling kan alleen de kans p gewijzigd worden. Door de grootte van de steekproef op te geven wordt het herhaald trekken uit een verdeling met de gewenste eigenschappen gesimuleerd. Elk experiment bestaat uit een steekproef waarvan gemiddelde en standaarddeviatie wordt berekend en waarbij een schattingsinterval wordt bepaald. De gezocht waarde staat als een doorlopende lijn aangegeven. Bijgehouden wordt welk percentage van de voorspellingen correct is zodat je kunt zien of dit percentage min of meer overeenkomt met hetgeen theoretisch verwacht mag worden. Bij een 95% betrouwbaarheidsinterval zal immers in ongeveer 95% van de gevallen de ingestelde parameterwaarde in het betrouwbaarheidsinterval moeten liggen. Je kunt onderzoeken welk effect de grootte van de steekproef, de betrouwbaarheid en de verdelingsparameters op het resultaat hebben.
Instelmogelijkheden en buttons Kies verdeling Keuze uit de normale of binomiale verdeling met gewenste parameters Omvang steekproef Hier geef je de grootte van de steekproef op. Betrouwbaarheid De betrouwbaarheid wordt in % uitgedrukt Tempobalk Met de tempobalk kun je de snelheid waarmee een experiment wordt gesimuleerd instellen maar ook tijdens een simulatie veranderen. Met Stap kun je gedetailleerd volgen hoe een experiment verloopt Een experiment wordt 1 keer uitgevoerd. Snel is bedoeld om veel data te maken die je in een bestand kunt bewaren. Onderbreken/Doorgaan Met de spatiebalk kun je de simulatie onderbreken of hervatten
het bestand wordt direct in Excel geopend.
bewaart de resultaten in een bestand. Dat bestand kun je in de rubriek Statistiek openen en bewerken.
82
8.7
Onderscheidend vermogen Onderscheidend vermogen De optie laat het onderscheidend vermogen van een binomiale toets zien. Het onderscheidend vermogen of onderscheidingsvermogen is de kans dat een alternatieve hypothese terecht aanvaard wordt. Het onderscheidend vermogen is het gedeelte van de kansverdeling dat boven de kritieke grens ligt en is dus een functie van p1, de alternatieve hypothese. De waarde van p1 kun je aanpassen. De grafiek van het onderscheidend vermogen heet ook wel power-curve. Je kunt onderzoeken welk effect de grootte van de verdelingsparameters en het significantieniveau op het onderscheidend vermogen hebben. Instelmogelijkheden Hypothesen Formulering van de binomiale toets Door invullen of door de lijn te slepen kun je de waarde van p1 aanpassen.
Index
Index
-GGrafieken van verdelingen
-AAggregatie
-H31
Hercoderen Hoofdmenu
-BBinomiale verdeling 72 boomdiagram 42 Bord van Galton 43 Boxplot 20
81
72
-IImporteren 30 Invoer van data 8
-KKendalls tau enSpearmans rho Kruistabel 26
-CCall en put opties
75
-D36
De lerende computer 69 Discriminant analyse 28 Dobbelspel Banken 68 Dobbelstenen 55
Lijndiagram 19 Lorentzkromme 23
-MMarkov- en Leslie-processen Multipele regressie 28 Munten 53
46
-NNormale verdeling
-E-
29
-L-
48
Centrale Limietstelling Centrummaten 24 Cirkeldiagram 18 Correlatiematrix 28
Exporteren
14 2
Hypergeometrische verdeling
Beeldmenu 15 betrouwbaarheidsintervallen Binomiale toets 78
Dataplot
74
73
-O31
-FFrequentieraster 44 Frequentietabel 25 Fruitautomaat 67
Onafhanklijke steekproeven Onderscheidend vermogen
29 82
-PPaarsgewijze verschillen Poisson verdeling 73 Poissontoets
80
29
83
84 Printen 4 Profielen 3
-RRandom generator
52
Randomized Response Reactiesnelheid 54 Regressie-lijnen 55 Reserveringen 66 Roken 64 Roosterdiagram Roulette 67
57
45
-SShow all 24 Slim tellen 48 Snackbar 64 Staafdiagram 17 Statistiek menu-opties Steekproeven 58 Steelblad 27
9
-TTABEL
25
Tabel en boom 46 Tekstvariabelen 32 Test met twee alternatieven tijdreeks 23 Toevalsregen 60 trekken met terugleggen T-toets 79
-VVaasmodel 43 Variantie analyse Vrije boom 41
-ZZ-toets
79
29
78
42
85
Endnotes 2... (after index)
Back Cover