Black plate (9,1)
DIDACTIEK & STATISTIEK 1 &
1
ICT-leermiddelen voor statistiek
Rene´ Nijs Inspecteur hoger onderwijs
1. Inleiding 2. Meerwaarde van ICT bij stapsgewijze statistische analyse 2.1. Gegevensvergaring en -weergave 2.2. Gegevensbeschrijving en grafische voorstelling 2.3. Gegevensanalyse 3. ICT-gerichte leermiddelen voor statistiek 3.1. De wetenschappelijke en grafische rekenmachine 3.2. De pc met het elektronisch rekenblad als leermiddel bij statistiek 3.3. Statistische toepassingspakketten 3.4. Statistische informatievergaring via ICT 3.5. Gebruik van ‘Open Source Software’ 4. Conclusies 5. Literatuur 6. Internetsites met statistische info Noten
Contactadres :
[email protected]
ICT EN ONDERWIJSVERNIEUWING
&
AFL. 7, SEPTEMBER 2004, 9 ONDERWIJS EN LEREN
Black plate (10,1)
DIDACTIEK & STATISTIEK 1 &
2
Krachtlijnen In dit artikel geven we een overzicht van het mogelijke gebruik van ICT bij het onderricht in de statistiek. We tonen aan hoe het gebruik van ICT een meerwaarde betekent en we illustreren het zinvol inzetten van verschillende ICT-gerichte leermiddelen. De meerwaarde door ICT-gebruik wordt geı¨llustreerd voor alle deelgebieden van de statistiek : van de gegevensvergaring over de gegevensbeschrijving en de grafische weergave tot de analyse en de besluitvorming. Twee uitgewerkte voorbeelden ondersteunen deze didactische meerwaarde. Wat ICT-gerichte leermiddelen betreft, kan de leerkracht vrij kiezen tussen de grafische rekenmachine (GRM) en de pc met aangepaste software. De aangepaste software kan het elektronische rekenblad zijn (bv. MS-Excel) of een meer professioneel statistisch toepassingspakket zoals SPSS (Statistical Package for Social Scientists). Wil men licentieproblemen omzeilen, dan kan men zijn toevlucht nemen tot ‘vrije software’-pakketten zoals OpenOffice, Gnumeric en de programmeertaal R. Zowel de GRM als de pc hebben hun specifieke voordelen maar de mogelijkheden van de pc zijn duidelijk ruimer en vlotter toepasbaar. De mogelijkheden van beide aanleren en gebruiken in de didactische praktijk is te verkiezen, in het belang van de leerlingen. De inschakeling van het internet als ICT-leermiddel levert de beste resultaten bij meer innovatieve werkvormen zoals zelfstandig werken in combinatie met PGO (ProbleemGestuurd Onderricht) en bij groepswerk, bijvoorbeeld bij de uitwerking van enqueˆtes. Dit artikel richt zich in de eerste plaats tot het secundair onderwijs, maar gaat in de aanwending van de beslissingsmethodieken verder dan eindtermen en leerplannen voorschrijven. Op die manier richt het zich ook tot het hoger onderwijs.
AFL. 7, SEPTEMBER 2004, 10 ONDERWIJS EN LEREN
&
ICT EN ONDERWIJSVERNIEUWING
Black plate (11,1)
DIDACTIEK & STATISTIEK 1 &
&
3
1. Inleiding
ruim toepassings-
Statistiek is een discipline die ons in staat stelt uitspraken te doen over een
gebied
groot aantal gegevens, de populatie, aan de hand van een beperkte deelverzameling van deze populatie, de steekproef. De technieken die hiervoor gehanteerd worden, hebben allemaal een wiskundige basis. In het secundair onderwijs worden de fundamenten van de statistiek aangeleerd binnen het vak wiskunde. In het hoger onderwijs is de leerstof statistiek eerder gebonden aan het specifieke studiegebied. Het toepassingsgebied van de statistiek is immers enorm. Buiten de wiskunde wordt zij toegepast binnen economische managements- en onderzoekstechnieken, in de psycho- en sociologie, de wetenschappen, de gezondheidszorg, de kwaliteitscontrole en vele andere domeinen. Naar gelang van het uiteindelijke doel zullen de accenten erg verschillen, maar de onderliggende basistechnieken blijven dezelfde.
ICT : apparatuur en
Na het vak (Toegepaste) Informatica zelf, is Statistiek wellicht he´t (deel)vak
programmatuur
bij uitstek om de veelzijdige mogelijkheden van ICT te implementeren. ICTleermiddelen die we op een efficie¨nte wijze didactisch kunnen aanwenden situeren zich op twee niveaus : het apparatuurniveau en het programmatuurniveau. Op het vlak van apparatuur heeft de gebruiker de keuze tussen de elektronische rekenmachine, beter gekend als GRM (grafische rekenmachine), en de intussen vertrouwde pc. Op het vlak van programmatuur heeft de gebruiker van de GRM geen keuze : hij is gebonden aan de software van de rekenmachine. Bij gebruik van de pc zijn er meer mogelijkheden : n
het elektronische rekenblad : MS-Excel, Lotus 1-2-3, ...;
n
professionele statistische pakketten zoals SPSS, Statistica, SAS en andere StatGraph of Minitab;
n
vrije software : vrij en gratis van het internet te plukken programmatuur (OpenOffice, Gnumeric, R, ... ).
Alvorens de ICT-gerichte leermiddelen te behandelen, verkennen we eerst de mogelijke meerwaarde die een ICT-gerichte aanpak voor statistiek kan betekenen.
&
2. Meerwaarde van ICT bij stapsgewijze statistische analyse
verantwoord ICT-
Het is duidelijk dat het gebruik van ICT binnen het onderwijs niet zo maar
gebruik : meerwaarde
aanvaard wordt. De tijd van het hanteren van ICT om de ICT zelf is definitief voorbij. Wil men ICT op een verantwoorde wijze binnen een vakdiscipline
aantoonbaar
gebruiken, dan zal men de meerwaarde ervan moeten aantonen.
ICT EN ONDERWIJSVERNIEUWING
&
AFL. 7, SEPTEMBER 2004, 11 ONDERWIJS EN LEREN
Black plate (12,1)
DIDACTIEK & STATISTIEK 1 &
4
De meerwaarde van ICT-gebruik binnen statistiek situeert zich bij elk van de opeenvolgende stappen van de statistische analyse : n
gegevensvergaring en -weergave;
n
gegevensbeschrijving en grafische datavoorstelling;
n
gegevensanalyse.
2.1. Gegevensvergaring en -weergave eerste stap in het
De eerste stap in het statistisch onderzoek bestaat uit de datavergaring en de
statistisch
datavastlegging. Dit kan op verschillende manieren gebeuren, afhankelijk
onderzoek
van het probleem dat gesteld is of het onderzoek dat men wenst te voeren. Enkele voorbeelden uit diverse domeinen van het ruime toepassingsgebied illustreren dit. Voorbeelden van statistisch onderzoek
Domein
Tijdreeksen
Economie en financie¨n
Enqueˆtes zoals opiniepeilingen Intelligentietests
Sociale en psychologische wetenschappen
Effectiviteitsonderzoek van serum - Diagnosetesten
een
Gezondheidszorg
Keuring van gefabriceerde producten
Kwaliteitsbeheer
Statistische procescontrole
Industrie¨le technieken
Kwaliteitszorgtechnieken
Management en administratie
Het toepassingsgebied bepaalt zowel de aard van de steekproef als het datatype dat het onderwerp ervan is. kwantitatieve
Kwantitatieve data hebben een rekenkundige betekenis omdat ze behoren
versus kwalitatieve
tot een (deel)verzameling van de gehele of rationale getallen. Ze zijn van het
data
discrete type (bv. opgooien van een dobbelsteen met zes mogelijke uitkomsten) of van het continue (interval)type (bv. leeftijdsverdeling). Kwalitatieve data geven een kenmerk weer en kunnen van het nominale of ordinale type zijn. Nominale data worden gekenmerkt door een gewone opsomming, zonder mogelijke ordening. Ordinale data hebben wel een ordening maar niet op een metrische schaal omdat de onderlinge afstand niet gedefinieerd is. Een voorbeeld hiervan zijn de scores die men kan aanduiden bij een enqueˆte. Het datatype beı¨nvloedt in sterke mate de te hanteren statistische beslissingsmethodiek.
AFL. 7, SEPTEMBER 2004, 12 ONDERWIJS EN LEREN
&
ICT EN ONDERWIJSVERNIEUWING
Black plate (13,1)
DIDACTIEK & STATISTIEK 1 &
zelf vergaarde data
5
De eenvoudigste situatie bij datavergaring is vertrekken van niets, d.w.z. men bepaalt welk statistisch onderzoek men wenst te doen en gaat dan over tot datavergaring. Hier start men dus van ‘scratch’ en verzamelt men data. ICT-middelen kunnen ingeschakeld worden bij metingen in laboratoria, bij het automatisch scannen van ingevulde enqueˆteformulieren, bij de elektronische stemopname, enz.
datasimulatie
Vanuit didactisch standpunt is het simuleren van data een interessant hulpmiddel in klasverband. Datasimulatie genereert (meestal automatisch) data aan de hand van een generator van lukrake getallen of andere software. Alle ICT-gerichte hulpmiddelen voor statistiek beschikken over routines om zogenaamde lukrake getallen (random numbers) te genereren. Op die manier kunnen zoveel data gegenereerd worden als men wil. Deze data kunnen voldoen aan bepaalde voorwaarden, bijvoorbeeld behorend tot een interval (0; 1) als het gaat over toevals- of stochastische resultaten, een interval (1; 42) als het gaat over Lotto-resultaten, of gegevens uit een kansdichtheids- of verdelingsfunctie zoals de binomiale of de normale probabiliteitsfunctie enz. Eenvoudige voorbeelden zijn het simuleren van het opgooien van een muntstuk, het rollen van een dobbelsteen of enig ander kansspel. Een ander voorbeeld is het genereren van de X- of Z-waarden uit een normaal verdeeld universum, waarbij men de leerlingen kan laten toetsen of ze inderdaad normaal verdeeld zijn. Erg didactisch interessant is het simuleren van de centrale limietstelling. Meer achtergrondinformatie over het genereren van lukrake getallen om data te simuleren is op het internet te vinden.1
rechtstreeks
Naast zelfverzamelde of gesimuleerde data, zijn data dikwijls rechtstreeks
beschikbare data
beschikbaar, wat heel wat energie en tijd kan besparen. Bij wijze van voorbeeld illustreren we gegevens uit de internetdatabank e-Atlas2 van de Internationale Diabetes Organisatie. Diabetes of suikerziekte is een typische aandoening van onze westerse beschaving, veroorzaakt door junkfood, te vet eten, frisdranken, enz. Diabetes staat in de topvijf van dodelijkste ziektes in de wereld. Preventie is noodzakelijk maar moeilijk omdat de ziekte in eerste instantie niet gevaarlijk lijkt... tot het te laat is. Dan riskeren we blind te worden of een voet kwijt te raken. In de database e-Atlas kan je alle info vinden om relaties te leggen tussen verschillende soorten data rond diabetes. Wij beperken ons hier tot data i.v.m. de levensverwachting van vrouwen en mannen, maar de gegevens over diabetes kunnen we ook hanteren om te bepalen waarom mensen sterven bij gebrek aan insuline, hoeveel diabetes kost aan de gezondheidszorg in 140 verschillende landen, enz.
voorbeeld
In Figuur 1 staat een deel van de oorspronkelijke gegevens. Door de knop bovenaan links, aangegeven met ‘export to xls’, in te drukken kun je de gegevens exporteren naar Excel (.xls is het dataformaat voor Excel-bestan-
ICT EN ONDERWIJSVERNIEUWING
&
AFL. 7, SEPTEMBER 2004, 13 ONDERWIJS EN LEREN
Black plate (14,1)
DIDACTIEK & STATISTIEK 1 &
6
den). Zo krijg je Figuur 2, klaar voor verdere verwerking in Excel. Dit illustreert het belang dat aan de compatibiliteit van datasets met Excel wordt gehecht. Dit is geen uitzonderingsgeval maar eerder de normale praktijk. Figuur 1 : diabetesdata voor Europese landen
AFL. 7, SEPTEMBER 2004, 14 ONDERWIJS EN LEREN
&
ICT EN ONDERWIJSVERNIEUWING
Black plate (15,1)
DIDACTIEK & STATISTIEK 1 &
7
Figuur 2 : gee¨xporteerde data naar Excel
De data zijn afkomstig uit verschillende Europese landen en het resultaat van eerdere metingen in die diverse landen. De gegevens weergegeven door een zwart vierkantje duiden ontbrekende waarden aan, in het Engels aangeduid als ‘missing values’. Merk ook op dat de variabele ‘Country’ van het nominale type is. 2.2. Gegevensbeschrijving en grafische voorstelling
statistisch
Zodra men over een ICT-gestuurde dataset beschikt, kan men die verder beschrijven in de vorm die men wenst. Een goede databeschrijving met
onderzoek
eventueel een grafische voorstelling (histogram, polygoon, spreidingsdia-
tweede stap in het
gram, ...) bereidt de statisticus voor op een grondige data-analyse, gebaseerd op erkende statistische beslissingsmethodieken. Een typisch voorbeeld van grafische databeschrijving met behulp van ICT is de diabetesdatabase. In Figuur 3 wordt eerst de levensverwachting van mannen en vrouwen in de Europese landen getoond. Het is meteen afleesbaar dat de vrouwen betere levenskansen hebben dan de mannen. Wanneer we de mannelijke en vrouwelijke levensverwachting van de verschillende landen tegenover elkaar uitzetten, krijgen we in Figuur 4 een spreidingsdiagram met alle data onder de bissectrice, gevolg van het feit dat de vrouwen langer leven.
ICT EN ONDERWIJSVERNIEUWING
&
AFL. 7, SEPTEMBER 2004, 15 ONDERWIJS EN LEREN
Black plate (16,1)
DIDACTIEK & STATISTIEK 1 &
8
Figuur 3 : histogram van de levensverwachting
Figuur 4 : spreidingsdiagram van de levensverwachting
turven en sorteren
Indien nodig kunnen gegevens in een frequentietabel verzameld worden via
via de pc
het zogenaamde turven, een tijdrovende bewerking als die manueel uitgevoerd moet worden. Ook hier kan de computer helpen om dit turven op automatische wijze te laten gebeuren. Zo kan je met behulp van een elektronisch rekenblad je gegevens laten sorteren, waardoor het bepalen van de frequenties van elk interval sterk vereenvoudigd wordt. Door het intikken van de intervalgrenzen, kan je ook in Excel een frequentietabel laten gene-
AFL. 7, SEPTEMBER 2004, 16 ONDERWIJS EN LEREN
&
ICT EN ONDERWIJSVERNIEUWING
Black plate (17,1)
DIDACTIEK & STATISTIEK 1 &
9
reren vanuit de oorspronkelijke dataset. Je kunt dan zelfs aanvinken of je ook een grafiek wilt. We illustreren beide methoden voor een eenvoudige dataset met 30 examenresultaten voor wiskunde (maximum is 20). Na het inbrengen van de examenresultaten in kolom A (met de naam ‘Punten’), kopieer je deze kolom in kolom B. Na sortering en bepaling van de intervalgrenzen is het vastleggen van de kolom met de absolute frequenties eenvoudig. Bij de methode van Excel moet je de dataset en de intervalgrenzen ingeven, waarna je de routine ‘Histogram’ activeert. Resultaat is het automatisch genereren van de frequentietabel, indien gewenst met een grafiek. De kengetallen gemiddelde en standaarddeviatie en het betrouwbaarheidsinterval werden apart berekend, zoals we in de volgende paragraaf zullen zien. Door de intervalgrenzen te wijzigen en de routine opnieuw uit te voeren, kan je het effect illustreren van de intervalbreedte op de steekproefverdeling. Figuur 5 : frequentietabel genereren in Excel
ICT EN ONDERWIJSVERNIEUWING
&
AFL. 7, SEPTEMBER 2004, 17 ONDERWIJS EN LEREN
Black plate (18,1)
DIDACTIEK & STATISTIEK 1 &
10
2.3. Gegevensanalyse derde stap in het
Data-analyse is de volgende stap in het statistisch onderzoek. Een eerste
statistisch
fase is het berekenen van kengetallen van de steekproef zoals gemiddelden
onderzoek
en varianties. In de figuur van de examenresultaten werden deze steekproefstatistieken toegevoegd. Ze werden automatisch berekend uit de oorspronkelijke dataset na uitvoering van de bijbehorende functies. Kengetallen van de steekproef laten ons toe verdere analyses uit te voeren zoals : n
normaliteitstesten;
n
bepaling van betrouwbaarheidsintervallen;
n
testen van nulhypotheses;
n
variantieanalyses;
n
correlatieanalyses;
n
niet-parametrische tests.
betrouwbaarheids-
Bij wijze van voorbeeld kunnen we uit de steekproef met de examenresul-
interval
taten het betrouwbaarheidsinterval voor het populatiegemiddelde berekenen. Hier worden we meteen geconfronteerd met een groot gevaar bij automatische berekening. Waakzaamheid is geboden opdat we steeds de correcte techniek toepassen. Het betrouwbaarheidsinterval kan in Excel eenvoudig berekend worden door de functie ‘Betrouwbaarheid( )’ te activeren. Deze functie veronderstelt echter dat de standaarddeviatie van de populatie gekend is en wordt ingetikt. Als alternatief wordt dan dikwijls de steekproefvariantie ingevuld, wat resulteert in de onder- en bovengrenzen van de tweede rij in de tabel. Om correct te werken, moeten we echter de Student verdelingsfunctie toepassen. De resultaten van beide benaderingen zijn weergegeven aan de rechterzijde van het werkblad met de resultaten in de figuur 5. Hoewel de verschillen niet groot zijn, is meteen duidelijk hoe verleidelijk het is bij automatische berekeningen gegevens in te vullen die men ter beschikking heeft zonder zich te bekommeren om de theoretische achtergrond. Dergelijke praktijken moeten vermeden worden. Deze waarschuwing is onafhankelijk van de gebruikte drager of het statistisch pakket : kritische zin en relativering zijn essentieel om correct te werken. Statistiek heeft juist door onzorgvuldig gebruik en bewuste vervorming van de gegevens of de interpretaties een slechte reputatie.
correlatie- en
Het diabetesvoorbeeld kunnen we gebruiken om de correlatie- en regressie-
regressierekening
rekening op automatische wijze toe te passen om het verband tussen twee variabelen numeriek vast te leggen. De graad van samenhang tussen de mannelijke en vrouwelijke levensverwachting wordt berekend via de correlatiecoe¨fficie¨nt, het eventuele lineaire verband door de regressierechte. Met een rekenblad worden deze parameters berekend via de eenvoudige oproep
AFL. 7, SEPTEMBER 2004, 18 ONDERWIJS EN LEREN
&
ICT EN ONDERWIJSVERNIEUWING
Black plate (19,1)
DIDACTIEK & STATISTIEK 1 &
11
van twee subroutines. De correcte interpretaties kunnen echter zware problemen opleveren. De resultaten voor het diabetesvoorbeeld zijn (regressie van mannen als X naar vrouwen als Y) : Correlatiecoe¨fficie¨nt r2
Richtingscoe¨fficie¨nt
Snijpunt met de as
0.89344
0.623
33.71
Wegens de goede correlatie kan de regressielijn functioneren als schatting voor de levensverwachting binnen Europa. Als controle voor Belgie¨ : X = 74 geeft voor de vrouwelijke levensverwachting : Y = 0.623 * 74 + 33.71 = 79.8 wat een goede schatting is voor de Belgische vrouwelijke levensverwachting van 81 jaar. De bovenstaande voorbeelden tonen zowel de meerwaarde als de tijdswinst aan van ICT-ondersteunde statistiek. De aldus vrijgekomen tijd kan besteed worden aan een grondigere inzichtelijke behandeling van de theoretische achtergrond.
&
3. ICT-gerichte leermiddelen voor statistiek
3.1. De wetenschappelijke en grafische rekenmachine De wetenschappelijke en grafische rekenmachine (GRM) is wellicht het eerste en meest voor de hand liggende leermiddel dat in aanmerking komt voor toepassing binnen het wiskundeonderwijs in het algemeen en het deelgebied statistiek in het bijzonder. voor- en nadelen
Het nut van een rekenmachine kan moeilijk betwijfeld worden. De voornaamste voordelen zijn de vrijwel onbeperkte beschikbaarheid van het toestel, de eenvoud in gebruik en de ruime rekenmogelijkheden. Deze mogelijkheden worden trouwens steeds beter en de inspanningen voor didactische ondersteuning vanwege de fabrikanten zijn opvallend. De fabrikanten van de GRM’s hebben zich terdege ingespannen om zo goed mogelijk hun grote broers te benaderen inzake functionaliteit. Hierdoor zijn ze erin geslaagd de meeste statistische voorstellingen en berekeningen te implementeren. Het voorbeeld van een boxplot kan daarbij als richtinggevend dienen. Mede daardoor blijft de grootste handicap wellicht de beperkte displaymogelijkheden. Dit is in de eerste plaats erg beperkend voor leerlingen met gezichtsproblemen, maar ook anderen ervaren het minischermpje met zijn grove pixels als de zwaarste handicap. Ook de hakige grafische voorstellingen nodigen niet uit tot goed inzicht. Een tweede nadeel is de wirwar
ICT EN ONDERWIJSVERNIEUWING
&
AFL. 7, SEPTEMBER 2004, 19 ONDERWIJS EN LEREN
Black plate (20,1)
DIDACTIEK & STATISTIEK 1 &
12
van toetsen, elk met soms wel drie functionaliteiten, die bovendien nog moeilijker te lezen zijn dan de tekst op het schermpje. In mindere mate, maar toch nog behoorlijk nadelig zijn de volgende onhandigheden : 1
beperkte opslagmogelijkheden van data, waardoor men de datasets moet beperken tot kleine, onbeduidende en onrealistische hoeveelheden getallen;
2
weinig overzicht bij gegevensinvoer;
3
noodzaak aan manuele invoer van de gegevens, wat erg tijdrovend is
4
voor grotere datasets; beperkt aantal variabelen (twee);
5
weinig compatibiliteit met statistische software;
6
te klein scherm voor duidelijke grafische voorstellingen;
7
beperkte functionele mogelijkheden inzake data-analyse.
uitrusting
Een ander heikel punt is de keuze van een gepaste rekenmachine doorheen
gemiddelde GRM
de verschillende jaren van het SO. Het ligt voor de hand dat leerlingen van de eerste graad het best af zijn met een eenvoudig toestel. Dit betekent echter dat in de tweede en derde graad een nieuw en duurder toestel met grafische (en programmeerbare ?) mogelijkheden aangekocht moet worden. Bovendien is een connectie met de pc een supplementaire mogelijkheid die eveneens afgewogen moet worden, zeker in de sterk wetenschappelijke studierichtingen en het hoger onderwijs. Toch mogen we niet voorbijgaan aan de steeds groeiende mogelijkheden, ook en vooral op het gebied van de waarschijnlijkheidsrekening en de statistiek. De middenklasse-GRM’s beschikken over de volgende mogelijkheden op het gebied van kansrekenen en statistiek : Kansrekenen Faculteit, toevalsgetallen n
Statistiek (numerisch grafiek) Aantal variabelen : 2
n
n
Combinaties, permutaties
n
Gemiddelde, mediaan
n
Normaalverdeling
n
Standaardafwijking
n
Waarschijnlijkheidsverdelin-
n
Regressie : lineaire, ex, macht,
gen (binomiale, normale, ...)
log/veelterm (2,3,4), sinus n
n
Correlatie, benadering Histogrammen, ogief, puntenwolk, boxplot...
Deze functionaliteiten volstaan ruimschoots om de leerplannen in al hun geledingen te realiseren. De nieuwste topmodellen hebben bovendien nog geavanceerde mogelijkheden, die echter meer tot het domein van het hoger onderwijs behoren :
AFL. 7, SEPTEMBER 2004, 20 ONDERWIJS EN LEREN
&
ICT EN ONDERWIJSVERNIEUWING
Black plate (21,1)
DIDACTIEK & STATISTIEK 1 &
13
Geavanceerde statistieken Tests (z3, t*, chi2*, F*, variantieanalyse) n
n
Intervallen (z, t)
n
Verdeling (normale*, student-t*, chi2*, F*, binomiale, Poisson, geometrische)
n
Sinusoı¨dale regressie (mogelijkheid tot grafische voorstelling)
Vergeten we hierbij niet dat de topmodellen vlot in de prijsklasse van de pc’s komen. 3.2. De pc met het elektronisch rekenblad als leermiddel bij statistiek lessen in gebruik
Alle leerlingen krijgen tijdens hun opleiding in de tweede graad van het
elektronisch
secundair onderwijs onderricht in het elektronisch rekenblad, nl. in de les-
rekenblad
sen (toegepaste) informatica. Aansluitend op deze cursus in de lessen lijkt het gebruik van de pc in het algemeen en van het elektronisch rekenblad in het bijzonder tijdens de lessen statistiek even vanzelfsprekend tijdens de lessen statistiek. Vele leraren hanteren trouwens dit didactisch leermiddel naast of samen met de GRM.
voor- en nadelen
De voordelen van het gebruik van het elektronisch rekenblad zijn legio en
van rekenblad
kunnen afgeleid worden uit de nadelen van een GRM. Die nadelen worden bij een pc omgezet in evenveel voordelen, hoewel het scherm van een pc nog te dikwijls als te klein wordt ervaren, zeker bij grotere rekenbladen. Het splitsen van het scherm en het blokkeren van titels zijn handigheden om dit tekort aanvaardbaar te maken.
functionaliteiten
Als leermiddel bij uitstek voor het vak statistiek hebben we nood aan een pc
van elektronisch
met elektronisch rekenblad. Het meest gebruikte elektronische rekenblad is
rekenblad
alleszins Excel van Microsoft, maar OpenOffice, Lotus 1-2-3 of Gnumeric onder Linux kunnen evengoed. Al de huidige pc’s beschikken over voldoende krachtige processoren en geheugens om statistische problemen op te lossen. Hoewel Excel niet echt een statistisch pakket is en ook nooit die pretentie had, beschikt het over zoveel statistische functionaliteiten dat het in vele opzichten de vergelijking kan doorstaan met de meer professionele, maar erg dure statistische pakketten. De statistische functionaliteiten kunnen als volgt ingedeeld worden : n
n
n
voorstellingen van uitgebreide datasets; basisrekenoperaties en basisrekenfuncties; grafische voorstellingen;
n
statistische functies;
n
subroutines in VBA (= Visual Basic for Applications).
ICT EN ONDERWIJSVERNIEUWING
&
AFL. 7, SEPTEMBER 2004, 21 ONDERWIJS EN LEREN
Black plate (22,1)
DIDACTIEK & STATISTIEK 1 &
14
datasets voorstellen
Als je de aaneengesloten kolomvoorstelling van variabelen respecteert, kun
in lijststructuur
je in Excel uitgebreide gegevensverzamelingen weergeven. Je moet alleen opletten dat de gegevens in de zogenaamde lijststructuur staan. In de eerste rij vermelden we de namen van de variabelen, terwijl in elke kolom de waarden worden geplaatst die de variabele met naam in de eerste rij aannemen. Rijen en kolommen van een lijststructuur moeten een aaneengesloten blok vormen. Bijkomende kolommen kunnen vlot gegenereerd worden. Mogelijkheden zoals splitsen van werkbladdelen en blokkeren van titels laten je toe, zelfs bij uitgebreide datasets, alle variabelen binnen ‘schermbereik’ te houden. Het genereren van verschillende werkbladen binnen e´e´n werkmap maakt het geheel van de toepassing nog overzichtelijker. Bij voorkeur plaatsen we de datalijst in het eerste werkblad, om aldus een consistente gebruikersomgeving te scheppen.
rekenmogelijkheden
De celgeorie¨nteerde rekenmogelijkheden van een elektronisch rekenblad zijn enorm, niet alleen voor de toepassingen binnen kansrekening en statistiek, maar evenzeer voor andere disciplines (wiskunde, economie, biologie, chemie, fysica, ...). Het betreft de klassieke rekenoperaties : optellen, aftrekken, vermenigvuldigen, delen en machtsverheffen, die zowel op individuele cellen als op reeksen van cellen toegepast kunnen worden. Ingewikkelder wiskundige berekeningen kunnen uitgevoerd worden met behulp van de uitgebreide verzameling wiskundige functies (sommeren, afronden, gehele waarde, vierkantswortel, lukrake getallen genereren, ...). Het is wel aangewezen dat deze algemene mogelijkheden afzonderlijk en vooraf worden aangeleerd, bijvoorbeeld in het vak (toegepaste) informatica. Specifiek voor statistiek bevat de deelgroep statistische functies een groot aantal functies die handig ingezet kunnen worden om statistische berekeningen uit te voeren.
grafieken
Grafieken maken van de variabelen is eenvoudig. De gangbare grafieken die men bij statistiek hanteert, kunnen gemakkelijk aangemaakt worden : histogram, polygoon of ogief, spreidingsdiagram, cirkeldiagram, ... Hier heeft Excel maar e´e´n tekort voor het secundair onderwijs : het tekenen van de welbekende boxplot is standaard niet voorzien binnen Excel, maar moet via een omweg gebeuren. De vindingrijkheid van de meeste leerkrachten moet hen toelaten gemakkelijk een boxplot te genereren met behulp van het financieel gerichte grafiektype ‘Hoog-laag-slot’ met vijf in te voeren waarden. Ook op het internet vind je trouwens hulp hiervoor.4
statistische functies
Het aantal statistische functies binnen Excel is enorm. Zij situeren zich op deelaspecten zoals gegevensvergaring en combinatieleer.
AFL. 7, SEPTEMBER 2004, 22 ONDERWIJS EN LEREN
&
ICT EN ONDERWIJSVERNIEUWING
Black plate (23,1)
DIDACTIEK & STATISTIEK 1 &
15
Aselect ( ) Aselecttussen ( ) Aantal ( ) Aantaltussen ( ) Interval ( )
Lukraak ( ) Fact ( ) Combin ( ) Permut ( )
Om in Excel functies op te roepen, plaatst men de argumenten tussen ronde haken. Daarom lieten we in de bovenstaande voorbeelden de namen van de functies symbolisch volgen door ( ). beschrijvende statistieken
Andere statistische functies laten toe beschrijvende statistieken te bepalen (centrale tendentie, spreiding en vorm van de verdeling). Kleinste ( ) Grootste ( ) Kwartiel ( ) Max ( ) Min ( ) Mediaan ( ) Percentiel ( )
Gemiddelde ( ) Harm.gem ( ) Meetk.gem ( ) Standaarddev ( ) Variantie ( )
Stand.fout ( ) Modus ( ) Kurtosis ( ) Scheefheid ( )
waarschijnlijkheids-
Een groot aantal waarschijnlijkheidsverdelingsfuncties laat toe de waar-
verdelingsfuncties
schijnlijkheid te berekenen van bepaalde steekproefresultaten (in het discontinue geval) of de kansdichtheid (bij continue verdelingsfuncties). Omgekeerd zullen de inverse functies de waarden geven overeenkomstig bepaalde waarschijnlijkheden. De nulhypothesetoetsen zijn vertegenwoordigd in de vorm van de Z-toets, de T-toets, de chi-kwadraattoets en de Ftoets voor twee steekproeven. Binomiale.verd ( ) Crit.binom ( ) Neg.binom.verd ( ) Hypergeo.verd ( ) Poisson ( ) Norm.verd ( ) Norm.inv ( ) Betrouwbaarheid ( ) Stand.norm.verd ( ) Stand.norm.inv ( ) T.verd ( ) en T.inv ( )
correlatie en regressie
Expon.verd ( ) Chi.kwadraat ( ) Chi.kwadraat.inv ( ) Fisher ( ) Gamma ( ) Z.toets ( ) T.toets ( ) Chi.toets ( ) F.toets ( )
Een volgende groep heeft te maken met meerdere-variabelenonderzoek, meer bepaald de correlatie- en regressierekening :
ICT EN ONDERWIJSVERNIEUWING
&
AFL. 7, SEPTEMBER 2004, 23 ONDERWIJS EN LEREN
Black plate (24,1)
DIDACTIEK & STATISTIEK 1 &
Correlatie ( ) Covariantie ( ) R.Kwadraat ( ) subroutines
16
Richting ( ) Snijpunt ( )
Trend ( ) Voorspellen ( )
Behalve over statistische en andere functies beschikt Excel ook over een aanzienlijke groep subroutines. Een functie wordt gekenmerkt door e´e´n resultaat, de functiewaarde, die in de actieve cel wordt geplaatst. Bij een subroutine bestaat het resultaat uit verschillende waarden die ergens op het actieve werkblad worden geplaatst. Je moet zelf aangeven waar. Subroutines zijn stukjes software, geschreven in VBA en verzameld in een module Gegevensanalyse van het afrolmenu Extra op de Excel menubalk. Vo´o´r het eerste gebruik moet je deze software eerst activeren. Eens geı¨nstalleerd, zijn deze subroutines binnen Excel steeds bruikbaar. De volgende routines maken er deel van uit. Lukrakegetallengenerator Rang en percentielen Histogram
Beschrijvende statistieken Steekproeven
Z-test, T-test Regressie
Correlatie
Over macro’s en VBA-routines kunnen we kort zijn. Het aanmaken ervan verschilt in geen enkel opzicht van de algemene aanmaakprocedure binnen Excel. Hiervoor verwijzen we dan ook naar de cursus Excel. Zelfgeschreven macro’s en subroutines voor statistiek kunnen naar eigen believen toegevoegd worden in een apart te installeren bibliotheek. Voordelen van MS-Excel Excel is als onderdeel van de MS-Office-software op de meeste pc’s geı¨nstalleerd, samen met het Windows-besturingssysteem. Echt ‘gratis’ kun je het pakket niet noemen (zie verder bij 3.5). Toch heeft het een aantal voordelen : n
Excel is de standaard om numerieke gegevens in een rekenblad te plaatsen;
n
n
Excel is bruikbaar binnen andere domeinen dan statistiek (wiskunde/ wetenschappen, economie, ...); het aanbod aan functies en subroutines overschrijdt ruimschoots de eindtermen van het secundair onderwijs. Voor het hoger onderwijs ontbreken o.m. de niet-parametrische toetsen.
AFL. 7, SEPTEMBER 2004, 24 ONDERWIJS EN LEREN
&
ICT EN ONDERWIJSVERNIEUWING
Black plate (25,1)
DIDACTIEK & STATISTIEK 1 &
17
Nadelen van MS-Excel Excel is geen statistisch pakket en heeft ook nooit gepretendeerd dat te zijn. Het is en blijft een elektronisch rekenblad dat initieel voor administratieve en boekhoudkundige (reken)doeleinden werd ontworpen. Dat houdt in dat men rekening moet houden met beperkingen, fouten en gebreken als men Excel wil hanteren voor Statistiek. De voornaamste nadelen zijn : n
Excel heeft geen routines om ontbrekende gegevens, extreme waarden e.d. aan te pakken en reageert daar foutief op;
n
n
boxplot wordt niet standaard aangeboden als grafiektype; grafieken worden niet steeds gebruiksvriendelijk getoond, waardoor de gebruiker aanpassingen moet doen, bijvoorbeeld schaalaanpassingen van de assen e.a.;
n
er zijn geen routines voor niet-parametrische toetsen;
n
de statistische mogelijkheden zijn veel beperkter dan die van de professionele statistische pakketten;
n
door gebrek aan structuur is Excel niet echt geschikt om te programmeren in een multi-useromgeving.
Veel gebreken kunnen echter opgelost worden met behulp van informerende internetsites, via de aanmaak van macro’s of met behulp van eigen programmatie in VBA. Bij wijze van voorbeeld tonen we in Figuur 6 en Figuur 7 een boxplot, niet standaard aanwezig in Excel, maar toch gegenereerd via de bestaande functionaliteiten (voor een werkwijze : zie John Peltier’s site). Figuur 6 : horizontale boxplot
ICT EN ONDERWIJSVERNIEUWING
&
AFL. 7, SEPTEMBER 2004, 25 ONDERWIJS EN LEREN
Black plate (26,1)
DIDACTIEK & STATISTIEK 1 &
18
Figuur 7 : verticale boxplot
3.3. Statistische toepassingspakketten SPSS en andere
Er zijn verschillende statistische computerpakketten op de markt zoals
pakketten
SPSS, Statistica en SAS. Het valt niet te betwijfelen dat de statistische pakketten de beste en wetenschappelijk meest verantwoorde resultaten geven. Zij beconcurreren elkaar op het gebied van volledigheid van statistische functies en gebruiksvriendelijkheid. Ter illustratie gaan we in op enkele kenmerken van SPSS (Statistical Package for Social Scientists). Het werkmateriaal van bijvoorbeeld SPSS bestaat uit : n
een datamatrix, waarbij in de kolommen de variabelen staan (met hun naam helemaal bovenaan) en in de rijen de waarden die deze variabelen aannemen;
n
drie standaardvensters : applicatievenster, outputvenster en data-editorvenster.
standaardvensters
Het data-editorvenster bevat de gegevens van de datamatrix en bestaat uit een
in SPSS
aaneengesloten geheel van kolommen — variabelen genoemd — en rijen — lijnen of gevallen genoemd. Zij stellen de steekproefresultaten voor. Het applicatievenster dient om de data te besturen en om bewerkingen op de waarden van de variabelen af te sturen. Afrolmenu’s in dit venster kun je hiervoor gebruiken. Het outputvenster bevat de resultaten.
AFL. 7, SEPTEMBER 2004, 26 ONDERWIJS EN LEREN
&
ICT EN ONDERWIJSVERNIEUWING
Black plate (27,1)
DIDACTIEK & STATISTIEK 1 &
procedures in SPSS
19
SPSS maakt een onderscheid tussen de volgende procedures : n
procedures voor beschrijvende statistiek voor het weergeven van steekproefkenmerken : gemiddelden, frequenties, verdelingen, correlaties, grafische voorstellingen, ...;
n
procedures voor vergelijkende statistiek : gemiddelden vergelijken tussen groepen door middel van kruistabellen, toetsen op het gemiddelde, ...;
n
procedures voor multivariate statistiek : regressiemodellen, discriminantenanalyse, ...;
n
manipulatie in SPSS
procedures voor datareductie : principale componentenanalyse, clusteranalyse, ...
De mogelijkheid om ontbrekende waarden te manipuleren is erg handig omdat in elke dataset wel ergens foutieve waarden worden ingetikt of waarden ontbreken. Je kunt dan aangeven wat met deze ontbrekende waarden moet gebeuren. Op een analoge manier kun je extreme waarden bespelen.
statistieken : Excel
Bij wijze van voorbeeld geven we in Figuur 8 en Figuur 9 een vergelijkende afdruk van beschrijvende statistieken in Excel en SPSS. Het betreft gegevens
en SPSS vergeleken
uit de eerder vermelde internet database e-Atlas vanwege de Internationale
beschrijvende
Diabetesorganisatie. Als we de beschrijvende statistieken van de variabelen ‘Female life expectancy’ en ‘Male life expectancy’ opvragen in Excel, krijgen we als resultaat Figuur 8. Figuur 8 : beschrijvende statistieken in Excel
ICT EN ONDERWIJSVERNIEUWING
&
AFL. 7, SEPTEMBER 2004, 27 ONDERWIJS EN LEREN
Black plate (28,1)
DIDACTIEK & STATISTIEK 1 &
20
Nadat we de dataset van Excel in SPSS hebben geı¨mporteerd en na de beschrijvende statistieken als analysetool te hebben geactiveerd, krijgen we de resultaten in SPSS (zie Figuur 9). Figuur 9 : beschrijvende statistieken in SPSS
De resultaten zijn vanzelfsprekend gelijk, maar SPSS toont ze automatisch in gebruiksvriendelijke vorm. Bij Excel moet je ze herformatteren. Een andere handigheid is dat SPSS het kengetal ‘‘standaard fout’’ koppelt aan het kengetal waarvan het afgeleid is (de standaardfout van om het even welk kengetal is gedefinieerd als de standaarddeviatie van de steekproefvariantie van dat kengetal en is een maat voor de informatie ons geleverd door de waarde van dat kengetal; de S.E. of standaardfout van een kengetal zou best klein zijn t.o.v. de waarde van het kengetal zelf). SPSS geeft van elk kengetal (gemiddelde, scheefheid en kurtosis) de standaardfout, Excel geeft ze enkel voor het gemiddelde. Een functionele vergelijking tussen MS-Excel en SPSS levert ons het volgende : MS-EXCEL
SPSS
Software standaard aanwezig (OpenOffice is geldig alternatief)
Software moet aangekocht worden
Functionaliteiten van de software zijn gekend door de gebruiker
Nieuw aan te leren functionaliteiten
Beperkt aanbod aan toepassingsgerichte modules
Uitgebreid aanbod aan toepassingsgerichte modules
Geen aanbod aan praktijkgerichte oplossingen
Uitgebreid aanbod aan praktijkgerichte oplossingen (enqueˆtes, evaluaties, ...)
Integratie in het bedrijfsproces (administratie, planning, ...) is moeilijk en moet door de gebruiker gerealiseerd worden
Eenvoudige integratie mogelijk in het bedrijfsproces
Uitbreiding is mogelijk via eigen programmatie m.b.v. VBA-routines
Uitbreiding is mogelijk dank zij het ‘‘Developer’s Kit’’
AFL. 7, SEPTEMBER 2004, 28 ONDERWIJS EN LEREN
&
ICT EN ONDERWIJSVERNIEUWING
Black plate (29,1)
DIDACTIEK & STATISTIEK 1 &
21
aankoopformules
Het prijskaartje dat bij professionele statistische pakketten hoort, is aan-
voor SPSS
zienlijk. Een licentie op een statistisch toepassingspakket is peperduur. Gelukkig bestaan er voor het onderwijs allerlei omwegen waardoor men zich de software kan aanschaffen tegen een studentvriendelijker prijs. Laten we opnieuw het voorbeeld nemen van SPSS. Hiervoor bestaan de volgende aankoopformules : n
een studentenversie, zoals bij SPSS, kan tegen een studentvriendelijke prijs (ca. ¤ 100) aangekocht worden in de boekhandel. Zo’n studentenversie heeft serieuze beperkingen zoals het aantal variabelen dat beperkt blijft tot 50 en het aantal lijnen dat niet hoger dan 1000 mag zijn. Een ander nadeel is dat je niet met syntaxbestanden kan werken. Dit is erg vervelend want inzicht in de commandostructuur is toch heel belangrijk (zeker voor didactisch gebruik). Bovendien verschenen geen upgrades meer na de versie 6.1 (thans is SPSS aan versie 12.0).
n
een ‘graduate’ versie, ‘SPSS Student Graduate Pack’ genoemd. Met dit pakket beschik je over het basispakket van SPSS en twee bijkomende modules naar keuze om je taken en opdrachten snel en eenvoudig op te lossen. Deze versie is ongelimiteerd in die zin dat je onbeperkt lijnen en variabelen kan inlezen. Verder beschik je over alle analytische mogelijkheden, zoals bij een volledige SPSS-licentie. De kostprijs is ‘schoolvriendelijk’.
n
verschillende multifunctionele aanbiedingen voor het onderwijs, o.m. : – het pakket wordt voor e´e´n school of scholengemeenschap aangekocht, bijvoorbeeld voor de administratie, maar men beschikt evenzeer over een licentie om het voor onderwijsdoeleinden te hanteren; –
het pakket wordt door een groep scholen aangekocht, bijvoorbeeld een onderwijsnet, een begeleidingsdienst, enz. Alle scholen van de groep kunnen vrij beschikken over het pakket en men kan profiteren van andere aanbiedingen (upgrades, extra modules, opleiding, ...).
3.4. Statistische informatievergaring via ICT andere ICT-gerelateerde leermiddelen
Naast de eerder geciteerde mogelijkheden kunnen diverse andere ICT-gerelateerde leermiddelen gehanteerd worden : het internet, cd-rom’s, statistische publicaties, enz.
internet
De didactische mogelijkheden van het internet voor het onderricht in de Statistiek zijn niet te onderschatten. Zij situeren zich op het vlak van : n
gegevensvergaring : datasets kunnen vrij van het internet geplukt worden;
n
n
ICT EN ONDERWIJSVERNIEUWING
gevallenstudies via probleemgestuurde situaties; vakondersteunende info zoals de geschiedenis van de statistiek e.a.
&
AFL. 7, SEPTEMBER 2004, 29 ONDERWIJS EN LEREN
Black plate (30,1)
DIDACTIEK & STATISTIEK 1 &
22
vakoverschrijdend
Een interessant voorbeeld van via het internet ingeladen datasets is het
leren
eerder getoonde fragment uit de diabetesgegevensbank e-Atlas van de International Diabetes Foundation. Het is een uitstekend middel om probleemgestuurd rond een vakoverschrijdend thema over gezondheidszorg te werken. De jeugd kan preventief gewezen worden op het grote gevaar van diabetes, een ziekte die door onze slechte westerse eetgewoonten sterk toegenomen is en nu de landen uit het voormalige Oostblok dreigt te veroveren. In Tsjechie¨ slaagt men er blijkbaar in preventieve maatregelen te nemen om de verspreiding van de ziekte in te tomen Voor een probleemdefinitie raadpleeg je best het overzicht van de tv-uitzending (zie 5. Literatuur). Een groot aanbod aan praktijksituaties uit het domein van de probleemgerichte aanpak in diverse domeinen zoals biologie, bedrijfsbeheer, geografie en psychologie is terug te vinden op het internet.5 Niet alleen vind je er talrijke praktijkvoorbeelden met oplossingen, maar tegelijk een globaal overzicht van de statistische terminologie en technieken, netjes opgedeeld in een tiental domeinen (.../steps/glossary/). Een niet te missen naslagwerk voor elke leerkracht in de statistiek.
vakondersteunende
Vakondersteunende info is op vele websites te vinden. Ze is meestal afkom-
info
stig van hogescholen en/of universiteiten uit het buitenland maar ook in Vlaanderen begint men zich te roeren. Een voorbeeld daarvan is het samenwerkingsproject Bij wijze van voorbeeld6 dat de hogescholen Katho en Artevelde samen met de Antwerpse en Leuvense universiteiten ontwikkelden in het kader van een door de overheid gefinancierd innovatief project ICTO (zie 5. Literatuur). Via enkele navigatiewegen kom je bij het zelfstudieproject voor statistiek met talrijke Java-applets. Wel blijft het opzoeken van informatie op internet een tijdrovende en dikwijls frustrerende aangelegenheid omdat niet steeds het gezochte resultaat verkregen wordt. Zelfs voor interessante datasets moet men over voldoende creativiteit beschikken om een probleem te stellen, te analyseren en op te lossen.
statistische
Andere leermiddelen zijn statistische publicaties op cd-rom’s of andere in-
publicaties
formatiedragers. We denken hier in de eerste plaats aan Belgostat, een bijzonder omstandige economisch-statistische database van de Nationale Bank, die zowel via het internet als via cd-rom wordt verspreid. Een andere belangrijke informatiebron zijn de jaarboeken van het Nationaal Instituut voor de Statistiek (NIS). In vijf grote steden van het land heeft het NIS zijn jaarboeken en gespecialiseerde publicaties voor u klaarliggen. Bovendien bestaat hun website7 uit domeinportalen van Conjunctuur, Gezondheid,
AFL. 7, SEPTEMBER 2004, 30 ONDERWIJS EN LEREN
&
ICT EN ONDERWIJSVERNIEUWING
Black plate (31,1)
DIDACTIEK & STATISTIEK 1 &
23
Arbeidsmarkt en Mobiliteit. Voor elk wat wils dus. Ook zijn de publicaties van onderwijsstatistieken of onderwijsindicatoren zeker het vermelden waard. 3.5. Gebruik van ‘Open Source Software’ Herman Bruyninckx houdt een warm pleidooi voor de stimulering van ‘vrije software’ in het onderwijs (zie 5. Literatuur). Dit is software die gratis gehanteerd kan worden volgens een copyleftsysteem. Linux en OpenOffice
Reeds eerder citeerden we dat Excel niet het aangewezen middel is om programmatuur te onderhouden. Excel scaleert niet naar grotere toepassingen, zeker niet indien deze toepassingen verdeeld zijn over verschillende computers. Bovendien zijn VBA-routines broeinesten voor virussen. Het goede nieuws bestaat er echter in dat je Excel-bestanden kunt gebruiken onder Linux, het vrij te downloaden en te gebruiken besturingssysteem dat hoe langer hoe meer markt verovert ten nadele van het Windows-besturingssysteem. Zelfs als je ervoor opteert binnen een Windows-omgeving te blijven werken, kun je Excel-bestanden lezen en bewerken met behulp van OpenOffice. Deze OpenOffice is te vergelijken met MS-Office, met dit enorme verschil dat het vrij te downloaden is en vrij gebruikt kan worden.8 Een ander kenmerk is dat OpenOffice alle functionaliteiten verzamelt van zowel de tekstverwerker als het elektronisch rekenblad.
Gnumeric
Een tweede voorbeeld van vrije software is het elektronische rekenblad Gnumeric9 waarbinnen je Excel-bestanden kunt importeren en gebruiken. De Gnumeric spreadsheet maakt deel uit van de Gnome desktopomgeving : een project om een vrije, gebruiksvriendelijke werkomgeving te cree¨ren. Zoals elke component of Gnome is Gnumeric vrij te gebruiken en gelicentieerd onder de benaming GNU GPL. Gnumeric wil geen kloon zijn van bestaande applicaties, maar een waardevolle vervanger van eigendomsgerichte spreadsheets. Gnumeric importeert probleemloos bestanden in Excel, Lotus 1-2-3, Applix, Sylk, XBase Quattro Pro, Dif, Plan Perfect en Oleo.
programmeertaal R
Voor ontwikkelaars bestaat er de programmeertaal R voor statistische berekeningen en grafieken. Naast de programmeertaal zelf levert het grafieken van hoog niveau, interfaces naar andere talen en mogelijkheden voor debugging. In tegenstelling tot commercie¨le pakketten zoals SPSS, SAS, ... wordt R ontwikkeld door een team van vrijwilligers verspreid over verschillende universiteiten wereldwijd. Het pakket is gratis beschikbaar voor iedereen. Op het internet10 kun je informatie vinden over deze programmatuur. De voordelen van R zijn onder meer : n
ICT EN ONDERWIJSVERNIEUWING
gratis beschikbaar;
&
AFL. 7, SEPTEMBER 2004, 31 ONDERWIJS EN LEREN
Black plate (32,1)
DIDACTIEK & STATISTIEK 1 &
24
n
interactief, met een syntax die dicht aanleunt bij de theorie;
n
zeer professionele plots;
n
ook bruikbaar voor meer geavanceerde technieken zoals : – structural equation models; –
mixed models, multilevel analysis;
–
clustering, classification, neural networks.
Geen van de vrije-softwarepakketten implementeert echter VBA-macro’s, waardoor alle vermelde VBA-subroutines uit de module Gegevensanalyse van Excel niet werkbaar zijn binnen OpenOffice. Wel beschikken ze over eigen scriptingmogelijkheden. Gnumeric implementeert ook een groot aantal wiskundige functies, zelfs meer statistische functies dan Excel.
&
4. Conclusies Het voorgaande toont voldoende aan dat het inschakelen van ICT binnen het vak Statistiek geen thema van discussie meer is. De mogelijkheden van zowel de GRM als de pc bewijzen hun didactische meerwaarde. Bij de inschakeling van ICT binnen Statistiek wordt de leerkracht geconfronteerd met een dilemma dat er geen hoeft te zijn : gebruik ik een GRM of een pc ? Beide hebben hun voor- en nadelen. Daarom opteren sommige leerkrachten voor het gebruik van beide en laten ze het aan de leerlingen over te beslissen wat de beste manier van werken is. De keuze van statistische software is in volle evolutie. Thans is Excel de grootste kandidaat, maar in de toekomst lijken Gnumeric en SPSS goede kandidaten om het vertrouwen van de scholen te winnen. Het internet verdient als gegevens- en informatiebron voor statistiek regelmatig geraadpleegd te worden, vooral bij onderwijsinnoverende methodieken.
&
5. Literatuur Bruyninckx, H., Vrije Software in het Onderwijs en De democratisering van de ICT V.3.7 : 6 februari 2002. Te raadplegen via de website : http ://www.mech.kuleuven.ac.be/ ~bruyninc. Clement, M. e.a., De BijVoorbeeld-databank, in ICT en onderwijsvernieuwing, Mechelen, Wolters Plantyn, 2004, rubriek Onderwijs en leren. De plaag uit het Westen. Tv-uitzending in de reeks Overleven op Canvas op zondag 5 oktober 2003 (raadpleegbaar via de website). Huff, D., How to Lie with Statistics, W. W. Norton & Company, New York — Londen (1954; 1993). Ott, R.L. en Longnecker, M., Statistical Methods and Data Analysis, fifth edition, Duxbury, Wadsworth Group, 2001.
AFL. 7, SEPTEMBER 2004, 32 ONDERWIJS EN LEREN
&
ICT EN ONDERWIJSVERNIEUWING
Black plate (33,1)
DIDACTIEK & STATISTIEK 1 &
25
SPSS For Windows, Student Version (Copyright 1994 by SPSS Inc.), published by Prentice Hall, Inc., Englewood Cliffs, New Jersey.
&
6. Internetsites met statistische info
Noten 1. http ://www.random.org 2. http ://www.idf.org/e-atlas 3. Een uitbreidingsmodule is noodzakelijk. 4. http ://www.geocities.com/jonpeltier/Excel 5. http ://www.stats.gla.ac.uk 6. http ://www.kuleuven.ac.be/icto/bv 7. http ://statbel.fgov.be 8. http ://www.openoffice.org 9. http ://www.gnome.org/projects/gnumeric 10. http ://allserv.ugent.be/~yrosseel/da/index.php ?path=R.html
ICT EN ONDERWIJSVERNIEUWING
&
AFL. 7, SEPTEMBER 2004, 33 ONDERWIJS EN LEREN
Black plate (34,1)
DIDACTIEK & STATISTIEK 1 &
26
AFL. 7, SEPTEMBER 2004, 34 ONDERWIJS EN LEREN
&
ICT EN ONDERWIJSVERNIEUWING