RIGA’S NOTITIES BIJ DE WIJKMONITOR Dit stuk bevat de volgende onderwerpen: Steekproefbepaling Causaliteit Fuzziness Data-analyse Plan voor een online krimppanel
1
STEEKPROEFBEPALING Beknopte versie hiervan zit in de gebruikershandleiding van de wijkmonitor. Dit is de uitgebreide versie. We bepalen de steekproef in twee volgende onderzoekssituaties: Onderzoekssituatie 1: Het onderzoek “leefbaarheid”) OF het onderzoek“actief burgerschap” wordt uitgevoerd, een van beide, maar niet beide. Onderzoekssituatie2 : Het onderzoek “leefbaarheid” EN het onderzoek “actief burgerschap” wordt uitgevoerd, beide, onder dezelfde populatie. Steekproefbepaling in onderzoekssituatie 1: Enkelvoudige aselecte steekproef Deze is van toepassing op het onderzoek “leefbaarheid” OF het onderzoek “actief burgerschap” (een van beide, maar niet beide) De (fictieve) gemeente Maasdal wil onderzocht hebben: Hoe staat het met de tevredenheid van de burgers over de leefbaarheid van hun leefomgeving? OF: Hoe staat het met het actieve burgerschap? Wat is de bereidheid van de burgers om zich in te zetten voor een leefbare leefomgeving? Geef precies aan op welke populatie het onderzoek betrekking heeft. De populatie omschrijven we hier als ‘alle inwoners van Maasdal die in het onderzoeksjaar ingeschreven zijn in Gemeentelijke Basisadministratie en 15 jaar of ouder zijn’ (de potentiële beroepsbevolking en ouderen). Steekproefkader: de Gemeentelijke Basisadministratie van Maasdal. Maasdal heeft 40.000 inwoners, verdeeld over de wijken: Tuinwijk: 10.000; Boskwartier: 12.000; en Centrum: 18.000. 85% van de inwoners is 15 jaar of ouder. De onderzoekspopulatie van Maasdal is: 34000. (In het voorbeeld gebruiken we ronde getallen.) Het is niet nodig de hele populatie te benaderen. Er kan worden volstaan met een steekproef. We nemen een aselecte steekproef. Alleen bij een aselecte steekproef kunnen de resultaten van de steekproef worden geïnduceerd naar de (operationele) populatie. We gaan uit van enkelvoudige aselecte steekproef: een vooraf bepaald aantal onderzoekseenheden wordt via een toevalsprocedure uit de populatie getrokken. Hoe groot moet de steekproef zijn? Een steekproef kan te klein en te groot zijn. Een te kleine steekproef kan er toe leiden dat een werkelijk verschil of verband niet door de studie blootgelegd wordt en personen dus voor niets zijn ondervraagd.
Een te grote steekproef kan ook tot bezwaren leiden. Er worden onnodig veel mensen in het onderzoek betrokken. Dat is niet alleen verspilling van tijd, maar ook van geld. De kosten van het onderzoek worden vergroot, zonder dat dit nodig is. De steekproefgrootte is afhankelijk van: 1 De grootte van de onderzoekspopulatie 2 Heterogeniteit van de populatie 3 Vereiste nauwkeurigheid 4 Vereiste betrouwbaarheid Formule minimale steekproefgrootte bij een eindige populatie n= (N. z2.P2)/ {(z2.P2)+(N-1).S2}
waarbij, n = de steekproefgrootte N=populatiegrootte P = heterogeniteit van de populatie S= de steekproefmarge; de vereiste nauwkeurigheid
z = vereiste betrouwbaarheid
P = 50. We gaan uit van het minst gunstige geval, dat er maximale onenigheid is, dat wil zeggen dat 50% van de ondervraagde personen tevreden is over hun leefomgeving. De steekproefmarge (is hier gesteld op 5%, maar kan ook op bijvoorbeeld 3, 2 of 1% worden gesteld. Dit zijn de meest gehanteerde foutmarges1 Elke steekproef geeft afwijkingen ten opzichte van de werkelijkheid. Dat wil zeggen dat als blijkt dat bijvoorbeeld 50% van de ondervraagde personen tevreden zijn over hun leefomgeving (P=50), het percentage in werkelijkheid (als iedereen ondervraagd zou worden) wellicht op 47,5% of 52,5% uit zou kunnen komen. We noemen deze afwijking naar beneden of boven de standaarddeviatie. Beide afwijkingen (naar boven of naar beneden) vormen samen de steekproefmarge (ofwel de steekproefmarge = 2 x de standaarddeviatie). z = 1,96 factor voor berekening op 95%-niveau. Dit houdt in dat een onderzoeksuitkomst in 95 van de 100 gevallen conform de realiteit is. De z-waarde is de afstand t.o.v. het midden van de normaalverdeling uitgedrukt in aantal maal de standaarddeviatie. We kiezen voor een betrouwbaarheid van 95%. Er kan ook gekozen worden voor een betrouwbaarheid van 99%, de Z-waarde is dan 2,57. bij een betrouwbaarheid van 90% is de Z-waarde 1.65.
Rekenvoorbeeld1: Als wijkpopulatie is 34000, dan is de steekproefgrootte: n= (34000. 1,962.502)/ {(1,962.502)+(34000-1).52}=380 Rekenvoorbeeld 2: Al s wijkpopulatie = 1000, dan is de steekproefgrootte: n= (1000. 1,962.502)/ {(1,962.502)+(1000-1).52}=278
1
http://wetenschap.infonu.nl/wiskunde/9884-het-berekenen-van-de-steekproefomvang-voor-enquetes.html
3
Er is een formule waarmee de minimale steekproefgrootte bij een eindige populatie kan worden berekend, maar een gemakkelijke manier om de steekproefgrootte te berekenen is gebruik te maken van een steekproefcalculator, bijvoorbeeld een van de volgende: Sample Size Calculator: http://www.surveysystem.com/sscalc.htm Of: Raosoft sample calculator: http://www.raosoft.com/samplesize.html
De steekproefmarge (margin of error) is gesteld op: 5%. Het betrouwbaarheidsniveau (confidence level) is: 95%. De populatieomvang (population size) is: 34000. De heterogeniteit van de bevolking (response distribution) is gesteld op: 50%. De steekproefcalculator meldt dat de uiteindelijke steekproef een grootte moet hebben van: 380 personen. De aanvankelijke steekproef (dat deel van de populatie dat wordt benaderd voor het onderzoek) is groter, aangezien we er rekening mee houden, dat geen respons komt van een deel van de benaderde populatie. Hoe groot de non-respons zal zijn, is moeilijk te voorspellen. Richtsnoer: Redelijke responspercentages zijn: 25% (realistisch) of 30% (optimistisch). Gebruikmaking van de realistische schatting betekent dat 4 maal de uiteindelijk te verkrijgen respons, dit is 4 x 380 = 1520 enquêtes, moeten worden verzonden.
Randomiseren van de steekproef Het is mogelijk met behulp van de loterijmethode of via een tabel met toevalsgetallen een enkelvoudige aselecte steekproef te trekken, maar het kan ook
met de computer. Bijvoorbeeld door gebruik te maken van de website http://www.randomizer.org. Voorwaarde is dat er een genummerde lijst is van alle inwoners die behoren tot de potentiële onderzoekspopulatie. Alle potentiële onderzoeksdeelnemers krijgen een getal op die lijst.
Uitleg bij de afbeelding: Het aantal verzamelingen van getallen (sets of numbers) is gesteld op: 1. Het aantal getallen per verzameling (numbers per set) is: 1520. Het bereik van de getallen (number range) is: van 1 tot 34000. Moet ieder nummer in een verzameling uniek zijn? Kies: Ja (Yes). Hoe wilt u de nummers sorteren? Kies: Ja, van het kleinste naar het grootste getal (Yes, Least to Greatest). Hoe moeten de getallen getoond worden? Kies: De getallen met hun rangnummers (Place Markers Within). De Randomizer toont een rij van 1520 toevallige getallen (random numbers) tussen 1 en 34000. Steekproefbepaling in onderzoekssituatie 2: Gestratificeerde aselecte steekproef Deze is van toepassing op een onderzoek “leefbaarheid” EN een onderzoek “actief burgerschap” , die beide, gelijktijdig worden uitgevoerd in dezelfde populatie
5
Gestratificeerde aselecte steekproef: Voor de steekproeftrekking wordt de populatie verdeeld in twee of meer deelpopulaties of strata (groepen), waarna aselect uit de onderscheiden strata de onderzoekseenheden worden getrokken De ene groep ondergaat een onderzoek “leefbaarheid; de andere groep een onderzoek “actief burgerschap”. De gemeente Maasdal wil onderzocht hebben: Hoe staat het met de tevredenheid van de burgers over de leefbaarheid van hun leefomgeving? EN: Hoe staat het met het actieve burgerschap? Wat is de bereidheid van de burgers om zich in te zetten voor een leefbare leefomgeving? Grootte van elk van beide steekproeven: 380. (Deze uitkomst hebben we gevonden op dezelfde manier als hierboven.) Bij elkaar opgeteld, levert dat een uiteindelijke steekproef op van 2x380=760. Gebruikmaking van de realistische schatting betekent dat 4 maal de uiteindelijk te verkrijgen respons, dit is 4 x 760 = 3040 enquêtes, moeten worden verzonden. Randomizer-procedure uitvoeren voor twee groepen
Dezelfde procedure als hierboven beschreven met dit verschil dat het aantal verzamelingen van getallen (sets of numbers) nu wordt gesteld op: 2. De Randomizer toont twee rijen, elk van 1520 toevallige getallen (random number) tussen 1 en 34000.
7
CAUSALITEIT Voordat causaal verband kan worden vastgesteld, moet aan drie voorwaarden zijn voldaan: 1 er moet een statistisch verband zijn; 2 er moet een tijdsvolgorde zijn; 3 er mag geen derde kenmerk in het spel zijn (het verband mag niet vals zijn) Een voorbeeld. Stel dat in onze vragenlijst de volgende variabelen voorkomen: sociale stratificatie en culturele participatie. Beide kunnen geobserveerd worden (observaties kunnen worden uitgedrukt in cijfers). Stel vervolgens, dat er twee soorten van sociaalculturele kwaliteit zijn, sociale kwaliteit en culturele kwaliteit, die allebei niet direct geobserveerd worden. Stel dat een groep respondenten twee vragen beantwoordt, een vraag met betrekking tot sociale stratificatie (wat is uw inkomen?) en een vraag met betrekking tot culturele participatie (Hoe vaak bezoekt u een theater?). Analyse toont aan dat er verband is tussen sociale stratificatie (inkomen) en culturele participatie (theaterbezoek). Dit kan betekenen dat sociale stratificatie (de positie op de maatschappelijke ladder) van invloed is op culturele participatie (deelname aan cultuur) of omgekeerd. Het kan ook zijn, dat een derde variabele in het spel is. Met een factoranalyse kan deze derde onbekende variabele worden geïdentificeerd. De onbekende variabele zou kunnen zijn: opleidingsniveau (tenminste als er geen rechtlijnig verband is tussen inkomensklasse en opleidingsniveau). Causale uitspraken kunnen niet worden gedaan in een eenmalig survey, maar (onder voorwaarden) wel in een longitudinaal survey. Deze voorwaarden betreffen vooral de interne validiteit. Baarda en De Goede (p.132): “Een survey wordt over het algemeen gekenmerkt door een lagere interne validiteit en, indien er een aselecte steekproef is getrokken, een hogere externe validiteit.” Een andere manier om het onderwerp causaliteit te bespreken is de volgende: Bij een deductieve of causale verklaring volgt het explanandum (conclusie) deductief uit het explanans (de premissen). Het bevat de volgende componenten: 1 Oorzaak (beginvoorwaarde; bijzondere uitspraken, die een concrete, aan plaats en tijd gebonden gebeurtenis beschrijven, of die aan een concreet object een bepaalde eigenschap toekennen). Bijvoorbeeld: de explanans is de inkomensklasse 2 Algemene uitspraken (wetten of theorieën), die een regelmatigheid uitdrukken. Bijvoorbeeld: de wet of de theorie is dat inkomen culturele participatie beïnvloedt
3 Gevolg, het te verklaren verschijnsel, explanandum, logisch noodzakelijke conclusie (kan een individuele gebeurtenis zijn, of een empirische of experimentele wet). Bijvoorbeeld het te verklaren verschijnsel is de lage sociaal-culturele participatie of de theorie dat inkomen invloed heeft op de culturele participatie. 4 Randvoorwaarden m.b.t. het te verklaren verschijnsel (ceteris paribus-clausule; aannames omtrent factoren, waarvan men veronderstelt dat ze gelijk blijven en het verband niet verstoren), Bijvoorbeeld: de samenstelling van wijkbewoners, wier inkomen en culturele participatie men onderzoekt, moet in de loop van de tijd gelijk blijven. Ceteris paribus: "de overige omstandigheden gelijk blijvend". De term wordt gebruikt om in theoretische modellen een situatie te onderzoeken waarin de invloed van veranderingen in één grootheid (de verklarende variabele) op één andere grootheid (de te verklaren variabele) wordt nagegaan. Uitspraak: Het inkomen bepaalt ceteris paribus de sociaal-culturele participatie. Interpretatie van deze uitspraak: De toename van lage inkomensklasse zal, onder verder gelijk blijvende omstandigheden, leiden tot een daling van de sociaal-culturele participatie. Die gelijk blijvende omstandigheden (ceteris paribus) houden in dat er geen verandering optreedt in: aantal en type wijkbewoners, de voorkeuren van die wijkbewoners, de kosten van sociaal-culturele participatie en andere invloed hebbende factoren.
9
FUZZINESS Meten op ordinaal niveau: Vaagheid (Fuzziness). Ook al kunnen we leefbaarheid uitdrukken als een kwantiteit (iemand kan de woonomgeving als meer of minder leefbaar ervaren en dat drukken we uit in een cijfer), leefbaarheid is geen kwantitatief begrip. Echter, mensen hebben een idee van wat "leefbaar" is, en erkennen dat er geen scherpe grens is tussen "leefbaar" en "niet leefbaar", waar "leefbaar" hetzelfde is als “meer dan gemiddeld leefbaar” en "niet leefbaar" gelijk is aan “minder dan gemiddeld leefbaar”. Het is onjuist om te denken dat men een meetmodel maakt door het geven van numerieke waarden aan taalkundige omschrijvingen. Bijvoorbeeld de volgende woorden als volgt omzetten in cijfers, is tricky. Tevreden = [0.6, 1.0] Matig tevreden = [0.3, 0.6] Ontevreden = [0, 0.3] De cijfers zijn immers niet minder vaag (fuzzy) dan de woorden.
WERKWIJZE Ten behoeve van de wijkmonitor worden de volgende hulpmiddelen gemaakt: 1 Codeboek in spss 2 Handleiding bij dit codeboek 3 Gebruikersovereenkomst onderzoek Gegeven deze hulpmiddelen zijn er ruwweg 4 taken te onderscheiden: a Implementatie onderzoek b Dataverwerking (pre-analyse) c Analyse d Rapportage De overeenkomst biedt drie mogelijkheden: Mogelijkheid 1: Gebruiker voert a, b, c en d geheel zelfstandig uit Mogelijkheid 2: Gebruiker voert a en b zelfstandig uit en geeft Neimed opdracht tot uitvoering van c en d Mogelijkheid 3: Gebruiker geeft alle opdrachten (a, b, c en d ) aan Neimed
11
DATA-ANALYSE We onderscheiden drie typen analyses: 1 Pre-analyse: data in cijfers 2 Analyse: data-analyse 3 Meta-analyse: analyse van data-analyses
PRE-ANALYSE
Onder pre-analyse verstaan we een eerste analyse gedaan als onderdeel van de dataverzameling na gedaan onderzoek. Pre-analyse omvat het berekenen van aantallen en percentages.
Berekenen aantallen en percentages
Gebruik in PASW de commando’s Analyze / Descriptive Statistics / Frequencies / Statistics (eventueel: Charts / Bar chart) Verplaats de variabelen; we doen allemaal tegelijk: dit is ten behoeve van de gebruiker door ons al zo ingesteld, met SYNTAX. Voorbeeld: postc (“Wat is uw postcode?”]. Klik op Statistics voor het berekenen van het gemiddelde, mediaan, standaarddeviatie, minimum, maximum en andere kengetallen Het resultaat lezen we in het Output window. Dit window is in twee stukken verdeeld. Het linker gedeelte geeft een overzicht van de uitvoer. We zien daar dat de Frequency uitvoer uit vier stukken bestaat: Title, Notes, Active Dataset, Statistics en Wat is uw postcode?. Rechts vinden we de volledige uitvoer. AANSTURING: GET FILE='g:\mijn documenten\Krimp\wijkmonitorL.sav'. DATASET NAME DataSet1 WINDOW=FRONT. FREQUENCIES VARIABLES=Pcode /STATISTICS=STDDEV MINIMUM MAXIMUM MEAN MEDIAN /BARCHART FREQ /ORDER=ANALYSIS. GET FILE='g:\mijn documenten\Krimp\wijkmonitorL.sav'. DATASET NAME DataSet1 WINDOW=FRONT. FREQUENCIES VARIABLES=Pcode /STATISTICS=STDDEV MINIMUM MAXIMUM MEAN MEDIAN /BARCHART FREQ /ORDER=ANALYSIS.
13
Statistics Wat is uw postcode? N
Valid
11
Missing
0
Mean
2,00
Median
2,00
Std. Deviation
,894
Minimum
1
Maximum
3
Wat is uw postcode? Cumulative
Valid
Frequency
Percent
Valid Percent
Percent
6271
4
36,4
36,4
36,4
6272
3
27,3
27,3
63,6
6273
4
36,4
36,4
100,0
Total
11
100,0
100,0
ANALYSE Analyse omvat de volgende onderwerpen: 1 2 3 4 5 6 7 8 9
Hercoderen van variabelen Een samengestelde variabele creëren Focus op een bepaalde groep Variantieanalyse/ Compare Means Regressieanalyse Crosstabs Analyse van responsconsistentie Consistentie van de vragenlijst Wegen als correctie voor non-respons en selectieve respons
15
Hercoderen van variabelen In de wijkmonitor gebruiken we tweepunts- of driepuntsschalen. Bijvoorbeeld de vraag “Vindt u dat volgende voorzieningen op bereikbare afstand van uw woning liggen?” wordt gevold door een driepuntsschaal. De antwoordmogelijkheden zijn namelijk: “Op loopafstand”; “Niet te ver met vervoer”; “Te ver”. Daar is aan toegevoegd: “Niet van toepassing/ Geen mening/ Weet niet”. Het zijn ordinale (quasi-numerieke) waarden, die we in PASW hebben gecodeeerd, respectievelijk als: “1”, “2”, “3” en “4”. We willen deze quasi-numerieke waarden hercoderen naar numerieke waarden. Dit is mogelijk door de waarden “1”, “2”, “3” en “4” om te zetten naar waarden tussen 0 en 1. (Dit proces van datamanipulatie wordt ook wel standaardisatie genoemd.)
Hoe doen we dit in PASW? Om een variabele te hercoderen kies: Transform, Recode, Into different variables waardoor het dialoogvenster 'Recode into different variables' wordt opgeroepen. In dit venster geven we de naam voor de nieuwe variabele op (bijvoorbeeld: dLZorg3) en brengen we de oude variabele (LZorg3) van de linkerkolom over naar de rechterkolom. Klik vervolgens op 'Old en New Values'. Hercodering verloopt dan als volgt: - Geef de oude codes op in het kader onder 'Old Value' (links) - Geef de nieuwe code op in het kader 'New Value' (rechts) - Klik op Add De PASW-gebruiker heeft 7 mogelijkheden (Value, System-missing, system- or usermissing Range, Range, LOWEST through value, Range, value through HIGHEST, All other values) om de oude code aan te geven. Gebruik Value om de code aan te geven Voorbeeld Vindt u dat volgende voorzieningen (Huisartsenpraktijk; Apotheek; Tandarts) op bereikbare afstand van uw woning liggen? Op loopafstand (code: 1); Niet te ver met vervoer (code: 2); Te ver (code: 3); Niet van toepassing/ Geen mening/ Weet niet (code:4) We willen de codes (1, 2, 3 en 4) hercoderen naar waarden tussen 0 en 1. De hercodering in het Old naar New kader ziet er dan als volgt uit: 1—> 1 (Op loopafstand) 2 —> 0,5 (Niet te ver met vervoer) 3 —> 0 (Te ver) 4—> SYSMIS (niet van toepassing, geen mening, weet niet)
AANSTURING: RECODE LZorg1 (1=1) (2=0.5) (3=0) (4=SYSMIS) INTO dLZorg1. VARIABLE LABELS dLZorg1 'Huisartspraktijk'. EXECUTE. RECODE LZorg2 (1=1) (2=0.5) (3=0) (4=SYSMIS) INTO dLZorg2. VARIABLE LABELS dLZorg2 'Apotheek'. EXECUTE. RECODE LZorg3 (1=1) (2=0.5) (3=0) (4=SYSMIS) INTO dLZorg3. VARIABLE LABELS dLZorg3 'Tandarts'. EXECUTE.
17
Een samengestelde variabele creëren We maken nieuwe variabelen op het niveau van indicatoren. Vraag: Vindt u dat volgende voorzieningen (huisartsenpraktijk; apotheek; tandarts) op bereikbare afstand van uw woning liggen? Antwoordmogelijkheden: Op loopafstand; Niet te ver met vervoer; Te ver; Niet van toepassing/ Geen mening/ Weet niet Stel dat we voor ons onderzoek een globaal idee willen krijgen over de bereikbaarheid van genoemde voorzieningen, meer bepaald Huisartsenpraktijk, Apotheek en Tandarts. Hiervoor kunnen we het gemiddelde nemen van de scores op de 3 variabelen zodat we een eindscore bereiken. De variabelen “huisartsenpraktijk”, “apotheek” en “tandarts” zijn hercodeerd als dLZorg1 (“Huisartspraktijk”), dLZorg2 (“Apotheek”) en dLZorg3 (“Tandarts”) Op basis van de hercodeerde variabelen dLZorg1 (“Huisartspraktijk”), dLZorg2 (“Apotheek”) en dLZorg3 (“Tandarts”) creëren we een nieuwe variabele iLZorg (“Zorg”), die het gemiddelde weergeeft van de scores op de hercodeerde variabelen. Deze samengestelde variabele iLZorg (“Zorg”) kan men dan gebruiken om conclusies te trekken rond het verband tussen de bereikbaarheid van zorgvoorzieningen en andere variabelen (bijvoorbeeld, er is een verschil in de bereikbaarheid van zorgvoorzieningen naar gelang de wijk). Hoe wordt dit gedaan in PASW? Om een nieuwe variabele te creëren selecteren we: Transform, Compute en het dialoogvenster 'Compute Variable' komt tevoorschijn. Om een nieuwe variabele te definiëren: - Klik in de tekstbox onder 'Target Variable' - Geef een nieuwe naam voor je samengestelde variabele (iLZorg) - Vorm in de tekstbox onder 'Numeric Expression' de formule aan de hand waarvan de nieuwe variabele moet worden berekend MEAN(dLZorg1 to dLZorg3)
Aansturing: COMPUTE iLZorg=MEAN(dLZorg1,dLZorg2,dLZorg3). EXECUTE.
19
Focus op een bepaalde groep Men kan een groep (bijvoorbeeld een wijk, een leeftijdsgroep, of een van beide geslachten) afzonderlijk willen onderzoeken. Voorbeeld: In het onderzoek waren meerdere wijken (Tuinwijk, Boskwartier en Centrum) van de gemeente Maasdal tegelijkertijd betrokken. We willen de scores van de wijk Tuinwijk afzonderlijk onderzoeken. Daarvoor moeten we eerst de wijk selecteren. Hoe doen we dat in PASW? Dit doen we met de optie: Data / select cases Het scherm Select Cases verschijnt. Vink hier de optie If condition is satisfied aan en klik op If. We krijgen dan een scherm te zien, waarop we de gewenste selectie kunnen aangeven, in het voorbeeld is dat Postcode=6373; alleen de postcodes 6373 worden nu bij de volgende analyses meegenomen. Om dit te doen selecteren we in de linkerlijst Postcode. Klik dan op de pijl, vervolgens op het = teken en dan op 6373. (6373 omvat de postcodes van Tuinwijk)
We kunnen nu analyses maken van alleen de respondenten van Tuinwijk. Let op: als deze analyses gedaan zijn, vink dan in het Select Cases scherm weer de optie All cases aan.
Variantieanalyse/ Compare Means
Bij een enkelvoudige variantieanalyse worden twee soorten variabelen gebruikt: de variabelen waarvan de groepsgemiddelden worden vergeleken (de afhankelijke variabele) en de variabele die de groepsindeling bepaalt (de factor ofwel onafhankelijke variabele). Voor het uitvoeren van een enkelvoudige variantieanalyse kent PASW de opdracht One-Way ANOVA. Voorbeeld: De steekproef in dit voorbeeld bestaat uit de gegevens van 11 respondenten, waarvan 4 uit Tuinwijk (Postcode 6271), 3 uit Boskwartier (Postcode 6272) en 4 uit Centrum (Postcode 6273) Onderaan de vragenlijst is de volgende vraag toegevoegd: Als het nu gaat om de leefbaarheid van uw omgeving, welk van de genoemde onderwerpen draagt het meeste bij aan uw woon- en leefgenot, en welk onderwerp het minste? Geef het belangrijkste waar u het meest tevreden over bent 6 punten en het minst belangrijke waar u het minst tevreden over bent 1 punt. Lokale politiek Directe leefomgeving Zorg en welzijn Culturele aanbod Lokale economie Milieu
1 1 1 1 1 1
2 2 2 2 2 2
3 3 3 3 3 3
4 4 4 4 4 4
5 5 5 5 5 5
6 6 6 6 6 6
De namen van de vaiabelen zijn in PASW als volgt gecodeerd: Lokale politiek (LP) Directe leefomgeving (DL) Zorg en welzijn (ZW) Culturele aanbod (CA) Lokale economie (LEc) Milieu (M) De punten zijn gecodeerd als: ”6 punten” =”1” ”2, 3 , 4 en 5 punten” = “2” “1 punt” =”3”
21
We willen de codes “1”, “2” en “3” hercoderen naar waarden tussen 0 en 1. De hercodering in het Old naar New kader ziet er dan als volgt uit: “1” --> “1” “2” --> “0,5” “3” --> “0”
Aansturing: GET FILE='G:\mijn documenten\Krimp\wijkmonitorL.sav'. DATASET NAME DataSet1 WINDOW=FRONT. RECODE LP (1=1) (2=0.5) (3=0) INTO dLP. VARIABLE LABELS dLP 'Lokale politiek'. EXECUTE. RECODE DL (1=1) (2=0.5) (3=0) INTO dDL. VARIABLE LABELS dDL 'Directe leefomgeving'. EXECUTE. RECODE ZW (1=1) (2=0.5) (3=0) INTO dZW. VARIABLE LABELS dZW 'Zorg en welzijn'. EXECUTE. RECODE CA (1=1) (2=0.5) (3=0) INTO dCA. VARIABLE LABELS dCA 'Culturele aanbod'. EXECUTE. RECODE LEc (1=1) (2=0.5) (3=0) INTO dLEc. VARIABLE LABELS dLEc 'Lokale economie'. EXECUTE. RECODE M (1=1) (2=0.5) (3=0) INTO dM. VARIABLE LABELS dM 'Milieu'. EXECUTE.
Hieronder volgt de gemiddelde beoordeling van elke kwaliteit Statistics
N Mean
Valid Missing
Lokale politiek 11 0 ,364
Directe leefomgeving 11 0 ,500
Zorg en welzijn 11 0 ,318
Culturele aanbod 11 0 ,500
Lokale economie 11 0 ,591
Milieu 11 0 ,591
Nu gaan we uit deze zes variabelen een nieuwe samengestelde variabele creëren, die we “Eindkwalificatie” noemen en coderen als iKWAL. De eindkwalificatie is het gemiddelde van de beoordelingen van elke kwaliteit.
Aansturing: COMPUTE iKWAL=MEAN(dLP,dDL,dZW,dCA,dLEc,dM). EXECUTE. FREQUENCIES VARIABLES=dLP dDL dZW dCA dLEc dM /STATISTICS=MEAN /ORDER=ANALYSIS. Ik wil weten, of de eindkwalificaties (iKWAL) van de respondenten afhankelijk zijn van de wijken, waartoe de respondenten behoren. Nulhypothese: Dit is niet het geval (de eindkwalificatie die men geeft heeft niets te maken met de wijk waar men vandaan komt) Alternatieve hypothese: Dit is het geval (de eindkwalificatie houdt verband met de wijk waar men vandaan komt) . Met de optie Compare means worden gemiddelden van groepen op bepaalde variabelen met elkaar vergeleken. De variabele die de groepsindeling bepaalt wordt de onafhankelijke variabele genoemd. De variabele waarvoor de gemiddelden worden berekend, wordt de afhankelijke variabele genoemd. Via de menu-optie Analyze → Compare Means → One-Way ANOVA verschijnt het dialoogvenster van de procedure One-Way ANOVA. Selecteer onder Dependent List de variabele waarvoor de gemiddelden getoetst worden. In dit geval is dit de variabele die de eindkwalificatie bevat (iKWAL). In het kader onder Factor plaatsen we de variabele waarin de groepsindeling staat. Met betrekking tot het voorbeeld is dit de variabele met de codering van de wijk (Pcode, met 1=6271, 2=6272 en 3=6273).
Het dialoogvenster One-Way ANOVA kent de drukknoppen Contrasts, Post Hoc en Options. Via de drukknop Options kunnen o.a. kengetallen berekend worden. Druk op Options, onder Statistics vink je Descriptive aan. PASW berekent voor het totaal aantal cases en voor elke groep afzonderlijk het aantal waarnemingen, gemiddelde, standaarddeviatie, standaardfout, 95 % betrouwbaarheidsinterval voor het gemiddelde, minimum en maximum.
23
Aansturing: ONEWAY iKWAL BY Pcode /STATISTICS DESCRIPTIVES /MISSING ANALYSIS.
Het eerste gedeelte van de uitvoer (tabel Descriptives iKWAL) geeft een aantal kengetallen weer voor elke groep afzonderlijk en voor het totaal aantal waarnemingen (dit is tot stand gebracht door Descriptive te gebruiken via de drukknop Options). Descriptives iKWAL
6271 6272 6273 Total
N
Std. Mean Deviation
Std. Error
4 3 4 11
,4583 ,5000 ,4792 ,4773
,04167 ,00000 ,02083 ,01625
,08333 ,00000 ,04167 ,05389
95% Confidence Interval for Mean Lower Upper Bound Bound ,3257 ,5909 ,5000 ,5000 ,4129 ,5455 ,4411 ,5135
Minimum Maximum ,33 ,50 ,42 ,33
,50 ,50 ,50 ,50
F ,461
Sig. ,647
Het tweede gedeelte van de uitvoer (tabel ANOVA iKWAL): ANOVA iKWAL Between Groups Within Groups Total
Sum of Squares Df ,003 2 ,026 8 ,029 10
Mean Square ,001 ,003
De tabel ANOVA iKWAl lezen we als volgt: Het aantal vrijheidsgraden tussen de groepen (Between Groups) is gelijk aan het aantal groepen minus 1 (3-1). Binnen de groepen (Within Groups) is het aantal vrijheidsgraden gelijk aan het totaal aantal waarnemingen minus het aantal groepen (11-3). Het aantal vrijheidsgraden van het totaal (Total) is gelijk aan het totaal aantal waarnemingen minus 1 ( 11-1). In de eerste en derde kolom staan de kwadratensommen (Sum of Squares/SS) en de gemiddelde kwadratensommen (Mean Squares/MS): SStussen (Sum of Squares Between Groups) is gelijk aan ,003. MStussen (Mean Squares Between Groups) is gelijk aan ,003/3 = ,001. SSbinnen (Sum of Squares Within Groups) is gelijk aan ,026. MSbinnen (Sum of Squares Within Groups) is gelijk aan ,026/8 = ,003. SStotaal tenslotte bedraagt ,029. In de laatste twee kolommen worden de resultaten van de F-toets weergegeven (F en Sig). De F toetsingsgrootheid is gelijk aan MStussen/MSbinnen: ,001 / ,003= ,461 met 2 en 8 vrijheidsgraden. Vervolgens berekent PASW de bijbehorende rechteroverschrijdingskans (Sig. ook wel Pwaarde of P-value genoemd). Deze is gelijk aan ,647.
De P-waarde is de kans op de in de steekproef gevonden waarde. Een kleine Pwaarde maakt de nul-hypothese ongeloofwaardig. P kleiner dan of gelijk aan 0,05: verwerp de nulhypothese P groter dan 0,05: accepteer de nulhypothese (verwerp de alternatieve hypothese) P = 0,647: de alternatieve hypothese wordt verworpen
25
Regressieanalyse Een andere methode om kwalificaties van bewoners te analyseren is met behulp van regressieanalyses. Het resultaat kan worden getoond op een perceptuele kaart (in PASW: Scatter/Dot onder Graphs). De procedure REGRESSION is gemakkelijk op te roepen via het menu ‘Analyze’ en twee submenu’s: Analyze /Regression /Linear De verdere aansturing kan worden gedaan door middel van een aantal dialoogvensters of met behulp van commando's in het syntaxvenster. Aansturing via dialoogvensters Procedure-aanroep via de taakbalk: Analyze / Regression / Linear Dialoogvensters: Hoofdvenster: Linear Regression Subvensters: Statistics… optionele statistische output opvragen Plots… optionele plots opvragen, vooral van residuen Save… voorspelde waarden en residuen opslaan in databestand Options… diverse aspecten van de analyse regelen, o.a. bij ontbrekende scores Via de dialoogvensters wordt de volgende aansturing verkregen: GET FILE='g:\mijn documenten\Krimp\wijkmonitorL.sav'. DATASET NAME DataSet1 WINDOW=FRONT. REGRESSION /MISSING LISTWISE /STATISTICS COEFF OUTS R ANOVA /CRITERIA=PIN(.05) POUT(.10) /NOORIGIN /DEPENDENT iKWAL /METHOD=ENTER Pcode. Aansturing via syntax De syntax kunnen we krijgen door de in de dialoogvensters gespecificeerde analyse niet meteen te laten uitvoeren (via de knop ‘OK’) maar de specificaties eerst te laten vertalen in commando’s. Dat kan door de knop ‘PASTE’ in te drukken. PASW geeft dan in het syntaxvenster een lijst van commando’s weer die we rustig kunnen bekijken alvorens de analyse daadwerkelijk te laten uitvoeren en die we eventueel nog kunnen wijzigen. Dat is handig, als we dezelfde analyse willen herhalen met bijvoorbeeld alleen maar een andere variabele. De analyse wordt pas
daadwerkelijk uitgevoerd, als we de betreffende syntax-tekst selecteren en activeren door in het menu van het syntaxvenster de optie Run te kiezen. De syntax voor een complete regressieanalyse bestaat uit maar een paar commando’s: de aanroep van de procedure (REGRESSION), de specificatie van de afhankelijke variabele (DEPENDENT) en de specificatie van de onafhankelijke variabelen (ENTER). Zo volstaat de volgende aansturing voor een standaard regressieanalyse met als afhankelijke variabele iKWAL en als predictor Postc:
REGRESSION /DEPENDENT = iKWAL /ENTER = Pcode
De output van aansturing via zowel dialoogvensters als syntax bestaat uit drie tabellen Model Summary, ANOVA en Coefficients voor één enkele regressievergelijking. Output:
Model Summary Model dimension0
1
R ,173
R Square Adjusted R Square Std. Error of the Estimate a
,030
-,078
,05595
a. Predictors: (Constant), Wat is uw postcode?
ANOVA Model 1
Sum of Squares
b
df
Mean Square
Regression Residual
,001 ,028
1 9
Total
,029
10
,001 ,003
F
Sig.
,277
,611
a
a. Predictors: (Constant), Wat is uw postcode? b. Dependent Variable: Eindkwalificatie
Coefficients Model
Unstandardized Coefficients Standardized Coefficients B
1 (Constant) Wat is uw
a
Std. Error ,456
,043
,010
,020
t
Beta
Sig.
10,613 ,000 ,173
,527 ,611
postcode? a. Dependent Variable: Eindkwalificatie
27
Grafiek maken De grafiek (of perceptuele kaart) wordt gemaakt door de volgende stappen te zetten: Graphs Chart Builder OK Gallery Choose from: Scatter/Dot Click on Simple Chart and drag it to Chart preview Drag wat is uw postcode? (Postc) to Y-Axis Drag Eindkwalificatie (iKWAL) to X-Axis OK
Crosstabs Verschillen tussen groepen We willen graag weten wat de verschillen zijn tussen de drie wijken, wat betreft hun algemene beoordeling van de leefbaarheid van hun wijk (Eindkwalificatie) Als het nu gaat om de leefbaarheid van uw omgeving, welk van de genoemde onderwerpen draagt het meeste bij aan uw woon- en leefgenot, en welk onderwerp het minste? Geef het belangrijkste waar u het meest tevreden over bent 6 punten en het minst belangrijke waar u het minst tevreden over bent 1 punt. Lokale politiek Directe leefomgeving Zorg en welzijn Culturele aanbod Lokale economie Milieu
1 1 1 1 1 1
2 2 2 2 2 2
3 3 3 3 3 3
4 4 4 4 4 4
5 5 5 5 5 5
6 6 6 6 6 6
De wijken zijn in PASW als volgt gecodeerd: Op de vraag Wat is uw postcode? zijn de mogelijke antwoorden in dit geval 6373 (Tuinwijk), 6374 (Boskwartier) en 6375 (Centrum). Postcode 6373 heeft de waarde 1 gekregen, postcode 6374 de waarde 2 en postcode 6374 de waarde 3. Crosstabs (kruistabellen) geven inzicht in verschillen tussen de wijken wat betreft de eindkwalificaties die ze geven. Hoe doen we dit in PASW? We kunnen een kruistabel uitdraaien door gebruik te maken van de volgende optie: Analyze / Descriptives / Crosstabs We kunnen nu kiezen welke variabele we horizontaal (row) en verticaal (colomn) in de kruistabel terug willen zien. In het voorbeeld is ervoor gekozen om “Wat is uw postcode?” (Postc) verticaal weer te geven en “Eindkwalificatie” (iKWAL) horizontaal.
29
Behalve aantallen kunnen ook percentages respondenten worden weergegeven. Klik om percentages weer te geven in het Crosstabs scherm op Cells en vink vervolgens onder percentages column aan. Wanneer we nu op Continue en vervolgens op OK klikken krijgen we de volgende tabel:
Wat is uw postcode? * Eindkwalificatie Crosstabulation Eindkwalificatie ,33
,42
,50
Total
0
3
4
Wat is uw
627
Count
1
postcode?
1
% within
100,0% ,0%
33,3%
36,4%
Eindkwalificatie 627
Count
0
0
3
3
2
% within
,0%
,0%
33,3%
27,3%
3
4
Eindkwalificatie 627
Count
0
1
3
% within
,0%
100,0% 33,3%
36,4%
Count
1
1
11
% within
100,0% 100,0% 100,0% 100,0%
Eindkwalificatie Total
9
Eindkwalificatie
Eventueel kunnen de aantallen ook worden weggelaten door in het scherm Crosstabs: Cell display, het vinkje bij Observed weg te laten. Bij het maken van crosstabs kun we een toets laten uitvoeren om te bepalen of de verschillen tussen de wijken significant zijn. Dit doen we door in het Crosstabs-scherm te klikken op Statistics en vervolgens de optie Chi-square aan te vinken.
Wanneer we vervolgens op Continue en dan op OK klikken, krijgen we een extra tabel die er als volgt uit ziet: Chi-Square Tests Value
Df
Asymp. Sig. (2-sided)
Pearson Chi-Square
3,667a
4
,453
Likelihood Ratio
4,206
4
,379
Linear-by-Linear Association
,299
1
,585
N of Valid Cases
11
a. 9 cells (100,0%) have expected count less than 5. The minimum expected count is ,27.
In deze tabel kijken we naar de waarde bij Pearson Chi-square. Deze is in dit geval ,453 en daarmee is het verschil niet significant (0,453 is duidelijk hoger dan 0,05).
31
Analyse van responsconsistentie De gegevens van een respondent worden gecontroleerd op interne consistentie. Met de monitor kunnen veel kwaliteiten tegelijkertijd gemeten worden (politieke, fysieke, sociale, culturele, economische, ecologische kwaliteit). Het is echter te verwachten dat inconsistentie in de antwoorden voorkomt. Stel we vragen bewoners een oordeel te geven over aspecten van de sociale kwaliteit, 55% oordeelt positief (gemiddelde waardering van alle aspecten). Daarna vragen we hun in het algemeen de sociale kwaliteit te waarderen, en 50% van de bewoners oordeelt positief. We stellen vast, dat er een verschil is. De variabele die we gebruiken om de algemene waardering van sociale kwaliteit te meten, hebben we gecodeerd als “ZW” (Zie onder Variantieanalyse/ Compare Means). “ZW” staat voor “Zorg en Welzijn”. De variabele die we gebruiken om de gemiddelde waardering van alle aspecten van sociale kwaliteit te meten, moeten we nog creëren. Dit doen we als volgt: Eerst creëren we uit de subvariabelen van sociale kwaliteit nieuwe samengestelde variabelen: “Zorg”, “Welzijn”, “Onderwijsvoorzieningen” en “Activiteiten van school”. Deze nieuwe variabelen coderen we bijvoorbeeld als “iZorg”, “iWelzijn”, “iOnderwijs” en “iSchool”. Vervolgens creëren we (weer op dezelfde manier) uit deze nieuwe variabelen nog een nieuwe variabele, die we bijvoorbeeld coderen als “iSoc”. Deze nieuwe variabele geeft het gemiddelde weer van alle aspecten (“Zorg”, “Welzijn”, “Onderwijsvoorzieningen” en “Activiteiten van school”) van sociale kwaliteit. We hebben nu twee variabelen: de variabele “iSoc” (gemiddelde beoordeling van aspecten van sociale kwaliteit) en de variabele “SW” (algemene beoordeling van sociale kwaliteit). We kunnen de responsconsistentie meten, door de sterkte van het lineaire verband tussen de twee variabelen iSoc en SW te meten. Een statistische maat voor dit verband is Pearson’s Correlatie Coëfficiënt (kortweg Pearson’s r genoemd). Waar vinden we Pearson’s r in PASW? We vinden deze correlatietechniek in PASW onder Analyze Correlate Bivariate Correlations. Als Pearson’s r een correlatie tussen iSoc en SW aantoont, kunnen we concluderen tot responsconsistentie. Kan er geen correlatie worden aangetoond, dan is er inconsistentie. Inconsistentie bederft de berekening van de waarde van de kwaliteitsmeting.
Mogelijke oorzaken: inconsistente respondenten; of: inconsistente vragenlijst (zie hieronder) Een kwestie is wat te doen met inconsistente respondenten. De eenvoudigste methode is om inconsistente respondenten uit het bestand te verwijderen. Een bijkomend risico daarvan is dat dit weer bias kan veroorzaken in de resultaten.
33
Consistentie van de vragenlijst Consistentie van de vragenlijst kan worden getoetst met Cronbachs alpha (Reliability in PASW). Cronbachs alpha is een indicatie van de mate waarin een aantal items hetzelfde onderliggende construct meten. We kunnen in PASW Cronbach's alpha opvragen via Analyze Scale Reliability analysis. We plaatsen alle items van een schaal in het witte veld en drukken op OK. Andere maten, zoals de item-rest correlatie en de alpha wanneer een item uit de schaal zou worden gehaald, kunnen via de knop Statistics worden opgevraagd.
Wegen als correctie voor non-respons en selectieve respons. We houden rekening met selectiviteit van de respons (redenen die respondenten kunnen hebben voor non-respons). Gegevens over de non-respons, verkregen nadat het onderzoek is uitgevoerd, nemen we mee in de data-analyse (om data te corrigeren). In principe zal randomisering leiden tot een verdeling/ spreiding van de steekproef evenredig aan de verdeling van de populatie over de wijken. Het valt te verwachten dat uiteindelijke respons van de Tuinwijkenaren 114 (30%) zal zijn, van de bewoners van Boskwartier zullen er 129 (34%) responderen en dit zullen er 137 (36%) zijn bij de Centrumbewoners. Als deze verwachting uitkomt (de verdeling van de steekproef blijkt evenredig te zijn met die van de populatie), is het niet nodig om achteraf weging toe te passen. Stel, dat, als de uiteindelijke respons 380 is, de responsverdeling is niet zoals verwacht (uitgaande van de populatieverdeling) voor de drie wijken respectievelijk 114, 129 en 137, maar bijvoorbeeld 114, 133 en 133 is. De verdeling van de uiteindelijke respons is niet evenredig met die van de populatie. Bovendien blijkt dat de verdeling man/ vrouw in de steekproef afwijkt van die van de populatie. In alle drie de wijken zou volgens de samenstelling van de bevolking de verdeling man/ vrouw in de steekproef gelijk moeten zijn, maar dit is niet het geval. In Tuinwijk blijkt de verdeling te zijn: 1/3 mannen en 2/3 vrouwen; in Boskwartier bestaan de respondenten voor 3/7 uit mannen en 4/7 vrouwen en in Centrum is juist het omgekeerde het geval: 4/7 mannen en 3/7 vrouwen. We gaan nu achteraf herwegen, waardoor de verdeling van de respons wat betreft wijk en geslacht weer evenredig wordt aan die van de populatie. Achteraf wegen in PASW. Bereken eerst de gewichten, als A Populatie Tuinwijk Man 5100 Tuinwijk Vrouw 5100 Boskwartier Man 5780 Boskwartier Vrouw 5780 Centrum Man 6120 Centrum Vrouw 6120 34000
volgt: B Proportie (A) 0,15 0,15 0,17 0,17 0,18 0,18
C Steekproef 38 76 57 76 76 57 380
D Proportie (C) 0,10 0,20 0,15 0,20 0,20 0,15
E B/D 1,5 0,75 1,33 0,85 0,9 1,2
35
Om in PASW een nieuwe gewichtsvariabele te contrueren: Ga naar File → New → Syntax Type in de lege PASW Syntax Editor die als pop up scherm verschijnt:
if (POSTC = 1 & GESL = 1) GEWICHT = 1.5. if (POSTC = 1 & GESL = 2) GEWICHT = 0.75. if (POSTC = 2 & GESL = 1) GEWICHT = 1.33. if (POSTC = 2 & GESL = 2) GEWICHT = 0.85. if (POSTC = 3 & GESL = 1) GEWICHT = 0.0. if (POSTC = 3 & GESL = 2) GEWICHT = 1.2. execute.
Hierbij is verondersteld dat POSTC (gecodeerd 1, 2 & 3) en GESL (gecodeerd 1 & 2) variabelen in de dataverzameling zijn, en dat GEWICHT de naam is van de nieuwe gecombineerde gewichtsvariabele die op het punt staat om gecreëerd te worden. Kies dan Run → All Daarna verschijnt een nieuwe kolom helemaal rechts in DATA VIEW, die de variabele GEWICHT bevat. Na de creatie van deze nieuwe variabele, moet aan PASW worden verteld, hoe deze moet worden gebruikt in de berekeningen. Dit gaat als volgt: Selecteer in het Data-menu “Weight cases”, klik op “Weight cases by”, vind het gecombineerde gewicht en klik OK. Daarna verschijnt onderaan rechts de boodschap "Weight on". Om "Weight on" uit te schakelen, selecteer "Do not weight cases" en klik "OK.
PLAN VOOR EEN ONLINE KRIMPPANEL Wat is een online krimppanel? Een online krimppanel is een online longitudinaal onderzoek onder personen die belang hebben bij vraagstukken op het gebied van maatschappelijke effecten van krimp. Wat zijn de belangrijkste elementen van het plan: 1 Creatie van een panelonderzoek op een website 2 Communicatie met stakeholders 3 Analyse en publicatie van onderzoek
37
Creatie van een panelonderzoek op een website
NEIMED beschikt over een eigen landelijk online onderzoekspanel voor stakeholders. De panelwebsite Van Meer naar Beter of Neimed.nl is hier speciaal voor ingericht. Door het gebruik van internet is het mogelijk om enquêtes per vraag op het computerscherm weer te geven. De respondent kan de gehele enquête invullen door antwoorden aan te klikken met de muis. In de online-vragenlijst worden in principe dezelfde indicatoren/ variabelen gebruikt als in de wijkmonitor. Alleen zullen, de vragen anders geformuleerd worden, aangepast aan de doelgroep (stakeholders). Hierover moet nog nagedacht worden. Een geschikte vragenlijst-generator is Lime Survey2 (Open Source PHP online and web based survey generator) Lime Survey beschikt (volgens eigen zeggen) over - een WYSIWYG (What You See Is What You Get) HTML Editor - W3C compliance (beantwoordt aan de standaarden van het World Wide Web Consortium). - Multi-Lingual Surveys - Unlimited number of surveys at the same time - Verschillende vraagtypen / Unlimited number of questions in a survey (only limited by your database) /20 different question types with more to come
- Printbare versie - Baseren (ook wel genoemd: Skip Logic of Branching): het is mogelijk om vervolgvragen en -antwoorden herhaald te baseren op antwoorden op vorige vragen - Herbruikbare en bewerkbare antwoordensets
- Verzenden van uitnodigingen, herinneringen en wachtwoorden via email
- Optie voor deelnemers om de antwoorden tussentijds op te slaan om later verder te kunnen gaan - Gebruik van beelden en films in een vragenlijst - Mogelijkheid om de pagina layout te bewerken - Uitgebreide en gebruikersvriendelijke beheeromgeving
‐ Statistische en grafische pre-analyse (tabellen en grafieken) met exporteermogelijkheden - Importeer- en exporteerfuncties naar tekst, CSV, PDF, SPSS, queXML en MS Excel formaat. - Online Manual (voor de ontwikkelaar)
2
http://www.limesurvey.org/nl/demo
We kunnen nog onderzoeken of volgende functies beschikbaar zijn in Lime Survey: - Validaties op foutieve invoer door respondenten - Voorbeeldweergave: Een preview inclusief opmaak kan per vraag, per blok van vragen of van de gehele vragenlijst worden getoond - Voortgangsindicator: Aan respondenten kan een voortgangsindicator worden getoond - Uitleg en tips: Geeft respondenten aanwijzingen of toont waarschuwingen via testblokken of mouse-over teksten voor, bij en na vragen en antwoorden. - Aanmeldformulier /Login: Het is mogelijk respondenten uitsluitend toegang te verlenen met een automatisch gegenereerde gebruikersnaam-wachtwoord combinatie. Deze geeft toegang tot enquête en eventueel het beveiligde Neimednetwerk
Neimed maakt ten behoeve van de respondent een Handleiding bij het invullen van het online-onderzoek
Communicatie met stakeholders
Een belanghebbende of stakeholder is een persoon of organisatie die invloed ondervindt of zelf invloed kan uitoefenen op een organisatie, een overheidsbesluit, een product of een project op het gebied van “maatschappelijke effecten van krimp” / leefomgeving van de stakeholder. Het streven van Neimed is om een panel van stakeholders te realiseren dat qua spreiding een goede afspiegeling is van de totale groep stakeholders. Selectie van de groep deelnemende stakeholders wordt bepaald door hun diversiteit / heterogeniteit. Heterogeniteitstoets/ diversiteitstoets geeft antwoord op de vraag: zijn alle categorieën in elke regio even sterk vertegenwoordigd? We stellen als voorwaarden voor diversiteit: De groep deelnemers is gespreid over alle regio’s: tenminste 1 deelnemer per regio Elke categorie stakeholders heeft tenminste 1 vertegenwoordiger We stellen vast: Nederland telt 40 regio’s (COROP-gebieden). Er zijn 10 categorieën stakeholders (de categorieën zijn afgeleid uit de Van Meer naar Beter-website; zie hieronder). Als we deze vaststellingen met elkaar combineren, betekent dit, dat het vereiste aantal 40 maal 10 = 400 deelnemers is.
39
Formule diversiteitstoets (hiermee kan worden berekend in hoeverre de vereiste diversiteit wordt behaald): H=1-(ko-ke)*(ro-re)/( ko* ro-ke*re) (ke = beoogd aantal categorieën; ko = gerealiseerd aantal categorieën; re = beoogd aantal regio’s; ro = gerealiseerd aantal regio’s) Rekenvoorbeeld (de vereiste diversiteit wordt behaald) (10 categorieën, 40 regio’s beoogd & gerealiseerd) Als ke = 10 en re = 40, ko = 10; ro = 40, dan H = 1-(10-10)*(40-40)/(10*40-10*40)=1-0=1 Rekenvoorbeeld (de vereiste diversiteit wordt niet behaald) (10 categorieën, 40 regio’s beoogd; 8 categorieën, 30 regio’s gerealiseerd) Als ke = 10 en re = 40, ko = 8; ro = 30, dan H = 1-(8-10)*(30-40)/(8*30-10*40)=1-(-20)/-160=1-0,125 = 0,875
Stakeholders zijn personen die komen uit, een belang hebben in, betrokken zijn bij of expertise hebben in een of meer van de volgende 10 sectoren: 1 Onderwijs 2 Bestuurskracht 3 Wonen 4 Financiën 5 Ruimte 6 Werken 7 Vrije tijd 8 Welzijn 9 Zorg 10 Mobiliteit De categorieën stakeholders komen overeen met de thema’s die zijn genoemd in Van Meer Naar Beter. Inschakeling van het panel geeft de mogelijkheid om informatie te verkrijgen over waarderingen (percepties / preferenties) die panelleden geven over politieke, sociaal-culturele en economische kwaliteit van geïdentificeerde leefomgevingen Panelonderzoek (met regiogebonden vraagstellingen) vindt periodiek plaats, maar ook onderzoek naar actuele (niet-regiogebonden) vraagstellingen is mogelijk. Selectie van categorieën van stakeholders wordt gedaan vanuit volgende achtergrondvariabelen: Postcode (adres) Expertise - Beroep - Bedrijfssector Regio – Gemeentegrootte - Stedelijkheidsgraad – Wel/niet krimpgebied
Als tegenprestatie voor hun deelname aan het krimppanel krijgen deelnemers toegang tot het Neimed-netwerk. Via dit netwerk kunnen stakeholders met elkaar communiceren. Met het oog daarop wordt een online krimpmagazine (KRIMPZINE) opgezet.
41
Analyse en publicatie van onderzoek
ANALYSE (PASW) Op de met het online panelonderzoek verzamelde data voert Neimed bepaalde analyses uit, zoals: 1 2 3 4 5 6 7 8 9
Hercoderen van variabelen Een samengestelde variabele creëren Focus op een bepaalde groep Variantieanalyse/ Compare Means Regressieanalyse Crosstabs Analyse van responsconsistentie Consistentie van de vragenlijst Wegen als correctie voor non-respons en selectieve respons
Verder kunnen er meta-analyses worden uitgevoerd.
META-ANALYSE /DSTAT Een meta-analyse is een onderzoek waarin kwantitatieve onderzoeken van een bepaald fenomeen (de maatschappelijke effecten van krimp) worden samengevoegd om meer precieze uitkomst te verkrijgen. DSTAT is een programma voor het uitvoeren van een meta-analyse. Vijf stappen: 1 Conceptualiseer de relatie tussen krimp (x) en maatschappij (y) (effect van x op y en omgekeerd van y op x). Beschrijf theoretische debatten over de relatie als deze bestaat. 2 Verzamel relevante onderzoeken, die deze relatie hebben gealyseerd. Beschrijf de grenzen van het literatuuronderzoek (welke onderzoeken horen er bij, welke niet?) Verzameltechnieken: - zoek in literatuurlijsten naar kwalitatief krimponderzoek - zoek literatuurbesprekingen - zoek databases via de computer - gebruik het onderzoekersnetwerk – doorzoek tijdschriften 3 Benoem de kwaliteit van elk van die onderzoeken en indien mogelijk beschrijf in cijfers wat volgens elk onderzoek de maatschappelijke effecten van krimp zijn - Identificeer moderator variabelen (variabelen waarvan men kan verwachten dat ze verantwoordelijk zijn voor de effecten) - Analyseer de betrouwbaarheid van het gemeten effect - Gebruik statistiek.
Parametrische toetsen (gemiddelde, standaarddeviatie, t-test, ANOVA, Pearson, pwaarden) kunnen worden geconverteerd naar een g-waarde (begrip in DSTAT, dat staat voor “gestandaardiseerd effect”). Non-parametrische toetsen (chi-kwadraat, proporties) zijn relatief onnauwkeurig en moeilijker om te zetten naar een g-waarde. 4 Analyseer de data: Bepaal het algemene gemiddelde en consistentie van de effectgrootten. Verklaar inconsistenties. 5 Schrijf een rapport (meta-analyse) Een vraag kan zijn, welke soorten onderzoeken we in de analyses gaan betrekken: Bijvoorbeeld behalve Neimed-onderzoek ook niet-Neimed-onderzoek. Behalve kwantitatief ook kwalitatief onderzoek. Idee: Publiceer artikelen (krimpanalyses) in een online magazine.
43
THEORIE VAN REVERDA Het volgende is te zien als een voorbeeld van hoe invulling zou kunnen worden gegeven aan stap 1 van een meta-analyse: “Conceptualiseer de relatie tussen krimp (x) en maatschappij (y) (effect van x op y en omgekeerd van y op x). Beschrijf theoretische debatten over de relatie als deze bestaat.”
Hypothese (theorie van Reverda): Politieke macht, economisch kapitaal en sociaal kapitaal zijn voldoende invalshoeken om het sociale gedrag van mensen te begrijpen. Deze drie dimensies zijn nodig, niet meer en niet minder. Kernvraag: wat zou het gevolg zijn als een wijk op een van de drie gebieden een risico zou lopen? Risicotypen: 1 Economisch zwakke samenleving Stel dat je twee samenlevingen, een met een zwakke economie en een sterke economie, zou beoordelen naar hun welvaart, dan zou de theorie van Reverda niet kloppen, als zou blijken, dat beide even welvarend zouden zijn (tenzij er een derde factor, bijvoorbeeld de verzorgingsstaat, in het spel is). 2 Sociaal-cultureel zwakke samenleving Stel dat je twee samenlevingen, een met een zwakke en een met een sterke burgermaatschappij zou beoordelen naar de openheid of geslotenheid van hun samenleving dan zou de theorie van Reverda niet kloppen, als zou blijken, dat beide even gesloten zouden zijn (tenzij er een derde factor, bijvoorbeeld politieke repressie, in het spel is).
3 Politiek zwakke samenleving Stel dat je twee samenlevingen, een met een zwakke en een met een sterke overheid zou beoordelen naar de mate van bureaucratie, dan zou de theorie van Reverda niet kloppen, als zou blijken, dat beide even bureaucratisch zouden zijn (tenzij er een derde factor, bijvoorbeeld technocratie, in het spel is).
45