Methode om het effect van een verkeersveiligheidsmaatregel op de gemiddelde snelheid en op de V85 te berekenen
RA-2006-87
Erik Nuyts Onderzoekslijn infrastructuur en ruimte
DIEPENBEEK, 2012. STEUNPUNT VERKEERSVEILIGHEID.
Documentbeschrijving Rapportnummer:
RA-2006-87
Titel:
Methode om het effect van een verkeersveiligheidsmaatregel op de gemiddelde snelheid en op de V85 te berekenen
Ondertitel:
Auteur(s):
Erik Nuyts
Promotor:
Rob Cuyvers
Onderzoekslijn:
infrastructuur en ruimte
Partner:
Provinciale Hogeschool Limburg
Aantal pagina’s:
36
Projectnummer Steunpunt:
2.2.4
Projectinhoud:
Effecten van infrastructurele maatregelen
Uitgave: Steunpunt Verkeersveiligheid, mei 2006.
Steunpunt Verkeersveiligheid Wetenschapspark 5 bus 6 B 3590 Diepenbeek T 011 26 91 12 F 011 26 91 99 E
[email protected] I www.steunpuntverkeersveiligheid.be
Samenvatting Het is niet altijd mogelijk om het effect van een verkeersveiligheidsmaatregel rechtstreeks te meten op de ongevallen. De reden is meestal dat er niet voldoende ongevallen gebeuren in het beschouwde tijdsinterval om op zinvolle wijze statistische testen toe te passen. Daar waar de verkeersonveiligheid ontstaat door een te grote snelheid, is het zinvol om het effect van de verkeersveiligheidsmaatregel op de snelheid te meten. In Vlaanderen wordt het effect van een maatregel op de snelheid al af en toe gemeten, maar dan ontbreken de correctie voor de algemene ongevallentrend en de relevante testen om significante verschillen te vinden. Ook het samennemen van dergelijke resultaten gebeurt niet met juiste formules. Dit rapport wil in deze lacune voorzien. Omdat niet alle mogelijke gebruikers van deze methodieken over geavanceerde statistische pakketten beschikken, is er bewust voor gekozen om enkel formules te gebruiken die uit te rekenen zijn met veelgebruikte rekenbladen zoals Microsoft Excel. Er zijn formules uitgewerkt om het effect te schatten op de gemiddelde snelheid en de V85, en dit met en zonder vergelijkingsgroep. Als uitbreiding op wat men in de literatuur vindt, mag bij de hier getoonde berekeningen de vergelijkingsgroep uit meerdere locaties bestaan. Uit de berekeningen blijkt dat bij voor-na analyses zonder vergelijkingsgroep het betrouwbaarheidsinterval van het effect onderschatten. Hierdoor geven testen zonder vergelijkingsgroep soms significante effecten aan, terwijl die effecten niet significant zijn indien een vergelijkingsgroep was gebruikt. Als men dezelfde maatregel op verschillende plaatsen heeft toegepast, en het effect op de verschillende plaatsen heeft berekend, wil men vaak ook een globaal effect kennen, een soort gemiddelde over alle plaatsen heen. Ook hiervoor zijn in dit rapport twee methodes uitgeschreven op basis van de theorie van meta-analyses. Welke methode gebruikt wordt, hangt af van het doel van de meta-analyse. Indien men wil nagaan of uitgevoerde maatregelen effectief waren op de uitgevoerde locaties moet men een fixed effects meta-analyse uitvoeren. Om na te gaan of de maatregel op andere plaatsen succesvol zou zijn, moet men een random effects meta-analyse uitvoeren. Uit de formules blijkt dat het best mogelijk is om een significant effect te vinden voor de locaties waar de maatregel uitgevoerd werd (fixed effects meta-analyse) terwijl het verwachte resultaat voor andere locaties (random-effects meta-analyse) niet significant is. De methodieken worden uitgelegd aan de hand van een voorbeeld van dynamische snelheidsborden in Antwerpen.
Steunpunt Verkeersveiligheid
3
RA-2006-87
Summary Calculation of the effect of a traffic safety measure on the average speed and the V85 It is not always possible to measure directly the effect of a traffic safety measure on the number of accidents. In a limited time window, the number of accidents is not always sufficiently large to allow statistical testing. Where traffic safety is linked with traffic the effect of the measure could be approximated by measuring the effect on the traffic speed. In Flanders, when the effect of a measure on traffic speed is calculated, most often there lack a correction for the general trend of traffic safety. Also statistical tests to see if the effect is significant are hardly used. In this report, the necessary formulas to do so are shown. Since not all members of the target group of the method have the disposal of advanced statistical packages, only formulas are used that can be calculated with regular spreadsheets like Microsoft Excel. The formulas allow estimating the effect on the mean speed and on the V85, with and without a comparison group. As an extension of what is found in literature, calculations in this report allow the use of more than one location as a comparison group. From the formulas, it follows that the lack of a comparison group results in an underestimation of the standaard error of the estimate. Hence, tests without an comparison group find easily significant results, that would not be significant if a comparison group was used. After calculating the effect of a measure on several locations, one often wants to have some general value of the effect of the measure. For this purpose, two formulas are presented, based on the theory of meta-analysis. One method (fixed effects model) allows to test if the measures were successful at the locations where the measures were taken. A second method (random effects method) allows estimating if the same measure would be successful in new locations. The second method is much more conservative than the first method. Hence, it is possible to find a significant effect for the locations where the traffic safety measure has been performed, without having a significant effect for extrapolation to other locations. All methods are explained with an example of variable speed message signs in Antwerp.
Steunpunt Verkeersveiligheid
4
RA-2006-87
Inhoudsopgave
1.
INLEIDING
8
1.1
Aanleiding van dit onderzoek
8
1.2
Doelstellingen
8
2.
KEUZE VAN DE EFFECTGROOTHEID VOOR DE GEMIDDELDE SNELHEID
10
2.1
Vertekening van de effectberekening voor snelheden
10
2.2
Effectgrootheid voor snelheid: het absolute verschil van gemiddeldes
11
2.3
Het absolute verschil van gemiddeldes: voor-na-meting met vergelijkingsgroep 12
3.
KEUZE VAN DE EFFECTGROOTHEID VOOR DE V85
15
3.1
V85 in plaats van de gemiddelde snelheid
15
3.2
De standaard error van het 85%-percentiel
16
4.
DE META-ANALYSE
17
4.1
Meta-analyses van absolute verschillen van gemiddeldes
17
4.2
Fixed effects meta-analyse van absolute gemiddelde verschillen
17
4.3
Random effects meta-analyse van absolute gemiddelde verschillen
19
5.
FORMULES BIJ HET ONTBREKEN VAN EEN VERGELIJKINGSGROEP
21
5.1
Aanvaardbaarheid van een voor-na-meting zonder vergelijkingsgroep
21
5.2 Berekening vergelijkingsgroep
van
de
effectgrootheid
bij
voor-na-metingen
zonder 21
5.3
Meta-analyses met inbegrip van voor-na-metingen zonder vergelijkingsgroep 22
6.
UITGEWERKT VOORBEELD: DYNAMISCHE SNELHEIDSINFORMATIE
23
6.1
Data snelheidsmeting en vergelijkingsgroep
23
6.2
Effect van de dynamische snelheidsinformatie op de gemiddelde snelheid
24
6.3
Effect van de dynamische snelheidsinformatie op de V85
26
6.4 Meta-analyse van het effect van de dynamische snelheidsinformatie op de gemiddelde snelheid 28
7.
CONCLUSIES EN AANBEVELINGEN
30
7.1
Conclusies
30
7.2
Aanbevelingen voor de overheid
31
7.3
Verder onderzoek
31
8.
DANKBETUIGING
32
Steunpunt Verkeersveiligheid
5
RA-2006-87
9.
LITERATUURLIJST
33
10.
APPENDIX
35
10.1 De tweede term van de variantie bij een fixed random analyse is kleiner dan de kleinste dfL. 35 10.2
G FE
Bij
SEGFE
fixed
effects
analyse
is
het
kleiner dan de kleinste dfL
aantal
vrijheidsgraden
t-verdeling
van 36
10.3 SE(GFE) is in een fixed effects meta-analyse kleiner dan of gelijk aan kleinste van de verschillende SE(G) 36
Steunpunt Verkeersveiligheid
6
RA-2006-87
Lijst van tabellen
Tabel 1: Voorbeeld van de beschikbare data van snelheidsmeting (Bron: De Clercq, 2005) .................................................................................................................23 Tabel 2: Data van de snelheidsmeting van de Ledeganckkaai (Bron: De Clercq, 2005 en eigen bewerking daarop) .......................................................................................24 Tabel 3: Effect van dynamisch informatiebord op de gemiddelde snelheid voor de Ledeganckkaai (Eigen bewerking op data uit De Clercq, 2005). ..................................25 Tabel 4: Effect van dynamisch informatiebord op de gemiddelde snelheid voor de Arthur Matthyslaan (Eigen bewerking op data uit De Clercq, 2005). ......................................26 Tabel 5: Data van de snelheidsmeting van de Ledeganckkaai (Bron: De Clercq, 2005 en eigen bewerking daarop) .......................................................................................27 Tabel 6: Effect van dynamisch informatiebord op de V85 voor de Ledeganckkaai (Eigen bewerking op data uit De Clercq, 2005)...................................................................27 Tabel 7: Input van de meta-analyse van voor de gemiddelde snelheid. .......................28 Tabel 8: Berekening van het globale effect op gemiddelde snelheid van dynamische borden voor een fixed effects analyse en een random effects .....................................28
Steunpunt Verkeersveiligheid
7
RA-2006-87
1.
INLEIDING
1.1
Aanleiding van dit onderzoek
Het effect van maatregelen op verkeersveiligheid wordt het beste gemeten door te onderzoeken of het aantal ongevallen vermindert ten gevolge van een maatregel. Omdat ongevallen op een specifieke plaats of een specifieke wegas vaak zeldzame gebeurtenissen zijn, moet er vaak een jaar of meer gewacht worden voor men het effect van een maatregel kan meten. In sommige situaties is dit veel te lang. Bv. als men een maatregel ergens heeft toegepast, en men overweegt om deze op korte termijn ook elders toe te passen. Anderzijds kan het zijn dat op een bepaalde plaats relatief weinig ongevallen gebeuren, of voornamelijk minder ernstige ongevallen waarvan geen PV wordt opgemaakt. Hierdoor worden deze ongevallen niet geregistreerd, en wordt het nog moeilijker om het effect van een maatregel te meten. Als de maatregel de verkeersveiligheid wil bevorderen door de snelheid te verminderen, kan het effect benaderend geschat worden door de verandering in snelheid meten. Een daling van de snelheid gaat meestal gepaard met een stijging van de verkeersveiligheid (literatuuronderzoek Aarts, 2004; Nilsson, 2004; Elvik et al., 2004). Als maat voor ‘de’ snelheid wordt bij verkeersonderzoek meestal ofwel het gemiddelde genomen, ofwel de V85. Voor Vlaanderen is reeds een methodiek beschreven en de Excel-tool CESaM ontwikkeld om het effect te meten aan de hand van ongevallen (Nuyts & Cuyvers, 2003; Van Geirt & Nuyts, 2004). Een methodiek om het effect te meten op snelheden volgt niet zomaar uit de methodiek voor ongevallen. De verdelingen verschillen volledig. Ongevallen zijn zeldzame gebeurtenissen met een Negatief Binomiaal verdeling. Snelheden zijn erg vaak voorkomende gebeurtenissen (elke auto heeft een snelheid) met een normaal verdeling. Vanuit statistisch standpunt geeft dit erg grote verschillen. Een nieuwe methodiek moet dus uitgewerkt worden om het effect van een maatregel te meten met behulp van snelheden. In hoofdstuk 2 geven we formules om het effect van een maatregel te berekenen op de gemiddelde snelheid van de locaties. In hoofdstuk 3 geven we formules om het effect te berekenen op de V85. In hoofdstuk 4 gebruiken we de theorie van de meta-analyse om resultaten van verschillende locaties samen te nemen tot één globaal resultaat. Vaak gebruiken onderzoekers geen vergelijkingsgroep. In hoofdstuk 5 herrekenen we de formules voor deze eenvoudigere situatie, en geven ook de bijbehorende vertekeningen aan. Om dit alles concreter te maken werken we in hoofdstuk 6 een voorbeeld uit van een Antwerps experiment met dynamische snelheidsborden. In hoofdstuk 7 tenslotte trekken we conclusies en doen we enkele aanbevelingen.
1.2
Doelstellingen
In dit rapport wordt een methodiek gegeven om -
het effect van een maatregel te meten aan de hand van een wijziging in gemiddelde snelheid
-
het effect van een maatregel te meten aan de hand van een wijziging in V85
Steunpunt Verkeersveiligheid
8
RA-2006-87
-
deze effecten van verschillende studies samen te kunnen nemen in een metaanalyse.
De methodieken worden uitgelegd aan de hand van een voorbeeld. Mogelijke gebruikers van deze methodieken zijn wetenschappelijke onderzoekers, maar ook mobiliteitsambtenaren, lokale en federale politie, medewerkers van ministeries en consultingbureaus,... Gezien zeker niet al deze diensten over geavanceerde statistische pakketten beschikken, is er bewust voor gekozen om enkel formules te gebruiken die uit te rekenen zijn met gebruikelijke rekenbladen zoals Microsoft Excel.
Steunpunt Verkeersveiligheid
9
RA-2006-87
2.
KEUZE
VAN
DE
EFFECTGROOTHEID
VOOR
DE
GEMIDDELDE SNELHEID
2.1
Vertekening van de effectberekening voor snelheden
We willen weten wat het effect van een maatregel is op de gemiddelde snelheid en op de V85. Naar analogie met de berekening van het effect van een maatregel op het aantal ongevallen vrezen we voor een vertekende schatting als gevolg van de algemene ongevallentrend en van regressie naar het gemiddelde. Voor een uitgebreide Nederlandstalige uitleg hierover, zie Nuyts & Cuyvers (2003). De algemene ongevallentrend in Vlaanderen is de laatste jaren meestal dalend. Verschillende maatregelen worden tegelijkertijd toegepast, vaak door verschillende instanties, waardoor het moeilijker is om het effect van één specifieke maatregel te isoleren. Hiervoor gebruikt men een vergelijkingsgroep. Deze vergelijkingsgroep moet zo goed mogelijk overeenkomen met de locatie waar een maatregel wordt toegepast. Tijdens de meetperiodes mogen er op de locaties van de vergelijkingsgroep geen maatregelen worden uitgevoerd, tenzij algemene maatregelen die automatisch ook gelden voor de locatie met de te onderzoeken maatregel. Klassieke voorbeelden van dergelijke algemene maatregelen zijn wetswijzigingen. Als men het effect van een maatregel op de snelheid wil berekenen en corrigeren voor algemene maatregelen, kan dit op een vergelijkbare manier. Door het verschil van de snelheid bij de locatie met de maatregel te vergelijken met het verschil in snelheid tussen de voor-periode en de naperiode van de vergelijkingsgroep, kan men het effect van de bedoelde maatregel isoleren. Regressie naar het gemiddelde treedt bij ongevallen op als maatregelen voornamelijk toegepast worden op locaties met een opmerkelijk hoog aantal ongevallen. Een uitzonderlijk hoog aantal ongevallen in een bepaald jaar is soms zuiver het gevolg van toeval. Ook zonder maatregelen volgt op een uitzonderlijk slecht jaar meestal een beter jaar. De kans op twee heel slechte jaren na elkaar is namelijk erg klein. Soms schrikt het beleid echter van dit uitzonderlijk hoge aantal ongevallen en voert een maatregel uit. Het jaar daarop is het aantal ongevallen dan meestal lager. Maar een gedeelte van die daling is dan ongetwijfeld regressie naar het gemiddelde. Hiervoor moet gecorrigeerd worden bij de berekening van de effectiviteit van verkeersmaatregelen op basis van ongevallenstatistieken. Correctie voor regressie naar het gemiddelde is waarschijnlijk echter overbodig bij de berekening van de effectiviteit van verkeersmaatregelen op basis van snelheden. Maatregelen worden zelden genomen omdat de snelheid bij een meting uitzonderlijk hoog was. Bovendien is het effect van toeval kleiner bij de gemiddelde snelheid of de V85 dan bij het aantal ongevallen. Ongevallen zijn zeldzame gebeurtenissen. Als er in een jaar op een bepaalde plaats 7 i.p.v. 5 ongevallen voorkomen is dat een stijging van 40%. Die best het gevolg van toeval kan zijn. Maar een stijging van een gemiddelde snelheid van 50 km/u naar 70 km/u kan geen toeval zijn. Hierbij gaan we er natuurlijk wel van uit dat er voldoende wagens gecontroleerd zijn bij de snelheidsmeting. Regressie naar het gemiddelde bij snelheid zal zich dus enkel voordoen indien (i) de voormeting onbetrouwbaar was (bv. te weinig wagens gemeten) of ongeldig (bv. speciale situatie ten gevolge van een omleiding) en (ii) er een maatregel uitgevoerd is ten gevolge van deze uitzonderlijke gemiddelde snelheid of een uitzonderlijke V85. Deze situatie is in praktijk zo eenvoudig te voorkomen, dat we ze in het vervolg van het rapport niet behandelen. Het minimale aantal voertuigen om een snelheidsverdeling te schatten bedraagt 100 voertuigen (Ewing, 1999; Traffic Engineering Manual, 2000; IOWA, 2001; Tech News, 2004). Deze metingen moeten gebeuren bij niet te hoge intensiteiten, zodat de
Steunpunt Verkeersveiligheid
10
RA-2006-87
bestuurders hun snelheid zelf kunnen kiezen. Het is vanzelfsprekend dat mensen trager rijden tijdens files, maar dat is niet wat we willen onderzoeken.
2.2
Effectgrootheid voor snelheid: het absolute verschil van gemiddeldes
Dit rapport wil een grootheid formuleren die het effect van een maatregel op de snelheid weergeeft. Deze grootheid moet ook over verschillende studies heen gecombineerd kunnen worden. Want we willen het effect van een maatregel op verschillende wegen meten, en de effecten nadien samen nemen zodat veralgemening voor Vlaanderen mogelijk is. Dergelijke analyse waarbij resultaten van verschillende studies gecombineerd worden tot overkoepelende resultaten heet een meta-analyse. Bij meta-analyses zijn er verschillende mogelijkheden om de grootte van effecten te berekenen. De verzamelnaam van deze grootheden is in de Engelse literatuur “Effect sizes” (effectgrootheid). Deze vallen uiteen in drie families (zie bv. Hedges, nd.; Bond et al., 2003): -
het gestandaardiseerde verschil van gemiddeldes (standaardized mean difference)
-
odds-ratio’s
-
het absolute verschil van gemiddeldes (raw mean difference)
De effectiviteit van een maatregel voor ongevallen wordt berekend als een odds-ratio (zie bv. Hauer, 1997; Elvik, 2002; Nuyts & Cuyvers, 2003). Een odds-ratio is een breuk van een breuk, en voornamelijk bruikbaar indien getelde aantallen of proporties vergeleken worden. Daarom zijn odds-ratio’s bruikbaar voor de effectiviteitsberekening op basis van ongevallenaantallen, maar niet als effectgrootheid op basis van een gemiddelde snelheid of de V85. Het gestandaardiseerde verschil van gemiddeldes is in meta-analyses de meest gebruikte effectgrootheid. Daarom werd voor dit rapport in eerste instantie gedacht aan het uitwerken van een gestandaardiseerd verschil van gemiddeldes. Het gestandaardiseerde verschil van gemiddeldes d is van de vorm (Hedges, nd.; Bond et al., 2003): Vergelijking 1 met
d
X maatregel X vergelijkingsgroep StDev X
,
X maatregel het gemiddelde van de metingen op de locatie met de maatregel,
X vergelijkingsgroep het gemiddelde van de vergelijkingsgroep en StDev X de standaardafwijking van de metingen. De kracht van Vergelijking 1 is dat d een dimensieloze grootheid is, onafhankelijk van wat er precies gemeten is door X. Want wat de dimensie van X ook is, dezelfde dimensie verschijnt in de teller (gemiddeldes van X) en in de noemer (standaardafwijking van X). Deze dimensieloosheid maakt het mogelijk om in een metaanalyse erg verschillende resultaten toch te vergelijken. Effecten op snelheid kunnen op gestandaardiseerde manier vergeleken worden met effecten op ongevallen, met effecten op intensiteiten, enzovoorts. Bovendien bestaan er ook methodes om correlaties, proporties van verklaarde variantie, overlap-indices e.d. te herrekenen naar een gestandaardiseerd verschil van gemiddeldes (Cohen, 1988). Dit verhoogt het nut van een gestandaardiseerd verschil van gemiddeldes nog in meta-analyses, omdat het toelaat om effectgrootheden die in publicaties op een andere manier geformuleerd zijn, toch om te rekenen naar een gestandaardiseerd verschil van gemiddeldes.
Steunpunt Verkeersveiligheid
11
RA-2006-87
Deze methodiek geeft dus vele mogelijkheden, maar heeft ook beperkingen. Het belangrijkste probleem is dat het gestandaardiseerde verschil van gemiddeldes niet eenvoudig te interpreteren is. Het geeft geen absolute verschil meer tussen de voor- en naperiode, en evenmin een procentueel verschil. Eigenlijk is de interpretatie equivalent met de ‘Z-score’ van een standaard normale verdeling. Bv. een gestandaardiseerd verschil van gemiddeldes van -0.4 betekent dat 34% van de vergelijkingsgroep trager rijdt dan het gemiddelde van de snelheid van de locatie waar de maatregel is toegepast (Coe, 2000). Om deze omzetting te maken bestaan tabellen (bv. Coe, 2000), maar zelfs na omzetting is de interpretatie niet evident. Andere interpretaties worden erg kwalitatief. Vaak wordt de interpretatie van Cohen (1977, 1988) gebruikt, waarbij 0.2 een ‘klein’ effect, 0.5 een’ medium’ effect en 0.8 als ‘groot’ effect wordt beschouwd. De kracht van het gestandaardiseerd verschil –zijn algemene bruikbaarheid- is dus ook zijn zwakte. Daarom wordt bij metingen waarvan het resultaat op zich nog begrijpbaar is, zoals een daling in snelheid, meer en meer gesuggereerd om als effectgrootheid het absolute verschil van gemiddeldes te berekenen (Coe, 2000; Bond et al., 2003, S.B. Morris, pers. comm.). In dit rapport willen we bij de meta-analyses niet verder gaan dan effecten op snelheden op verschillende wegen samen nemen. We zoeken niet naar het “globale effect” van een maatregel, gebaseerd op resultaten van ongevalseffecten en snelheidseffecten, maar wel naar een globaal effect op de snelheid. We werken dan ook formules uit voor het absolute verschil van gemiddeldes.
2.3
Het absolute verschil van gemiddeldes: voor-na-meting met vergelijkingsgroep
Volgende formules zijn gebaseerd op Morris (2003). Aangezien de formules niet exact zijn overgenomen uit dit artikel, zijn wijzigingen besproken met S. Morris om tot formules te komen die bruikbaar zijn voor toepassing in verkeerskunde. We gaan uit van een locatie waar een maatregel is uitgevoerd en n vergelijkingswegen. Definieer: V,M voor
is de gemiddelde snelheid in de voor-periode op de weg met de maatregel
V,M na
is de gemiddelde snelheid in de na-periode op de weg met de maatregel
V,VGL,i,
voor
is de gemiddelde snelheid in de voor-periode voor de vergelijkingsweg i
V,VGL,i,
na
is de gemiddelde snelheid in de na-periode voor de vergelijkingsweg i
N...,
is het aantal waarnemingen voor de betrokken weg
SE...,
is de standaard error van het gemiddelde voor de betrokken weg
n~i krijgen. Een weg met een groter gewicht
De vergelijkingswegen kunnen een gewicht
heeft meer impact op de resultaten dan een weg met een kleiner gewicht. Indien het aantal waarnemingen per weg min of meer in dezelfde grootte-orde is, dan is het gebruik van volgende gewichten (gebaseerd op het idee van de N-weighted mean) verantwoord: Vergelijking 2
n~i
1 1 N VGL ,i ,voor
1 N VGL ,i ,na
Bij deze gewichten worden wegen waarbij meer tellingen gebeurd zijn betrouwbaarder geacht. Dit kan een probleem opleveren indien voor de ene vergelijkingsweg automatische tellingen gebeuren (bv. omdat daar tellussen liggen), en voor een andere Steunpunt Verkeersveiligheid
12
RA-2006-87
vergelijkingsweg handmatige tellingen (data speciaal verzameld voor de effectiviteitsberekening). In dat geval kan het aantal tellingen van de locatie met de lus gemakkelijk 10 keer zo groot zijn als het aantal handmatige tellingen van de andere locatie. Nochtans zijn die resultaten dan niet noodzakelijk 10 keer zo betrouwbaar 1. In dergelijke situatie kan men overwegen om zonder gewichten te werken: Vergelijking 3
n~i 1
Een alternatief is om bij de berekening het aantal waarnemingen van de weg met automatische tellingen kunstmatig gelijk te stellen aan bv. twee keer het grootste aantal van de handmatige tellingen. Deze ingreep is duidelijk subjectief, en men moet dan uitproberen wat het effect is als men bv. even groot of drie keer zo groot neemt als het grootste aantal handmatige tellingen. De schatting van het effect is n
Vergelijking 4
G (VM , na VM , voor)
n~ (V i 1
i
VGL , i , na
VVGL , i , voor)
n
n~
i
i 1
Aangezien dit effect een schatting is, is er ook een variantie op deze schatting. De variantie van een som of een verschil is de som van de varianties van de verschillende termen. Voor elke parameter van een verdeling kan het kwadraat van de standaard error van parameter gebruikt worden als variantie van die parameter. Dan vinden we n
Vergelijking 5
VAR (G ) SE M2 ,na SE M2 ,voor
n~ (SE i 1
2
i
2 VGL ,i , na
2 SEVGL ,i ,voor )
n ~ ni i 1
2
Als de parameter waarover sprake een gemiddelde is, dan is de standaard error SE van die parameter de standaard afwijking S van de betrokken verdeling gedeeld door wortel van het aantal waarnemingen Vergelijking 6
SE
S N 1
We kunnen de standaard errors dus schatten uit de beschikbare data. In principe nemen we aan dat alle verdelingen van de weg met de maatregel en de wegen zonder maatregel dezelfde variantie hebben, anders waren de wegen niet echt vergelijkbaar. In dat geval kunnen we de standaard error beter schatten op basis van pooled within-group variance van de voor-periode S²pooled:
1
Bemerk dat we hier het statistische begrip ‘betrouwbaarheid’ behandelen. We gaan uit van exacte meetwaarden, maar houden rekening met de impact van toeval. Verschillen in ‘betrouwbaarheid’ als gevolg van andere meettoestellen zijn niet in rekening gebracht.
Steunpunt Verkeersveiligheid
13
RA-2006-87
Vergelijking 7
( NM , voor 1) S 2 M , voor ( NM , na 1) S 2 M , na ( NVGL , i , voor 1) S 2 VGL , i , voor ( NVGL , i , na 1) S 2 VGL , i , na n
S ² pooled
i 1
n
( NM , voor 1) ( NM , na 1) ( NVGL , i , voor 1) ( NVGL , i , na 1) i 1
De variantie uit Vergelijking 5 wordt dan: n
VAR (G ) Vergelijking 8
S ² pooled S ² pooled n M ,na n M ,voor
S ² pooled ~ ni
n~ i 1
2
i
n ~ ni i 1
2
1 1 1 S ² pooled NM , voor NM , na n ~ ni i 1
De schatting van de variantie uit Vergelijking 8 is een betere schatter dan die uit Vergelijking 5 omdat die minder vertekend is. Bovendien is deze variantie vaak ook kleiner, wat wil zeggen dat de onzekerheid over het effect G ook kleiner is. Als er slechts één vergelijkingsweg is, waarvan we de resultaten betrouwbaarder achten naarmate we meer waarnemingen hebben en we dus Vergelijking 2 gebruiken, reduceert Vergelijking 8 tot de meer klassieke formule Vergelijking 9
1 1 1 1 VAR (G) S ² pooled . NM , voor NM , na NVGL , i , voor NVGL , i , na
De standaard error van G is: Vergelijking 10
G
SEG
SEG VAR (G)
heeft benaderend een standaard normaal verdeling wat het mogelijk maakt om
hypotheses te toetsen.
Steunpunt Verkeersveiligheid
14
RA-2006-87
3.
KEUZE
3.1
V85 in plaats van de gemiddelde snelheid
VAN DE EFFECTGROOTHEID VOOR DE
V85
Bij onderzoek van een snelheidsverdeling bij mobiliteit wordt als eerste indicator vaak de gemiddelde snelheid genomen, en als tweede indicator de V85. De V85 is die snelheid die door 85% van de wagens niet overschreden wordt. Vanuit statistisch standpunt is dit het 85%-percentiel. Om het effect van een maatregel op de V85 te berekenen, moeten we de redenering uit sectie 2.3 nu herhalen voor percentielen. In de formules wordt het gemiddelde vervangen door de V85. Definieer V85,M voor
de V85 in de voor-periode op de weg met de maatregel
V85,M na
de V85 in de na-periode op de weg met de maatregel
V85,VGL ,i,voor
de V85 in de voor-periode voor vergelijkingsweg i
V85,VGL,i,na
de V85 in de na-periode voor vergelijkingsweg i
N...,
is het aantal waarnemingen voor de betrokken weg
SEV85 ...
de standaard error van de V85 voor de betrokken weg
n
het aantal wegen in de vergelijkingsgroep
De gewichten zijn dezelfde als bij de berekening voor de gemiddelde snelheid (cfr. Vergelijking 2):
Vergelijking 11
1
n~i
1 N VGL ,i ,voor
1 N VGL ,i ,na
De schatting van het effect G is dan: n
Vergelijking 12
G (V 85M , na V 85M , voor)
n~ (V 85 i 1
VGL , i , na
i
V 85VGL , i , voor)
n
n~i
.
i 1
De variantie van deze G wordt: Vergelijking 13 n
VAR (G ) SEV285, M ,na SEV285, M ,voor
n~ (SE 2
i 1
i
2 V 85,VGL ,i , na
SEV285,VGL ,i ,voor )
n ~ ni i 1
2
De standaard error SEG op de schatting van het effect G blijft: Vergelijking 14
Steunpunt Verkeersveiligheid
SEG VAR (G) . 15
RA-2006-87
Voor de standaard errors van percentielen bestaat geen tegenhanger van de pooled within-groep variance. De berekening optimaliseren kan dan ook niet verder dan de nu getoonde vergelijkingen.
3.2
De standaard error van het 85%-percentiel
Alle statistische pakketten en ook het rekenblad Microsoft Excel, berekenen gemiddelde, standaardafwijking en percentielen van een verdeling, dus vergt de berekening van G en SEG in praktijk geen extra formules. Dit is niet zo voor de berekening van de standaard error van een percentiel. Sommige statistische pakketten berekenen een aantal percentielen (....75%, 90%, 95%, ...) met de bijbehorende standaard error. Maar zelfs een uitgebreid pakket als SAS berekent geen standaard error van het 85%-percentiel. Schijnbaar is het 85%-percentiel erg specifiek voor mobiliteitsonderzoek. De hierna volgende berekening is een benaderende formule, die met geavanceerde statistische pakketten weliswaar wat exacter kan, maar die op zich ook reeds wetenschappelijk verantwoorde resultaten oplevert. Eerst berekenen we het betrouwbaarheidsinterval rond een percentiel. De methode is gebaseerd op Schwarz (2006) (zie bv. ook Labour Force Survey, 2001). Hoewel het SAShandboek (SAS, 1999) andere formules geeft, geeft die methodiek identieke resultaten als die van Schwarz (2006). Ze werkt niet goed voor kleine steekproeven en voor percentielen vlakbij 0 en 1 (daarom is het dan ook een benaderende formule). Aangezien we uitgaan van een steekproef van minstens 100 wagens, en een 85%-percentiel zijn deze beperkingen minder belangrijk. Neem p
het betrokken percentiel
n
het aantal waarnemingen.
Neem aan dat alle waarnemingen geordend zijn in volgorde van stijgende snelheid. Het rangnummer van de ondergrens van het betrouwbaarheidsinterval is dan: Vergelijking 15
Rlower n p z n p (1 p) .
Het rangnummer van de bovengrens: Vergelijking 16
Rupper n p z n p (1 p) .
De waarde van z hangt af van het gevraagde betrouwbaarheidsinterval, maar is typisch z=1.96 voor een 95%-betrouwbaarheidsinterval. De ondergrens van het betrouwbaarheidsinterval is dan de waarde van de waarneming VR, lower met nummer Rlower. De bovengrens is de waarde van de waarneming VR, upper met nummer Rupper. Het betrouwbaarheidsinterval is dan: Vergelijking 17
BI VR, lower; VR, upper .
Bij een voldoende grote steekproef kan men een betrouwbaarheidsinterval van een percentiel ook vinden als (Hahn & Meeker, 1991): Vergelijking 18
BI V 85 z * SEV 85; V 85 z * SEV 85 .
Gelijkstelling van Vergelijking 17 en Vergelijking 18 levert dan de waarde van de standaard error van een percentiel: Vergelijking 19
Steunpunt Verkeersveiligheid
SEV 85
VR , upper VR , lower . 2z
16
RA-2006-87
4.
DE
META-ANALYSE
4.1
Meta-analyses van absolute verschillen van gemiddeldes
Vele case studies over verkeersmaatregelen hebben eigenlijk te weinig data om degelijke conclusies uit te kunnen trekken. Maar de resultaten van vele studies samen vormen vaak wel een degelijke basis. Het samenvoegen van de resultaten van verschillende studies noemt men een meta-analyse. Afhankelijk van het doel veranderen de formules van een meta-analyse. Indien men er van uitgaat dat het effect altijd hetzelfde is voor de verschillende studies, en indien men enkel wil nagaan of de maatregel gewerkt heeft in die specifieke studies, dan gebruikt men best een fixed effects meta-analyse. Indien men er van uitgaat dat er effecten tussen de locaties kunnen verschillen, en men wil een beste schatting doen voor het effect op een mogelijke nieuwe locatie, dan gebruikt men best een random effects metaanalyse (bv. Bond et al., 2003; Hedges, nd). Voor een stadsbestuur dat een uitgevoerde maatregel wil evalueren, is een fixed effects meta-analyse het meest aangewezen. Voor een ministerie dat zich afvraagt of het een maatregel in een regio wil stimuleren, is dan een random effects meta-analyse meer aangewezen. Voor gestandaardiseerde verschillen van gemiddeldes (standaardised mean differences) kan men eenvoudig aantonen dat de random effects meta-analyse conservatiever is (Hedges, nd). Dit wil zeggen dat het betrouwbaarheidsinterval rond het geschatte globale effect groter is bij een random effects analyse dan bij een fixed effects meta-analyse, en dat resultaten dus minder gemakkelijk significant zijn. Uit de formules voor meta-analyse van absolute verschillen in gemiddeldes (raw mean differences) is niet vanzelfsprekend op te maken welke methode de meest conservatieve is (zie formules in Bond et al., 2003, of vergelijk formules uit secties 4.2 en 4.3 ). Dit kan problemen opleveren waar we in sectie 4.3 meer op in gaan. De formules van een meta-analyse van absolute verschillen in gemiddeldes zijn iets ingewikkelder dan die van gestandaardiseerde verschillen van gemiddeldes. De reden hiervoor is technisch en wordt uitgelegd in Bond et al. (2003). De hierna volgende formules zijn dan ook grotendeels overgenomen uit Bond et al. (2003). Waar afgeweken wordt van de formules zonder dat dit in de appendix verklaard wordt, zijn de wijzigingen besproken met C. Bond om te komen tot een werkwijze die bruikbaar is voor toepassing in verkeerskunde.
4.2
Fixed effects verschillen
meta-analyse
van
absolute
gemiddelde
Fixed effects meta-analyse is de beste methode om na te gaan of een maatregel gewerkt heeft op bepaalde locaties. Stel opnieuw: NM,voor
is het aantal waarnemingen in de voor-periode op de weg met de maatregel
NVGL,i,voor
is het aantal waarnemingen in de voor-periode op de vergelijkingsweg i
n
is het aantal wegen in de vergelijkingsgroep
k
het aantal studies die samengenomen worden in de meta-analyse
Per studie is een effectgrootheid G berekend en de bijbehorende standaard error SEG. Deze zijn berekend voor de gemiddelde snelheid of voor de V85. Binnen één metaanalyse worden enkel vergelijkbare grootheden samengenomen, dus ofwel G altijd voor de gemiddelde snelheid ofwel voor de V85. Steunpunt Verkeersveiligheid
17
RA-2006-87
Het gemiddelde effect G FE (Fixed Effects) over k studies heen is het gewogen gemiddelde van de effecten per studie: k
G FE
Vergelijking 20
w
L*
GL
L 1
k
w
L
L 1
met als gewichten de inverse van het kwadraat van de standaard error:
wL
Vergelijking 21
1
SEG , L 2
De betekenis van Vergelijking 21 is de volgende: hoe kleiner de standaard error SEG van G, hoe betrouwbaarder het resultaat G; hoe betrouwbaarder het resultaat, hoe meer waarde er aan gehecht wordt bij de meta-analyse. De variantie van het gemiddelde effect is op zijn beurt dan weer de inverse van de som van de gewichten met een extra correctiefactor2:
k (k 1) wL * wj k 1 4 j L . VAR (G FE ) k * 1 * 2 L 1 (k 1)dfL 4(k 2) k w L wL L 1 L 1
Vergelijking 22
dfL is het aantal vrijheidsgraden van de pooled variance van studie L: Vergelijking 23
n dfL ( NM , voor 1) ( NM , na 1) ( NVGL , i , voor 1) ( NVGL , i , na 1) . i 1
De correctiefactor in Vergelijking 22 is algemeen geldig voor heel veel situaties (Bond et al., 2003). Vanaf 100 records is het tweede lid echter steeds kleiner dan de kleinste (4/dfL ) (zie Appendix 10.1 ). Uitgaande van minstens 100 wagens per snelheidsmeting, en minstens 1 vergelijkingsweg in elke studie is de kleinste dfL zeker 400. Het tweede lid bedraagt nog maximaal 0,01. De correctiefactor is dus in zijn geheel nooit groter dan 1,01. Voor het doel van dit rapport wordt Vergelijking 22 dus zeer goed benaderd door Vergelijking 24
VAR (G FE )
1 k
w
.
L
L 1
Dit komt overeen met de klassieke formule van de variantie in meta-analyses (Hedges, nd; Elvik, 2001). De standaard error SEGFE op de schatting van het effect Vergelijking 25
2
G FE is:
SEGFE VAR (G FE ) .
In een meta-analyse van gestandaardiseerde gemiddelde verschillen is die correctiefactor niet nodig.
Steunpunt Verkeersveiligheid
18
RA-2006-87
Om betrouwbaarheidsintervallen op te stellen rond zoals
G FE =0 kan men er van uitgaan dat G FE
G FE en om hypotheses te testen
SEGFE
een t-verdeling heeft met een
aantal vrijheidsgraden dat groter is dan de kleinste dfL (Bond et al., 2003, en Appendix 10.2 ). Zelfs uitgaande van slechts 50 wagens per snelheidsmeting en 1 vergelijkingsweg per studie benaderen deze t-verdelingen steeds heel dicht een standaard normaalverdeling.
4.3
Random effects verschillen
meta-analyse
Random effects meta-analyse is nieuwe locaties. Het wezenlijke analyses is dat bij de random studies extra onzekerheid over nieuwe locaties zijn dan altijd situatie.
van
absolute
bedoeld om na te gaan of een maatregel zal werken op verschil tussen fixed effects en random effects metaeffects methode de variantie tussen de verschillende een nieuw resultaat introduceert. Verwachtingen voor minder significant dan evaluaties van de bestaande
De schatting van deze variantie tussen de studies noemen we gemiddelde en wL uit Vergelijking 21 wordt k
Vergelijking 26
²
G
². Met G het ongewogen
² gedefinieerd door:
G
2
L
1 k 1 k L 1 wL
k 1
L 1
Met deze worden:
gemiddelde
² kunnen nu nieuwe gewichten WRE (Weights Random Effect) berekend
Vergelijking 27
WREL
1
SEG , L 2 ²
.
En met deze nieuwe gewichten kan een nieuw globaal effect berekend worden:
G RE van de maatregel
k
Vergelijking 28
G RE
WRE
L*
GL
L 1
k
WRE
L
L 1
Als ² voldoende groot is, dan zijn Vergelijking 26, Vergelijking 27 en Vergelijking 28 beter dan de formules uit sectie 4.2 . De berekening van de variantie van dit nieuwe globale effect lijkt helemaal niet meer op die bij een fixed effects meta-analyse (Vergelijking 25) maar is de formule van de variantie van een gewogen rekenkundig gemiddelde (Anoniem, 2004): k
Vergelijking 29
VAR (G RE )
WRE
L
(GL G RE )²
L 1
(k 1) k WREL k L 1
De standaard error SEGRE op de schatting van het effect
Steunpunt Verkeersveiligheid
19
G RE is:
RA-2006-87
Vergelijking 30
SEGRE VAR (G RE ) .
Om betrouwbaarheidsintervallen op te stellen rond zoals
G RE =0 kan men er van uitgaan dat G RE
G RE en om hypotheses te testen
SEGRE
een t-verdeling heeft met k-1
vrijheidsgraden (Bond et al., 2003). k is het aantal wegen waar de maatregel is toegepast. Dit aantal is meestal niet zo groot, dus mag men deze t-verdeling niet zomaar gelijkstellen met een normaalverdeling. Bij een te kleine ² kunnen er twee berekeningen mis lopen in vorige redenering. Doordat ² maar een schatting van een variantie is, kan Vergelijking 26 negatief zijn. De echte ² kan echter nooit negatief zijn omdat het een kwadraat is. Daarom wordt ² gelijk gesteld aan 0 als Vergelijking 26 een negatief getal oplevert (SAS, 1999; C. Bond, pers. comm.). Bij kleine ², zelfs als die niet 0 is, kan SEGRE kleiner zijn dan SEGFE. Dit is evenmin het doel van de berekening van de random effects methode. In dat geval wordt SEGRE berekend op een analoge manier als Vergelijking 24 (cfr Hedges, nd; C. Bond, pers. comm.): Vergelijking 31
SEGRE
1 k
WRE
L
L 1
Steunpunt Verkeersveiligheid
20
RA-2006-87
5.
FORMULES
BIJ
HET
ONTBREKEN
VAN
EEN
VERGELIJKINGSGROEP
5.1
Aanvaardbaarheid vergelijkingsgroep
van
een
voor-na-meting
zonder
Indien er geen vergelijkingsgroep beschikbaar is, zijn niet alle berekeningen uit het vorige hoofdstuk mogelijk. Het is nog steeds mogelijk om het effect van een maatregel in te schatten. Maar de standaard error van het effect wordt dan onderschat. De standaard error bij een voor-na meting bevat minder termen dan die van een meting met een vergelijkingsgroep. Vergelijk Vergelijking 13 en Vergelijking 35. Aangezien al deze termen positief zijn, is de getalwaarde in Vergelijking 13 groter dan die in Vergelijking 35. Het weglaten van de vergelijkingsgroep geeft dus een overdreven gevoel van zekerheid over de schatting van het effect. Zonder vergelijkingsgroep wordt, alleszins voor ongevallen, het effect van een maatregel vaak overschat, doordat het effect van andere maatregelen impliciet mee gemeten wordt. Het is mogelijk dat zich hetzelfde voordoet voor effectmeting van snelheid. De combinatie van een overschatting van het effect en een onderschatting van de onzekerheid, maakt dat analyses zonder vergelijkingsgroep vaker significante resultaten opleveren dan in werkelijkheid het geval is. Als de periode tussen de voor- en naperiode van de snelheid voldoende kort is, zal het effect van alle algemene maatregelen beperkter zijn. Het zou al een groot toeval zijn indien er een nieuwe wet verschijnt of een globale verscherping van de snelheidscontroles net in de week tussen de voor- en de nameting. Indien men echter effecten op wat langere termijn wil meten, wordt de impact van de globale trend steeds belangrijker. Als al de andere omstandigheden van de voor- en nameting hetzelfde zijn, dan zal het ontbreken van een vergelijkingsgroep bij een korte tussentijd relatief weinig impact hebben op de effectberekening. De standaard error blijft natuurlijk nog steeds onderschat. Bij een handig gebruik van rijsimulatoren is Indien in de rijsimulator eenmaal de versie maatregel geprogrammeerd is, dan kan men er maatregel verschilt in de twee programma’s. gecorrigeerd moet worden.
5.2
evenmin een vergelijkingsgroep nodig. zonder maatregel en eenmaal met de exact voor zorgen dat enkel de bedoelde Er is dus geen globale trend waarvoor
Berekening van de effectgrootheid bij voor-na-metingen zonder vergelijkingsgroep
Indien er geen vergelijkingsgroep is, vereenvoudigen de formules aanzienlijk. De schatting van het effect voor het gemiddelde is Vergelijking 32
G = (V,M na - V,M voor )
De standaard afwijking SEG op deze schatting is dan: Vergelijking 33
Steunpunt Verkeersveiligheid
1 1 SEG S 2 pooled * NM , voor NM , na
21
RA-2006-87
Voor de V85 vereenvoudigen de formules op dezelfde wijze: Vergelijking 34
G (V 85M , na V 85M , voor) .
En de standaard error SEG op de schatting van het effect G wordt: Vergelijking 35
SEG SEV285,M ,na SEV285,M ,voor .
De berekening van de standaard errors SEV85 blijft identiek als voorheen.
5.3
Meta-analyses met inbegrip van voor-na-metingen zonder vergelijkingsgroep
De wezenlijke formules van de meta-analyses veranderen niet. Er is geen enkele reden om, indien men verschillende studies heeft van voor-nametingen zonder vergelijkingsgroep daar geen meta-analyse op uit te voeren. Het samengevoegde resultaat heeft altijd een meerwaarde voor het verwachte effect van de maatregel dan al de effecten apart. De vraag stelt zich of men één meta-analyse mag uitvoeren over studies waarbij sommige wel en andere geen vergelijkingsgroep hebben. Principieel is het het veiligste om twee meta-analyses uit te voeren voor de twee aparte groepen, en ze niet te mengen. In praktijk worden vaak alle studies wel samen geanalyseerd. Indien de correcties op basis van de vergelijkingsgroep niet meestal in dezelfde richting wijzen, is dergelijke globale meta-analyse verantwoord. Indien de correcties echter wel meestal dezelfde richting uitwijzen zijn studies zonder correcties dus meestal vertekend in dezelfde andere richting. Een overkoepelende meta-analyse is dan minder betrouwbaar, omdat de meer betrouwbare studies met correcties gemengd worden met de systematisch3 vertekende studies.
3
Waardoor deze systematische afwijking dan komt, is niet algemeen vast te leggen. Gewoon het feit dat de meeste correcties in één richting gaan, toont aan dat er een vorm van systematiek in de afwijking is.
Steunpunt Verkeersveiligheid
22
RA-2006-87
6.
VOORBEELD:
UITGEWERKT
DYNAMISCHE
SNELHEIDSINFORMATIE
6.1
Data snelheidsmeting en vergelijkingsgroep
Alle gebruikte data uit dit hoofdstuk komen uit het stageverslag van Karen De Clercq (2005). In Antwerpen zijn op twee wegen, de Arthur Matthyslaan en de Ledeganckkaai, gedurende een dag dynamische informatieborden geplaatst. Als een wagen sneller reed dan de snelheidslimiet (50 km/u) dan lichtte het bord op en toonde de gereden snelheid. Honderd meter voor en honderd meter na de borden zijn snelheidsmetingen uitgevoerd met een radar. In de periode voor de plaatsing van de borden werden eveneens snelheidsmetingen uitgevoerd. Voor- en nameting gebeurden op dezelfde dag. De voormetingen hadden plaats van 10.30 tot 14.00, dan werd de borden geplaatst, en van ± 14.10 tot ’s avonds 21.50, resp. 9.00 de volgende ochtend werden er nametingen uitgevoerd. Snelheden trager dan 30 km/u zijn weggelaten omdat ze beschouwd werden als traagrijdend tot stilstaand verkeer. De bijlage van het stageverslag bevat tabellen met de resultaten van de acht metingen (voor- en nametingen van 2 wegen met elk 2 radars), zie Tabel 1. We beschikken dus over de snelheden van alle wagens, en niet enkel over samenvattende parameters zoals gemiddelde, standaard afwijking en V85. Tabel 1: Voorbeeld van de beschikbare data van snelheidsmeting (Bron: De Clercq, 2005) Voormeting A. Matthyslaan: Radar 2 Snelheid
frequentie
30
7
31
15
32
14
.....
.....
.....
.....
69
1
70
4
De voormetingen en de nametingen zijn gebeurd op dezelfde dag. Binnen dat tijdsinterval is het onmogelijk dat de globale trend wijzigt ten gevolge van welke globale maatregel dan ook. Dit is dus geen reden om een vergelijkingsgroep te zoeken. Maar de voormetingen zijn op een ander tijdstip (voormiddag) gebeurd dan de nametingen (namiddag, avond en nacht), wat een reden kan zijn om een ander snelheidsprofiel te krijgen. Daarom is er nood aan een vergelijkingsgroep. Voor de vergelijkingsgroep kiezen we de meting van vóór het informatiebord. We nemen aan dat de bestuurders niet reageren op een bord dat wat verder staat, maar dat ze pas reageren als het bord oplicht. Deze veronderstelling is waarschijnlijk niet helemaal
Steunpunt Verkeersveiligheid
23
RA-2006-87
correct. Bestuurders die voor hen een bord zien oplichten omdat een van hun voorgangers te snel rijden vertragen misschien ook. En als bestuurders bij het passeren van het bord echt remmen, en niet enkel wat vertragen, dan kunnen achterliggers reageren op hun remlichten door ook te vertragen. Maar het gebruik van deze vergelijkingsgroep is waarschijnlijk toch correcter dan geen vergelijkingsgroep te gebruiken.
6.2
Effect van de dynamische gemiddelde snelheid
snelheidsinformatie
op
de
De input voor het berekenen van het effect op de gemiddelde snelheid is heel vaak in publicaties, rapporten e.d. te vinden, zelfs al beschikt men niet over de volledige snelheidsverdeling. De noodzakelijke informatie zijn steekproefaantallen, gemiddeldes en standaardafwijkingen (Tabel 2). Tabel 2: Data van de snelheidsmeting van de Ledeganckkaai (Bron: De Clercq, 2005 en eigen bewerking daarop) radar 1
radar 2, na het informatiebord
Vergelijkingsgroep
Locatie met Maatregel
aantal wagens, N,voor
773
856
Gemiddelde snelheid Vvoor
55,5
57,5
Standaard Afwijking snelheid Svoor
10,6
10,4
aantal wagens, N,na
3065
3132
Gemiddelde snelheid V,na
52,1
51,6
9,3
8,2
Absoluut verschil Vna - Voor
-3,4
-5,9
SEvoor = voor Svoor / wortel (Nvoor)
0,38
0,36
SEna = voor Sna / wortel (Nna)
0,17
0,15
Voor-meting
Na-meting
Standaard Afwijking snelheid Sna Eigen berekeningen
Met deze resultaten kunnen we op drie manieren het effect berekenen van de dynamische borden: het effect G (Vergelijking 4) met een variantie op basis van de standaard errors (Vergelijking 5), het effect met een variantie gebaseerd op de pooled variance (Vergelijking 8), en het effect alsof er geen vergelijkingsgroep zou zijn (Vergelijking 32 en Vergelijking 33).
Steunpunt Verkeersveiligheid
24
RA-2006-87
Tabel 3: Effect van dynamisch informatiebord op de gemiddelde snelheid voor de Ledeganckkaai (Eigen bewerking op data uit De Clercq, 2005). Met vergelijkingsgroep
Met vergelijkingsgroep
Zonder vergelijkingsgroep
VAR(G) op basis van standaard errors
VAR(G) op basis van pooled variance
VAR(G) op basis van pooled variance
effect G
-2,5
-2,5
-5,9
SE(G) = wortel(VAR(G))
0,57
0,52
0,36
Z-waarde = G / SE(G)
4,38
4,83
16,49
< 0,001
< 0,001
< 0,001
P van tweezijdig
z-waarde,
De schatting van het effect G verschilt duidelijk bij de analyses met en zonder vergelijkingsgroep. De schatting bij analyse met vergelijkingsgroep is de daling van 5,9 km/u tussen de voor- en nameting, gecorrigeerd voor de daling van 3,4 km/u 100m voor het bord. Indien de daling vóór het bord het gevolg is vàn dat bord dan geeft het gebruik van deze vergelijkingsgroep een onderschatting van het werkelijke effect. Dergelijke onderschatting doet zich steeds voor als de vergelijkingsgroep mee beïnvloed wordt door de genomen maatregel. Indien de lagere gemiddelde snelheid vóór het bord het gevolg is van het tijdstip, dan is de correctie noodzakelijk. In dat geval wordt het effect met meer dan 100% overschat bij de berekening zonder vergelijkingsgroep. De standaard error van G is kleiner op basis van de pooled variance dan op basis van de standaard errors. Veel belangrijker echter is het verschil in standaard error tussen de berekening met (0,52) en zonder (0,36) vergelijkingsgroep. De onzekerheid over de schatting G lijkt dus kleiner dan ze werkelijk is. Ze lijkt kleiner omdat we geen gegevens hebben om de resultaten van de groep mee te vergelijken. Volgens elk van de berekeningen is het effect significant. De significantie is zo uitgesproken (P < 0,0001) dat verschillen op dit niveau niet meer zichtbaar zijn. De resultaten voor de Arthur Matthyslaan zijn volkomen analoog (Tabel 4), alleen zijn de significanties hier niet zo klein dat onderscheid nog mogelijk is. De P-toets is tweezijdig omdat we in principe niet weten in welke richting het effect zal zijn. In praktijk verwachten we natuurlijk een daling.
Steunpunt Verkeersveiligheid
25
RA-2006-87
Tabel 4: Effect van dynamisch informatiebord op de gemiddelde snelheid voor de Arthur Matthyslaan (Eigen bewerking op data uit De Clercq, 2005). Met vergelijkingsgroep
Met vergelijkingsgroep
Zonder vergelijkingsgroep
VAR(G) op basis van standaard errors
VAR(G) op basis van pooled variance
VAR(G) op basis van pooled variance
effect G
-1,3
-1,3
-3,5
SE(G) = wortel(VAR(G))
0,43
0,42
0,30
Z-waarde = G / SE(G)
2,99
3,08
11,82
0,003
0,002
< 0,001
P van waarde, tweezijdig
z-
Als we mogen aannemen dat een dynamisch informatiebord geen effect heeft vóór het bord, wordt het effect op de gemiddelde snelheid het beste berekend door de middelste berekening.
6.3
Effect van de dynamische snelheidsinformatie op de V85
Als de V85 al gegeven wordt in artikels of rapporten, dan ontbreekt zo goed als altijd de standaard error op de V85. Deze kan enkel uit de data zelf worden afgeleid. De procedure zoals beschreven in sectie 3.2 is uitgevoerd in Microsoft Excel. Eenmaal dat de rangnummers berekend zijn (Vergelijking 15 en Vergelijking 16) kan de bijbehorende waarde gevonden worden met eenvoudige rekenbladfuncties.
Steunpunt Verkeersveiligheid
26
RA-2006-87
Tabel 5: Data van de snelheidsmeting van de Ledeganckkaai (Bron: De Clercq, 2005 en eigen bewerking daarop) radar 1
radar 2, na het informatiebord
Vergelijkingsgroep
Locatie met Maatregel
773
856
66
68
3065
3132
61
58
-5
-10
SEvoor
0,51
0,51
SEna
0,26
0,26
Voor-meting aantal wagens, N,voor V85voor Na-meting aantal wagens, Nna V85na Eigen berekeningen Absoluut verschil V85na – V85voor
Er zijn slechts twee manieren om het effect te berekenen van de dynamische borden: het effect G (Vergelijking 12) met een variantie op basis van de standaard errors (Vergelijking 13), en het effect alsof er geen vergelijkingsgroep zou zijn (Vergelijking 34 en Vergelijking 35). De tegenhanger met de pooled variance bestaat niet voor percentielen. Tabel 6: Effect van dynamisch informatiebord op de V85 voor de Ledeganckkaai (Eigen bewerking op data uit De Clercq, 2005). Met vergelijkingsgroep
Zonder vergelijkingsgroep
VAR(G) op basis van standaard errors
VAR(G) op basis van standaard errors
-5
-10
SE(G) = wortel(VAR(G))
0,81
0,57
Z-waarde = G / SE(G)
6,18
17,47
< 0,001
< 0,001
effect G
P van tweezijdig
z-waarde,
De resultaten bij de V85 zijn vergelijkbaar met die voor het gemiddelde. De schatting van het effect G met vergelijkingsgroep is kleiner en de spreiding er rond is groter dan
Steunpunt Verkeersveiligheid
27
RA-2006-87
indien we geen vergelijkingsgroep gebruikten. Nogmaals vergelijkbare resultaten vinden we voor de Arthur Matthyslaan.
6.4
Meta-analyse van het effect van de snelheidsinformatie op de gemiddelde snelheid
dynamische
In de meta-analyse voegen we de resultaten van de verschillende studies samen. In dit voorbeeld is dit niet heel spectaculair, omdat het maar over twee studies gaat. Aangezien alle resultaten in dezelfde richting wijzen en significant zijn, verwachten we a priori dat het overkoepelende resultaat ook in diezelfde richting wijst, en ook significant is. Een op het eerste zicht merkwaardig resultaat is dat dit laatste zeker niet altijd waar is. De noodzakelijke input voor de meta-analyse is erg beperkt (Tabel 7). Tabel 7: Input van de meta-analyse van voor de gemiddelde snelheid. Arthur Matthyslaan
Ledeganckkaai
effect G
-1,3
-2,5
SE(G)
0,42
0,52
Afhankelijk van het doel van de analyse passen we een fixed effects analyse toe, of een random effects analyse. Als we willen weten of de maatregel op de plaatsen zelf succes had, nemen we een fixed effects analyse. De variantie tussen effecten op de verschillende locaties is dan niet van belang. Als we willen weten of dezelfde maatregel op een andere plaats zou werken, dan nemen we een random effects analyse. De variantie tussen de effecten op de locaties is dan wel van belang. In Tabel 8 geven we de resultaten van beide analyses. Tabel 8: Berekening van het globale effect op gemiddelde snelheid van dynamische borden voor een fixed effects analyse en een random effects FIXED EFFECTS
RANDOM EFFECTS Het aantal studies k G ongewogen Variantie tussen de studies ²
globale
G FE (fixed effects)
SE( G FE ) (fixed zonder correctie z-waarde=
-1,77
globale G RE (random effects)
0,33
SE( G RE ) (random effects)
2 -1,90 0,50 -1,86
effects)
G FE SE (G FE )
P van z-waarde
t-waarde = 5,40 < 0,001
G RE SE (G RE )
P van t-waarde
0,85
2,20 0,27
Het fixed effects model voldoet het meeste aan de verwachtingen. Het ongewogen globale effect zou –1,9 km/u zijn. Doordat de onzekerheid voor de Arthur Matthyslaan
Steunpunt Verkeersveiligheid
28
RA-2006-87
kleiner is dan voor de Ledeganckkaai (Tabel 7: SE resp. 0,42 en 0,52) weegt de Arthur Matthyslaan meer op het globale effect, en ligt -2,5 km/u.
G FE dus dichter bij -1,3 km/u dan bij
Per snelheidsmeting hebben we ruim meer dan 100 waarnemingen, dus kunnen we de correctiefactor in Vergelijking 22 weglaten en Vergelijking 24 nemen voor de standaard error van de globale G FE . De onzekerheid over het globale effect (0,33) is kleiner dan elk van de standaard errors van de aparte studies (resp. 0,42 en 0,52). Dit is wat we verwachtten. Het samennemen van studies is o.a. bedoeld om van een aantal eventueel zwakke resultaten een overkoepelend sterker resultaat te bekomen. Men kan wiskundig bewijzen dat bij het gebruik van Vergelijking 24 de standaard error van het globale effect altijd kleiner is dan of gelijk aan de kleinste van de standaard errors van de aparte studies (Appendix 10.3 ). Met een z-waarde van 5,40 is het globale effect
G FE significant negatief. Vertaald in meer begrijpelijke termen: we zijn heel zeker dat het plaatsen van de dynamische informatieborden de snelheid achter de borden heeft doen dalen op de Arthur Matthyslaan en de Ledeganckkaai. Bij het random effects model staan eerst de resultaten van drie tussenstappen: het aantal studies, het ongewogen gemiddelde en de variantie tussen de studies ². Deze variantie tussen de studies in is niet verwaarloosbaar: ²=0,50 wijkt duidelijk af van 0. De standaard afwijking tussen de studies is van dezelfde grootte als de standaard errors per studie (0,42 en 0,52). De gewichten worden nu op een andere manier berekend dan bij een fixed effects analyse. In praktijk worden de gewichten meer met elkaar vergelijkbaar. Meestal ligt het random effects gemiddelde
G RE (hier: -1,86) dichter bij het ongewogen gemiddelde (hier: -1,90) dan het fixed effects gemiddelde G FE (hier: -1,77). De onzekerheid over het random effects gemiddelde is groter dan bij het fixed effects gemiddelde (hier resp. 0,85 en 0,33). Ook dat moet zo zijn. Want bij het random effects model wordt extra onzekerheid meegenomen. Er wordt namelijk van uit gegaan dat de verschillen tussen de effectwaarden G van de individuele studies een wezenlijk onderdeel van de onzekerheid vormen, en dat dit ook bij andere studies zal terugkomen. Indien de berekeningen op deze plaats een kleinere standaard error geven voor het random effects gemiddelde dan voor het fixed effects gemiddelde, dan wordt de berekening van het random effects model aangepast. (zie Vergelijking 31 en bijbehorende paragraaf). Om te weten of het gevonden globale effect significant verschilt van 0 wordt opnieuw het effect gedeeld door zijn standaard error. In tegenstelling tot het fixed effects model heeft deze breuk geen normale verdeling maar een t-verdeling met k-1 vrijheidsgraden. In dit voorbeeld dus 1 vrijheidsgraad. Een t-verdeling lijkt sterk op een normale verdeling, maar bij een beperkt aantal vrijheidsgraden zijn resultaten minder snel significant. De twaarde (2,20) in dit voorbeeld is niet significant (P=0,27). Dezelfde waarde bij een normale verdeling zou wel geweest significant zijn (zelfs tweezijdig P=0,03). Hieruit blijkt dat het samenvoegen van twee significante resultaten dus niet altijd tot een nog significanter resultaat leidt. Vertaling van dit resultaat in meer begrijpelijke termen: we verwachten dat dynamische informatieborden op andere plaatsen dan de Arthur Matthyslaan en de Ledeganckkaai de gemiddelde snelheid met 1,86 km/u zal doen dalen, maar we zijn daar niet zeker van. We zijn zelfs niet zeker dat er een daling van de snelheid zal zijn. Als het effect tussen twee wegen 1,2 km/u kan verschillen (-1,3 tegenover -2,5) dan kan een volgende keer het verschil twee keer zo groot zijn, en krijgen we misschien een stijging van de snelheid met 1,1 km/u.
Steunpunt Verkeersveiligheid
29
RA-2006-87
7.
CONCLUSIES
7.1
Conclusies
EN AANBEVELINGEN
Het is niet altijd mogelijk om het effect van een verkeersveiligheidsmaatregel rechtstreeks te meten op de ongevallen. De reden is meestal dat er niet voldoende ongevallen gebeuren in het beschouwde tijdsinterval om op zinvolle wijze statistische testen toe te passen. Daar waar de verkeersonveiligheid ontstaat door een te grote snelheid, is het zinvol om het effect van de verkeersveiligheidsmaatregel op de snelheid te meten. De methodiek om het effect van een verkeersveiligheidsmaatregel te meten op snelheden wijkt sterk af van de methodiek om het effect te meten via ongevallen. De methodiek voor ongevallen is reeds eerder uitgewerkt. In dit rapport wordt een methodiek gegeven om het effect van een maatregel te meten met behulp van snelheden. In Vlaanderen wordt het effect van een maatregel op de snelheid al af en toe gemeten, maar dan ontbreken de correctie voor de algemene ongevallentrend en de relevante testen om significante verschillen te vinden. Ook het samennemen van dergelijke resultaten gebeurt niet met juiste formules. Dit rapport wil in deze lacune voorzien. Omdat niet alle mogelijke gebruikers van deze methodieken over geavanceerde statistische pakketten beschikken, is er bewust voor gekozen om enkel formules te gebruiken die uit te rekenen zijn met veelgebruikte rekenbladen zoals Microsoft Excel. Er zijn formules uitgewerkt om het effect te schatten op de gemiddelde snelheid en de V85, en dit met en zonder vergelijkingsgroep. Bij de hier getoonde berekeningen mag de vergelijkingsgroep uit meerdere locaties bestaan. De berekening voorziet dat aan de verschillende wegen van de vergelijkingsgroep gewichten worden toegekend, die de impact van de wegen op de berekeningen bepalen. Hoe meer waarnemingen van een bepaalde weg, hoe zekerder we zijn van de schattingen voor die specifieke weg, hoe meer impact hij mag hebben op het eindresultaat. Uit de berekeningen blijkt dat bij voor-na analyses zonder vergelijkingsgroep het betrouwbaarheidsinterval van het effect onderschatten. Hierdoor geven testen zonder vergelijkingsgroep soms significante effecten aan, terwijl die effecten niet significant zijn indien een vergelijkingsgroep was gebruikt. Als men dezelfde maatregel op verschillende plaatsen heeft toegepast, en het effect op de verschillende plaatsen heeft berekend, wil men vaak ook een globaal effect kennen, een soort gemiddelde over alle plaatsen heen. Ook hiervoor zijn in dit rapport twee methodes uitgeschreven op basis van de theorie van meta-analyses. Welke methode gebruikt wordt, hangt af van het doel van de meta-analyse. Indien men wil nagaan of uitgevoerde maatregelen effectief waren (heeft het hier gewerkt ?) zijn er andere formules nodig dan indien men wil nagaan of de maatregel veralgemeend moet worden (zal het op een andere plaats ook werken ?). Technisch is dit respectievelijk een fixed effects analyse en een random effects analyse. Indien men wil nagaan of uitgevoerde maatregelen effectief waren op de uitgevoerde locaties moet men een fixed effects metaanalyse uitvoeren. Om na te gaan of de maatregel op andere plaatsen succesvol zou zijn, moet men een random effects meta-analyse uitvoeren. Uit de formules blijkt dat het best mogelijk is om een significant effect te vinden voor de locaties waar de maatregel uitgevoerd werd (fixed effects meta-analyse) terwijl het verwachte resultaat voor andere locaties (random-effects meta-analyse) niet significant is.
Steunpunt Verkeersveiligheid
30
RA-2006-87
7.2
Aanbevelingen voor de overheid
1.
Het gebruik van een vergelijkingsgroep heeft een duidelijke impact op de schatting van het effect van een maatregel. Slechts in beperkte situaties is een vergelijkingsgroep overbodig.
2.
Het gebruik van één methodiek in Vlaanderen laat toe om resultaten van verschillende studies eenvoudig te vergelijken. Dat is reeds aangetoond voor de methodiek voor ongevallen. Enerzijds kunnen studies over dezelfde maatregel heel eenvoudig gecombineerd worden. Hierdoor kunnen –op zich vaak beperkte studiesgecombineerd worden tot één krachtiger resultaat. Anderzijds verhoogt het gebruik van dezelfde methodiek voor verschillende maatregelen de vergelijkbaarheid van maatregelen. We raden dan ook aan om deze methodiek te promoten bij de overheidsdiensten.
7.3
Verder onderzoek
1. De hier uitgewerkte methodiek zal binnen het Steunpunt gebruikt worden om het effect te meten van verschillende zones 30 km/u rond scholen. 2. Op Vlaamse studiedagen is al eerder gevraagd naar een methodiek om het effect van maatregelen op snelheden te meten. Het lijkt logisch om de onderzoeken die toen gevraagd werden, effect van drempels, effecten van wegversmallingen, e.d. nu uit te voeren. 3. Naast methodieken om effecten op aantal ongevallen, gemiddelde snelheid en V85 te meten, ontbreekt nog een methodiek om het effect te meten op percentage overtreders. Aangezien het percentage overtreders vanuit statistisch standpunt nog een andere verdeling heeft dan aantal ongevallen en snelheden, zijn hier nog andere formules voor nodig.
Steunpunt Verkeersveiligheid
31
RA-2006-87
8.
DANKBETUIGING
Bij dit onderzoek wil ik Scott B. Morris, professor aan de Illinois Institute of Technology en Charles Bond, professor aan de Texas Christian University bedanken voor hun waardevolle commentaar bij het zoeken van de juiste formules.
Steunpunt Verkeersveiligheid
32
RA-2006-87
9.
LITERATUURLIJST
Aarts, L.T. (2004). Snelheid, spreiding in snelheid en de kans op verkeersongevallen. SWOV, Leidschendam. Anoniem (2004): Weighted variance. http://www.itl.nist.gov/div898/software/dataplot/refman2/ch2/weighvar.pdf Bond, C.F. Jr., Wiitala, W.L. & Richard, F.D. (2003). Meta-Analysis of Raw Mean Differences. Psychological Methods, Vol. 8, No. 4, 406–418 Coe, R. (2000). What is an 'Effect Size'? A guide http://www.cemcentre.org/ebeuk/research/effectsize/confidence.htm
for
users
Cohen, J. (1977). Statistical power analysis for the behavioral sciences. (Rev. ed). New York: Academic Press. Cohen, J. (1988). Statistical power analysis for the behavioral sciences. (2nd. ed). Hillsdale, NJ: Erlbaum. De Clercq, K. (2005). Effectiviteit van snelheidsbeheersing. Bemand en onbemand toezicht. Dynamische snelheidsinformatie. Stageverslag 2e lic. Criminology. KUL, Leuven Elvik, R. (2001). Area-wide urban traffic calming schemes: a meta-analysis of safety effects. Accident Analysis and Prevention: 33, 327-336. Elvik, R. (2002). The importance of confounding in observational before-and-after studies of road safety measures. Accident Analysis and Prevention: 34, 631-635. Elvik, R., Christensen, P. & Amundsen, A. (2004). Speed and road accidents. An evaluation of the Power Model. TOI, Oslo. Ewing (1999) Ewing, R. 1999. Traffic Calming Impacts. In Traffic Calming: State and Practice. Washington, D.C.: Institute of Transportation Engineers, pp. 99–126. Hahn, G.J. and Meeker, W. Q. (1991) Statistical Intervals: A Guide for Practitioners, New York: John Wiley & Sons, Inc Hauer, E. (1997). Observational before-after studies in road safety. Pergamon, Oxford. Hedges (nd). Systematic Reviews. Presentation on internet, gelezen op 30 september 2005.http://obssr.od.nih.gov/Conf_Wkshp/RCT05/Lectures/Hedges_Systematic_Review. pdf Iowa (2001). Traffic Control Devices and Pavement Markings: A Manual for Cities and Counties. http://www.ctre.iastate.edu/pubs/itcd/speedlimits.pdf Labour Force Survey (2001). Labour Force Survey Users Guides: Background and Methodology. http://www.statistics.gov.uk/downloads/theme_labour/LFSUG_Vol1_2003.pdf Morris, S.B. (2003). Estimating Effect Size from the Pretest-Posttest-Control Design. Paper presented at the 18th annual conference of the Society for Industrial and Organizational Psychology, Orlando, FL. http://luna.cas.usf.edu/~mbrannic/files/conf/esppc_siop03.pdf Nilsson, G. (2004). Traffic Safety Dimensions and the Power Model to Describe the Effect of Speed on Safety. Lund University, Lund. Nuyts, E & Cuyvers, R. (2003). Effectiviteitmeting bij Voor-Na studies met een vergelijkingsgroep. Steunpuntrapport RA-2003-22. Steunpunt Verkeersveiligheid, Diepenbeek. SAS (1999). SAS OnlineDoc®, Version . by SAS Institute Inc., Cary, NC, USA, http://v8doc.sas.com/sashtml/
Steunpunt Verkeersveiligheid
33
RA-2006-87
Schwarz, C.J. (2006). Intermediate Sampling and Experimental Design and Analysis. Simon Fraser University, British Columbia, Canada. http://www.stat.sfu.ca/~cschwarz/Stat-650/Notes/PDF/ChapterPercentiles.pdf Tech News (2004). Technology news: Simplified spot speed http://www.ctre.iastate.edu/PUBS/tech_news/2004/sep-oct/spot_speed.htm Traffic Engineering manual (2000). Chapter 5, Data http://www.dot.state.mn.us/trafficeng/otepubl/tem/Chap-5-2003.pdf
studies. collection.
Van Geirt, F. & Nuyts, E. (2004). CESaM 1.0. Handleiding voor de Calculator for Effects of Safety Measures (Effectiviteitberekening). Steunpuntrapport RA-2004-48. Steunpunt Verkeersveiligheid, Diepenbeek.
Steunpunt Verkeersveiligheid
34
RA-2006-87
10.
APPENDIX
10.1 De tweede term van de variantie bij een fixed random analyse is kleiner dan de kleinste dfL. In de praktijk van verkeerskunde, waarbij er minstens 100 waarnemingen zijn bij een snelheidsmeting, kan de formule uit Vergelijking 22 goed benader worden door de veel eenvoudigere formule Vergelijking 24.
k (k 1) wL * wj k 4 jL Tweede term * 2 L 1 (k 1)dfL 4(k 2) k wL L 1
k (k 1) wL * wj k 4 jL * 2 L 1 (k 1)(dfL 4) 4 k wL L 1
Aangezien dfL meer dan 100 bedraagt, is (dfL –4) ongeveer gelijk aan dfL, en de 4 achteraan is eveneens verwaarloosbaar. Dan
k (k 1) wL * wj k 4 jL Tweede term * 2 (k 1)dfL k L 1 wL L 1
4
k k 1 wj w L * 2 kleinste dfL L 1 jL
k
wL
*
L 1
k
4 * kleinste dfL
wL
2
L 1
k
k
w² L
wL
L 1
2
L 1
k w² L 4 * 1 L 1 2 kleinste dfL k w L L 1 4 kleinste dfL
Q.E.D
Steunpunt Verkeersveiligheid
35
RA-2006-87
10.2
Bij fixed effects analyse is het aantal vrijheidsgraden tverdeling van G FE kleiner dan de kleinste dfL SEGFE
Uit Bond et al.(2003) volgt dat
k
wL
gelijk aan
k
wL
w² L L 1 dfL k
L
w² L L 1 dfL k
een t-verdeling met aantal vrijheidsgraden
. Deze is kleiner dan de kleinste dfL.
k
SEGFE
2
L 1
2
L 1
G FE
wL
2
L 1
k 1 w² L kleinste dfL L 1
k
kleinste df
wL
2
L 1 k
w² L
L 1
kleinste dfL
10.3 SE(GFE) is in een fixed effects meta-analyse kleiner dan of gelijk aan kleinste van de verschillende SE(G) Uit de combinatie van Vergelijking 21 en Vergelijking 24 volgt dat we willen bewijzen dat
VAR (G FE )
Vergelijking 36
1 k
w
L
L 1
1 k
1 L 1 SE ² G , L
SE ²G , L .
Voor de eenvoud van de notatie gaan we uit van drie studies, en noemen we de SE² a, b, c > 0. Te bewijzen is
Of nog:
a, b, c :
1 a 1 1 1 a b c
abc a. bc ac ab
Aangezien a, b, c allemaal positief geldt zeker dat:
abc abc a²c a²b .
Een analoge redenering kan gemaakt worden indien er meer of minder dan drie studies zijn in de meta-analyse.
Steunpunt Verkeersveiligheid
36
RA-2006-87