7. BESCHRIJVEND ONDERZOEK 7.1 Inleiding Beschrijvend onderzoek heeft, zoals de naam al suggereert, ten doel iets te beschrijven, niet om een fenomeen te verklaren. Net zoals bij alle andere typen onderzoek geeft de methodologie geen enkele richtlijn voor het te beschrijven onderwerp. Dit is een zaak van de onderzoeker (en/of zijn opdrachtgever). Zo kan een onderzoeker een beschrijving geven van de prestaties van de leerlingen op een bepaald niveau in het onderwijs, maar ook kan een beschrijving gegeven worden van de mishandelingen waaraan vrouwen bloot staan, van de incest in Nederland, et cetera. Het aantal onderwerpen is schier onbeperkt. Vaak wordt beschrijvend onderzoek gezien als hypothesevormend onderzoek. Op grond van een beschrijving kan een onderzoeker ideeën vormen of opdoen. Beschrijvend onderzoek wordt impliciet van minder belang geacht dan experimenteel onderzoek. Dit beeld doet echter geen recht aan beschrijvend onderzoek. Als we een parallel trekken met de natuurkunde zien we dat deze in de vorige eeuw tot bloei gekomen is, omdat er vele feiten waren die niet verklaard konden worden met de destijds gangbare theorieën. Totdat begin deze eeuw het vak natuurkunde, volgens insiders, ‘af’ was. Alles was beschreven en er behoefde niets meer gedaan of onderzocht te worden, aldus de raad die Einstein mee kreeg, voordat hij natuurkunde ging studeren. Daarna kwamen er weer nieuwe feiten aan het licht, die weer een impuls waren voor theorievorming. Waar het nu om gaat is de feitenkennis. Theorieën worden ontworpen omdat feiten niet verklaard kunnen worden. Deze theorieën zijn aanleiding voor experimenteel onderzoek. In de sociale wetenschappen ontbreekt het ten enen male aan systematische feitenkennis. Dat dit een enorme handicap is bij de vorming van theorieën behoeft geen betoog. Deze redenering kan opgevat worden als een pleidooi voor beschrijvend onderzoek. Daarmee is niet gezegd dat er alleen maar beschrijvend onderzoek gedaan zou moeten worden. We willen alleen de status van beschrijvend onderzoek wat opvijzelen en het belang benadrukken. Bij beschrijvend onderzoek spelen vanzelfsprekend ook verschillende betrouwbaarheids- en validiteitsproblemen. Een aantal problemen komt overeen met de problemen bij experimenteel onderzoek. Aspecten van de validiteit die betrekking hebben op (de validiteit van) oorzaak-gevolgrelaties zijn hier niet van toepassing, omdat men in beschrijvend onderzoek geen causale relaties tracht aan te tonen (zie paragraaf 3.3.1). Maar aspecten van de constructvaliditeit als convergente en divergente validiteit blijven van essentieel belang. Dit was bijvoorbeeld ook de kritiek op het recente onderzoek naar geweld tegen vrouwen. De onderzoeksters hadden namelijk alleen vrouwen bevraagd. Dit was de enige informatiebron. Begrijpelijk gezien de problematiek, maar onbegrijpelijk gezien de twijfels over de validiteit van hun conclusies die nu resteert. We hebben immers geen enkel inzicht .
112 in de vraag hoe herinneringen in de loop der tijd vertekend zijn en in hoeverre er sociaal wenselijke antwoorden gegeven zijn, om maar twee problemen te noemen. Met opzet is in de vorige alinea gekozen voor de ietwat vreemde constructie: ‘Aspecten van de validiteit die betrekking hebben op de validiteit van oorzaakgevolgrelaties zijn slechts gedeeltelijk van toepassing’, omdat men in beschrijvend onderzoek slechts met zeer veel slagen om de arm causale relaties mag veronderstellen. Eigenlijk kunnen geen oorzaak-gevolgrelaties geïnfereerd worden op grond van beschrijvend onderzoek. Dit kan aanleiding zijn voor flinke blunders, die te maken hebben met zogenaamde interveniërende variabelen. Een voorbeeld maakt dit probleem wellicht duidelijk. Toen de Amerikanen in de Tweede Wereldoorlog rekruten opriepen werden zij geconfronteerd met een plaatsingsprobleem. Welke functie in het leger moet een bepaalde rekruut krijgen? Moet hij opgeleid worden tot piloot? Of is hij meer geschikt als soldaat derde klas, oftewel kanonnenvoer? Vanzelfsprekend wilde men dit zo snel mogelijk weten, het liefst al zodra de rekruut binnenkwam. Want het was natuurlijk geld over de balk smijten om iemand een dure opleiding tot piloot te laten volgen als hij daar de capaciteiten niet voor had. En omgekeerd zou er wel erg slecht met menselijk kapitaal om worden gesprongen als personen met ‘piloot-capaciteiten’ als kanonnenvoer gebruikt zouden worden. Vandaar dat de rekruten de eerste weken allerlei tests moesten maken om een zo goed mogelijk plaatsingsbesluit te kunnen nemen. Dit leverde zeer veel gegevens op, die later voor allerlei doeleinden opnieuw geanalyseerd zijn. Eén van de conclusies die destijds op grond van dit materiaal getrokken is, gaf ‘wetenschappelijke’ onderbouwing aan het idee dat negers dommer zijn dan blanken. Kijk maar eens naar de volgende tabel (N: aantal waarnemingen).
Negers
Blanken
< 100
70%
41%
> 100
30%
59%
N = 15000
N = 7000
IQ
Van de 15.000 geteste negers heeft 70% een intelligentiequotiënt (IQ) lager dan 100. Van de geteste blanken heeft 41% een IQ lager dan 100. Een flink verschil dus. We zouden dan ook geneigd kunnen zijn te concluderen dat negers dommer zijn dan blanken. We weten echter ook dat intelligentie iets is dat zich ontwikkelt, c.q. dat ontwikkeld moet worden. Het IQ van een individu is (in elk geval deels) afhankelijk van de schoolloopbaan van dat individu. Iemand die middelbaar of
HOOFDSTUK 7: BESCHRIJVEND ONDERZOEK hoger onderwijs gevolgd heeft, heeft daardoor een hoger IQ dan iemand die alleen maar de lagere school doorlopen heeft (en in de VS vaak dat nog niet eens). De gevolgde opleiding zou een interveniërende variabele kunnen zijn. In de volgende tabel is het IQ voor negers (N) en blanken (B) dan ook uitgesplitst naar opleiding. Lager onderwijs
Hoger onderwijs
Negers
Blanken
Negers
Blanken
<100
95%
95%
95%
95%
>100
5%
5%
80%
80%
IQ
Het behoeft geen betoog dat op grond van de gegevens in de tweede tabel een geheel andere conclusie getrokken zou worden dan op grond van de gegevens in de eerste tabel. Opleiding is in dit voorbeeld een interveniërende variabele tussen IQ en ras. Een dergelijke relatie wordt soms schematisch weergegeven. Het schema, of model
Ras
IQ
verwerpen we ten faveure van het model:
Ras
Opleiding
IQ
Merk op dat combinatie van beide kruistabellen leert dat veel meer blanken hogere vormen van onderwijs gevolgd moeten hebben. Hierin zou wellicht aanleiding gevonden kunnen worden om de laatste redenering om te draaien: Ras‚ IQ‚ Opleiding. Er moet immers een oorzaak zijn voor de verschillen in opleiding? Let wel, de gepresenteerde gegevens ondersteunen deze verklaring niet; in de kruistabel is duidelijk te zien dat er een verschil in percentages is bij beide onderwijsvormen. Tevens is te zien dat er een duidelijk verschil is in IQ. 7.2 Generaliseerbaarheid Beschrijvend onderzoek, onderzoek dat niet gericht is op het aantonen van causale relaties, is er in verschillende soorten en maten. Soms worden in een onderzoek één of enkele gevallen beschreven. Een psycholoog, Piaget, werd wereldberoemd door de beschrijving van zijn drie kinderen. In therapeutisch onderzoek wordt zeer
114 regelmatig het verloop van een therapie bij één patiënt beschreven. Sommige onderwijsonderzoekers beschrijven het lees- of schrijfproces bij enkele leerlingen. Ook in erfelijkheidsonderzoek, waar veelal met tweelingen als proefpersonen gewerkt wordt, is het aantal proefpersonen vaak niet meer dan twee, et cetera. Al deze onderzoeken hebben een beperkte generaliseerbaarheid. Case-studies, of case-achtige studies, hebben als nadeel dat nauwelijks uitspraken gedaan kunnen worden over de waarde van de resultaten bij andere proefpersonen. Desalniettemin hebben case-studies als voordeel dat de onderzoeker zich veel verder in het onderwerp kan verdiepen dan wanneer enkele duizenden proefpersonen onderzocht worden. Daarmee kunnen gevalsbeschrijvingen zeer rijke gegevens opleveren. Een probleem is echter dat veel onderzoekers het niet kunnen nalaten toch te generaliseren en hun onderzoeksresultaten gebruiken om hele theorieën te weerleggen. Als een theorie voor één (of enkele) geval(len) niet uit lijkt te komen, dan kan dit niet als een weerlegging van de theorie beschouwd worden. Dit is een tomeloze overschatting van de zeggingskracht van onderzoeksresultaten gebaseerd op één (of enkele) waarneming(en). Een tweede type beschrijvend onderzoek is onderzoek waar de onderzoeker wel pretenties tot generalisatie moet waarmaken. Dit is bijvoorbeeld het geval bij het al genoemde onderzoek naar vrouwenmishandeling, maar ook bij peilingsonderzoek. In het onderstaande voorbeeld geven we een toelichting op beschrijvend onderzoek aan de hand van periodiek peilingsonderzoek in het voortgezet onderwijs. Peilingsonderzoek heeft ten doel de kwaliteit van het onderwijs te beschrijven. Dat wil zeggen: een beschrijving te geven van de inhoud en opbrengsten van het onderwijs op een bepaald niveau van het onderwijs. Er moet een overzicht gegeven worden van de doelstellingen die in het onderwijs nagestreefd worden, welke middelen daarvoor gebruikt worden en wat de leerprestaties zijn. In dit voorbeeld zullen we ons voornamelijk beperken tot de meting van de prestaties van leerlingen voor het vak Nederlands. Het klinkt eenvoudig: we meten de prestaties, beschrijven die en klaar is Kees. Er komt echter wel wat meer bij kijken. Met name de generaliseerbaarheid levert nogal wat problemen op. Generaliseerbaarheid wordt hier gebruikt in twee verschillende opzichten. Er wordt gerefereerd aan generaliseerbaarheid naar leerlingen (bijvoorbeeld naar alle derdeklassers, wanneer een peiling gericht is op de derde klas). Maar ook wordt gerefereerd aan generaliseerbaarheid naar het domein van vaardigheden die tezamen de vaardigheid in de Nederlandse taal bepalen. Het eerste punt, generaliseerbaarheid naar leerlingen, is een kwestie van het trekken van een steekproef. Dat is een oplosbaar probleem. Wel zullen grote aantallen leerlingen aan het onderzoek moeten deelnemen om met enige zekerheid te kunnen generaliseren (zo is het absoluut onmogelijk om op de spelprestaties van 80 eerstejaars te generaliseren naar alle eerstejaars, zoals een Groningse onderzoeker een aantal jaar geleden meende te kunnen doen). Het tweede probleem, generaliseerbaarheid naar het vak Nederlands is een veel lastigere zaak. Wanneer we bijvoorbeeld de schrijfvaardigheid van
HOOFDSTUK 7: BESCHRIJVEND ONDERZOEK derdeklassers willen evalueren, dan moeten de leerlingen schrijven. Maar hoeveel opdrachten moet elke leerling maken om een betrouwbare indicatie van zijn schrijfvaardigheid te krijgen? En nog belangrijker, hoeveel verschillende opdrachten zijn nodig om het domein aan mogelijke schrijfopdrachten te dekken? Zo langzamerhand zijn we tot de vrijwel onafwendbare conclusie (en misschien volgens sommigen wel een open deur) gekomen dat het schrijven van de ene opdracht niet gelijk is aan het schrijven van een andere opdracht. Het maakt nogal wat uit of de schrijfvaardigheid geëvalueerd wordt met behulp van een verhaal, een betoog of een kort sollicitatiebriefje. Daar een meting van de schrijfvaardigheid afhankelijk is van de opdracht in kwestie waarmee schrijfproducten aan leerlingen ontlokt worden, kan op basis van één opdracht niet gegeneraliseerd worden naar de schrijfvaardigheid. Dit is echter wel het doel van peilingsonderzoek. We moeten dus de leerlingen een steekproef uit alle mogelijke schrijfopdrachten voorleggen. Maar wat is het aantal mogelijke schrijfopdrachten? Op welke dimensies variëren verschillende schrijfopdrachten eigenlijk? Welke dimensies die kunnen variëren hebben een verband met de meting van de schrijfvaardigheid? Allemaal vragen die we samen kunnen vatten met: er ontbreekt een adequate domeinbeschrijving van schrijfopdrachten. Een steekproef van schrijfopdrachten, of dit er nu één is of dat het er honderd zijn, zal derhalve altijd het karakter van een gelegenheidssteekproef dragen (er is zomaar een x aantal gekozen) met alle generaliseerbaarheidsproblemen van dien. Deze problematiek geldt niet alleen voor de schrijfvaardigheid, maar eigenlijk voor alle vaardigheden die bij het vak Nederlands onderwezen worden. De conclusie is dan ook dat in peilingsonderzoek weliswaar gegeneraliseerd kan worden naar leerlingen, maar alleen voor de opdrachten die ook daadwerkelijk afgenomen zijn. Wetenschappelijk gezien mag niet gegeneraliseerd worden naar dé schrijfvaardigheid, dé leesvaardigheid en dergelijke.
Met deze korte beschrijving van onderzoek naar het niveau van het onderwijs is natuurlijk lang niet alles gezegd. Er zijn veel verbanden tussen variabelen die zich heel wel laten onderzoeken c.q. analyseren, maar de causaliteitsvraag blijft vaak een heikel punt. Daarnaast is een dergelijke verzameling gegevens uitermate nuttig om inzicht te krijgen in de consequenties van bepaalde beslissingen. Denk maar aan de invoering van de basisvorming in het onderwijs. Het idee is om voor alle leerlingen in het voorgezet onderwijs in de toekomst na te gaan of zij aan het einde van de derde klas een bepaald niveau bereikt hebben. Hiervoor kunnen zij op twee niveaus een examen afleggen: op een laag of hoog niveau. Na deze voor alle leerlingen gelijke periode wordt gedifferentieerd naar schooltype. Het spreekt voor zich dat één van de problemen die kleeft aan de invoering van een dergelijke basisvorming het probleem van normstelling is: welke prestaties moeten leerlingen halen voor het laagste niveau en hoe hoog moet een prestatie zijn om te slagen voor het hoogste niveau? Voor alle veertien vakgebieden die deel uitmaken van de basisvorming zijn commissies van wijze mannen en vrouwen aan de slag gegaan om normen op te stellen. Toen de normen voor het vak Nederlands bekend waren, was het aardig deze commissie met de empirie – oftewel de gegevens uit het peilings-
116 onderzoek – te confronteren. De resultaten waren schokkend. Zij kunnen het beste weergegeven worden in de woorden van de auteurs: ‘In onze operationalisatie van de eindtermen moet een leerling aan verschillende eisen voldoen. Een sollicitatiebrief moet bijvoorbeeld niet alleen goed geschreven zijn, maar mag ook niet al te veel spelfouten bevatten. Het gaat immers om minimaal noodzakelijke vaardigheden. Indien we de resultaten van de leerling aan de normen weerspiegelen, dan zijn de resultaten in onze ogen desastreus: grote groepen leerlingen blijken zelfs beneden de relatief soepele norm van het lage niveau te presteren. Bovendien blijkt het hogere niveau voor vrijwel alle LBO-leerlingen te hoog gegrepen. En dan hebben we het pas over twee aspecten van één doelstelling: ‘De leerlingen kunnen een zakelijke of persoonlijke brief schrijven (...) ten behoeve van (...) toekomstige werkgevers en daartoe de noodzakelijke conventies hanteren met betrekking tot interpunctie, spelling, structuur, kenmerken van tekstsoorten, taalgebruik en uiterlijke verzorging.’ Hadden we de eis gesteld dat een leerling voor meer eindtermen van het vak Nederlands op het algemene (lage) niveau moet presteren, dan hadden de uitkomsten nog meer aanleiding tot zorg gegeven. Wanneer we daarnaast bedenken dat de leerlingen voor toelating tot HAVO/MBO behalve Nederlands nog zes andere vakken op het algemene niveau moeten afsluiten, dan moeten we welhaast concluderen dat HAVO- en MBO-docenten een erg rustige tijd te wachten staat. Het verdient derhalve aanbeveling de thans voorliggende eindtermen nog eens kritisch te beschouwen: wellicht wordt hier en daar toch overvraagd. Misschien zou bij het formuleren van de eindtermen meer rekening gehouden kunnen worden met de feitelijke prestaties van leerlingen zoals deze uit (bijvoorbeeld) peilingsonderzoek naar voren komen. Wij zouden gezien de huidige eindtermen de stelling willen verdedigen dat reële eindtermen, waarbij 80% van de leerlingen kan slagen, enkel geformuleerd kunnen worden op het niveau: ‘Zeg het alfabet op’.’ (Van den Bergh & Kuhlemeier, 1990, p.13) Wat noodzakelijk is, is dat op grond van een beschrijving van het huidige prestatieniveau doelstellingen geformuleerd worden. Zo kan beschrijvend onderzoek een belangrijke bijdrage leveren aan besluitvorming over onderwijsvernieuwingen.
Ook in beschrijvend onderzoek kunnen hypotheses getoetst worden. Zo kan in peilingsonderzoek nagegaan worden, of meisjes (gemiddeld) taalvaardiger zijn dan jongens (als alternatieve hypothese) en of vwo-leerlingen hoger prestaties behalen op leesvaardigheidstoetsen dan havo-leerlingen, et cetera. Soms wordt een beschrijvend onderzoek zelfs wel opgezet louter en alleen om bepaalde hypotheses te toetsen. Het cruciale verschil tussen beschrijvend onderzoek en experimenteel onderzoek is gelegen in de vraag of er iets gemanipuleerd wordt. Indien dat het geval is, dan is er sprake van experimenteel onderzoek; is dat niet het geval, dan is er sprake van beschrijvend onderzoek. Merk op dat sommige vraagstellingen zich niet lenen voor experimenteel onderzoek. Denk maar aan de vraag naar eventuele verschillen tussen jongens en meisjes in taalvaardigheid. Hiervoor is geen experimenteel onderzoek mogelijk; we kunnen sekse niet aselect toewijzen aan personen of
HOOFDSTUK 7: BESCHRIJVEND ONDERZOEK personen kunnen niet aselect toegewezen worden aan sekse. Het antwoord op deze vraag kan dus alleen maar verkregen worden op grond van beschrijvend onderzoek. 7.3 Correlationeel onderzoek Een derde type beschrijvend onderzoek is onderzoek waarin men gericht is op samenhangen tussen variabelen. Zo kan een onderzoeker geïnteresseerd zijn in vragen als: hangt taalvaardigheid samen met sekse? Wat is de samenhang tussen het eten van roomboter en het krijgen van kanker? In hoeverre hangen de prestaties op een leesvaardigheidstoets samen met de tijd die mensen aan lezen besteden? Hoe hoog hangen verschillende toetsen om de luistervaardigheid te meten samen? et cetera. Al deze vragen zijn vragen naar samenhang. De mate waarin de scores op twee variabelen samenhangen, wordt uitgedrukt in een correlatiecoëfficiënt. Een correlatiecoëfficiënt kan alle waarden aannemen tussen de -1 en de +1. Hierbij correspondeert -1 met een perfect negatieve samenhang en +1 met een perfect positieve samenhang. Een negatieve samenhang betekent: hoe hoger de score op de ene variabele, hoe lager de score op de andere variabele. Als bijvoorbeeld lengte en gewicht negatief samenhangen betekent dit dat hoe langer iemand is, hoe lichter hij is. Een positieve samenhang geeft in dit voorbeeld aan dat hoe langer iemand is, hoe zwaarder hij is. Een correlatiecoëfficiënt van nul duidt op de afwezigheid van een samenhang. Als de correlatie tussen lengte en gewicht nul is, dan is er geen verband tussen deze twee variabelen. In het algemeen geldt: hoe meer een correlatiecoëfficiënt afwijkt van nul, hoe sterker het verband tussen beide variabelen. Een belangrijke vraag is nu: hoe moet een bepaalde waarde van een correlatiecoëfficiënt geïnterpreteerd worden? Wat betekent een correlatie van 0.20, 0.40 of -0.60? Zonder op de berekeningswijzen voor correlatiecoëfficiënten vooruit te lopen, kan de volgende vuistregel opgesteld worden. Deze regel, die in de onderstaande tabel is weergegeven, moet echter wel met de nodige souplesse gehanteerd worden. Immers, grenzen zijn altijd enigszins arbitrair! Waarde van de correlatiecoëfficiënt -1.00 tot -0.80 -0.79 tot -0.60 -0.59 tot -0.30 -0.29 tot -0.01 0.00 0.01 tot 0.30 0.31 tot 0.60 0.61 tot 0.80 0.81 tot 1.00
Interpretatie zeer sterk negatief verband sterk negatief verband matig negatief verband zeer zwak tot geen negatief verband geen verband zeer zwak tot geen positief verband matig positief verband sterk positief verband zeer sterk positief verband
118 Tot slot van deze paragraaf twee voorbeelden van correlationeel onderzoek. Het eerste voorbeeld betreft onderzoek naar de samenhang tussen argumenten voor grammatica-onderwijs en de tijdsbesteding aan verschillende onderdelen die aan bod komen in het basisonderwijs (Wesdorp & Tordoir, 1979). Wesdorp en Tordoir onderscheidden vier groepen docenten wat betreft hun motivering om grammatica-onderwijs te geven. Zij onderscheiden: (1) de groep docenten die argumenten voor grammatica-onderwijs hanteren als zou grammatica-onderwijs de moedertaalvaardigheid positief beïnvloeden, (2) de groep die het belang van grammatica voor het vreemde talenonderwijs benadrukt, (3) de groep die de positieve invloed van grammatica op het logisch denken en de zinvolheid van grammatica-onderwijs op zichzelf onderschrijft en (4) de groep die grammatica-onderwijs geeft vanwege de eisen die door het voortgezet onderwijs gesteld worden. Wat betreft de inhoud van het grammatica-onderwijs werd een viertal aspecten onderscheiden: (1) de kernstof van zinsontleding (zinsdelen, onderwerp, zinskern, werkwoord e.d.), (2) de uitbreidingsstof van zinsontleden (naamwoordelijk gezegde, de bijvoeglijke en bijwoordelijke bepaling et cetera), (3) de kernstof van woordbenoeming, (zelfstandig naamwoord, lidwoord, bijwoord en dergelijke) en (4) de uitbreidingsstof voor woordbenoemen (on/bepaald lidwoord, on-/bepaalde telwoorden, concrete en abstracte zelfstandige naamwoorden et cetera). In de onderstaande tabel zijn de correlaties tussen de oordelen van docenten voor deze vier aspecten, de tijdbesteding aan grammatica-onderwijs en de sterkte van de motivatie weergegeven.
Moedertaalvaardigheid
Inhoud
Motivering VreemdeLogisch taalvaardigheid denken
Eisen leerplan VO
Zinsontleden ○Kernstof
0.25
0.25
0.16
0.14
○Uitbreidingsstof
0.30
0.26
0.21
0.08
Woordbenoemen ○Kernstof
0.33
0.33
0.20
0.10
○ Uitbreidingsstof
0.37
0.34
0.25
0.09
Tijdbesteding
0.22
0.16
0.18
0.04
Naar de mening van docenten is er een verband tussen de kernstof van zinsontleden en de vaardigheid in de moedertaal. De correlatie op de hiermee corresponderende vragen bedraagt .25. Uit de bovenstaande tabel blijkt dus dat er zeker een verband is tussen de mate waarin de docenten zich achter de vier motieven scharen en de hoeveelheid onderdelen waaraan men aandacht schenkt. Doch dit verband is niet sterk; er is ook geen aanleiding om verschillen tussen de correlatiecoëfficiënten bijzonder te belichten, gezien de geringe sterkte van de verbanden. Voor de correlatie tussen tijdbesteding en motivering kan gesteld worden dat er kennelijk andere factoren zijn (dan mo-
HOOFDSTUK 7: BESCHRIJVEND ONDERZOEK tivatie van de docent) die de tijd die aan grammatica-onderwijs besteed wordt, beïnvloeden.
Correlationeel onderzoek kan ook veel ingewikkelder zijn dan het hierboven gegeven relatief eenvoudige voorbeeld. Eén van de problemen met correlaties is dat wanneer de scores op variabele A, B en C onderling correleren, de kans bestaat dat een deel van de correlatie tussen A en B veroorzaakt wordt door C. Evenzo kan een deel van de correlatie tussen A en C veroorzaakt worden door B, en tussen B en C door A. Dit maakt correlatiecoëfficiënten vaak erg moeilijk te interpreteren. Vandaar dat we vaak geïnteresseerd zijn in partiële correlaties. Een voorbeeld: Verbeek en Visser (1990) zijn geïnteresseerd in de relatie tussen kenmerken van televisieprogramma’s en het aantal telefonische reacties dat binnenkomt bij Stichting Correlatie. Om enig inzicht te krijgen in de relatie tussen programmakenmerken en het ‘aantal bellers’, is van een groot aantal programma’s waarvoor Correlatie nazorg verrichtte (a) het aantal bellers nagegaan, (b) een aantal programmakenmerken achterhaald, bijvoorbeeld: aantal kijkers, tijdstip van uitzending, type programma (documentaire, praatprogramma, film), et cetera. Al deze aspecten werden gecorreleerd met het aantal telefonische reacties. Het is echter goed voorstelbaar dat het aantal kijkers samenhangt met het aantal bellers, maar dat een deel van deze samenhang tot stand komt door het tijdstip van uitzending. Niet voor niets bestaat in de tv-wereld de uitdrukking ‘primetime’, waarmee de tijd tussen acht en tien uur ‘s avonds aangeduid wordt, als zijnde de tijd waar de kijkdichtheid het grootste is. Verstandig genoeg besloten Verbeek en Visser derhalve tot de bestudering van de partiële correlaties tussen het aantal telefonische reacties en de verschillende programmakenmerken. Hier waren bij deze partiële correlaties alle andere programmakenmerken uitgesloten, zodat alleen de zuivere invloed van een bepaald programmakenmerk overbleef.
Merk op dat in dit specifieke geval ook een uitspraak gedaan kan worden over de causaliteit tussen de verschillende typen variabelen (aantal bellers en programmakenmerken). Programmakenmerken kunnen normaliter nooit bepaald worden door het aantal telefonische reacties bij Correlatie. Verbeek en Visser kunnen gevoeglijk aannemen dat de programmakenmerken van invloed zijn op het aantal bellers.
120