Wetenschapsleer
Leereenheid 2: Beschrijving van de wetenschappelijke methode aka Scientific method
1 Intro op de wetenschappelijke methode – empirische cyclus 2 Beschrijving van de empirische cyclus 3 Overzicht van bezwaren tegen de methode 3.1 Het inductieprobleem 3.2 Het toetsprobleem 3.3 Het waarnemingsprobleem 4 Demarcatie en epistemische deugden 5 Opdrachten en terugkoppeling
1
Beschrijving van de wetenschappelijke methode
1
Introductie op de wetenschappelijke methode – empirische cyclus
De wetenschappelijke methode bestaat uit een planmatige manier om onderzoek te programmeren en uit te voeren, een manier waarin theorie, hypothesen, waarnemingen via deductie en inductie worden gecombineerd in experimenten die uitsluitsel geven over bepaalde theoretische puzzels. Wij gebruiken ‘de wetenschappelijke methode’ als vertaling van ‘the scientific method’. In het Nederlands is het trouwens meer gebruikelijk om te spreken van ‘de empirische cyclus’. We zullen deze methode beschrijven, en aangeven waarom zij zo belangrijk is binnen de wetenschapsleer. Alleen al de vraag òf we mogen spreken van de wetenschappelijke methode heeft betrekking op de kern van (het object van) de wetenschapsleer. Kort gezegd bestaat veel van de wetenschapsleer uit discussies over de wetenschappelijke methode. Dit brengt ons bij de bezwaren die (sinds David Hume) tegen de methode zijn ingebracht, zoals het inductieprobleem. Dat probleem zullen we beschrijven, net als twee andere bezwaren tegen de wetenschappelijke methode. Na alle discussie over en twijfel aan de methode rijst de vraag, of we nog beschikken over een demarcatiecriterium dat wetenschap van niet-wetenschap kan onderscheiden. Een deel van de functie van zo’n criterium kan worden vervuld door zogenaamde epistemische deugden, zoals Occam’s razor, de epistemische deugd van eenvoud. Belang methode Wanneer kennis feitelijk geldt, voor waar wordt aangenomen binnen een gemeenschap, betekent dit niet per se dat deze kennis waar is. Ook vooroordelen, bijgeloof en andere idolen gelden immers soms als waar, zonder dat ze het zijn. Wetenschappelijke kennis wordt gelegitimeerd door aan te geven dat ze op de juiste wijze is verworven. (cf. Korthals 1989). De wetenschappelijke methode is in de eerste plaats van belang, omdat zij geldt als manier om kennis te rechtvaardigen. Sommige stromingen (logisch empirisme; positivisme) zien in de wetenschappelijke methode zelfs de enige manier om kennis te rechtvaardigen, de unieke manier om wetenschap te bedrijven; zij beschouwen die methode dus ook als demarcatiecriterium tussen wetenschap en niet-wetenschap. Pluralisten achten juist verschillende manieren om onderzoek te doen wetenschappelijk. Gegeven de methode valt het eenvoudig om de grens tussen wetenschap en niet-wetenschap (of pseudo-wetenschap en religie/metafysica) te trekken; het demarcatiecriterium is duidelijk: alleen wie deze methode hanteert, produceert wetenschap. De wetenschappelijke methode is het beeld dat vele wetenschappers bij zich dragen van het project wetenschap waar zij deel van uitmaken. Cornelisse (1985) zegt het zo: “Het standaardbeeld is een ideaalbeeld, waarin getracht is normatieve aspecten van wetenschapsbeoefening zo geprononceerd mogelijk uit te drukken. De logica en de methodologie (..) hebben dit beeld gestructureerd . De voorspelling neemt een sleutelpositie in. Uiteindelijk beslist de empirie over de houdbaarheid van hypothesen: de beslissende observaties worden niet vóór de formulering van de hypothese, maar erná gedaan. (…) Deze opsomming van algemene trekken van het standaardbeeld draagt praktisch elke onderzoeker min of meer in het hoofd.” De wetenschappelijke methode is ontwikkeld door velen, zoals de rationalist Descartes en vele vroege Engelse empiristen, zoals Francis Bacon en Robert Boyle. Hun verschillende inbreng is gecombineerd in de hypothetischdeductieve werkwijze, die met deductie en inductie elementen samenbrengt uit rationalistisme en empirisme. Enkele hoogtepunten uit de ontstaansgeschiedenis van de methode zijn weergegeven in wikipedia. Veel discussies binnen de wetenschapsleer gingen of gaan over (delen van) de wetenschappelijke methode. We citeren hierover Wikipedia; desgewenst kunt u doorklikken naar de onderstreepte hyperlinks: The history of scientific method is inseparable from the history of science itself. The development and elaboration of rules for scientific reasoning and investigation has not been straightforward; scientific method has been the subject of intense and recurring debate throughout the history of science, and many eminent natural philosophers and scientists have argued for the primacy of one or another approach to establishing scientific knowledge. Some of the most important debates in the history of scientific method center on: rationalism, especially as advocated by René Descartes; inductivism, which rose to particular prominence with Isaac Newton and his followers; and hypothetico-deductivism, which came to the fore in the early 19th century. In the late 19th and early 20th centuries, a debate over realism vs. antirealism was central to discussions scientific method as powerful scientific theories extended beyond the realm of the observable, while in the mid-20th century some prominent philosophers argued against any universal rules of science at all.
2
Wetenschapsleer
Nu eerst een meer gedetailleerde beschrijving van de wetenschappelijke methode. Vervolgens zullen we ingaan op enkele wetenschapsfilosofische discussies in de vorm van bezwaren tegen de methode: ertegen: wat is er zoal mis met het fraaie beeld van de wetenschappelijke methode?
2 Beschrijving van de empirische cyclus De wetenschappelijke methode, ook bekend als de empirische cyclus, kan kort worden aangeduid als een stapsgewijze procedure voor onderzoek. Op z’n simpelst beschreven: Stel, u beschikt over een hypothese over hoe de wereld in elkaar zit. Als dat idee klopt, zou iets anders ook waar moeten zijn. U gaat dan kijken of dat zo is, en zo ja, acht u uw hypothese (en achterliggende theorie) bevestigd. Zo kan het idee dat bepaalde landschappen ooit onder water hebben gestaan worden bevestigd door de vondst van een zeefossiel. Begrip van de cyclus vergt kennis van twee basisbegrippen: deductie en inductie. Voor een uitgebreide beschrijving van deze twee redeneerprocedures en hun diverse vormen, zie de Ou-cursus Argumentatie (Van Zanten 2000a; 2000b). Deductie is gebaseerd op formele logica en levert absolute zekerheid: wat we weten voor alle gevallen, wordt toegepast op één geval. Alle mensen zijn sterfelijk; Socrates is een mens; dus, kunnen wij deductief concluderen dat Socrates sterfelijk is. De specifieke uitspraak wordt afgeleid uit de meer algemene. Een frequent voorkomende deductie binnen de wetenschap is de zogenaamde modus tollens: we weten dat als A, dan B; we constateren dat B niet het geval is; zodoende mogen we deductief concluderen (zonder de moeite nemen dit te gaan waarnemen) dat A evenmin het geval is. Vaak wordt dit genoteerd als: AB -B Ergo, -A Als A dan B (ofte wel A B) is te lezen als: “A is een voldoende voorwaarde voor B”, of als “B is een noodzakelijke voorwaarde voor A.” Dit betekent dat “zonder adem (A) geen leven (L) ”, genoteerd wordt als L A. De absolute zekerheid is een belangrijk voordeel van deductie; daartegen staat dat zij geen informatie toevoegt. In het Socrates-voorbeeld wisten we immers al dat alle mensen sterfelijk zijn. Inductie biedt juist wel nieuwe informatie; daar staat als minpunt tegenover dat inductie niet 100% zeker is. Voorbeeld van inductie: ik zie een zwaan en die is wit; ik zie nog vijftig zwanen, en die zijn allemaal wit; ik concludeer: dus, alle zwanen zijn waarschijnlijk wit. Gewapend met deze kennis over deductie en inductie vervolgen wij de beschrijven van de empirische cyclus. Een gedetailleerde weergave van de empirische cyclus is te vinden in vrijwel elk methodologieboek. Sociale wetenschappers kennen doorgaans de versie van Adriaan D. de Groot: Methodologie: grondslagen van onderzoek en denken in de gedragswetenschappen, Mouton Den Haag, 1961. De twaalfde druk verscheen in 1994. Onderstaande weergave van de empirische cyclus is ontleend aan Veerman & Essers (1988:55-57): “De empirische wetenschappen starten in feite bij de empirie: via inductie worden uit waarnemingsuitspraken empirische generalisaties (empirische wetten) afgeleid. Wetenschap steunt daarnaast in belangrijke mate op deductieve (logische) afleidingen. De via generalisatie verkregen empirische wetten probeert men te herleiden tot een meer algemene, hypothetische, verklarende theorie. De eis die men aan deze verklarende theorie stelt is dat al eerder geformuleerde empirische wetten, die via generalisatie verkregen zijn, deductief uit de hypothetische theorie kunnen worden afgeleid. Zo’n algemene theorie wordt bevestigd wanneer ook andere, nog onbekende wetten of feiten uit deze theorie op een deductieve wijze afgeleid kunnen worden, dan wel op grond hiervan feiten of verschijnselen voorspeld kunnen worden. Via experimenten of observaties is het mogelijk vast te stellen of de nieuw ontwikkelde theorie bevestigd wordt of onjuist blijkt te zijn. Over het algemeen probeert men in de ervaringsafhankelijke wetenschappen de deductieve en de inductieve methode te combineren. De werkwijze die men momenteel het meeste toepast, wordt veelal aangeduid met de hypothetisch-deductieve methode. Vaak wordt ook over de empirische cyclus gesproken. Deze werkwijze omvat een tweetal fasen: een hypothetische fase en een deductieve fase. De volgende stappen kunnen hierbij onderscheiden worden:
3
Beschrijving van de wetenschappelijke methode
A.De hypothetische fase: 1.Observatie: via waarnemingen wordt feitenmateriaal verzameld. Zo nodig wordt er gebruik gemaakt van experimenten. Hierbij wordt feitenmateriaal verzameld in situaties waarin men de omstandigheden zoveel mogelijk tracht te beheersen. De verzamelde data worden beschreven in een niet van enige theorie afhankelijke taal L0. De verzamelde gegevens worden vervolgens geordend. Het resultaat van deze observaties zou bijv. een reeks uitspraken van de vorm O1(a) -> O2(a) kunnen zijn. Het is van belang om hier te onderkenen, dat het dus steeds over concrete gevallen gaat. 2.Inductie: op basis van het verzamelde feitenmateriaal worden algemene empirische uitspraken (wetten) geformuleerd. Deze wetten dienen alle tot dan toe bekende gevallen op een algemene wijze te beschrijven. Hierbij wordt louter gebruik gemaakt van termen uit de observatietaal L0. Zo nodig wordt gebruik gemaakt van de zogenaamde ceteris paribus clausule. Dat wil zeggen dat men precies aangeeft onder welke omstandigheden de wet geldt en dat bij gewijzigde omstandigheden de wet niet, of vermoedelijk niet opgaat. In het gegeven voorbeeld zou op grond van de waarnemingen de empirische generalisatie G: (Vx) [O1(x) -> O2(x)] als vooronderstelling geformuleerd kunnen worden. [W. van Zanten: In deze generalisatie staat de x als in een wiskundige functie voor ‘een willekeurig geval’. De generalisatie heeft daarmee betrekking op alle gevallen die in domein V voorkomen. De eerdere uitspraak bevatte geen ‘x’, maar een ‘a’; de ‘a’ staat voor een waargenomen geval. Dus: van geval a hebben we waargenomen dat als O1, dan (steeds) O2. De empirische generalisatie (met de ‘x’) spreekt zich ook uit over gevallen die (nog) niet zijn waargenomen.] 3. Hypothesevorming: op basis van de geformuleerde empirische generalisaties (wetten) kunnen nu theoretische hypothesen worden geponeerd, waarin dus niet uitsluitend over louter concrete gevallen kan worden gesproken. Uit deze hypothesen moeten de eerder geformuleerde empirische wetten afgeleid kunnen worden, dat wil zeggen dat ze moeten kunnen dienen als verklaring voor deze wetten. Bij het formuleren van deze hypothesen wordt dus gebruik gemaakt van zowel het theoretische vocabularium als het observatievocabularium. Het resultaat hiervan is een aantal theoretische postulaten en een aantal correspondentieregels (operationele definities). (…) B. De deductieve fase: 1. Deductie: uit de geformuleerde hypothesen kunnen langs logische weg nieuwe uitspraken (wetten, feiten) worden afgeleid van zowel theoretische als empirische aard. 2. Toetsen: via empirisch onderzoek worden de nieuw afgeleide uitspraken getoetst. Het resultaat van deze toetsing kan zijn dat de geformuleerde uitspraak met de werkelijkheid overeenkomt dan wel dat de afgeleide uitspraak weerlegd wordt. 3. Evaluatie: wanneer in het empirisch onderzoek de afgeleide uitspraak bevestigd wordt betekent dit een versterking van de verklarende hypothese en de via generalisering verkregen wettelijke uitspraak. Blijkt uit het onderzoek dat de afgeleide uitspraak niet strookt met de werkelijkheid dan is hiermee in ieder geval voorlopig de verklarende hypothese weerlegd en moet getwijfeld worden aan de geformuleerde wet op grond waarvan de hypothese geformuleerd was.” Voor een eenvoudig voorbeeld van de cyclus hebben we ons laten inspireren door het werk van de socioloog Durkheim. Eerst zijn via waarnemingen feiten verzameld. De observatie is dat in diverse steden in Nederland de laatste tien jaar meer zelfmoorden zijn gepleegd dan in de tien jaar daarvoor. U formuleert op basis hiervan via inductie een algemene wet: voor alle Nederlandse steden geldt dat daar de laatste tien jaar meer zelfmoorden zijn gepleegd dan in de tien jaar daarvoor. U gaat nu op zoek naar een theoretische hypothese die uw wet zou verklaren, en u komt tot: “Het aantal zelfmoorden in een stad is afhankelijk van de mate van ‘sociale cohesie’: hoe lager de cohesie, hoe hoger het aantal zelfmoorden. U introduceert hiermee een theoretische term, namelijk het begrip ‘sociale cohesie’; u geeft daarvan apart een operationele definitie die duidelijk maakt hoe de cohesie kan worden gemeten. Via deductie leidt u vervolgens het empirische vermoeden af dat de sociale cohesie in uw land de laatste tien jaar is gedaald. Indien dit vermoeden wordt bevestigd, beschikt u over een logisch sluitende verklaring: u kunt het empirische gegeven immers invullen in de theoretische hypothese. Als die juist blijkt, kunt u er ook andere zaken
4
Wetenschapsleer
uit afleiden, zoals de voorspelling ‘De vorming van nieuwe sociale verbanden zal het aantal zelfmoorden doen afnemen’ of de nieuwe theoretische hypothese ‘De mate van sociale cohesie heeft effect op de volksgezondheid’.
Voordat we bezwaren tegen deze methode gaan behandelen, presenteren we als tegenwicht eerst een voorbeeld van de succesverhalen waar de methode op kan bogen. We laten u daarbij meedenken vanuit de positie van een beroemde gebruiker van de cyclus, Louis Pasteur (1822-1895). Stel, u doet in het midden van de 19e eeuw onderzoek naar bacteriën. Ter discussie staat of bacteriën al dan niet spontaan kunnen ontstaan in vloeistof. Collega Spallanzani meent van niet. Hij heeft een vloeistof eerst bacterievrij gemaakt door verhitting, en, zolang hij die vloeistof afgesloten houdt, groeien er geen bacteriën in terug. Exit spontane generatie, aldus Spallanzani. U bent overtuigd door dit experiment. De aanhangers van de spontane generatie-theorie juist niet. Bacteriën kunnen wel degelijk spontaan ontstaan, zolang ze maar in contact staan met lucht. Spallanzani heeft die conditie geschonden, dus zijn experiment bewijst helemaal niets! Wat zou u in deze situatie doen om de verklaring uit te sluiten, dat spontane generatie mogelijk is zolang de bacteriën in contact staan met lucht? Het probleem is – in uw ogen – dat contact met lucht ook contact met mogelijke besmettingsbronnen betekent. Neem even de tijd om zelf een experiment te bedenken; Pasteur’s aanpak vindt u hier1. Hopelijk heeft u genoten van de elegante aanpak van Pasteur, van zijn heldere logica. De casus illustreert de planmatige aanpak van wetenschappelijk onderzoek volgens de methode: bewust resultaten oproepen die informatief zijn, die bepaalde verklaringen uitsluiten. Als de resultaten op tafel liggen weten we meer, omdat één verklaring is uitgesloten. Op deze manier beoefend, heeft wetenschap iets weg van het spel Mastermind, waarin een kleurcode in zo min mogelijk ´informatieve experimenten´ moet worden gekraakt. Beginners stellen in dit spel vaak in het wilde weg vragen, zonder vooraf te bedenken of het antwoord opties uitsluit. Een aanhanger van de wetenschappelijke methode zou dat niet gauw overkomen: die beseft dat elk experiment informatie moet opleveren.
3 Overzicht van bezwaren tegen de methode Tegen de wetenschappelijke methode als rechtvaardiging van kennis en tegen (bepaalde versies van) de methode als demarcatiecriterium zijn vele bezwaren ingebracht. Zolang het om versies van de methode gaat zouden we dit als ‘onderonsjes’ kunnen beschouwen, hoewel sommige daarvan veel stof hebben doen opwaaien. Het bekendste onderonsje vond plaats tussen de logisch empiristen en Karl Popper. De empiristen namen verificatie als demarcatiecriterium, en toetsen theorie aan hun mate van bevestiging ofte wel ‘confirmatie’. Popper bracht daar het falsificatiecriterium tegen in, volgens welke een theorie hooguit kan worden gecorroboreerd. Popper stelt dat een wetenschappelijke theorie betrekking moet hebben op de empirie, en zodoende weerlegd ofte wel gefalsifieerd moet kunnen worden. Denk terug aan de conditionele zin A B. Wie dit wil confirmeren, zoekt naar gevallen waarin A en B samen optreden. Popper’s falsificatiestreven houdt in dat we moeten zoeken naar gevallen waarin de stelling niet opgaat, namelijk omstandigheden waarin A het geval is, en B niet. Volgens Popper is een theorie nooit zeker, omdat we later het tegendeel kunnen meemaken van elke stelling, zelfs van de tot nu toe sterkst bevestigde stelling. Popper wil daarom de theorie die het beste bestand is gebleken tegen weerleggingspogingen, in zijn terminologie ‘met een hoge corroboratiegraad’, tot (voorlopig) de beste te verklaren. Popper pleit verder voor een grote empirische inhoud van een theorie: hoe meer een theorie beweert, hoe meer zij uitsluit, en des te gemakkelijker is zij te weerleggen. ‘Riskante’ en gecorroboreerde theorieën genieten zodoende Popper’s voorkeur. Tot zover de discussie tussen Popper en de logisch empiristen over de empirische cyclus (meer specifiek: over de manier waarop men zich de empirische steun voor een theorie moet voorstellen) die de basisvorm van de wetenschappelijke methode niet aantast. Voor meer over Popper zie de Ou-cursus Academische vaardigheden 5 deel 2, Empirische cyclus à la Popper: deductie, inductie en weerlegbare hypothesen (Garssen & Van Zanten 2006). 1
Louis Pasteur slaagde erin een experiment te bedenken. Hij ontwierp een fles met een zwanenhals, hij deed onderin een gesteriliseerde vloeistof, die op die manier in contact met de lucht stond, zonder dat er bacteriën erbij konden. Er bleek inderdaad geen besmetting te ontstaan – zo kon de hypothese van spontane generatie worden geëlimineerd. De bron van het voorbeeld vindt u hier.
5
Beschrijving van de wetenschappelijke methode
Als een ander onderonsje - dat wijst op de beperkingen van de methode zonder er ernstig afbreuk aan te doen beschouwen we Bertrand Russell's voorbeeldprobleem met confirmeren. Bedenk dat we in de wetenschappelijke methode willen toetsen of een hypothese waar is - die hypothese zou dus onzinnig kunnen zijn. Russell neemt als hypothese "varkens hebben vleugels", en als waarneming "varkens zijn lekker om te eten". Hieruit kan logisch worden gededuceerd "sommige gevleugelde dieren zijn lekker om te eten". Vervolgens gaat hij toetsen, en neemt hij waar dat allerlei gevleugelde dieren inderdaad verrukkelijk smaken, zoals eenden en kalkoenen. Dit levert een bevestiging van de hypothese, keurig volgens de hypothetisch-deductieve methode. Wesley Salmon (1983:121) concludeert naar aanleiding van dit voorbeeld: "Recognition of the basic inadequacy of the hypotheticodeductive schema does no violence to the logic of science; it only shows that the methods of science are more complex than this oversimplified schema." In het Engels heeft het voorbeeld van Russell als bijkomende aardigheid de woordspeling op de uiterst toepasselijke uitdrukking 'If pigs could fly'2. We bespreken hieronder nog drie bezwaren die tegen de wetenschappelijke methode zijn ingebracht: Het inductieprobleem sinds Hume: inductie is geen zekere basis voor kennis; Het toetsprobleem: hypothesen kunnen niet geïsoleerd getoetst worden (Duhem-Quine these) en geven uiteindelijk geen uitsluitstel over wat de mest juiste theorie is; Het waarnemingsprobleem: feiten niet bestaan zonder theorie (theory-ladenness; Kuhn’s paradigma’s) Er zijn veel meer bezwaren te maken tegen de methode. Voor enkele daarvan verwijzen we naar Yeo 1986. Hij relativeert drie basisassumpties van de methode, namelijk het idee dat de methode toegankelijk zou zijn (zodat iedereen kan waarnemen), het idee dat er slechts één methode zou bestaan, en de mogelijkheid om de methode op alle terreinen toe te passen.
3.1
Het inductieprobleem sinds Hume:
We hebben gezien dat de wetenschappelijke methode gebruikt maakt van deductie (een vorm van logica met absolute zekerheid) en inductie (gebaseerd op empirie). Het inductieve deel van de cyclus ligt sinds David Hume (1711-1776), onder vuur. “De inductieve methode (…) berust op een ‘sprong’ van uitspraken gebaseerd op een (per definitie) beperkt aantal uitspraken naar een universele uitspraak, dat wil zeggen in een alle omstandigheden ware uitspraak. Die stap valt nooit logisch te bewijzen. Dit is het inductieprobleem.” (Veerman en Essers ---). Het inductieprobleem bestaat uit de vraag of inductie gerechtvaardigd is en zo ja, hoe? Hume’s positie is dat inductie geen zekere basis biedt voor verklaringen, dat oorzaken mogelijk niet bestaan, en dat wij geen onderscheid kunnen maken tussen deugdelijke en ondeugdelijke inducties (omdat ze allemaal mogelijk niet deugen). Voor toelichting op of oefening met de basisbegrippen verwijzen we naar de toolbox. Voor een gedegen beschrijving van het inductieprobleem zie Vickers (2006). Wie Hume zelf wil lezen, vindt hier en hier twee basisteksten. De liefhebber kan Hume integraal lezen: (1) A Treatise of Human Nature; (2) Enquiries Concerning Human Understanding and Concerning the Principles of Morals
Het betoog van Hume maakt bij eerste kennismaking een verrassende indruk. Elk van ons baseert zich dagelijks op inductie, op regelmaat, op de verwachting dat de natuur zich vandaag net zo zal gedragen als voorheen. Hume geeft aan dat dit een ontologische veronderstelling is, we nemen aan dat de wereld uniform is, alleen maar uniform kàn zijn. We nemen alleen aan dat “instances of which we have had no experience must resemble those of which we have had experience” We hebben echter geen grond om dit te veronderstellen, anders dan onze gewoonte. Weer Hume: “All inferences from experience [about what will happen in the future] suppose, as their foundation, that the future will resemble the past … If there be any suspicion, that the course of nature may change, and that the past may be no rule for the future, all experience becomes useless, and can give rise to no inference or conclusion.” Waarom geloven mensen dan steeds weer in de betrouwbaarheid van inductie? Volgens Hume is de schijnbare objectiviteit van causaliteit, van de inductieve gevolgtrekking, een voorbeeld van de eigenschap van menselijke geest “to spread itself on external objects”. 2
6
Vrij vertaald: “Ja, dan kun je àlles wel geloven”, “Zo goedgelovig ben je toch niet?”, of “Wat een onzin”.
Wetenschapsleer
Analytisch maakt Hume gebruik van het onderscheid tussen ideeën en feiten. Over ideeën zijn uitspraken mogelijk waarvoor geen ervaring nodig is; je komt tot die uitspraken door na te denken. Zo is de waarheid van de uitspraak ‘het regent of het regent niet’ vast te stellen zonder buiten te gaan kijken. Over ideeën zijn zodoende zogenaamde a priori uitspraken mogelijk, uitspraken die voortvloeien uit de idee of definitie. Uitspraken over feiten daarentegen vergen zintuiglijke ervaring, en kunnen als het om oorzaken gaat hooguit zijn gebaseerd op inductie. Dit zijn uitspraken a posteriori. Volgens Hume is inductie principieel onzeker, omdat we geen reden hebben (behalve onze ingesleten gewoonte) om aan te nemen dat de werkelijkheid zo zal blijven als hij nu is. “If there be any suspicion, that the course of nature may change, and that the past may be no rule for the future, all experience becomes useless, and can give rise to no inference or conclusion.” Ook al hebben we eeuwenlang iets waargenomen, nog geldt, zoals Hume zegt: “The contrary of every matter of fact is still possible.” Dit leidt ertoe dat de premissen van een inductief argument – hoe overtuigend het ook lijkt – nooit voldoende reden zijn om te denken dat de conclusie waar is. Al met al heeft Hume overtuigend aangetoond dat alleen deducties geldig kunnen zijn, en inducties nooit. Popper heeft daarom geprobeerd te ontkennen dat de methode gebruik maakt van inductie, en gesteld dat zijn falsificatie-versie geheel op deductie berust. Popper aanvaardt Hume's kritiek op inductie, maar beweert dat wetenschappers geen inductie toepassen3 aangezien zuivere observatie onmogelijk is, omdat alle waarneming selectief is en theory-driven (zie daarvoor het derde bezwaar: het waarnemingsprobleem: feiten bestaan niet zonder theorie). Niet iedereen was overtuigd van deze poging Hume’s probleem uit de wereld te helpen. Het inductieprobleem achtervolgt ons dus nog steeds. Overigens houdt dit wetenschappers niet tegen om op inductie als gewoonte te blijven vertrouwen.
3.2 Het toetsprobleem: hypothesen kunnen niet geïsoleerd getoetst worden (Duhem-Quine these) en geven uiteindelijk geen uitsluitstel over wat de meest juiste theorie is. Anders gezegd: feiten zijn niet genoeg. Het toetsprobleem houdt in dat geen enkele hypothese in zijn eentje een doorslaggevende test kan bieden, zodat zo’n test uiteindelijk geen uitsluitstel biedt over wat de meest juiste theorie is. Er zijn steeds weer hulphypothesen te bedenken zodat men de schijnbaar weerlegde hypothese kan handhaven. Men spreekt ook van de empirische onderbepaaldheid van theorieën, of de Duhem-Quine these. Wat houdt de Duhem-Quine these in? Het idee van Duhem dat theorieën alleen globaal getoetst kunnen worden, is verder uitgewerkt door Quine (1953) en heeft veel instemming gevonden. “Een postulaat kan alleen maar getoetst worden onder aanname van de juistheid van andere postulaten en van wat je achtergrondkennis kunt noemen. Bij het toetsen van een hypothese is de juistheid van andere hypotheken, hulphypothesen genaamd, voorondersteld. Om de gedachten te bepalen kun je denken aan een sterrenkundige die voor toetsing van zijn hypothese gebruik moet maken van een kijker op wiens optiek hij in het algemeen zonder meer vertrouwt.” (Cornelisse 1985). De hulphypothese is dit voorbeeld is dus dat de kijker betrouwbaar is. Gelet op de ontwikkeling van optische lezen was die hulphypothese ten tijde van Galileo (1564-1642) niet vanzelfsprekend; wie in die tijd vroeg naar de betrouwbaarheid van waarnemingen met lenzen, gaf een tegenwerping die destijds niet ongegrond was. Eerder zagen we Pasteur aan het werk. Nu is duidelijk dat Pasteurs’ voorbeeld de Duhem-Quine these illustreert. Volgens deze stelling kan een wetenschappelijke hypothese (zoals die van Spallanzani) nooit geïsoleerd worden getoetst, omdat de empirische test altijd bepaalde veronderstellingen moet doen. Spallanzani nam in zijn experiment aan dat het niet uitmaakte of er al dan niet contact was met open lucht, en zijn tegenstanders vonden die veronderstelling (niet zonder grond) discutabel. Pasteur liet zien dat deze veronderstelling juist was - maar er is altijd wel weer een andere veronderstelling (hulphypothese) aan te wijzen in de testprocedure. Neem een ander voorbeeld. Stel dat u voorspelt dat de kraamvrouwenkoorts wordt veroorzaakt door vuile doktershanden, en dat de koorts sterk zal verminderen als de artsen hun handen zouden ontsmetten. Om de hypothese ‘geen koorts bij ontsmetting’ te toetsen, laat u de artsen hun handen insmeren met puimsteen. U krijgt dan bij toetsing een negatief resultaat. U kunt dan de hypothese over de wenselijkheid (c.q. het effect) van ontsmetting opgeven als weerlegd, of kiezen voor de mogelijkheid dat enige hulphypothese onjuist is (in dit geval de hulphypothese dat bewerken met puimsteen een ontsmettend effect zou hebben). In het laatste geval is het rationeel 3 Zie hierover Healey (2005:96-109) of Chalmers (1987:40): "Een derde antwoord op het inductieprobleem houdt in dat men ontkent dat wetenschap op inductie berust. Men zal het inductieprobleem vermijden, als men kan vaststellen dat de wetenschap geen inductie bevat."
7
Beschrijving van de wetenschappelijke methode
het experiment te herhalen, met een ander middel waarvan u vermoedt dat het kan ontsmetten. Helaas zijn er altijd weer nieuwe ‘hulphypothesen’ te bedenken. Quine trok hieruit de vergaande conclusie, dat empirische data onvoldoende zijn om te kiezen tussen twee getoetste theorieën. Zo kwamen wetenschappers ertoe bij de keuze tussen theorieën hun toevlucht te nemen tot andere overwegingen, epistemische deugden zoals Occar’s razor. Wie wil weten hoe Duhem met een natuurkundig experiment tot zijn stelling kwam, leze onderstaand citaat4. In Part II, 'The Structure of Physical Theory', Duhem (…) describes the logic of testing: A physicist disputes a certain law; he calls into doubt a certain theoretical point. How will be justify these doubts? From the proposition under indictment he will derive the prediction of an experimental fact; he will bring into existence the conditions under which this fact should be produced; if the predicted fact is not produced, the proposition which served as the basis of the prediction will be irremediably condemned. (ibid, 184) This looks like a loose formulation by Duhem, because the thrust of subsequent argument is that a single proposition cannot be irremediably condemned; perhaps he is simply using the accepted language of falsification at this stage, to be modified as his argument proceeds. The example which Duhem uses here is Wiener's test of Neuman's proposition that the vibration in a ray of polarised light is parallel to the plane of polarisation. Wiener deduced that a particular arrangement of incident and reflected light rays should produce alternatively dark and light interference bands parallel to the reflecting surface. Such bands did not appear when the experiment was performed, and it was generally accepted that Neuman's proposition had been convincingly refuted. But Duhem went on to argue that a physicist engaged in an experiment which appears to challenge a particular theoretical proposition does not confine himself to making use of that proposition alone; whole groups of theories are accepted without question. A partial list of these in the Wiener experiment are the laws and hypotheses of optics, the notion that light consists of simple periodic vibrations, that these are normal to the light ray, that the kinetic energy of the vibration is proportional to the intensity of the light, that the degree of attack on the gelatine film on the photographic plate indicates the intensity of the light. If the predicted phenomenon is not produced, not only is the proposition questioned at fault, but so is the whole theoretical scaffolding used by the physicist. The only thing the experiment teaches us is that among the propositions used to predict the phenomenon and to establish whether it would be produced, there is at least one error; but where this error lies is just what it does not tell us. The physicist may declare that this error is contained in exactly the proposition he wishes to refute, but is he so sure it is not in another proposition? (ibid, 185) In symbolic form, let H be a hypothesis under test, with A1, A2, A3 etc as auxiliary hypotheses whose conjunction predicts an observation O. H.A1.A2.A3... -> O Let -O be some observation other than O. H.A1.A2.A3... -> -O In this situation logic (and this experiment) do not tell us whether H is responsible for the failure of the prediction or whether the fault lies with A1 or A2 or A3. THE LOGIC OF MODUS TOLLENS This situation described above arises from the logic of the modus tollens:
4
8
De bron van het citaat is The Duhem-Quine problem (1998).
Wetenschapsleer
The falsifying mode of inference here referred to - the way in which the falsification of a conclusion entails the falsification of the system from which it is derived - is the modus tollens of classical logic. It may be described as follows: Let p be a conclusion of a system t of statements which may consist of theories and initial conditions (for the sake of simplicity I will not distinguish between them). We may then symbolize the relation of derivability (analytical implication) of p from t by 't -> p' which may be read 'p follows from t'. Assume p to be false, which may be read 'not-p'. Given the relation of deducability, t -> p, and the assumption not-p, we can then infer 'not-t'; that is, we regard it as falsified... By means of this mode of inference we falsify the whole system (the theory as well as the initial conditions) which was required for the deduction of the statement p, i.e. of the falsified statement. Thus it cannot be asserted of any one statement of the system that it is, or is not, specifically upset by the falsification. Only if p is independent of some part of the system can we say that this part is not involved in the falsification. (Popper, 1972, 76) Duhem noted Poincare's suggestion that Neuman's hypothesis could be saved if another hypothesis is given up, namely that the mean kinetic energy is the measure of the light intensity. Instead of the kinetic energy, the potential energy could conceivably be the chosen measure. We may, without being contradicted by the experiment, let the vibration be parallel to the plane of polarization, provided that we measure the light intensity by the mean potential energy of the medium deforming the vibratory motion. (Duhem, 1954, 186) (…) THE IMPLICATIONS OF THE DUHEM THESIS Given the foregoing argument on falsification and the problems of allegedly crucial experiments, what are the implications for science and scientists? Duhem himself identifies two possible ways of proceeding when an experiment contradicts the consequences of a theory. One way is to protect the fundamental hypotheses by complicating the situation, suggesting various causes of error, perhaps in the experimental setup or among the auxiliary hypotheses. Thus the apparent refutation may be deflected or changes are made in other places. Another response is to challenge some of the components that are fundamental to the system. It does not matter, so far as logical analysis is concerned, whether the choice is made on the basis of the psychology or temperament of the scientist, or on the basis of some methodology (…). There is no guarantee of success (…) Furthermore Duhem conceded that each of the two responses described above may permit the respective scientists to be equally satisfied at the end of the day, just provided that the adjustments appear to work.
Het zal duidelijk zijn dat dit probleem met de gevolgen die we mogen verbinden aan de toetsing van een hypothese, ernstige gevolgen heeft voor de bruikbaarheid van de wetenschappelijke methode. Hoe kunnen we wetenschappelijk voortgang boeken als we niet door experimenten kunnen bepalen welke van twee (of meer) theorieën (waarschijnlijk) juist is, welke de voorkeur verdient? Laudan & Leplin (1991:248-9) schetsen de aard van de gevolgen: “The idea that theories can be empirically equivalent, that in fact there are indefinitely many equivalent alternatives to any theory, has wreaked havoc throughout twentieth-century philosophy. It motivates many forms of relativism, both ontological and epistemological, by supplying apparently irremediable pluralisms of belief and practice. It animates empirical scepticism by apparently underwriting the thesis of underdetermination. In general, the supposed ability to supply an empirically equivalent rival to any theory, however well supported or tested, has been assumed sufficient to undermine our confidence in that theory and to reduce our preference for it to a status epistemologically weaker that warranted assent.” Overigens verzoenen onderzoekers Duhem-Quine these vaak met Poppers’ falsificatiestreven door er een Kuhniaanse draai aan te geven. Men stelt dan dat falsificatie als bewijs weliswaar niet mogelijk is (we kunnen hulphypothesen naar voren blijven schuiven om de theorie te redden), maar dat falsificatie wel het effect kan zijn van experimenten –als de gemeenschap van onderzoekers dit aanvaardt. Het wetenschappelijk onderzoek kan zo verder – alleen zijn de kennistheoretische problemen hiermee niet volgens iedereen bevredigend opgelost. Op zoek naar een nieuw fundament op epistemologische vlak komen de epistemische deugden in beeld. Zie verderop.
9
Beschrijving van de wetenschappelijke methode
3.3
Het waarnemingsprobleem: feiten bestaan niet zonder theorie
Ondanks het inductieprobleem blijft de wetenschappelijke methode gebruik maken van waarnemingen. Wetenschap zonder waarneming als grondslag kunnen we ons moeilijk voorstellen (behalve in axiomatische wetenschappen als de wiskunde). Een fundamentele kritiek op de betrouwbaarheid van onze waarneming stamt van filosofen als Norwood Hanson en Thomas Kuhn. De liefhebber kan Observation lezen, het toegankelijke eerste hoofdstuk (Observation) van Hanson’s Patterns of Discovery (1e druk 1958). Hanson geeft eenvoudige voorbeelden, sommige uit de Gestalt-psychologie, die aantonen dat twee mensen die naar hetzelfde kijken en iets heel anders kunnen ‘zien’. Observatie vergt waarneming èn een cognitief proces. Als we eenmaal een bepaalde kijk op iets hebben, is het lastig van perspectief te wisselen. Neem onderstaande twee figuren.
Hanson: “The context gives us the clue. Here, some people could not see the figure as an antelope. Could people who had never seen an antelope, but only birds, see an antelope in fig. 4? In the context of fig. 6 the figure may indeed stand out as an antelope. It might even be urged that the figure seen in fig. 5 has no similarity to the one in fig. 6 although the two are congruent. Could anything be more opposed to a sense-datum account of seeing?” Hierop voortbordurend komt de vergaande conclusie, dat het niet mogelijk is om feiten waar te nemen zonder eerst een theoretische opvatting te hebben: we zien zaken altijd in een bepaalde kader, een bepaalde Gestalt. Anders gezegd: waarnemingen zijn theorie-bepaald. In het Engels heet dit dat de observatie “theory-laden” is. (Hanson 1958: “There is a sense, then, in which seeing is a 'theory-laden' undertaking.”) Chalmers (1987:45-47) stelt: “We kunnen niet zomaar zien wat we willen zien. Maar terwijl de beelden op onze netvliezen een deel vormen van de oorzaak van wat we zien, wordt een ander belangrijk deel gevormd door de innerlijke staat van onze geest of hersenen, en die zal zeker afhangen van onze culturele opvoeding, onze kennis, onze verwachtingen enzovoort, en ze zal niet alleen bepaald worden door de fysische eigenschappen van onze ogen en het tafereel dat men waarneemt. (...) Wanneer dus een aantal waarnemers naar een foto (...) of wat dan ook kijkt, worden ze in zekere zin allen geconfronteerd met hetzelfde ding (...) Maar hieruit volgt niet dat ze identieke waarnemingservaringen hebben. In een heel belangrijk opzicht zien ze niet hetzelfde ding, en hierop is mijn kritiek op het inductivistische standpunt gebaseerd. (…) Hoe men met kennis van zaken moet kijken door een telescoop of microscoop, moet men leren, en de ongestructureerde rij heldere en donkere vlekken die de beginner waarneemt, verschilt van het gedetailleerde exemplaar of beeld dat de geoefende kijker kan onderscheiden. Er moet iets soortgelijks aan de hand zijn geweest toen Galileo voor het eerst de telescoop invoerde als een instrument om de hemel te onderzoeken. De terughoudendheid die de rivalen van Galileo vertoonden wat betreft het aanvaarden van verschijnselen zoals manen van Jupiter, die Galileo had leren zien, moet ten dele te wijten zijn, niet aan vooroordelen, maar aan echte moeilijkheden die men tegenkomt als men leert 'zien' door al met al grove
10
Wetenschapsleer
telescopen. In de volgende passage beschrijft Michael Polanyi de veranderingen in de waarnemingservaring van een student in de medicijnen, als hem wordt geleerd hoe hij een diagnose moet stellen door een röntgenfoto te onderzoeken. Stel je een student in de medicijnen voor die een college volgt in het diagnosticeren van longziekten met behulp van röntgenstralen. (...) In het begin weet de student totaal niet hoe hij het heeft. Want hij ziet in de röntgenfoto van de borst alleen de schaduwen van het hart en de ribben en enkele spinachtige vlekken ertussen. Het lijkt alsof de experts staan te fantaseren over zelfverzonnen ficties, hij ziet niets van de dingen waarover ze praten. Dan, als hij enkele weken blijft luisteren (...) zal hij het steeds beter gaan begrijpen; hij zal langzamerhand de ribben vergeten en de longen gaan zien. En uiteindelijk (..) onthult zich een rijk panorama van betekenisvolle details aan hem: fysiologische variaties en pathologische veranderingen., littekens, chronologische infecties en tekenen van ernstige ziekte." Thomas Kuhn’s begrip van een paradigma sluit geheel op Hanson aan, en op Chalmers latere beschrijving. Een paradigma is een standaardmanier om te kijken naar een wetenschappelijk probleem (of aantal problemen) in een discipline, een wetenschappelijke benadering. Een nieuwe benadering levert een nieuwe kijk, zoals de astronomische waarnemingen die pas mogelijk werden nadat de telescoop als instrument was ingevoerd. Volgens Kuhn kan de theorie die we willen toetsen niet gescheiden worden van de theorie waarop de observaties berusten. Kuhn beschrijft verder hoe lastig het is om tot een nieuwe benadering over te gaan; hij vergelijkt zo’n ‘paradigmaverandering’ met een revolutie5. Dit gegeven is in veel fictie verwerkt: thrillers, psychologische en historische romans. De lezer, in het bezit van alle gegevens, denkt eerst dat het zus zit, en moet later zijn interpretatie plotsklaps, wijzigen tot zo, alsof een gewelddadige revolutie daartoe dwingt. Denk aan de verhaaltechniek van Umberto Eco, Nicci French of Robert Goddard. Soms blijven perspectieven naast elkaar voortbestaan. Terzijde. Max Planck heeft men de uitspraak toegeschreven: "Science advances funeral by funeral." Hoe interpreteert u deze uitspraak in paradigma-verband?6 De conclusie van de theoriegeladenheid van waarneming is haarscherp geformuleerd door Horsten c.s. (2007:38): “Indien dit alles klopt, dan kan de observatie niet de rol spelen die het logisch empirisme haar toedicht: de observatie is niet de onbetwijfelbare rotsbodem van de wetenschappelijke kennis. Observaties worden corrigeerbaar. Indien de theoretische context wijzigt, dan kunnen vroegere observaties vanuit de nieuwe theoretische achtergrond in twijfel worden getrokken. Het scherpe onderscheid tussen de onmiddellijk verkregen observationele kennis [W. van Zanten: ‘de feiten’] en de geïnferereerde theoretische kennis wordt hiermee problematisch. Dit alles hoeft niet te betekenen (…) dat observaties altijd ‘fabrikaties’ in de zin van zuivere constructies zijn. Het impliceert wel dat dit onderscheid context-gebonden is. Wat als een direct observatiegegeven geldt in één context, kan als theoretische conclusie gelden in een andere. Dat de aarde niet draait gold eens als een observationeel gegeven; nu niet meer.” Overigens gaat het idee dat de aarde om haar as draait, en om de zon, terug tot de Griekse astronoom Aristarchus (310 – 230 voor Chr.). Inmiddels zal duidelijk zijn waarom dit waarnemingsprobleem een probleem vormt binnen de wetenschapsopvatting die is neergelegd in de empirische cyclus: de observatie waarmee we hypothesen willen toetsen, bevat zelf een theoretische component, zo de toets beïnvloedend en minder ‘objectief’ makend. Chalmers (1987:55) formuleert het tenslotte zo: “De extreme inductivisten, de logisch positivisten, gingen zover te zeggen dat theorieën slechts betekenis hebben in zoverre ze geverifieerd kunnen worden door directe waarnemingen. Dit standpunt wordt ondergraven door het feit dat men het scherp onderscheid tussen waarneming en theorie niet kan volhouden, want waarnemingen, of liever de uitspraken die het gevolg zijn van waarnemingen, zijn doordrengd van theorie.”
5
Kuhn’s uitzonderlijk veel geciteerde boek (1962) heet The Structure of Scientific Revolutions; hier staat een samenvatting. 6 In het licht van de passage past de uitleg dat in een wetenschappelijke revolutie één paradigma het onderspit delft. Volgens velen bedoelde Planck de uitspraak vileiner: vooruitgang is alleen mogelijk als de aanhangers ervan uitsterven, want hun paradigma zullen ze tijdens hun leven niet opgeven.
11
Beschrijving van de wetenschappelijke methode
4 Demarcatie en epistemische deugden Na alle bezwaren tegen de wetenschappelijke methode krijgt de volgende passage uit Horsten c.s. (2007:19) meer reliëf: “Daarnaast beoogt dit boek de complexiteit en diversiteit van de wetenschappen in het licht te stellen. Hierdoor kunnen karikaturen en vooroordelen, die ook bij goede wetenschappers vaak leven, over wat wetenschap nu eigenlijk is of moet zijn, uit de weg worden geruimd. De grootste vergissing bestaat erin te denken dat wetenschap bestaat in het onbevooroordeeld verzamelen van empirische feiten waaruit dan de wetenschappelijke wetten rigoureus en met zekerheid worden afgeleid. We hopen dat bij diegenen die dit boek doornemen, uiteindelijk tenminste dit vooroordeel verdwenen zal zijn.” Als de wetenschappelijke methode op zichzelf niet kan fungeren als het demarcatiecriterium, is het natuurlijk dat wetenschappers op zoek gaan naar een andere manier om de bijzondere status van wetenschappelijke kennis aan te tonen. Noodzakelijk is dit niet; er zijn wetenschappers en filosofen die de zoektocht hebben opgegeven. Laudan noemt het demarcatieprobleem een pseudo-probleem, onder andere op grond van de overweging dat veel uiteenlopende activiteiten en opvattingen worden beschouwd als wetenschappelijk Een moderne oplossing biedt het pluralisme (Horst 2007). Kellert c.s. (2006:ix, in onze vrije vertaling) schetsen de wetenschappelijke pluraliteit als een mogelijk onuitroeibare eigenschap van wetenschappelijk onderzoek en wetenschappelijk kennis. Zij ontkennen dat uit pluraliteit een tekort aan kennis zou spreken, en zij vinden dat wetenschapsfilosofische begrippen (zoals theorie, verklaring, bewijs) zo moeten worden behandeld dat zij pluralisme niet uitsluiten. Een bekende, vergaande pluralist is Paul Feyerabend. Hij meent dat elk bekend criterium in de loop van de wetenschapsgeschiedenis wel eens is geschonden. Sterker nog, hij meent dat er geen demarcatiecriterium kàn zijn, gegeven de verscheidenheid aan wetenschappelijke methoden. Volgens Feyerabend is het enige principe dat wetenschappelijke groei niet remt "anything goes", elke methode die kennis oplevert komt in aanmerking. Inderdaad zijn er vele methoden binnen de wetenschap (in deze cursus zie daarvoor Diesing & Haack). Het voordeel van de pluralistische opstelling is dat zij wetenschappelijk onderzoek, in welke vorm dan ook, niet in de weg staat. Het nadeel van de tolerante pluralistische opstelling zit in het risico dat de relativering zover gaat in het gelijk maken van methoden, dat we methoden van waarde niet meer voldoende kunnen waarderen. Een ander nadeel is dat te grote relativering afbreuk doet aan het rationele imago van de wetenschap. Kuhn heeft geworsteld met dit vraagstuk. Zijn paradigma-begrip ging in tegen eenvoudige versies van het falsificatiebeginsel. Zo kwam hij voor de vraag te staan, hoe nog wel wetenschap van niet-wetenschap te onderscheiden. Bij Kuhn is het de wetenschappelijke gemeenschap die beslist over wat als wetenschappelijk kan gelden. Bij zo’n voorstelling dreigt het verwijt van willekeur, omdat die gemeenschap kan doen wat ze wil. Op de één of andere manier valt het volgens Kuhn met die willekeur wel mee. Zo wordt een nieuw paradigma volgens hem vooral aanvaard door de gemeenschap omdat het nieuwe paradigma een superieur vermogen heeft om onderzoeksproblemen op te lossen. Het paradigma dat meer kan verklaren (i.c. voorspellen) wordt tot winnaar uitgeroepen. Wie heeft gepubliceerd in wetenschappelijke tijdschriften, en heeft ervaren hoe zijn/haar werk door anonieme beoordelaars wordt gecontroleerd voordat tot publicatie wordt overgegaan, heeft een indruk van de werkwijze van de wetenschappelijke gemeenschap. Kuhn geeft aan dat wetenschappelijke beslissingen gebaseerd zijn op vaststaande criteria - zoals overeenstemming met de data; eenvoud - waarmee onder andere kan worden bepaald of de ene of de andere theorie de voorkeur verdient. Dit zijn de zogenaamde epistemische deugden. Voor een eerste kennismaking met de epistemische deugden doen we een beroep op Artigas (2006:218): “Countering an accusation of relativism, Kuhn indicated that objective criteria help us choose among competing theories. He described five: accuracy; consistency; scope; simplicity; and fruitfulness. Kuhn explains that a theory is accurate if its consequences agree with the results of existing experiments and observations. Consistency7 refers to its internal absence of contradiction and to its consistency with other accepted theories.
7 De epistemische deugd coherentie is diepgaand onderzocht door Meijs (2005); hij onderzocht onder andere of coherentie een aanwijzing is voor waarheid. Hij vat daarbij coherentie op verschillende manieren op: coherentie als wederzijdse ondersteuning en coherentie als relatieve overlap.
12
Wetenschapsleer
Broadness of scope means that its consequences extend beyond the particular data it was originally designed to explain. Simplicity implies bringing order to otherwise isolated phenomena. Fruitfulness is the capacity to promote new findings in scientific research. Kuhn’s fives criteria are well selected. He stresses that, even though they are useful, they must be supplemented by the appreciation of scientists; therefore, theory-choice is not a matter of taste, but must include evaluations. Theory-choice cannot be decided by the automatic impersonal application of an algorithm. Interpretation plays an important part in experimental science.” Wesley Salmon (1990) heeft de 5 criteria van Kuhn geordend naar drie aspecten van wetenschappelijke theorieën, namelijk hun informatiegehalte, hun mate van empirische ondersteuning en hun eenvoud. Salmon: Consider, for example, the matter of scope. Newton’s three laws of motion and his law of universal gravity obviously have greater scope than the conjunction if Galileo’s law of falling bodies and Kepler’s three laws of planetary motion. This means, simply, that Newtonian mechanics contains more information than the laws of Kepler and Galileo taken together. Given a situation of this sort, we prefer the ore informative theory because it is a basic goal of science to increase out knowledge as much as possible. We might, of course, hesitate to choose a highly informative theory if the evidence for it were extremely limited or shaky, because the desire to be right might overrule the desire to have more information content. But in the case at hand this consideration does not arise. (…) Another of Kuhn’s criteria is accuracy. It can, I think, be construed in two ways. The first has to do with informational virtues; the second with economic. On the one hand, two theories might both make true predictions regarding the same phenomena, but one of them might give us precise predictions where the other gives only predictions that are less exact. If, for example, one theory allows us to predict that there will be a solar eclipse on a given day, and that its path of totality will cross North America, it may well be furnishing correct information about the eclipse. If another theory gives not only the day, but also the time, and not only the continent, but also the precise boundaries, the second provides much more information, at least with respect to this particular occurrence. It is not that either is incorrect; rather, the second yields more knowledge than the first. (…) The three remaining three criteria re simplicity, consistency, and fruitfulness; all of them have direct bearing upon the confirmational virtues. (…) Consistency has two aspects, internal consistence of a theory and its compatibility with other accepted theories. While science may be fully justified in entertaining collections of statements that contain contradictions, the goal of science is surely to accept only logically consistent theories. The discovery of an internal inconsistency has a distinctly adverse effect on the prior probability of that theory, to wit, it must go straight to zero. When we consider the relationships of a given theory to other accepted theories we again find two aspects. There are deductive relations of entailment and incompatibility, and there are inductive relations of fittingness and incongruity. The deductive relations are quite straightforward. Incompatibility with an accepted theory makes for implausibility; being a logical consequence of an accepted theory makes for a high prior probability. Although deductive subsumption of narrower theories under broader theories is probably something of an oversimplification of actual cases, nevertheless, the ability of an overarching theory to deductively unify diverse domains furnishes a strong plausibility argument. When it comes to inductive relations among theories, analogy is, I think, the chief consideration. I have already mentioned the use of analogy in inductively transferring results of experiments from rats to humans. In archaeology, the method of ethnographic analogy, which exploits similarities between extant primitive societies and prehistoric societies, is widely used. Kuhn’s criteria of consistency (broadly construed) and simplicity seem clearly to pertain to assessments of the prior probabilities of theories. They cry out for a Bayesian interpretation. The final criterion in Kuhn’s list is fruitfulness; it has many aspects. Some theories prove fruitful by unifying a great many apparently different phenomena on terms of a few simple principles. The Newtonian synthesis is, perhaps, the outstanding example; Maxwellian electrodynamics is also an excellent case. As I suggested above, this ability to accommodate a wide variety of facts tends to enhance the prior probability of a given theory. To attribute diverse success to happenstance, rather than basic correctness, is implausible.
13
Beschrijving van de wetenschappelijke methode
Another sort of fertility involves the predictability of theretofore unknown phenomena. We might mention as familiar illustrations the prediction of the Poisson bright spot by the wave theory of light and the prediction of time dilation by special relativity. These are the kinds of instances in which, in an important sense, the expectedness is low. As we have noted, a small expectedness tends to increase the posterior probability of a hypothesis. A further type of fertility relates directly to plausible scenarios; a theory is fruitful in this way if it successfully copes with difficulties with the aid of suitable auxiliary assumptions. Newtonian mechanics again provides an excellent example. The perturbations of Uranus were explained by postulating Neptune. The perturbations of Neptune were explained by postulating Pluto. The motions of stars within galaxies and of galaxies within clusters are explained in terms of dark matter, concerning which here are many current theories. A theory that readily gives rise to plausible likelihoods can boast this sort of fertility.” Richard Swinburne (1997) kiest voor één van de epistemische deugden. Hij geeft als oplossing dat we moeten kiezen voor de meest eenvoudige theorie. Hij beroept zich op het epistemische principe dat eenvoud een indicatie is voor juistheid. Swinburne redeneert vanuit het ongerijmde: het zou absurd zijn als er geen logische methode was om tussen hypothesen te kiezen; de enige methode die ons open staat is de keus voor de meest eenvoudige theorie. Het idee om eenvoud als deugd te zien is klassiek binnen de wetenschapsfilosofie; deze epistemische deugd staat bekend als ‘Ockham's razor’, het scheermes van Occam, waarmee alle overtollige ballast moet worden weggesneden. De Latijnse formulering is: entia non sunt multiplicanda praeter necessitatem. Zonder noodzaak moet je niet er meer bijhalen dan nodig. Meer formeel: introduceer niet lichtvaardig een extra factor, als je probeert iets te verklaren. Het is niet gebruikelijk om het hardop te zeggen. Toch, de epistemische deugden lijken te worden opgevoerd als herstelpoging van het demarcatiecriterium, een laatste verdedigingslinie, een verzwakte vorm van demarcatie: bij alle pluriformiteit die is toegestaan, moet wetenschappelijke vooruitgang verlopen via de regels die de deugden afbakenen. Maso legt eveneens de link tussen demarcatiecriterium en de epistemische deugden. Hij geeft overigens te kennen de deugden niet te beschouwen als een geschikt demarcatiecriterium – maar nogmaals, zo functioneren ze momenteel wel. Laten we Maso (2003) aan het woord: “Het is wel degelijk zo dat we bepaalde activiteiten als wetenschap of wetenschappelijk zien omdat ze bepaalde eigenschappen bezitten. Sterker nog, een aantal van die eigenschappen is al genoemd. Zo is er al op gewezen dat uitspraken of theorieën, tenminste voor een deel toetsbaar aan ervaringen moeten zijn. Ook is al gezegd dat nieuwe theorieën moeten voortbouwen op eerdere theorieën en onderzoekingen en dat problemen met niet uitgekomen voorspellingen en anomalieën voor een belangrijk deel moeten kunnen worden opgelost binnen bestaande, aanvaarde theorieën. Hiernaast wijst Kuhn ook nog op de noodzaak tot eenvoud, precisie en congruentie met theorieën die in andere specialisaties worden gebruikt (Kuhn 1972: 21), terwijl Lakatos nog het streven naar consistentie noemt (Lakatos 1972: 143). Daarnaast kunnen nog argumentatieve overtuigingskracht worden genoemd en methodologische eigenschappen als (virtuele) herhaalbaarheid, betrouwbaarheid en validiteit (Maso en Smaling 1998: 64, 68-74) en daarmee is het lijstje zeker nog niet klaar. Kunnen deze, en ongetwijfeld nog andere zaken tezamen dan niet het criterium vormen op grond waarvan wetenschappelijkheid kan worden gescheiden van niet- of pseudowetenschappelijkheid?”
14
Wetenschapsleer
Inmiddels is er ook alweer discussie over de status van de epistemische deugden, zodat het lastiger wordt hen de eenheidsbewarende functie te laten uitoefenen (Kellert 20068).
5
Opdrachten
Opdracht 1: Epistemische deugden Vroeger beschouwde men bezetenheid door een demon als verklaring voor bepaalde psychische aandoeningen. Tegenwoordig is dit geen serieuze verklaring meer. Stel dat u deze verandering wilt beschrijven in termen van de epistemische deugden. Op welke deugd doet u dan een beroep? Motiveer uw antwoord Opdracht 2: Cyclus Een ervaren onderzoeker beschrijft hieronder wat wetenschappers in de praktijk zoal doen, en wat dit volgens hem betekent voor de juiste wetenschappelijke methode. Lees de tekst, en geef aan waarom zij bepaalde wetenschapsfilosofen niet zou overtuigen. Rothchild (2006: 1 en 4): “(…) the only method, in fact, is whatever the scientist can use to find the solution to a problem. This includes induction, a form of logic that identifies similarities within a group of particulars, and deduction, a form of logic that identifies a particular by its resemblance to a set of accepted facts. Both forms of logic are aids to but not the solution of the scientist’s problem. Being a good scientist requires (…) knowing how to make and interpret observations (…), how to ask the right questions, how to theorize without getting lost in the details, and knowing when to do experiments and apply statistical tests. (…) The only true scientific method is to use whatever tools we can to make observations, ask and answer questions, solve problems, test a theory, etc., and it doesn’t matter whether we use induction, deduction, or any other kind of reasoning to do so; it would be a heresy to deny the validity of any method that helps us learn to know.”
Opdracht 3: Inductieprobleem en stromingen Dit is een pittige opdracht - een ‘poging tot beantwoording’ volstaat. Probeer een oordeel te formuleren over onderstaande oplossing van het inductieprobleem (Swartz 1985:34): Dewey, unlike Hume, did not see the goal of scientific inquiry as the discovery of absolute truth. (…) the pragmatists argued for a radically new view of truth which suggested that scientific truth was only the opinion ‘fated to be ultimately agreed to by all who investigate’ a theory (…) This pragmatic view of truth was articulated clearly by Peirce near the end of the 19th century. During the first few decades of the 20th century, people such as Russell and James hotly debated whether absolute truths or pragmatics truths should be the aim of human inquiry (…) once Dewey had decided that the aim of inquiry should be pragmatic truths, he was then able to ignore much of what Hume had said about induction; for Hume only suggested that inductive support was inadequate because it could not guarantee that a generalization had been absolutely true. Since Dewey did not expect any guarantee of absolute truth from induction, he could recommend that inductive procedures be used as a means to decide whether some ideas were ‘warranted assertions’ (…)
8
Kellert c.s. (2006: viii-ix): “Philosophers of science have begun to advance pluralism at the meta-scientific level, most notably with respect to epistemic virtues. A variety of views regarding the role, status, and identity of scientific or epistemic virtues has been advanced in the philosophical literature. Some philosophers treat adequacy, consistency, simplicity, explanatory power, and refutability as truth indicators (McMullin 1983). Others treat them as markers of scientificity (Kuhn 1977), while still others emphasize their incapacity to be maximally realized at one time by any one given theory (Van Fraassen 1989). Despite these disagreements, philosophers typically assumed that there must be one foundational set of virtues, whatever their role or status in science. Hence, some philosophers advocate for one or another within the set (e.g., explanatory power against empirical adequacy and vice versa [Churchland 1985] or advocate different virtues altogether, such as heterogeneity or social utility (Longino 1996). But now there is talk of a pluralist solution that would claim that which virtues should hold what degree of regulatory status in any given research project is a function of features specific to the problem end of the particular aims of the research (Longino 2002).”
15
Beschrijving van de wetenschappelijke methode
Opdracht 4: Mendeleev Het verhaal van de ontdekking van het periodiek systeem der elementen door Dmitri Mendeleev is vele malen verteld. Opmerkelijk zijn de grote verschillen tussen de verhalen. We vragen u om onderstaande vier versies te bezien. We hebben deze voor u in chronologische volgorde geplaatst: Williams – Rabinowitsch & Thilo – Gordin – Schaffer. Centraal staat de ordening die Mendeleev aanbracht in de chemische elementen, en zijn voorspellingen. Mendeleev gold als een voorbeeld van de epistemische deugd ‘fruitfulnes’, vanwege zijn voorspellende kracht. Beoordeel zijn betekenis op dit conto, en reflecteer op de verschuiving in de beschrijvingen, met name op het contrast tussen Williams en Schaffer.
a. Williams behandelt de geschiedenis van de exacte wetenschappen. And yet, oddly enough, it has chanced that hand in hand with the experiments leading to such a goal have gone other experiments arid speculations of exactly the opposite tenor. In each generation there have been chemists among the leaders of their science who have refused to admit that the so-called elements are really elements at all in any final sense, and who have sought eagerly for proof which might warrant their scepticism. The first bit of evidence tending to support this view was furnished by an English physician, Dr. William Prout, who in 1815 called attention to a curious relation to be observed between the atomic weight of the various elements. Accepting the figures given by the authorities of the time (notably Thomson and Berzelius), it appeared that a strikingly large proportion of the atomic weights were exact multiples of the weight of hydrogen, and that others differed so slightly that errors of observation might explain the discrepancy. Prout felt that it could not be accidental, and he could think of no tenable explanation, unless it be that the atoms of the various alleged elements are made up of different fixed numbers of hydrogen atoms. Could it be that the one true element--the one primal matter--is hydrogen, and that all other forms of matter are but compounds of this original substance?Prout advanced this startling idea at first tentatively, in an anonymous publication; but afterwards he espoused it openly and urged its tenability. Coming just after Davy's dissociation of some supposed elements, the idea proved alluring, and for a time gained such popularity that chemists were disposed to round out the observed atomic weights of all elements into whole numbers. But presently renewed determinations of the atomic weights seemed to discountenance this practice, and Prout's alleged law fell into disrepute. It was revived, however, about 1840, by Dumas, whose great authority secured it a respectful hearing, and whose careful redetermination of the weight of carbon, making it exactly twelve times that of hydrogen, aided the cause.Subsequently Stas, the pupil of Dumas, undertook a long series of determinations of atomic weights, with the expectation of confirming the Proutian hypothesis. But his results seemed to disprove the hypothesis, for the atomic weights of many elements differed from whole numbers by more, it was thought, than the limits of error of the experiments. It was noteworthy, however, that the confidence of Dumas was not shaken, though he was led to modify the hypothesis, and, in accordance with previous suggestions of Clark and of Marignac, to recognize as the primordial element, not hydrogen itself, but an atom half the weight, or even one-fourth the weight, of that of hydrogen, of which primordial atom the hydrogen atom itself is compounded. But even in this modified form the hypothesis found great opposition from experimental observers.In 1864, however, a novel relation between the weights of the elements and their other characteristics was called to the attention of chemists by Professor John A. R. Newlands, of London, who had noticed that if the elements are arranged serially in the numerical order of their atomic weights, there is a curious recurrence of similar properties at intervals of eight elements This so-called "law of octaves" attracted little immediate attention, but the facts it connotes soon came under the observation of other chemists, notably of Professors Gustav Hinrichs in America, Dmitri Mendeleeff in Russia, and Lothar Meyer in Germany. Mendeleeff gave the discovery fullest expression, explicating it in 1869, under the title of "the periodic law."Though this early exposition of what has since been admitted to be a most important discovery was very fully outlined, the generality of chemists gave it little heed till a decade or so later, when three new elements, gallium, scandium, and germanium, were discovered, which, on being analyzed, were quite unexpectedly found to fit into three gaps which Mendeleeff had left in his periodic scale. In effect the periodic law had enabled Mendeleeff to predicate the existence of the new elements years before they were discovered. Surely a system that leads to such results is no mere vagary. So very soon the periodic law took its place as one of the most important generalizations of chemical science.This law of periodicity was put forward as an expression of observed relations independent of hypothesis; but of course the theoretical bearings of these facts could not be overlooked. As Professor J. H. Gladstone has said, it forces upon us "the conviction that the elements are not separate bodies created without
16
Wetenschapsleer
reference to one another, but that they have been originally fashioned, or have been built up, from one another, according to some general plan." It is but a short step from that proposition to the Proutian hypothesis. b. Rabinowitsch & Thilo behandelen Mendeleev in hun Periodisches System; Geschichte und Theorie, (1930:35): Die grundlegende Erkenntnis von Mendelejeff (…) bestand darin, dass man zu einer offenbar das Wesen der Sache treffenden, im wahren Sinne des Wortes natürlichen Anordnung der chemischen Elemente kommt, wenn man sie in der Reihe ihrer Atomgewichte ordnet und gleichzeitig versucht, die Elemente mit ausgesprochen analogen Eigenschaften untereinander in vertikalen Spalten zusammenzufassen, die wir weiterhin als natürliche Gruppen bezeichnen werden. Dabei wird vond vornerein keine bestimmter Rahmen vorgeschrieben, in den alle Elemente eingezwängt werden müssen, und es wird nicht mehr Bewegungsfreiheit gelassen, als sich bei einer solchen Klassifikation von selbst als notwendig erweist. c. Gordin schreef in A well-ordered thing: Dmitrii Mendeleev and the shadow of the periodic table (2004:25): Mendeleev’s skepticism toward atomism sharply emphasizes the difference between the present-day interpretation of the periodic system and Mendeleev’s views of 1869. Today’s periodic system is widely understood as revealing periodic properties caused by the gradual filling of electron shells in individual atoms. Elements with one free electron in the outer shell will have similar propensities to combine in certain ratios, and thus have similar chemical properties. The primary ordering of today’s system – atomic number – measures the number of protons in the nucleus of an atom, which in turn determines the electrons and thus the chemical properties. This entire concept is structured around atoms. For Mendeleev, any atoms that might exist had absolutely no substructure, and he resisted the notions of electrons (discovered in 1897) until his death. He never even heard of protons.) Mendeleev’s system had no notion of atomic number, and everything was ordered by atomic weights – or, as Mendeleev would prefer, ‘elemental weights.’ d. Schaffer kan prachtig de wetenschapsgeschiedenis weergeven, zo ook in zijn ‘Dmitri Mendelejev’. Enkele citaten: Schaffer (2005:98-102): “(…) periodieke wet’: (…) de atoomgewichten van elementen bepalen hun eigenschappen, die op periodieke wijze van element tot element verschillen. (…) De atoomgewichten van de elementen, die oorspronkelijk waren gebaseerd op een stelsel waarin de massa van het waterstofatoom als eenheid werd aangenomen, zijn inmiddels vervangen door het atoomgetal, het aantal protonen in de atoomkern van een chemisch element. In zijn eerste schets van het systeem hanteerde Mendeleev 116 als atoomgewicht van uranium, waarmee hij het in dezelfde groep als aluminium en goud plaatste. (…) Aan het einde van 1870 had hij het gewicht van uranium meer dan verdubbeld tot 140, waardoor het terechtkwam in de groep van zuurstof en zwavel. In de moderne tabel heeft uranium het atoomgetal 92, waarmee het een plaats heeft gekregen in de actiniumreeks. (…) “Er zaten lacunes in Mendelejevs oorspronkelijke schema’s, terrae incognitae die door in die tijd nog onbekende, onontdekte elementen werden bezet. Drie van deze elementen werden in de vijftien jaar de eerste publicatie van de tabel daadwerkelijk gevonden door scheikundigen in Frankrijk, Zweden en Duitsland. Door saillante verschillen tussen voorspelling en werkelijkheid te bagatelliseren maakten Mendelejev en zijn bondgenoten in het de westerse Europese scheikundige ontdekkingen tot een onvervalst bewijs van de kracht van zijn periodieke wet. (…) Mendelejevs voorspellingen waren bovendien niet allemaal correct. Hij vermoedde dat er elementen waren in elke lacune tussen waterstof (atoomgewicht 1) en lithium (7). Die zijn er niet. Hij voorspelde de eigenschappen van veel elementen die niet bleken te bestaan. Hier liet zijn scheikundige intuïtie hem in de steek.”
17
Beschrijving van de wetenschappelijke methode
Terugkoppeling opdrachten Opdracht 1 Tegenwoordig hebben wij de demon niet meer nodig in de verklaring; we zouden dit kunnen beschrijven als vereenvoudiging, toepassing van Occam’s razor. Opdracht 2 Rothchild ontkent de bijzondere status van de wetenschappelijke methode à la de empirische cyclus. Hij stelt dat elke methode die ons verder brengt gebruik verdient. Een pragmatist zou dit standpunt zeker overwegen. Rothchild levert met zijn opstelling helaas geen oplossing voor het demarcatieprobleem. Anders gezegd, hoe weet je dat de methode die je ‘verder helpt’, je inderdaad kennis levert die ‘op de juiste wijze’ is verworven? Wie zich laat helpen door een ondeugdelijke methode, kan voor vervelende verrassingen komen te staan. Opdracht 3 Een pragmatist zal de oplossing elegant vinden: het inductieprobleem van Hume wordt weggezet als iets waar je in de praktijk geen last van hebt, zolang je je er niet mee bezig houdt. De opdracht illustreert de consequenties van een wetenschaps- of kennis-opvatting: wie absolute zekerheid van kennis opgeeft, hoeft zich geen zorgen meer te maken over Hume’s inductieprobleem. Swartz vervolgt dan ook: “For a pragmatist such as Dewey, the assertions warranted by experience were not final and lasting truths but suggestions making it possible ‘to direct new orders of experimental observations and to open up new problems and new fields of subject-matter’.” Opdracht 4 De epistemische deugd ‘fertility’ impliceert dat je bij succes op de goede weg bent, op weg naar de ‘waarheid’. Bij Mendeleev leek dit zo. De uiterst positieve beschrijving van Williams schetst Mendeleev als Wetenschappelijke Held, die de vooruitgang dichterbij heeft gebracht. Dit relaas past prima in een realistische visie. Geheel anders is dit bij Schaffer, die graag aan ‘debunking’ doet en wijst op de manco’s van de helden van weleer. Sowieso laat de casus zien dat succes bij voorspelling geen perfecte indicatie is van de juistheid van een theorie. In deze casus lieten veel wetenschappers zich overtuigen van de waarheid van de theorie, omdat drie voorspellingen van Mendeleev uitkwamen. Het lijkt inderdaad alsof de chemische werkelijkheid hier onafhankelijkheid van de mens bestaat. Dit beeld wordt minder duidelijk, wanneer we ook letten op de voorspellingen die niet uitkwamen. Een doorslaggevend bewijs pro of contra het realisme biedt de casus niet. Wellicht bestaat de chemische werkelijkheid inderdaad los van de mens, en heeft Mendeleev op enkele vlakken slordig gededuceerd. Een verdergaande, speculatieve, conclusie zou kunnen zijn dat sommige wetenschapstheoretici hunkeren naar succesverhalen; andere (naar) faalverhalen (debunking); successen gaan later stuk, blijken gemankeerd; succes maakt een onwaarheid plausibel; zodoende is voorspelling geen perfect bewijs voor juistheid theorie.
18