Inhoud 0
Tellen - Aftellen ...................................................................................................................................................................... 5 - Is pincodes tellen dom werk?.................................................................................................................................6
1
Gehele getallen
1.1
Ontbinden.....................................................................................................................................................................9 - De priemgetallengenerator ...................................................................................................................................11 - De Grootste Gemene Deler ..................................................................................................................................12 Diophantische vergelijkingen.................................................................................................................................14 - De stelling van Pythagoras in R2........................................................................................................................15 - De stelling van Pythagoras in R3........................................................................................................................17 - Het vermoeden van Fermat ..................................................................................................................................18 - Fibonacci en het 3n+1 vermoeden ...................................................................................................................... 20
1.2
2
Frequentie en kans
2.1 2.2
Gezond verstand? .....................................................................................................................................................26 Uitkomstenverzamelingen ...................................................................................................................................... 27 - Muntje gooien.........................................................................................................................................................30 Theorie en praktijk ...................................................................................................................................................32 - Combinaties ............................................................................................................................................................35 - Met twee dobbelstenen .........................................................................................................................................37 - Drie dobbelstenen ..................................................................................................................................................37 - Meer munten...........................................................................................................................................................38 - Pascal en Chevalier de Meré................................................................................................................................39 - Het vaasmodel ........................................................................................................................................................40 - Balletjes in bakjes leggen .....................................................................................................................................41 - Series nullen en enen.............................................................................................................................................43 Het versterkte toeval ................................................................................................................................................44 - Van kop af winnen.................................................................................................................................................44 - Het vaasmodel van Pólya .....................................................................................................................................45 - Genetische drift ...................................................................................................................................................... 46 Wanneer verwacht je succes? .................................................................................................................................46 - Wanneer is de verzameling compleet?...............................................................................................................48 Beroemde problemen...............................................................................................................................................49 - Het probleem van de twee kaarten...................................................................................................................... 49 - Het probleem van de oppas..................................................................................................................................50 - Het probleem van de drie deuren ........................................................................................................................51 - Volledige inductie..................................................................................................................................................52 - Pak twee getallen uit n. Hoe groot is de grootste van de twee? ....................................................................53 - Eenentwintigen.......................................................................................................................................................55 - Lootjes trekken voor Sinterklaas.........................................................................................................................57 - Schudden .................................................................................................................................................................57 - Matches....................................................................................................................................................................62 Continue kansvariabelen .........................................................................................................................................63 - Een duel...................................................................................................................................................................63 - Een meting van p, met darts.................................................................................................................................63 - Ontwerp zelf een randomgenerator.....................................................................................................................64 - De afstand tot een cirkelrand ...............................................................................................................................68 - De afstand tot de rand van een vierkant.............................................................................................................68 - De stomphoekige driehoek...................................................................................................................................69 - Een afspraakje ........................................................................................................................................................70 - Maak een driehoek van een stok .........................................................................................................................71 - De knekelman: het gebroken bot.........................................................................................................................73 - Onnodige ongerustheid.........................................................................................................................................75 Extra opgaven over simulaties ...............................................................................................................................78
2.3
2.4
2.5 2.6
2.7
2.8
Inventies 03/05/05
-1-
3
Statistiek
3.1
3.2
Mendel sjoemelde: Verklarende Statistiek...........................................................................................................81 - Ontwerp zelf een puntenwolk.............................................................................................................................. 82 - Regressie naar het midden....................................................................................................................................82 - Het chi-kwadraat certificaat.................................................................................................................................83 Welke functie past bij de meetpunten? .................................................................................................................85 - Het kleinste kwadraat?..........................................................................................................................................85 - Functie met één parameter ...................................................................................................................................87 - Functie met twee parameters................................................................................................................................87 - Een lineaire combinatie van twee functies ........................................................................................................88
4
Analyse
4.1
Calculus...................................................................................................................................................................... 89 - De afgeleide is de helling .....................................................................................................................................89 - Grondtal e en de natuurlijke logaritme...............................................................................................................92 - De raaklijn in een punt op de grafiek .................................................................................................................92 Optimaliseren ............................................................................................................................................................93 - De raaklijn vanuit een punt buiten de grafiek ...................................................................................................93 - De afstand van een punt tot een grafiek.............................................................................................................93 - De maximale kijkhoek ..........................................................................................................................................94 Vergelijkingen...........................................................................................................................................................94 - De reeks van MacLaurin.......................................................................................................................................95 - De mooiste formule ...............................................................................................................................................95 - Complexe getallen .................................................................................................................................................96 - Stelsels vergelijkingen ..........................................................................................................................................97 Nanowiskunde...........................................................................................................................................................99 - Ontwerp zelf een rekenmachine met vier decimalen.....................................................................................100 Sommeren en Integreren .......................................................................................................................................102 - De harmonische reeks .........................................................................................................................................103 - Gamma, de constante van Euler........................................................................................................................105 Productrijen .............................................................................................................................................................106 - Het product van Wallis .......................................................................................................................................108 Recursieve rijen ......................................................................................................................................................110 2 - Kwadratische recursie x®x +p.........................................................................................................................111 - Multivergentie ......................................................................................................................................................113 - Logistische recursie x®ax(1-x) ........................................................................................................................116 - Grenzen aan de groei...........................................................................................................................................117 - Oorsprong van leven ...........................................................................................................................................117 - Onverwachte golfverschijnselen .......................................................................................................................119 Functies van twee variabelen................................................................................................................................121 - Differentiaalvergelijkingen ................................................................................................................................122 - Het snijpunt van twee XY krommen................................................................................................................123
4.2
4.3
4.4 4.5
4.6 4.7
4.8
5
Meetkunde
5.1 5.2 5.3 5.4 5.5
De oppervlakte van een polygoon .......................................................................................................................126 Panorama van de driehoeksmeting......................................................................................................................128 Vectoren in R2 ........................................................................................................................................................131 Vectoren in R3 ........................................................................................................................................................134 Het berekenen van afstanden en hoeken.............................................................................................................139
Antwoorden ...........................................................................................................................................................................143 Overzicht Programma's .........................................................................................................................................................155
Inventies 03/05/05
-2-
INVENTIES IN DE VRIJE RUIMTE Waar een vervroegde uittreding van een wiskundeleraar al niet toe kan leiden. Mijn VUT viel samen met de invoering van de Tweede Fase. Daar hield ik een grafische rekenmachine (TI-83) aan over plus vrije tijd. Het programmeren van dat toestel verloopt via een basic-achtig taaltje (TIBASIC) dat aan iedere brugklasser is uit te leggen. Met in wezen niet veel meer dan een paar instructies voor de invoer en uitvoer van gegevens en nog wat voorwaardelijke (if-then), verwijzende (goto) en herhalende (forto, repeat) instructies kun je problemen aanpakken. De in dit boek getoonde programmaatjes (en programma's) zijn gemakkelijk binnen te halen via mijn site www.henkshoekje.com, maar met dat doel is dit boek niet geschreven. Leuk (voor sommigen tenminste) is de stroomlijning van bekende procedures, leidend tot zogenaamde black-box programmaatjes: daar stop je wat in en er komt automatisch een antwoord uit. De oplossing van een vergelijking bijvoorbeeld of de vergelijking van een raaklijn in een bepaald punt van een grafiek. Of de oppervlakte tussen de grafiek van een functie en de x-as. Of het bepalen van een (rechte of kromme) lijn die het beste past bij gegeven meetpunten (regressie heet dat). Kant en klare, voorgebakken oplossingen. Maar na een keer uitproberen is daar volgens mij al gauw de lol vanaf (tenzij je, als student, vlak voor een tentamen over het bewuste onderwerp zit). En een heel enkele keer kon ik (als leraar) het niet laten een wiskundig principe te demonstreren met een TIBASIC programma. Maar veel leuker is het natuurlijk om naar oplossingen te zoeken voor problemen waarvoor geen kant en klaar recept (c.q. knop) bestaat. De vergelijking van een raaklijn vanuit een punt buiten de grafiek (aan die grafiek) bijvoorbeeld. De oppervlakte of omwentelingsinhoud van een vlakdeel tussen een grafiek en de y-as bijvoorbeeld. Of het bepalen van de best passende regressielijn die door de oorsprong gaat bij een aantal meetpunten. Dan speelt de knoppentechniek een ondergeschikte rol en moet je gaan nadenken en wordt de GR ondergeschikt aan de oplossing van het probleem. Kanssituaties met dobbelstenen en munten kun je gemakkelijk nabootsen, maar hoe simuleer je het drie deuren probleem van de quizmaster? En hoe bereken je de oppervlakte van een veelhoek (polygoon) waarvan de hoekpunten gegeven zijn? Nog een voorbeeld. Bij het 3n+1 vermoeden (oneven n wordt 3n+1, even n wordt ½n; op den duur kom je op 1 uit) rijst de vraag waarom de verwachting voor de opvolger van n kleiner dan n is. Bij het zoeken naar gehele oplossingen van de 3 3 3 vergelijking x + y = z ± 1 en bij het opsporen van gehele Pythagoras viertallen ontdek je dat er aan time management moet worden gedaan. En hoe kan je de loodrechte snijlijn en dus de afstand van twee kruisende lijnen berekenen? Soms gaat het niet om het oplossen van een probleem maar om pure nieuwsgierigheid. De verwondering, drijfveer van alle wetenschap. Wat waren de uitkomsten van de beroemde, erwten tellende monnik Gregor Mendel verdacht nauwkeurig ... Wat gebeurt er als je (bijna) letterlijk in een singulier punt (perforatie) duikt (singulariscopie)? Op welk moment gaat orde over in chaos? Heeft de 1 2
1 3
1 4
harmonische reeks 1 + + + + ... een limiet? En hoe onvoorstelbaar knap was de bijna blinde Euler toen hij zijn constante (g) op zes decimalen nauwkeurig benaderde! Mijn TI83 had na tien minuten de vijfde decimaal nog steeds niet te pakken. Dan gaat je verwondering over in bewondering. Bij het schrijven van teksten en het componeren van programma's heb ik uiteraard bewust of onbewust over de schouders meegekeken van anderen. In mijn boekenkast staan boeken, hieronder aangegeven, die ik zeker geraadpleegd heb. En een uitgebreide e-mail correspondentie met collega's die ik niet of slechts terloops ontmoet heb heeft mij veel opgeleverd. Mensen als Henk Tijms (die vooral!), Theo van Uem, Ton van Amsterdam (creatief en productief), Ton van den Berg, Ton Lecluse (wat zit er achter de voornaam Ton?), Pedro Tytgat, Koen Stulens, Michel van Ast, Dick Klingens, Bram Kole en Cor van Etten hebben mij met hun ideeën gestimuleerd om door te gaan in tijden dat onze kleinkinderen nadrukkelijk om aandacht vroegen.
Inventies 03/05/05
-3-
Tijdens de voorbereidingen voor de tweede druk kwam het model TI-84 op de markt met een grotere geheugenruimte voor de opslag van nog meer programma's. Het is nu mogelijk alle (ongeveer 75) programma's die ik geschreven heb op alfabetische volgorde in een TI-84 op te slaan. Of dat aan te bevelen is, betwijfel ik overigens. Ook zijn er mogelijkheden om middels een zogenaamde virtuele TI83 op een PC te werken met als voordeel een veel grotere PC snelheid. Met al dat soort snufjes hoef ik mij gelukkig niet bezig te houden. Het gaat immers om de wiskunde en de lol van het programmeren. Al gebiedt de eerlijkheid mij toe te geven dat ik een enkele keer, gedreven door nieuwsgierigheid, van de virtuele TI-83 op de microprocessor van mijn PC gebruik heb gemaakt. In een eerste versie van het boek (toen nog Programmeer het Zelf genaamd, in twee delen te downloaden van www.henkshoekje.com) werden 125 programma's besproken en uitgebreid toegelicht. De leesbaarheid leed daar echter flink onder, vandaar deze geheel herziene uitgave in één deel waarin veel geschrapt is: het onderdeel statistiek is grotendeels gesneuveld, in de meetkunde is flink gesnoeid, alle programmeertechnische zaken en de meeste broncodes zijn weggelaten. Veel materiaal, van wiskundige en recreatieve aard, is echter ook toegevoegd. Het inleidende hoofdstuk over het programmeren in TIBASIC is overgebracht naar een ander boek(je): Programmeren in TIBASIC. Aldus ontstond Inventies in de Vrije Ruimte. Aldus is het programmeren geworden tot wat het moet zijn: een hulpmiddel. De tekst is een doorlopend verhaal. Voor het volgen van de grote lijn is het niet echt nodig om de broncode van alle programma's te bestuderen. Waar het nuttig was (en dat gebeurde nogal eens) om de theorie achter die tekst uit te leggen, heb ik dat gedaan. Want wie zich de moeite getroost de achter het verhaal liggende wiskunde te doorgronden zal er meer plezier aan beleven dan de ongeschoolde lezer. Er is een opklimmende moeilijkheidsgraad, lopend vanaf het tellen via de gehele getallen, kansen en functies naar de vectormeetkunde. De meeste onderwerpen staan niet of slechts terloops in het Nederlandse leerplan maar bevinden zich wel aan de periferie daarvan. Ik heb mijn best gedaan uit te gaan van zo min mogelijk voorkennis van de lezer. Maar wat het abstractieniveau betreft mik ik op vierde klassers voor het begin en zesde klassers en eerstejaars voor het eind van het boek. H.A. Lauwerier: Modellen met de microcomputer (Epsilon nr. 12) Henk Tijms: Spelen met kansen (Epsilon nr. 43) Martin Gardner: The Colossal Book of Mathematics (Norton & Cie, isbn 0-393-02023-1) Julian Havil: Gamma (Princeton, isbn 0-691-09983-9) Prem S. Mann: Introductory Statistics (John Wiley & Sons, isbn 0-471-37353-2) David Freedman: Statistics (Norton & Cie, isbn 0-393-09076-0) Swokowski: Calculus (PWS Boston, isbn 0-534-93624-5) Hanz-Otto Peitgen c.s.: Chaos and Fractals (Springer, isbn 0-387-20229-3 Clifford Pickover: The mathematics of Oz (Cambridge U.P., isbn 0-521-01678-9) Guido Herweyers & Koen Stulens: Statistiek met een grafisch rekentoestel (Acco, isbn 90-334-4597-2), uit de prachtige serie: Geboeid door Wiskunde en Wetenschappen (Limburgs Universitair Centrum, Diepenbeek België)
Inventies 03/05/05
-4-
0.
Tellen
Aftellen Dit boek is een speurtocht naar merkwaardigheden rond getallen, getalrijen, getalverzamelingen, getallenparen (coördinaten), toevalsgetallen, getalbewerkingen, variabele getallen (letters) en verbanden tussen variabelen (functies). Aan de basis daarvan lig het tellen. Paragraaf nul dus. Is aan zoiets gewoons als tellen nog wat bijzonders te bespeuren? Voor de hand ligt een onderzoekje naar het aftellen. Tien kinderen staan in een kring. Wie krijgt het ijsje? Via het aftelversje ie-wie-waai-weg (met de klemtoon op de vierde lettergreep) wordt elk vierde kind afgetikt (je kunt ook zeggen dat er telkens drie overgeslagen worden). Welk kind blijft over? Voor het gemak geven we de kinderen een nummer, van 1 tot en met 10. De eerste paar stappen zijn: 1 2 3 4 5 6 7 8 9 10 1 2 3 5 6 7 9 10 1 3 56 9 10 waarna een kind kan zien hoe het afgemaakt wordt. Nummer 5 krijgt het ijsje. Als je hier een programma voor maakt, moet dat ook met andere getallen bruikbaar zijn. Zo krijg je variabelen. Bijvoorbeeld N voor het aantal kinderen (1,2,3,...,N) en P voor het aantal overgeslagenen. In regel 2 van het volgende TIBASIC programma is een rij L1 met N enen geformeerd. Een 1 betekent dat een kind nog meedoet. Elke geschrapte 1 gaat over in een nul (regel 9). In regel 5 is X het aangetikte nummer en telt T van 1 tot en met P zolang er een 1 in de lijst op plaatsnummer X staat. Daarna (in regels 8 en 9) wordt het te schrappen nummer op het scherm geplaatst (Disp is van Display) en op nul gezet. Ook de teller T wordt dan op nul gezet. T staat dus voor het ie-wie-waai. In regel 11, 12 en 13 telt S het aantal enen in L1. In regel 14 tellen we door vanaf het begin van de rij zolang er meer dan één 1 staat. De inleidende en begeleidende tekst van het programma AFTELLEN zijn hier niet vermeld. Een goede intro en toelichting zijn weliswaar belangrijk (een andere gebruiker moet het programma zonder problemen kunnen hanteren), maar leiden te veel af van de inhoud. Daarom tonen we in het algemeen slechts de kern van een programma, een enkele keer zelfs alleen maar de belangrijkste regel uit die kern. 1. 2. 3.
Nüdim(L1 ) Fill(1,L1 ) 0üT:0üX
4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14. 15. 16. 17. 18.
Lbl 0 X+1üX:T+L1 (X)üT If T=P Then Disp X 0üL1 (X):0üT End sum(L1 )üS If X
1:Goto 0 Disp "OVER BLIJFT NR.:" For(Y,1,N) If L1 (Y)=1:Disp Y End
Inventies 03/05/05
-5-
Is pincodes tellen dom werk? Vraagje 1: Hoeveel van de 100 getallen 00 t/m 99 bestaan uit twee verschillende cijfers? Het antwoord daarop is gauw gevonden. Er zijn 100 getallen, waarvan er 10 uit twee gelijke cijfers bestaan (namelijk de getallen 00, 11, 22, 33, 44, 55, 66, 77, 88 en 99). Over blijven dus 100-10 = 90 getallen met twee verschillende cijfers. Met een kleine redenering kan je ook op een andere manier aan dat antwoord komen: voor het eerste cijfer zijn er 10 mogelijkheden (0 t/m 9); bij elk van die 10 keuzes zijn er nog 9 mogelijkheden voor het andere cijfer; totaal dus 10´9=90. We noteren de uitkomsten van het aantal getallen met respectievelijk 1 en 2 verschillende cijfers als #(1)=10 en #(2)=90. Vraagje 2: Hoeveel van de getallen 000 t/m 999 bestaan uit een, twee of drie verschillende cijfers? Niet te gauw hoera roepen, we moeten namelijk drie gevallen onderscheiden: (1) het type {A,A,A} zoals bijvoorbeeld 333 of 000 (2) het type {A,A,B} met twee verschillende cijfers, zoals 225 of 020 en (3) het type {A,B,C} met drie verschillende cijfers, zoals 537 of 189 Van het eerste type zijn er weer 10 versies (000 t/m 999); van type (2) zijn er 10 mogelijkheden voor A en (nadat je A gekozen hebt) 9 voor B en (nadat je een volgorde uit {A,A,B} gekozen hebt) 3 rangschikkingen AAB, ABA, BAA zodat er in totaal 10´9´3 = 270 mogelijkheden zijn. Voor type (3) resteren er dus 1000 – 10 – 270 = 720 getallen. Met de opmerking dat voor type (3) ook de berekening 10´9´8 = 720 in aanmerking komt. Samengevat: #(1)=10 #(2)=270 #(3)=720 controle: #(1) + #(2) + #(3) = 1000. Slim gewerkt, al zeggen we het zelf. Nu pakken we de programmeerbare rekenmachine om het een en ander te controleren. Dom werk dus, maar het geeft een goed gevoel om een rekenmachine te slim af te wezen. Ik noem het programma DOMWERK. In het begin staat de teller T op nul. Vervolgens doorlopen A, B en C alle mogelijkheden van 0 t/m 9. T wordt met 1 verhoogd (T+1üT) zodra de drie cijfers verschillend zijn. Ik heb wat verklarende teksten toegevoegd, maar die zijn er alleen voor de gebruiksvriendelijkheid. Ziehier de kern van een mogelijk TIBASIC programma dat #(3) uitrekent. De uitdrukking For(A,0,9) betekent "Voor A lopend vanaf 0 t/m 9". 0üT For(A,0,9) For(B,0,9) For(C,0,9) If AøB and BøC and AøC Then T+1üT End End End End Disp T
Voor #(2) is een kleine wijziging in de broncode voldoende. In de vijfde regel moet dan staan: If A=B and BøC met in de zevende regel: T+3üT ter vervanging van de ingewikkelde logische constructie: En voor #(1):
If A=B and BøC or A=C and AøB or B=C and AøB If A=B and B=C
Dom werk? Wacht even. Hoe staat het met viercijferige getallen?
Inventies 03/05/05
-6-
Vraagje 3: Een pincode bevat vier cijfers (0000 t/m 9999). Hoe groot is de kans dat een willekeurige pincode #(1) uit vier gelijke cijfers (bijvoorbeeld 0000) #(2) uit twee verschillende cijfers (bijvoorbeeld 2233 of 2333) #(3) uit drie verschillende cijfers (bijvoorbeeld 2234) #(4) uit vier verschillende cijfers (bijvoorbeeld 5308) bestaat? We lossen dit eerst "even" slim op. (1) De kans op vier gelijke cijfers is 0,1% want #(1) is weer 10. Geen probleem. (2) en (3) slaan we even over. (4) Het aantal getallen met vier verschillende cijfers is #(4)=10´9´8´7=5040; de kans daarop is 50,4% (2)
Type {A,A,B,B} met AABB, ABAB en ABBA geeft 3´10´9=270 mogelijkheden. Type {A,A,A,B} met AAAB, AABA, ABAA en BAAA levert 4´10´9=360 mogelijkheden. Totaal 270+360=630 mogelijkheden met kans 6,3%. (3) Type {A,A,B,C} levert zes mogelijkheden: AABC, ABAC, ABCA, BAAC, BACA en BSAA. Dus in totaal 6´10´9´8=4320 mogelijkheden met kans 43,2%. Controle: #(1)=10 #(2)=630 #(3)=4320 #(4)=5040 totaal: 10+630+4320+5040=10 000. Je begrijpt nu waarom ik het woord "even" tussen aanhalingstekens gezet had. Ik denk dat er niet zo gek veel mensen in staat zijn deze uitwerking zelf te bedenken. Daarvoor is een toch wel grote technische vaardigheid vereist. En er is nog een kanttekening. Als het gaat om meer dan vier cijfers, wordt het probleem al gauw praktisch onoplosbaar, zelfs voor routiniers. Tussen twee haakjes, vaak ondekt zo'n routinier een algemene formule, waarna het oplossen van een probleem neerkomt op het invullen van getalwaarden in die formule. Ik weet niet of er zo een formule bestaat voor pincodes met meer dan 4 cijfers, ik denk het wel, maar eerlijk gezegd interesseert me dat niet erg. Wel wil ik graag onderzoeken of er een programmaatje voor dit probleem geschreven kan worden. Laten we het daarom nog maar eens met de computer (in dit geval dus de grafische rekenmachine TI83 of TI-84 met TIBASIC) proberen. De hierboven gekozen methode met If A=B and BøC or A=C and AøB or B=C and AøB
is niet handig, want je krijgt zo enorme ketens van onontwarbare logische betrekkingen. We zullen een andere aanpak moeten bedenken. Ik geef eerst het fundament van het programma CIJFERS4 en daarna de toelichting. Is dit dom werk? Oordeel zelf. 1. For(A,0,9) 2. For(B,0,9) 3. For(C,0,9) 4. For(D,0,9) 5. {A,B,C,D}üL1 6. SortA(L1) 7. 1+sum(¾List(L1)=0)üS 8. 1+L3(S)üL3(S) 9. End 10. End 11. End 12. End 13. L3üL2
Inventies 03/05/05
-7-
In de regels 5 en 6 wordt het actuele stel waarden van A, B, C en D in de lijst L1 gestopt die direct daarna oplopend gesorteerd wordt met SortA(L1). Regel 7 is ingewikkeld; ¾List(L1) is de verschilrij van lijst L1. Om regel 7 goed te begrijpen moet je de werking van de logische beweringen (= > < enzovoorts) kennen. Een logische bewering kent slechts twee uitkomsten: goed (uitkomst 1) of fout (uitkomst 0). Zo heeft de bewering 7<9 de uitkomst 1, want hij is waar. De uitkomst van 7=9 is 0 (nul) want hij is onwaar. De uitkomst van {1,2,3,4}={1,3,5,7} is {1,0,0,0} want alleen de eerste term klopt. En de uitkomst van {1,2,2,3,4,5}=2 zal zijn {0,1,1,0,0,0}. De logische bewering ¾List(L1)=0 geeft dus ook een rijtje nullen en enen. Ik zal dat toelichten met een getallenvoorbeeld. Stel dat L1={A,B,C,D} op een bepaald moment de waarden {4,5,5,9} heeft (al oplopend gesorteerd met SortA(L1)), dan is de verschilrij ¾List(L1)= {1,0,4} en het resultaat van ¾List(L1)=0 is nu {0,1,0} omdat het middelste getal nul is. De som van (¾List(L1)=0) is nu 1 omdat er één 1 in staat (verder alleen maar nullen). De uitdrukking in regel 7 sommeert dus het aantal gelijke cijfers S in het rijtje L1. In regel 8 wordt de S-de term van L3 met één verhoogd. (Aan het eind verschuiven we lijst L3 nog naar L2, om cosmetische redenen). Een intro en een verzoek om geduld voltooien het geheel. Is dat dom werk? Ik dacht het niet!
En nu de finishing touch. Het kostte me minder dan een minuut om de regels 4 en 5 zodanig te wijzigen (met een extra End aan het eind) dat de mogelijkheden voor een pincode van vijf cijfers berekend konden worden. De TI-83, gehoorzaam en geduldig, deed daar ruim een uur over. Zie het rechter plaatje. Je ziet daar o.a. uit dat de kans dat een vijfcijferige pincode uit vier verschillende cijfers bestaat, praktisch gelijk is aan 50% (toevallig hetzelfde als bij een viercijferige pincode). [ Muggenzifters (en een echte wiskundige is altijd een beetje aan het muggenziften) zullen vallen over het woord toevallig in de vorige zin. De kans op vier verschillende cijfers bij een viercijferige pincode is precies even groot als bij een vijfcijferige pincode omdat het aantal combinaties van 2 uit 5 een tienvoud is, namelijk 10. En dat is wèl toevallig. ]
Inventies 03/05/05
-8-
1.
Gehele getallen
1.1
Ontbinden
"Oude" Grieken als Euclides (300 vC) en Pythagoras (500 vC) hebben zich intensief beziggehouden met getaltheorie. Daarbij wordt alleen gekeken naar de natuurlijke getallen (0, 1, 2, 3, …) of de gehele getallen (0, 1, 2, 3, … maar ook -1, -2, -3, …). We noemen A deelbaar door B (of: B is een deler van A, of: B deelt op A) als voor de gehele getallen A, B en B' (B¹0 en B' ¹0) geldt: A = B¢ B A Aangezien A = B ´ B¢ en dus = B , zal ook B ' een deler zijn van A. B¢ Bij iedere deler B van A hoort dus een partner B', die eventueel gelijk is aan B. In dat geval is A=B´B dus het kwadraat van B. Als je alle delers zoekt van een getal N hoef je dus alleen maar te kijken naar de delers kleiner dan of gelijk aan Ö N. Neem bijvoorbeeld N=36 met Ö 36 = 6. Beginnend bij 1 vind je achtereenvolgens de delers 2, 3, 4 en 6. bij 1 hoort 36 bij 2 hoort 18 bij 3 hoort 12 bij 4 hoort 9 bij 6 hoort 6. Stoppen maar, want de eerstvolgende deler (9) is al genoemd. Het getal 36 heeft dus negen delers. Bij veel onderzoek naar de deelbaarheid van een getal N hoef je dus niet verder te gaan dan Ö N. De TI-83 gebruikt iPart(X) voor het gehele deel van X en fPart(X) voor het breukdeel van X. Zo is iPart(17/5)=3 en fPart(17/5)=2/5=0.4. Als A deelbaar is door B, dan is fPart(A/B)=0 . In het volgende programma DELERS verschijnen alle delers van een ingevoerd getal in paren op het scherm. Het aantal delers wordt geteld door T , het rijnummer is X.
Input "GETAL?",N ClrHome For(I,1,ð(N)) "I=DELER?" If fPart(N/I)=0 "DELER GEVONDEN" Then X+1üX "X=RIJNUMMER" If X=9 "NIEUW SCHERM ALS LAATSTE RIJ" Then Pause :ClrHome 1üX End Output(X,1,I):Output(X,8,"*"):Output(X,11,N/I) End End
Inventies 03/05/05
-9-
Priemgetallen zijn natuurlijke getallen met precies twee delers, namelijk 1 en het getal zelf. De rij priemgetallen begint dus met 2, 3, 5, 7, 11, 13, 17, 19. Straks meer daarover. De hoofdstelling van de rekenkunde zegt hierover het volgende. Elk natuurlijk getal > 1 is, afgezien van de volgorde, op precies één manier te schrijven als product van priemgetallen. 3
2
1
Zo is het getal 2600 te schrijven als 2 ´5 ´13 . De getalletjes op één hoog heten de exponenten van de priemdelers 2, 5 en 13. Men zegt dat het getal ontbonden is in (priem)factoren (priemdelers). Dat ontbinden gaat zo dat je, beginnend met het kleinste priemgetal (2), door alle priemgetallen probeert te delen tot er 1 staat: 3 2600/2=1300, 1300/2=650, 650/2=325 dus 3 keer door 2 gedeeld; factoren 2 ; door 3 delen lukt niet; 2 325/5=65, 65/5=13 dus 2 keer door 5 gedeeld; factoren 5 ; delen door 7 en 11 lukt niet; 1 13/13=1; tenslotte 1 keer door 13 gedeeld; factor 13 ; uiteindelijk kom je altijd op 1 uit. Zo'n zichzelf herhalend mechanisme heet een algoritme (rekenritme) en wordt in het volgende programma ONTBIND gedemonstreerd. Prompt N 1üS:2üF:0üE ð(N)üM
"VRAAGT DE WAARDE VAN N"
Hierna komen twee While opdrachten. E telt hoe vaak een priemfactor voorkomt (dat wordt de exponent); F geeft de bijbehorende priemfactor. 3 2 1 De oplossing krijgt de vorm: F1E1´F2E2´F3E3´ … bijvoorbeeld 2600 = 2 ´5 ´13 waarbij de priemfactoren in L1 komen en de exponenten in L2. While F÷M While fPart(N/F)=0 E+1üE N/FüN End If E>0 Then FüL1(S) EüL2(S) S+1üS 0üE ð(N)üM End If F=2 Then 3üF Else F+2üF End End If Nø1 Then NüL1(S) 1üL2(S) End
"F=PRIEMFACTOR" "N DEELBAAR DOOR F, DAN:" "EXPONENT OPGEHOOGD" "NIEUWE WAARDE VAN N"
"PRIEMFACTOR IN L 1 " "EXPONENT IN L2 " "VOLGENDE PRIEMFACTOR"
5
4
1
2
Hieruit blijkt dat 2 190 240 ontbonden kan worden als: 2 ´3 ´5 ´13 .
Inventies 03/05/05
- 10 -
OPGAVE 1.
Je kent de aan/uit drukknopjes. Met één keer drukken schakel je uit als hij aan stond, en aan als hij uit stond. In een lange gang hangen 100 lampen, genummerd van 1 t/m 100. Elke lamp heeft zo'n aan/uit schakelaar. Aanvankelijk brandt geen van de lampen. In de eerste ronde (k=1) wordt op alle knopjes gedrukt waardoor de lampen aan gaan. In de tweede ronde (k=2) wordt alleen op de knopjes met een even rangnummer gedrukt; in de derde ronde op de knopjes met een rangnummer deelbaar door 3; in de k-de ronde op alle knopjes waarvan het nummer een k-voud is. Men gaat hiermee door tot en met de 100-ste ronde. Als uit met een 0 en aan met een 1 wordt weergegeven, krijg je dus: rangnr begin ronde 1 ronde 2 ronde 3 ronde 4 ronde 5 Enzovoorts
1 0 1 1 1 1 1
2 0 1 0 0 0 0
3 0 1 1 0 0 0
4 0 1 0 0 1 1
5 0 1 1 1 1 0
6 0 1 0 1 1 1
Peter Winkler behandelt dit probleem in zijn boek Mathematical Puzzles (al gaat het daar over kluisjes die beurtelings geopend en gesloten worden). De vraag is welke lampjes uiteindelijk branden. Welke getallen komen door de mazen van deze zeef van Winkler? Wie een programmaatje maakt waaruit het antwoord op de vraag blijkt, krijgt van mij een zesje. Wie het antwoord zonder programmeren vindt en een passende redenering bedenkt krijgt een tien. Een aanwijzing: de meeste getallen hebben een even aantal delers.
De priemgetallengenerator Je onderzoekt of een getal N>2 priem is via: For(K,3,ð(N),2) If fPart(N/K)=0: Goto NP End
"NP= NIET PRIEM"
Dit met de waarschuwing, dat je niet onbeperkt uit een lus mag springen (met Goto NP); na ongeveer 200 keer raakt de interne Goto teller geheel de kluts kwijt en weigert dienst. Dat bezwaar kan alleen opgeheven worden ten koste van de snelheid, door de for lus open te breken, ongeveer als volgt: 1üK Lbl D K+2üK If fPart(N/K)=0:Goto NP If K>ð(N):Goto P Goto D
"K=DELER" "Niet priem" "Priem"
Eratosthenes, zegt men, zeefde de priemgetallen uit de natuurlijke getallen. Begin met 2 en schrap alle veelvouden van 2 behalve 2 zelf. Dan hetzelfde voor 3, enzovoorts. Dat laten we de rekenmachine doen. Makkelijk zat. Een probleem is echter dat je voor grote priemgetallen hiermee niet gemakkelijk uit de voeten kunt.
Inventies 03/05/05
- 11 -
Het aantal priemgetallen neemt af, verhoudingsgewijs. Met een TI-83 (Silver Editie) maakte ik een lijst van de eerste 784 priemgetallen: p1 =2, p2 =3, p3 =5, …, p784=6007. Hieruit las ik dat p100=541, p200=1223, p300=1987, p400=2741, p500=3571, p600=4409 en p700=5279. De verschilrij hiervan is: 541, 682, 764, 754, 830, 838, 870. De priemgetallendichtheid (het aantal priemgetallen per 1000 bijvoorbeeld) neemt dus geleidelijk af. Het honderdste priemgetal p100=541 hetgeen betekent dat er aan het begin van de lijst (laten we zeggen tussen de natuurlijke getallen 1 en 1000) gemiddeld ongeveer 1000/5.41 » 185 priemgetallen per 1000 zijn, daarna 1000/6.82 » 147, vervolgens 131, 133, 120, 119 en 115. De 90 priemgetallen tussen 100 000 en 101 112 hebben een dichtheid van 1000/12.34, ongeveer 81 priemgetallen per 1000. Voor het aantal priemgetallen tussen 1 en n geldt de benaderingsformule
p ( n) »
n . ln n
De natuurlijke logaritme van n, ln n, is een zeer traag stijgende functie. Daar is een knop voor. Kijk maar eens naar de uitkomsten van ln(1000) en ln(100000000). Bij zulke relatief kleine getallen als hier gebruikt zijn klopt de formule nog niet erg: 6000/ln(6000)=690 in plaats van het gemeten aantal 783. Pas overtuigend wordt dit verband als je heel wat meer Gigabytes en MegaHerz hanteert. De vraag dringt zich op, of op de zeer lange duur het vóórkomen van priemgetallen zo zeldzaam wordt, dat het zelfs ophoudt. Komt er een eind aan de rij priemgetallen? Of zijn het er oneindig veel? Met een kleine redenering is aan te tonen dat er na elk priemgetal (hoe groot ook) altijd een groter priemgetal te vinden is. Veronderstel dat N het grootste priemgetal is. Je kunt nu een groter getal M construeren door het product van de priemgetallen t/m N met één te vermeerderen: M = p1 ´p2 ´p3 ´…´N + 1. Dit getal is niet deelbaar door p1 , p2 , …,N (want de afstand tussen opvolgende priemgetallen moet minstens twee zijn, de waarde van het kleinste priemgetal). M kan geen priemgetal zijn (volgens de veronderstelling dat N het grootste priemgetal is), maar dan zou er tussen N en M nog minstens één priemdeler van M moeten liggen (groter dan N). Er is dus een groter priemgetal (misschien M zelf wel). Zo'n soort redenering heet een bewijs uit het ongerijmde.
Grootste Gemene deler De getallen 440 en 140 hebben gemeenschappelijke delers. Behalve de deler 1 (die deler hebben alle getallen gemeenschappelijk) zijn dat 2, 4, 5, 10 en 20. De grootste gemeenschappelijke deler (de GGD) is dus 20. Onder MATH9: vind je gcd(440,140)=20 (gcd: Greatest Common Divisor). Dat de GR het antwoord direct geeft kan ons even niet schelen. Kijk naar de ontbinding van de twee 3 2 getallen: 440=2 .5.11 en 140=2 .5.7. De gemeenschappelijke priemdeler 5 valt direct op, de deler 4 is de hoogste macht van 2 die in beide getallen voorkomt. Zodat het antwoord 4.5=20 wel duidelijk zal zijn. Als A niet deelbaar is door B, zal na delen een A rest C¹0 overblijven: = B¢ + C B
Inventies 03/05/05
- 12 -
Hierbij moet opgemerkt worden dat B' op de TI-83 beschreven wordt door iPart(A/B), het gehele deel (niet lettend op een min-teken): iPart(-22/7)= -3. Je kunt in het algemeen schrijven: A/B=(iPart(A/B)+fPart(A/B)) oftewel A=B*(iPart(A/B)+fPart(A/B)) Als je een eventueel min-teken voor een getal A weglaat, krijg je de absolute waarde van A, genoteerd als |A|. Een stelling zegt dat GGD(A,B)=GGD(min(A,B), |A-B|). Gebaseerd op deze regel kun je de GGD gemakkelijk uit (laten) rekenen, mits je over het nodige geduld beschikt. De GGD(84,30) bijvoorbeeld berekenen we door telkens de GGD te nemen van het kleinste van de twee (30) en het absolute verschil van de twee (84-30=54): GGD(84,30)=GGD(30,54). Herhaling van dit proces geeft achtereenvolgens GGD(30,24) = GGD(24,6) = GGD(6,18) = GGD(6,12) = GGD(6,6), waarna duidelijk is dat de gezochte GGD gelijk is aan 6. Prompt A,B While AøB If A>B Then A-BüA Else B-AüB End End Disp A
Euclides heeft een razendsnel algoritme ontwikkeld om de GGD van twee getallen A en B te vinden. Dat gaat ongeveer zo. Deel A door B en bepaal de rest C: B*fPart(A/B)->C. Deel daarna B door C en bepaal de rest D. Ga hiermee door tot de rest nul is. De voorlaatste rest was de GGD van A en B. Het bewijs van de juistheid van dit algoritme berust op het volgende inzicht. Stel A=B'B+R; iedere gemeenschappelijke deler (D) van A en B is ook een gemeenschappelijke deler van B en van de rest (R). Immers, uit A=PD en B=QD volgt R=A - B'B = PD - B'QD = D(P - B'Q) is dus ook deelbaar door D. Dus GGD(A,B) = GGD(B,R). Het algoritme van Euclides berust op het net zolang doorschuiven van de rest tot deze nul is. Als bijvoorbeeld A=1234 en B=567, dan krijg je de volgende resten: 567*fPart(1234/567)=100; 100*fPart(567/100)=67; 67*fPart(100/67)=33; 33*fPart(67/33)=1 ; 1*fPart(33/1)=0 STOP
De voorlaatste rest is de GGD, dus de GGD(1234,567)=1. Een opmerking. Omdat fPart een niet-gehele uitkomst berekent (in 10 decimalen benaderd) krijg je problemen als de rest exact nul moet zijn. Daarom moet je het int of het iPart commando gebruiken, zoals in het volgende programma gebeurd is. In plaats van B*fPart(A/B)üC dus AB*iPart(A/B)üC ClrHome Prompt A,B Lbl 0 A-B*iPart(A/B)üC BüA:CüB Disp A If Cø0:Goto 0 Disp "GGD(A,B)=",A
Naar het schijnt heeft Sigmund Freud, de beroemde psychiater, geen enkel inzicht gehad in de ondeelbaarheid van getallen, hoewel het begrip GGD in zijn tijd (rond 1900) al op de lagere school behandeld werd. In citeer uit het boek Ongecijferdheid van J.A. Poulos:
Inventies 03/05/05
- 13 -
Een van Freuds beste vrienden, Wilhelm Fliess vond de bioritmische analyse uit. Hij wees Freud op het feit dat de getallen 23 en 28, respectievelijk de cyclusduur van een bepaald mannelijk en vrouwelijk principe, de speciale eigenschap bezaten dat men elk mogelijk getal kon verkrijgen door 23 keer x plus 28 keer y te nemen. Zo kan men bijvoorbeeld het getal 6 krijgen door x = 10 en y = -8 te nemen: 23.10 + 28.-8 = 6. Freud was hiervan zo onder de indruk dat hij jarenlang vurig in bioritmen geloofde en dacht dat hij op zijn eenenvijftigste (51=1.23+1.28) zou sterven (Freud werd 83). Maar wat is het geval? Deze eigenschap is helemaal niet bijzonder. Hij geldt voor elk tweetal getallen (zoals 23 en 28) dat een GGD = 1 heeft. Diophantus wist dat al, 1600 jaar geleden. Lees verder.
1.2
Diophantische vergelijkingen
Een Diophantische vergelijking speelt zich af in de verzameling van de gehele getallen. De coëfficiënten en de variabelen zijn gehele getallen. Een algemene uitdrukking voor een eerstegraads Diophantische vergelijking is: a. x + b. y = c met a, b, c, x en y geheel. Men zegt, dat c een lineaire combinatie is van x en y. De coëfficiënten van x en y zijn respectievelijk a en b. De eerstegraads Diophantische vergelijking 2x + y = 3 bijvoorbeeld heeft o.a. de oplossingen: (0,3), (1,1), (2,-1), (-1,5) , …; de grafiek ervan is een rechte lijn die door (o.a.) deze roosterpunten gaat. Eigenlijk is de grafiek geen lijn maar een verzameling van "losse" roosterpunten. Roosterpunten hebben gehele coördinaten. De lijn 2x + 2y = 3 daarentegen gaat door geen enkel roosterpunt. Een klein verschil met grote gevolgen. De Diophantische vergelijking 2x + 2y = 3 heeft geen oplossingen; de Diophantische vergelijking 2x + 2y = 4 echter weer wél: (0,2), (2,0), (1,1), (3,-1) enzovoorts. Hoe zit dat? De oplosbaarheid en de oplossingen van a x + b y = c hangen af van de GGD van a en b. Nodig en voldoende voor de oplosbaarheid daarvan is, dat c deelbaar is door de GGD van a en b. Wonderlijk! De lijn 105 x + 24 y = 30 gaat door oneindig veel roosterpunten; de lijn 105 x + 24 y = 31 echter gaat door geen enkel roosterpunt. Door welke roosterpunten gaat de lijn 105 x + 24 y = 30? Het programma DIOPHANT1 geeft antwoord op die vraag. (De 1 uit de naam DIOPHANT1 duidt op de graad van de vergelijking). Het zijn de punten (30 + 8n, -130 - 35n), waarbij n weer een (willekeurig) geheel getal is. Zo geeft n = -4 de gemakkelijk te controleren oplossing (-2, 10). Het algoritme van Euclides is gebruikt bij de oplossing van dit probleem. We volgen alle Euclidische stappen op de voet. L1
L2
L3
L4
¯
¯
¯
¯
105 = 24 =
4.24+ 9 2.9 + 6
9 =
1.6 + 3
6 =
2.3 + 0
9 = 1.105 + -4.24 6 = 24 - 2.9 = 1.24 - 2(1.105-4.24) = -2.105 + 9.24 3 = 9 - 6 = 105 -4.24 -(-2.105+9.24) = 3.105 + -13.24 STOP
De onderstreepte waarden links met de doorgeschoven resten {105, 24, 9, 6} komen in L1; de gehele delen {4, 2, 1} in L2 en de lineaire combinaties die de geschikte coëfficiënten opleveren in L3 en L4.
Inventies 03/05/05
- 14 -
2
2
De stelling van Pythagoras in R2: a + b = c
2
Een Pythagorieel drietal (a,b,c) is een drietal natuurlijke getallen dat voldoet aan: 2
2
2
a + b = c met GGD(a,b,c) = 1 GGD(a,b,c)=1 betekent dat a,b,c de eenvoudigste verhouding hebben. In feite is dit dus een Diophantische kwadratische vergelijking. Stelling: 2 2 2 2 2 2 2 De oplossingen van a +b =c worden beschreven door a=x - y , b=2xy, c=x +y (waarbij x en y natuurlijke getallen zijn met x-y = oneven). Bovendien geldt: Óf a óf b is even, c is oneven; Er zijn een paar regels over even (E) en oneven (O) die we hier symbolisch vermelden. E is van de vorm 2n; O is van de vorm 2n+1 (n geheel) E+E=E want 2n+2m=2.(n+m)=2k dus even O+O=E want 2n+1+2m+1=2.(n+m+1)=2k dus even E+O=O want 2n+2m+1=2.(n+m)+1=2k+1 dus oneven E.E=E want 2n.2m=2.2nm=2.k is even O.O=O want (2n+1)(2m+1)=4nm+2n+2m+1=2.(2nm+n+m)+1=2k+1 dus oneven E.O=E want 2n.(2m+1)=2.(2nm+n)=2k dus even 2 2 O is dus oneven; E is dus even 2
2
2
Kijkend naar a + b = c zijn er drie mogelijkheden: 2
2
2
(1) E + E = E ; deze mogelijkheid vervalt omdat (a,b,c) een factor 2 gemeen hebben 2 2 2 2 2 2 (2) O + O = E ; oftewel (2n+1) + (2m+1) = (2k) (n, m, k geheel). Uitwerken geeft: 2 2 2 4.(n +m +n+m) + 2 = 4k , maar dat is onmogelijk (een viervoud plus 2 kan niet een viervoud zijn), dus deze mogelijkheid vervalt eveneens. Blijft over: 2 2 2 (3) E + O = O . Dus óf a óf b is even (en c is oneven).
2
2
x +y
2
2
y -x
2xy
Stel dat a even is (b dus oneven). 2 2 2 Er geldt b = c - a = (c+a).(c-a). De GGD(a,b,c)=1 dus ook GGD(c+a,c-a)=1. Dus hebben (c+a) en 2 (c-a) geen gemeenschappelijke priemdeler. Links [b ] staat een kwadraat, rechts [(c+a)(c-a)] staat een product van twee factoren die geen priemdeler gemeen hebben. Daaruit volgt dat c+a en c-a beide een 2 2 2 2 2 2 2 2 2 zuiver kwadraat zijn. Noem c+a=x en c-a=y dus b =x Òy . Dan is c=(x +y )/2, a=(x -y )/2 en b=xy; 2 2 2 2 na verdubbeling (halven kunnen we niet gebruiken) komt er: c=x +y , a=x -y en b=2xy. Even controleren of hiermee aan de stelling van Pythagoras voldaan is: 2 2 2 2 2 2 2 4 2 2 4 2 2 4 2 2 4 2 2 2 a + b = (x -y ) + 4x y = x -2x y +y + 4x y = x +2x y +y = (x +y ) klopt! In het programma PYTHAGO2, dat systematisch naar Pythagoriële drietallen zoekt, is uitgegaan van 2 2 2 2 A=2XY, B=Y -X en C=X +Y , waarna X in stapjes van 2 oploopt van 1 (als Y even is) of 2 (als Y oneven is) tot en met Y-1.
Inventies 03/05/05
- 15 -
PYTHAGO2 1üY:0üT
"T=REGELTELLER"
Lbl P Y+1üY "Y MET 1 VERHOOGD" If fPart(Y/2)=0 "ALS Y=EVEN DAN STARTWAARDE S=1" Then 1üS Else "ALS Y=ONEVEN DAN STARTWAARDE S=2" 2üS End For(X,S,Y-1,2) "X VAN S TOT Y-1, STAPGROOTTE 2" XÜ+YÜüC: YÜ-XÜüB 2XYüA If gcd(A,B)ø1:Goto Q "VEREENVOUDIGBAAR DAN OVERSLAAN" min(A,B)üD "KLEINSTE VOOROP" max(A,B)üE DüA:EüB T+1üT If T=9 Then 1üT Pause ClrHome End Output(T,1,A):Output(T,6,B):Output(T,11,C) Lbl Q End Goto P 2
De stelling van Pythagoras in R3:
2
2
2
a +b +c =d
In een rechthoekig blok met breedte a, lengte b en hoogte c is de lengte van een lichaamsdiagonaal te berekenen door twee keer de stelling van Pythagoras te hanteren. 2
2
De gronddiagonaal is Ö(a +b ) en in rechthoekige driehoek PQR komt er vervolgens voor de lichaamsdiagonaal: 2
2
2
2
2
R
P
2
PR =PQ +QR =(a +b )+c . Dat is de stelling van Pythagoras in de ruimte R3. In de tekening zie je dat 2 2 2 Ö(2 +2 +1 )=Ö(4+4+1)=Ö9=3
c=1 Q
d=3 Q
a=2 Q
b=2 QQ
Als we uitsluitend naar gehele oplossingen van deze (Diophantische) vergelijking zoeken, is er geen tijdbesparend trucje mogelijk (zoals in het tweedimensionale geval). En dat is jammer, want er moeten liefst drie geneste for-lussen doorlopen worden bij het zoeken naar gehele oplossingen. Toch is er nog wel iets te verbeteren. De lichaamsdiagonaal (d) is namelijk altijd oneven, zodat een stapgrootte 2 bij d tijdwinst oplevert (die vooral bij grotere getallen merkbaar is). Stelling. 2
2
2
2
Voor de gehele oplossingen van a +b +c =d (a,b,c zijn natuurlijke getallen met GGD(a,b,c)=1) geldt dat d oneven is en precies twee van de drie a,b,c even zijn. We werken weer met de symbolen E voor even en O voor oneven. Er zijn vier mogelijkheden. E + E + E = E vervalt (namelijk alle termen zijn deelbaar door 2) O + O + O = O vervalt (4-voud + 3 ¹ 4-voud + 1) E + O + O = E vervalt (4-voud + 2 ¹ 4-voud)
Inventies 03/05/05
- 16 -
Conclusie: E + E + O = O is de enige mogelijkheid. In het programma hebben we van dit laatste nuttig gebruik gemaakt. We slaan met de waarde van d er telkens een over: d = 3, 5, 7, … PYTHAGO3 1üT: 1üD Output(1,1,"A B C D ") Lbl 1 D+2üD "D IS ONEVEN DUS STAP 2" For(A,1,D-1) For(B,A,D-1) For(C,B,D-1) If AÜ+BÜ+CÜ=DÜ Then If gcd(A,gcd(B,gcd(C,D)))ø1:Goto 2 T+1üT Output(T,1,A) Output(T,5,B) Output(T,9,C) Output(T,13,D) If T=8 "NIEUWE SCHERMPAGINA" Then 1üT Pause :ClrHome Output(1,1,"A B C D ") End End Lbl 2 End End End Goto 1 2
2
2
2
Kijk naar het plaatje van de TI-83 en verbaas je. Op de bol x +y +z =33 =1089 liggen maar liefst 366 2 2 2 roosterpunten! De bol x +y +z =1090 daarentegen gaat door geen enkel roosterpunt.
Het vermoeden van Fermat Er zijn dus oneindig veel oplossingen met positieve, gehele drietallen (x, y, z) van de vergelijking 2 2 2 x +y =z . Je kunt je afvragen, nadat je de stelling van Pythagoras voor gehele getallen hebt doorgrond, in hoeverre er oplossingen zijn van vergelijkingen als: 3
3
n
n
3
x +y = z 4 4 4 x +y = z .... en in het algemeen: n
x +y =z
(met x, y, z en n positieve gehele getallen, n ³ 3). Dan ben je niet de eerste die zich dat afvraagt. De vraag heeft haar oorsprong in de wiskunde van het oude Griekenland, tweeduizend jaar voordat Pierre de Fermat (1601-1665) er diepgaand onderzoek naar verrichtte. Fermat was jurist aan het gerechtshof in Toulouse en in zijn vrije tijd een gedreven en nauwgezet wiskundige. Hij wordt wel eens de koning van de wiskunde-amateurs genoemd. Zijn vermoeden was, dat de bovenvermelde vergelijking voor geen enkele n oplossingen had.
Inventies 03/05/05
- 17 -
Maar een vermoeden telt niet in de wiskunde. Al bevestig je de juistheid met behulp van computers voor alle getallen onder de miljard, dan is dat nog steeds geen bewijs. Exactheid wil zeggen dat er geen speld tussen te krijgen is. Immers, misschien vindt later iemand een oplossing die boven de miljard ligt. Maar … In 1637 schrijft Fermat: Ik heb een waarlijk spectaculair bewijs van deze stelling gevonden, maar deze marge is te smal om het te bevatten. Inmiddels hebben de grootste wiskundige genieën (waaronder Euler) hun tanden stuk gebeten op dit "laatste" raadsel van Fermat, maar geen sluitend bewijs gevonden. Men gelooft thans dat er toch een onvolkomenheid in zijn vermeende bewijs heeft gezeten. Op 25 oktober 1991 kwam er een eind aan tweeduizend jaar onzekerheid. Na acht jaar hartstochtelijke, hoogst specialistische arbeid publiceerde de Brit Andrew Wiles in een manuscript van meer dan honderd bladzijden een bewijs dat uiteindelijk de toets der kritiek kon doorstaan. Men zegt dat er in de hele wereld maar een paar honderd wiskundigen zijn die zijn werk hebben begrepen. Maar het bewijs staat als een huis. We hoeven dus geen moeite te doen om het laatste raadsel van Fermat op te lossen. Wat we wel kunnen proberen is, te kijken naar "bijna" oplossingen. Laten we ons beperken tot de exponent n=3 en kijken naar oplossingen die er maar één naast zitten. Dan is de vraag: 3 3 3 Is de vergelijking x + y = z ± 1 oplosbaar? Let op. Als er ook maar één oplossing te vinden is (een zogenaamd tegenvoorbeeld) dan kun je met die oplossing een vermoeden ontzenuwen, een bewijs leveren dus. Met een rekenmachine mogen we in dit geval dus op zoek gaan naar een bewijs!
Goede tijden slechte tijden … We nemen ons voor systematisch te zoeken naar oplossingen (x,y,z) van een Diophantische vergelijking die "heel weinig" afwijkt van de vergelijking van Fermat. Zijn er oplossingen (zo ja, welke?) van de vergelijking n n n x + y = z ± M? We beperken ons eerst tot n=3 en M=1 dus: 3
3
3
3
3
3
x + y = z + 1 en x + y = z - 1 Laten we met de rekenmachine maar eens beginnen met Z lopend van 10 tot en met 25 en X en Y van het begin af (2) tot en met de lopende waarde van Z. Als je daarvoor alle getallen X en Y achtereenvolgens van 2 t/m Z gebruikt ziet je programma er uit als programma A hieronder. Drie geneste for-lussen, dat kost tijd. Kostbare tijd. Dat kun je constateren door programma A af te draaien. Mijn TI-83 Silver Edition (hoewel twee keer zo snel als een gewone TI-83) deed er ruim twee minuten over. Nou zit er symmetrie in de verschillende mogelijkheden: X en Y zijn verwisselbaar (symmetrisch). 3 3 3 3 12 + 15 is bijvoorbeeld hetzelfde als 15 + 12 . Je verliest dus geen informatie (en wat belangrijker is: geen oplossing) door in de binnenste lus Y niet alle waarden maar alleen die van X t/m Z te laten doorlopen. Het programma B werkte z'n opdrachten af, voor Z van 10 t/m 25, in iets meer dan één minuut. Een duidelijke verbetering dus. Maar nog geen goede tijd. Dan maar even goed nadenken. Is er nog tijdwinst te boeken? Is het een idee om te starten met X en Y ongeveer even groot, daarna X een stapje groter te maken en Y daarbij aan te passen zodanig, dat Y vlakbij een mogelijke oplossing blijft? 3 3 3 3 3 1/3 3 1/3 Het eerste betekent dat X +X =2X » Z dus X » (Z /2) , dus starten met X = 1+int((Z /2) ); 3 3 1/3 het tweede betekent dat Y = (Z - X ) uitgeprobeerd moet worden. Bij elke combinatie X, Z hoeft dan maar één Y waarde uitgerekend te worden. In programma C is dit verwezenlijkt, met een verbluffend resultaat! Het programma is in 5 seconden klaar. Een goede tijd, 26 keer zo snel als bij de eerste poging. Inventies 03/05/05
- 18 -
programma A:130 sec
programma B: 72 sec
programma C: 5 sec
For(Z,10,25) For(X,2,Z) For(Y,2,Z)
For(Z,10,25) For(X,2,Z) For(Y,X,Z)
For(Z,10,25) (.5Z^3)^(1/3)üK 1+int(K) üK For(X,K,Z-1) (Z^3-X^3)üQ round(Q^(1/3),0)üY abs(Y^3-Q)üE If E=1: Then . . .
Een overzicht van de doorlopen Z, X en Y waarden:
programma A
programma B
programma C
X 2 2 2 ... 3 3 ... 3 4 4 ... 4
X 2 2 ... 2 3 ... 3 4 4 ... 4 5
X 8 9 9 10 10 11 11 12 12 13 12 ...
Y 2 3 4 ... 2 3 ... 10 2 3 ... 10
Z 10 10 * 10 * 10 * 10 10 10 * 10 10
Y 2 3 ... 10 3 ... 10 4 5 ... 10 5
Z 10 10 10 10 10 10 10 10 10
Y 8 6 8 7 9 7 10 8 10 8 12
Z 10 10 11 11 12 12 13 13 14 14 15
De waarden met * zijn verwisselbaar, komen dus twee keer voor. Het blijkt dat er nogal wat oplossingen bestaan van de "bijna" Fermat vergelijking. Het programma PSFERMAT (een afkorting van Pseudo Fermat) levert bijvoorbeeld: 4 4 4 36 + 21 = 37 - 64 (een afwijking van 0,003%) 5 5 5 13 + 16 = 17 + 12 (een afwijking van slechts 0,00085%) Voor n=3 en een afwijking van 1 zijn er veel oplossingen binnen het bereik van de GR. Robert Schipper (geen wiskundige, maar een amateur als Fermat) schreef me dat hij een algemene 3 3 3 oplossing heeft gevonden voor x + y = z + 1, namelijk 3 4 3 x = 72a +1, y=144a , z=6a(24a +1) (a geheel) OPGAVEN 2.
3.
3
3
3
De eerste oplossing die het programma PSFERMAT vindt is 6 + 8 = 9 - 1. Controleer dit met een berekening en bepaal alle volgende oplossingen met z < 200. Bewijs dat de oplossing van R. Schipper inderdaad voldoet (voor alle a). 3
3
3
Voor a=1 komt er 73 + 144 = 150 + 1; 3375001 = 3375000 + 1. Om het maar eens natuurkundig uit te drukken: voor 99,99997% de ontkenning van de stelling van Fermat. Een voor natuurkundigen volstrekt verwaarloosbaar foutje. Waar hebben die wiskundigen zich al die eeuwen eigenlijk druk over gemaakt! Sterker nog: er zijn oneindig veel waarden van a die 3 3 3 we in kunnen vullen om zo een bijna perfecte benadering van x +y =z te krijgen. Neem de 13 bescheiden waarde a = 4 en je krijgt een afwijking van 1 op de 5.10 , dat is ongeveer het totale aantal 3 3 3 zandkorrels aan een strand van 1 km lang, 100 m breed en 1 m diep. Op één korrel zand na x +y =z . Wat een wonderlijke prestatie van het menselijk vernuft, dat "we" (c.q. Andrew Wiles) aangetoond 3 3 3 3 3 3 hebben dat x + y = z nooit kloppend te krijgen is terwijl x + y = z + 1 oneindig vaak klopt.
Inventies 03/05/05
- 19 -
PSFERMAT Input M:ClrHome For(Z,1,100) 1+int((.5Z^N)^(1/N))üK For(X,K,Z-1) (Z^N-X^N)üQ round(Q^(1/N),0)üY abs(Y^N-Q)üE Output(7,1,"X") Output(7,6,"Y") Output(7,11,"Z") Output(8,1," Output(8,1,X) Output(8,6,Y) Output(8,11,Z) If abs(E)÷M Then Output(1,1,"X=") Output(1,4,X) Output(1,14,"N=") Output(1,16,N) Output(2,1,"Y=") Output(2,4,Y) Output(3,1,"Z=") Output(3,4,Z) Output(4,1,"VERSCHIL:") Output(4,10,E) Output(5,10,"-----") Pause :ClrHome End End End
")
Fibonacci en het 3n+1 vermoeden De rij van Fibonacci 1, 1, 2, 3, 5, 8, 13, 21, … is de moeite van het bestuderen waard. Na een beetje puzzelen lukt het je vast wel om de volgende term te vinden. Elke term is namelijk de som van de twee eraan voorafgaande termen: 3 = 1+2, 5 = 2+3, 8 = 3+5 enzovoorts. Als we term nummer n voorstellen door tn is het verband dus: tn+2 = tn+1 + tn (t1=1, t2=1) Kijken we naar de verhouding t n / tn+1 van twee opvolgende termen dan krijg je achtereenvolgens: 1/2, 2/3, 3/5, 5/8, … afgerond 0.5, 0.67, 0.6, 0.625, 0.615, … Met het programma FIBONAC verschijnen de termen in L1 en de opvolgende verhoudingen op het scherm. ClrHome:ClrAllLists 1üX:1üY For(T,1,100) X+YüZ YüX ZüY YüL1(T) Output(1,1,X/Y) End
Inventies 03/05/05
- 20 -
De verhouding in deze rij convergeert naar een limietwaarde r = 0,61803398… die de "gouden" verhouding of gulden snede genoemd wordt. Kijk naar de breedte en hoogte van de rechthoeken hierboven. De verhouding tussen de breedte en lengte gaat voor grotere rechthoeken steeds meer lijken op wat men vroeger een ideale verhouding vond. Elke rechthoek met hoogte h wordt op een vierkant met zijde h geplaatst en levert zo de volgende rechthoek. Wie over de abc formule beschikt (de oplossing van kwadratische vergelijkingen) kan r exact uitrekenen. Stel dat de hoogte van zo'n ideale rechthoek r is en de breedte 1, dan moet de verhouding constant blijven, dus: r 1 -1± 1+ 4 2 r : 1 = 1 : (1+r) oftewel = zodat r + r - 1 = 0. En nu: r1, 2 = ; het minteken 1 1+ r 2 kunnen we niet gebruiken omdat r positief moet zijn. Dus r = 1 2 ( -1 + 5 ) » 0,618034 De Fibonaccigetallen 2, 3, 5, 8, 13 enzovoorts en de erbij behorende limiet r spelen een rol bij het 3n+1 raadsel. In het midden van de vorige eeuw kwam een ogenschijnlijk onnozel spelletje onder de aandacht van de wiskundigen. Begin met een willekeurig, geheel getal n groter dan 2 en pas het volgende voorschrift steeds maar weer toe tot n =1 geworden is.
Als n even is halveer je n; als n oneven is ga je over op 3n+1. Startend met bijvoorbeeld n=3 komt er: 3 ® 10 ® 5 ® 16 ® 8 ® 4 ® 2 ® 1 STOP. [ Doorgaan heeft geen zin omdat je in een cirkel zit: 1 ® 4 ® 2 ® 1.] Daar is gemakkelijk een programma bij te maken (N3PLUS1), dat we aan de lezer overlaten. 16
Men heeft geconstateerd dat je voor alle startwaarden n kleiner dan 3.10 op 1 uitkomt. Het vermoeden rijst, dat je altijd op 1 uitkomt. Maar een vermoeden is nog geen bewijs en dat maakt het spelletje interessant. Tot op heden is er zelfs nog geen begin van een theorie die tot een bewijs zou kunnen leiden. Soms kan het erg lang duren voor we het eindpunt bereiken. Met onze GR ontstaat een lange rij bijvoorbeeld al met n = 27, waar 111 stappen nodig zijn. Rekenend met supercomputers heeft men bij het getal 100759293214567 gevonden dat het einde pas na 1820 stappen komt. k
Startgetallen van de vorm 2 - 1 (3, 7, 15, 31, 63, 127, …) beginnen met een aantal keren verdrievoudiging en worden steeds maar groter, tot uiteindelijk de halvering toeslaat en het eindpunt 1 toch wel degelijk, zij het moeizaam, bereikt wordt. Versnellend daarbij werkt het feit dat voor oneven waarden van n, 3n+1 altijd even is en dus daarna door 2 gedeeld wordt. Bij de drietallen van Pythagoras gebruikten we de letters E en O voor even en oneven. In deze symbolentaal: 3n+1 is type 3×O+1 = O+O=E; dus na 3n+1 komt altijd ½(3n+1). Hierachter een paar plaatjes met n in L1 en het aantal nodige stappen in L2. De zeven stappen bij n=3 zijn al vertoond; de 2 stappen bij n=4 zijn 4 ® 2 ® 1; vanuit 5 gaat het verder met 16 ® 8 ® 4 ® 2 ® 1, dat zijn 5 stappen; enzovoorts.
Twee dingen vallen op. Allereerst de grote verscheidenheid en springerigheid. In het gebied van n=122 t/m n= 128 ben je soms (bij n=128) al na 7 stappen klaar, maar vlak daarvoor (bij n=124, 125, 126) kost het maar liefst 108 stappen.
Inventies 03/05/05
- 21 -
Dit laatste groepje van drie "even trage" n-waarden is hoogst merkwaardig. Precies hetzelfde aantal stappen! Bij n=124 en n=125 zie je de kettingreactie al op de derde stap (vanaf 94) gelijk oplopen. Maar bij n=126 leidt een heel andere weg naar Rome. Pas na de dertiende stap (vanaf 364) zit deze op hetzelfde spoor. Het eerste treffen is te begrijpen: via EEOE of via OEEE, van n via ½n en ¼n naar 0,75n+1 respectievelijk van n+1 via 3(n+1)+1 en ½(3n+4) en ¼(3n+4) naar (ook) 0,75n+1 klopt; maar het tweede treffen (na EOEOEOEOEOEOEE) lijkt volstrekt toevallig. Zie de drie plaatjes hierna.
Zulke clusters van "trage" getallen komen opvallend vaak voor. Het volgende cluster ligt bij n=130 t/m n=134, waar het stappenpatroon betrekkelijk snel naar 1 gaat (in 28 stappen namelijk). We zullen ons niet wagen aan een tot mislukken gedoemde poging tot bewijsvoering. Maar de drang om toch iets te begrijpen van dit wonderlijke spelletje is groot. Voor de hand ligt een op de kansrekening gebaseerde redenering met verwachtingswaarden. Weliswaar is hier strikt genomen geen sprake van aselect (random) gekozen getallen, maar voor een gewoon mens heeft het daar wel erg veel van weg. Populair gezegd wordt de verwachtingswaarde berekend door elk waarnemingsgetal met "z'n" kans te vermenigvuldigen en al deze producten op te tellen. Daar gaan we. Is het startgetal n even (de kans daarop is ½) dan krijg je ½n, is het startgetal n oneven (eveneens kans ½) dan komt er 3n+1. De verwachting na één stap is dus ½.½n + ½.(3n+1) = 0,25n + 1,5n + 0,5 = 1,75n + 0,5. Bij een verwachtingswaarde moet je denken aan de gemiddelde uitkomst bij een zeer groot aantal "experimenten". Controle op de geloofwaardigheid van deze redenering kan verricht worden met behulp van een programmaatje dat voor de 100 opvolgende getallen 9900 t/m 9999 de verhouding voor en na één stap opslaat in L3(1) t/m L3(100). Het gemiddelde Ë van L3 wordt uitgerekend met 1-VarStats. De aldus gevonden waarde 1.750050252 komt erg goed overeen met de op basis van toevalsprocessen verwachte uitkomst 1,75n + 0,5; nemen we voor n het gemiddelde startgetal (9950 of 1,75 . 9949,5 + 0,5 = 1,750050254 eigenlijk 9949,5) dan is de voorspelling 9949,5 Nou kunnen we wel blij zijn met deze prachtige voorspelling, maar in feite is het raadsel alleen maar groter geworden! Gemiddeld genomen en voor grote getallen wordt een getal opgevolgd door een ongeveer 1,75 keer zo groot getal. Dat zou een letterlijk exponentiële stijging betekenen in plaats van een krimp naar het eindgetal 1. Maar de praktijk is natuurlijk minder simpel. Elk oneven getal namelijk wordt onverbiddelijk gehalveerd. In plaats van het model na één stap E: dan ½n met verwachting ½n.½ = ¼n O: dan 3n+1 met verwachting (3n+1).½ ; totale verwachting 1,75n + 0,5 moet een model voor anderhalve stap E: ½n met verwachting ½n.½ = ¼n OE: ½.(3n+1) met verwachting ½.(3n+1).½ ; totale verwachting 1.n + 0,25 gehanteerd worden. Met verwaarlozing van de onbelangrijke term 0,25 betekent dit dat gemiddeld en op de lange duur een getal gelijk is aan zijn opvolger (of ietsje groter zelfs).
Inventies 03/05/05
- 22 -
Ook nu klopt het experiment (Ë = 1.000025126) met de voorspelling (1,000025127). Maar het raadsel blijft. Verder onderzoek in deze richting blijkt ons aanvankelijk niet verder te helpen. De mogelijkheid OO vervalt. Na twee hele stappen EE, EO, OE vinden we een verwachte verhouding van 19/16 (als we de rest ½ verwaarlozen) dat gaat aardig richting 1, maar … Na drie hele stappen EEE, EEO, EOE, OEE, OEO is de voorspelde verhouding juist weer de verkeerde kant op: 103/64. En daarna blijft voor hele stappen de verwachting rond de 1,45 schommelen. Kijkend naar de extra halve stap OE (na O komt altijd E) vinden we voor tweeënhalve stap de verwachting 1.n + 3/8; de coëfficiënt van n blijft steeds 1, met een extra halve stap. OPGAVE 4.
Controleer of de verwachte groeiverhoudingen na 2, 2½ en 3 stappen (respectievelijk 19/16, 1 en 103/64) goed berekend zijn. De schrijver van dit boek is menselijk …
Probleem! Hoe kan (vermoedelijk) elk getal uiteindelijk op 1 uitkomen terwijl gemiddeld genomen de verwachting is dat de getallen ongeveer gelijk blijven of zelfs iets stijgen? Laten we het programma N3PLUS1 er nog maar eens bij halen en voor een honderdtal grote getallen het gemiddeld aantal stappen uitrekenen. Dat doen we met STAT en 1-VarStats. Voor de groep n=9900 t/m 9999 vinden we 93 voor het gemiddeld aantal stappen; voor de groep n=513 t/m 612 is het gemiddeld aantal 93 stappen 61. In het eerste geval is de gemiddelde "groeifactor" g te berekenen uit 1/9950 = g met als 61 oplossing g=0,906; in het tweede geval doe je dat met 1/563 = g met g=0,901. Deze uitkomsten wijzen er op dat in de praktijk gemiddeld en op de zeer lange duur een getal gevolgd wordt door een getal dat ongeveer 10% kleiner is. Kunnen we dat verklaren (niet bewijzen)? Als je de verschillende mogelijkheden met E en O op een rijtje zet, valt op dat er na een stap meer E's dan O's zijn. De kans op even en oneven is dus niet ½: kijk maar naar het aantal E's en O's in de laatste stap. Eén stap:
E O
E
Twee stappen: EE EO OE
stap 3 O
Drie stappen: EEE EEO EOE OEE OEO
E E
stap 2 E E
Vier stappen: E EEE E EEO E EOE E OEE E OEO O EEE O EEO O EOE
stap 1 E
O
Enzovoorts. Laten we de kans op even p(E) aangeven met de letter p. Dan is p(O) = 1- p.
Inventies 03/05/05
O
- 23 -
O
In het anderhalf-stapsmodel kunnen we nu de verwachting beschrijven met E: ½n.p plus OE: ½(3n+1).(1-p) groei per stap dus ½n.p + 1½.n+½-1½.np-½p = ½.(3-2p)n - ½p » ½.(3-2p)n (*) Voor de bepaling van p kijken we naar de eerste (of laatste) kolom hierboven en merken op dat, aangezien de mogelijkheid OO vervalt, het aantal E's in de eerste kolom in het vierstaps model gelijk is aan het totaal aantal E's en O's in het driestaps model, maar dat is weer gelijk aan het aantal mogelijkheden in het tweestaps model. Dat doet denken aan het plaatje bij de rij van Fibonacci, waar telkens een rechthoek werd gestapeld op een vierkant. Zie de vetgedrukte blokjes van letters. De rechthoek van 2 bij 3 wordt gestapeld op het vierkant van 3 bij 3 en wordt de rechthoek van 5 bij 3. De aantallen E's en O's in de eerste kolom, de startgetallen dus, volgen keurig netjes de rij van Fibonacci: (1, 1) (2, 1) (3, 2) (5, 3) (8,5) . . . Aangezien we weten volgens welke verhouding deze aantallen op den duur gaan optreden, is daarmee duidelijk geworden hoe groot de kans p is op een even getal. Die kans wordt gegeven door het verhoudingsgetal van Fibonacci: p » 0,618. In de formule (*) vullen we deze benadering in voor p en er komt ongeveer 0,882n uit. We noemen de coëfficiënt 0,882 de gemiddelde (of verwachte) groeifactor, te vinden door p = ½ (-1+Ö5) in te vullen: ½.(3-2.½(-1+Ö5)) = 2-½Ö5; zie het vervolg. De verwachting is dus dat de getallen op den duur gemiddeld ongeveer 12% kleiner worden na elke tussenstap. Waarmee we dicht bij een bevredigende verklaring van het 3n+1 raadsel gekomen zijn. De verwachte gemiddelde groeifactor 2-½Ö5 » 0,881966 kwam er prachtig uitrollen, toen ik naar de virtuele TI-83 greep (die op mijn modale PC ongeveer 12 keer zo snel rekent als de TI83 SE) en het volgende programmaatje intypte. Na een kwartiertje stabiliseerde de groeifactor zich rond de 0,882. ClrHome 0üT:0üG:0üU Input "STARTGTAL?",N Lbl 0 NüM Lbl 1 U+1üU If fPart(M/2)=0 Then: M/2üM Else: 3M+1üM End If Mø1:Goto 1 G+(1/N)^(1/U)üG "G=GROEIFACTOR" T+1üT:Disp G/T N+1üN:0üU:Goto 0 Een nieuw probleem duikt op, als we starten met een veel grotere waarde van n. Het startgetal 1 miljoen leverde na 10 uur rekenen met de virtual TI-83 een groeifactor die tot rust kwam in de buurt van 0,890638, dat is 1% hoger dan voorspeld was (0,881966). Hoe groter de startwaarde, des te hoger de groeifactor. En bij lagere startwaarden is het net zo: tussen n=10 en n=300 loopt de groeifactor g op van ongeveer 0,75 naar 0,84. Waar kan dat aan liggen?
n 10 100 1000 1000000
g 0,75 0,80 0,88 0,89
Het lijkt erop dat p gemiddeld langzaam naar zijn limietwaarde r»0,618 groeit. Dat wordt duidelijk met een programmaatje dat het voortschrijdende gemiddelde van die verhouding t t1 t2 + + ... + n t t tn +1 pn = 2 3 n
Inventies 03/05/05
- 24 -
uitrekent: 0,5 ; 0,583 ; 0,589 ; 0,598 ; enzovoorts, waaruit blijkt dat na de eerste 10 termen pn pas boven 0,61 komt en na 100 stappen nog "slechts" op de waarde 0,6172 zit. OPGAVEN 5.
Toon aan dat het verband tussen het gemiddeld aantal stappen s en de startwaarde n beschreven kan worden door
s » 20 × 10 log n (neem p=0,61).
6.
(a) Ontbind de getallen 100 000, 100 001, 100 002 en 100 003 in priemfactoren. (b) Zelfde vraag voor de getallen 2´3´5´7´11´13´17´19 ± 1
7.
Onderzoek voor welke natuurlijke waarden van n £ 41 de uitdrukking 2 n - n + 41 een priemgetal oplevert.
8.
Het vermoeden van Goldbach (1690-1764) luidt, dat elk even getal (³ 4) op minstens één manier te schrijven is als som van twee priemgetallen. Een bewijs daarvoor is nimmer gevonden. Ermee verwant is het vermoeden dat elk oneven getal (³5) als de som van hoogstens drie priemgetallen (5=2+3; 7=2+2+3=2+5) kan worden geschreven. Kan elk oneven getal (³5) als de som van hoogstens drie verschillende priemgetallen beschreven worden? Formuleer je eigen vermoeden.
9.
Er is precies één roosterpunt in het eerste kwadrant (met positieve, gehele coördinaten) dat op de lijn 23x + 29y = 792 ligt. Welk punt is dat? Gebruik DIOFANT1.
10.
Bij de drietallen van Pythagoras: a + b = c . Als c-b=1 is geldt: a = 2c-1 Zo vind je (3,4,5), (5,12,13), (7,24,25) enz. Bewijs dit verband. 2 Bewijs ook, uitgaande van c-b=2, dat a = 4(c-1). Hieruit vind je o.a. (8,15,17) en (12,35,37).
Inventies 03/05/05
2
2
2
- 25 -
2
2.
Frequentie en kans
2.1
Gezond verstand?
De kansrekening kent veel verrassende uitkomsten. Het lijkt soms wel, of je te maken hebt met natuurkunde in plaats van wiskunde. Of erger: je gaat twijfelen aan "het" gezonde verstand. Dat zal je in het komende hoofdstuk vaak merken. De meest fundamentele controverse tussen theorie en praktijk is wellicht het experiment van de twee geldstukken. Werp met een euro. De kansen op kop of munt zijn ½, daarover kan geen twijfel bestaan. Werp tegelijk met twee identieke euro's en daar begint de eerste aarzeling. Wat is de kans op twee kop of twee munt? En wat is de kans op een kop en een munt? Het is heel goed mogelijk dat zelfs de meest onnozele beginneling het antwoord op deze vragen al weet, omdat hij of zij er al eerder over gehoord of gelezen had. Maar stel je eens voor dat je in de middeleeuwen leeft en de beschikking hebt over twee muntjes, een stuk papier en een ganzenveer en dat je over gezond verstand beschikt. Er zijn duidelijk twee antwoorden die overwogen moeten worden, samenhangend met het aantal mogelijkheden. En de hamvraag is of er drie dan wel vier mogelijkheden zijn. MODEL 1 K en K K en M M en M
MODEL 2 K en K K en M M en K M en M
Het eerste model is lijkt me het meest aantrekkelijk voor iemand met gezond verstand. De twee geldstukken immers zijn identiek, dus niet van elkaar te onderscheiden. De mogelijkheden K en M en M en K zijn dus ook niet van elkaar te onderscheiden, waarmee model 2 verworpen zou worden. Maar wacht eens. Als je de twee muntjes een verschillende kleur geeft of als je ze niet meer tegelijk, maar achter elkaar werpt, dan zijn ze in één klap wel van elkaar te onderscheiden! De rode van de groene of de eerstgeworpene van de tweede. Dat zou pleiten voor model 2. We gaan een keuze maken tussen de modellen en dat doen we met behulp van de randomgenerator A: randInt(0,1). Een uitkomst 1 staat voor kop, het aantal keren kop wordt geteld in L2 : randInt(0,1)+randInt(0,1)üK 1+L2(K+1)üL2(K+1)
Onderaan het scherm verschijnt een teller. Omdat het werpen te snel gaat voor het menselijk oog, tellen we om de tien worpen: If fPart(X/10)=0:Output(8,1,X).
Probeer KOPMUNT maar een paar keer uit met bijvoorbeeld 1000 worpen en je onzekerheid is voorgoed verdwenen: model 2 is het ware model!
Inventies 03/05/05
- 26 -
ClrHome: Disp "HOEVEEL" Disp "SIMULATIES:" Input S ClrHome {0,1,2}üL1:3üdim(L2) For(X,1,S) randInt(0,1)+randInt(0,1)üK 1+L2(K+1)üL2(K+1) If fPart(X/10)=0:Output(8,1,X) End Output(1,1,"{K,K}:") Output(2,1,"{K,M}:") Output(3,1,"{M,M}:") Output(1,8,L2(1)) Output(2,8,L2(2)) Output(3,8,L2(3)) Output(5,1,"FRACTIE {K,M}:") Output(6,1,L2(2)/S) Output(8,7,"SIMULATIES")
De meest sceptische lezer vraagt zich zelfs af, of de random functie wel te vertrouwen is. Zijn de random waarden wel uniform (gelijkmatig) verdeeld tussen 0 en 1 en zijn opvolgende randomwaarden wel onafhankelijk van elkaar? Verderop zullen we hier dieper op ingaan. OPGAVEN 11.
De functie rand(999) levert 999 randomgetallen x tussen 0 en 1. De TI-83 kan er maar maximaal 999 produceren. Ga experimenteel na hoe groot x is, de gemiddelde waarde van deze randomgetallen. Bepaal het gemiddelde absolute verschil tussen twee randomgetallen:
| x - y | = abs (rand - rand ) ; is dat hetzelfde als | x - y | ? En is 12.
x´ y = x´ y
? Met andere woorden: zijn de uitkomsten onafhankelijk van elkaar?
INTERMEZZO
Een enquêteur ondervraagt 100 mensen over het bezit aan huisdieren. Uit zijn aantekeningen blijkt later dat 30 een hond hebben en 18 daarvan ook nog een ander huisdier 37 een poes hebben en 22 daarvan ook nog een ander huisdier 23 een konijn hebben en 10 daarvan ook nog een ander huisdier 4 mensen vertelden, van alle drie de soorten (hond, poes, konijn) er minstens een in huis te hebben. Er werden geen andere soorten gemeld. De enquêteur is helaas vergeten bij te houden hoe vaak het voorkwam dat er geen huisdier aanwezig was bij de ondervraagden. Help hem even!
2.2
Uitkomstenverzamelingen
Als alle mogelijke uitkomsten van een (toevals-)experiment bij elkaar worden gezet zonder op de volgorde daarvan te letten, krijg je de uitkomstenverzameling (U). Alle uitkomsten (elementen, elementaire gebeurtenissen) zijn verschillend, hoewel ze soms niet van elkaar te onderscheiden zijn. Dat is geen tegenspraak. Denk aan een bak met een witte en drie identieke rode knikkers. De rode knikkers zijn niet van elkaar te onderscheiden, maar voor de uitkomstenverzameling zijn het verschillende elementen. Het is gebruikelijk de elementen van een verzameling tussen accolades {} weer te geven. Je kunt U noteren als {W, R1, R2, R3} maar ook bijvoorbeeld U = {R2, W, R1, R3}, de volgorde is immers niet van belang.
Inventies 03/05/05
- 27 -
Een ander voorbeeld. Bij het werpen met twee geldstukken, lettend op kop (K) of munt (M), is U = {(K,K), (M,M), (K,M), (M,K)}. De ronde haakjes geven aan dat daarbinnen de volgorde wél van belang is, zoals bij coördinaten: het punt (3,7) is een ander punt dan (7,3). Binnen accolades echter mogen de elementen door elkaar geschud worden. De ongeordendheid van een verzameling blijkt ook uit de definitie van gelijke verzamelingen. De verzamelingen A en B zijn gelijk aan elkaar (A=B) als elk element van A ook element van B is en omgekeerd elk element van B ook element van A is. Dit "in twee richtingen" toetsen van een eigenschap is kenmerkend voor bewijzen in de verzamelingenleer. Gebruikmakend van de symbolen Î voor "is een element van" of "ligt in" of "is lid van" en Þ voor "als … dan" staat er als definitie: A=B betekent: voor alle xÎA Þ xÎB en voor alle xÎB Þ xÎA. De "als dan en omgekeerd" symbolen kunnen samengetrokken worden tot Û hetgeen erg ondubbelzinnig maar typisch wiskundig wordt geformuleerd als "dan en slechts dan als": De verzamelingen A en B zijn gelijk dan en slechts dan als elk element van A element is van B en als elk element van B element van A is. Waaruit bijvoorbeeld volgt dat de verzamelingen {1,2,3} en {3,3,3,1,2} gelijk zijn. Enkele andere definities. A is een deelverzameling van B, notatie AÌB als voor alle xÎA Þ xÎB. Het complement van A, genoteerd als A', is de verzameling van alle elementen van U die niet tot A behoren. Kortweg geschreven als: A' = {xÎU | x Ï A}. De doorsnede van A en B is de verzameling van de elementen die in A en B liggen: AÇB = {xÎA | xÎB}; dit is hetzelfde als {xÎB | xÎA} want stel dat het niet zo was, dan zou er volgens de tweede definitie een element uit de doorsnede zijn dat niet in A ligt maar wel in A zou moeten liggen volgens de eerste definitie. Waarmee met een redenering uit het ongerijmde de gelijkwaardigheid is aangetoond. De vereniging AÈB is de verzameling van de elementen die in A of in B liggen met de aantekening dat het voegwoord of gelezen moet worden als en/of. De GR gebruikt hiervoor het woord or uit de logica (zie [2nd[TEST]). Dus AÈB = {x | xÎA or xÎB} De verschilverzameling A \ B of A – B is gedefinieerd als: {x | xÎA and xÏB)} = AÇB'. Het aantal verschillende elementen van A wordt genoteerd als #(A); de lege verzameling wordt genoteerd als Æ zodat #(Æ)=0.
Inventies 03/05/05
- 28 -
Verzamelingen laten zich prettig illustreren met Venn-diagrammen. doorsnede AÇB and
leeg AÇB=Æ uitsluitend
vereniging AÈB or
complement A' not
verschil A\B
óf óf (A\B) È (B\A) xor
Dan nog een paar voorbeelden met getallen. Stel dat de uitkomstenverzameling U = {0, 1, 2, 3, 4, 5, 6, 7, 8, 9} is en E = {0, 2, 4, 6, 8}; O = {1, 3, 5, 7, 9}; A = {0, 2} en B = {1, 2, 3, 4} dan geldt o.a.: EÌU, OÌU, AÌU, BÌU; AÌE; AÇB={2}, AÇE=A, AÇO=Æ, EÇO=Æ; AÈB={0, 1, 2, 3, 4}, AÈO={0, 1, 2, 3, 5, 7, 9}, EÈO=U; U\O = O' = E, U\E = E' = O, A\E =Æ, E\A = {4, 6, 8}; #(U)=10; #(E) + #(O) = # (EÈO). Deelverzamelingen A, B en C van een uitkomstenverzameling U hebben o.a. de volgende eigenschappen. PANORAMA
(1) (5) (7) (10) (12) (14) (16)
AÈÆ=A (2) AÇÆ=Æ AÈA=A (6) AÇA=A AÈA'=U (8) AÇA'=Æ AÈB = BÈA AÈ(BÈC) = (AÈB)ÈC AÈ(BÇC) = (AÈB)Ç(AÈC) (AÈB)' = A' Ç B'
(3) AÈU=U (9) (11) (13) (15) (17)
(4) AÇU=A
(A')' =A AÇB = BÇA AÇ(BÇC) = (AÇB)ÇC AÇ(BÈC) = (AÇB)È(AÇC) (AÇB)' = A' È B'
Deze stellingen zijn meestal gemakkelijk via een redenering te bewijzen. Daarbij moet vaak "heen" en "terug" een bewijs geleverd worden. Nemen we als voorbeeld stelling (15): AÇ(BÈC) = (AÇB)È(AÇC) Van links naar rechts. Een willekeurig element x van AÇ(BÈC) zal tot A en tot BÈC behoren, dus tot B of C. Dus x behoort tot A en B of tot A en C. Dus is x ook een element van (AÇB)È(AÇC).
Inventies 03/05/05
- 29 -
Van rechts naar links. Stel y is een element van (AÇB)È(AÇC). Dan hoort y tot AÇB of tot AÇC. Als y element is van AÇB dan behoort y tot A en B dus ook tot BÈC. Als y een element is van AÇC dan kan met een soortgelijke redenering aangetoond worden dat y element is van A en BÈC. De twee verzamelingen links en rechts van het gelijkteken zijn dus identiek. Straks, bij het bewijs van de uitgebreide somregel, zullen we verwijzen naar enkele van deze stellingen.
Muntje gooien De eenvoudigste uitkomstenverzameling waar nog wat aan te beleven valt, is de verzameling {0, 1}. Je kunt daarbij denken aan de twee mogelijkheden bij het werpen met een geldstuk: bijvoorbeeld 0 = "munt" en 1 = "kop". {M, K} zou ook kunnen, maar we geven hier de voorkeur aan een uitdrukking met getallen. Met getallen immers kan je berekeningen uitvoeren, met de letters M en K gaat dat niet zo best. Bij een "ideale" munt is de verwachting dat munt en kop (0 en 1) gemiddeld ongeveer even vaak voor zullen komen. In het volgende programmaatje gaan we dat simuleren. De letter T telt de worpen (met 100 tegelijk), de letter F (van frequentie) houdt bij hoe vaak er een 1 werd geworpen. De breuk F/T heet de fractie (denk aan fPart). KOPSTUK ClrHome:ClrList L1 Disp "WERPEN MET EEN" Disp "GELDSTUK EN" Disp "TELLEN VAN DE" Disp "FRACTIE KOP" Output(8,14,"==>") Pause :ClrHome 0üT:0üF Output(1,1,"AANTAL: ") Output(2,1,"FRACTIE: ") Lbl 0 100+TüT randInt(0,1,100)üL1:sum(L1)üK F+KüF Output(2,10," ") Output(2,10,round(F/T,4)) Output(1,9,T) Goto 0
Als je dit programma uitprobeert, ben je een simulatie van een experiment aan het uitvoeren. Afrondend op drie decimalen ontdekte ik dat mijn TI-83 Silver Edition pas na een paar minuten min of meer tot rust kwam op de verwachte gemiddelde waarde 0.500; dat valt nog behoorlijk tegen. De vierde decimaal heeft veel langer nodig. Zie het schermplaatje: na ongeveer 7 minuten en 30 000 worpen zoekt de vierde decimaal nog steeds naar rust. Een supercomputer kan heel wat meer decimalen aan. Je kunt afschatten dat pas na ongeveer vier miljoen worpen (eindelijk!) de derde decimaal redelijk betrouwbaar is. [ Voor de gevorderden: normalcdf(2002000,E99,2000000,1000)=0.02275) ] Vier miljoen worpen: als er elke seconde een keer geworpen werd en men ging daarmee zeven weken lang door, dag en nacht, dan pas zou men de derde decimaal een beetje kunnen vertrouwen. De conclusie is dat we uit experimenten nooit met zekerheid de conclusie kunnen trekken dat de fractie uiteindelijk (op den duur) exact 0,5 is. Je kunt immers niet oneindig vaak gooien. Men moet dus zoeken naar een bewijs. Maar elk bewijs is gebaseerd op een aantal axioma's. Een axioma is een stelling die we niet (kunnen of willen) bewijzen, een soort principe dus. De Rus Kolmogorov (19031987) is er in geslaagd een bewijs te geven voor, wat we noemen, de wet van de grote aantallen.
Inventies 03/05/05
- 30 -
Laten we in de volgende bladzijden Pierre-Simon Laplace (1749-1827) volgen, de Fransman die als eerste een model voor de waarschijnlijkheidsrekening opstelde. Na oneindig veel herhalingen zullen elementaire gebeurtenissen gemiddeld even vaak voorkomen. We veronderstellen dat de fractie dan overgaat in een kans. Een elementaire gebeurtenis (e) slaat op de elementen van de totaalverzameling. Uitgaande van een oneindige uitkomstenverzameling met n elementen: U = {e1, e2, e3, … , en} beschouwen we een deelverzameling A van U die we een gebeurtenis zullen noemen. Voor elke gebeurtenis AÌU definiëren we de kans als volgt:
P( A) =
# ( A) # (U )
Aangezien A een deelverzameling is van U en dus #(A) £ #(U) moet P tussen 0 en 1 liggen: 0 £ P(A) £ 1. Voor elkaar uitsluitende gebeurtenissen (verzamelingen met een lege doorsnede) geldt de somregel: P(AÈB) = P(A) + P(B) voor elk paar met AÇB=Æ We nemen deze eigenschap op als een axioma en bewijzen hem niet. De uitgebreide somregel echter, die ook geldig is voor niet gescheiden verzamelingen: P(AÈB) = P(A) + P(B) - P(AÇB) moet bewezen worden. En dat doen we met behulp van enkele hiervoor gegeven stellingen uit de verzamelingenleer. Het bewijs verloopt als volgt. (*)
AÈB = AÈ(B\A), immers: AÈB = (AÈB)ÇU (stelling 3) = (AÈB)Ç(AÈA') (stelling 7) = AÈ(BÇA') (stelling 14) = AÈ(B\A)
(**)
(B\A) È (BÇA) = B, want: (BÇA') È (BÇA) = B Ç (AÈA') (stelling 15) = B Ç U (stelling 7) = B (stelling 3)
Wat de kansen betreft geldt dus volgens het axioma en volgens (**): P(B\A) + P(AÇB) = P(B), want de doorsnede is leeg en AÇB = BÇA. Waarna uit (*) volgt dat P(AÈB) = P(AÈ(B\A)) = P(A) + P(B\A) = P(A) + P(B) - P(AÇB). Zonder in te gaan op de finesses (dat valt buiten het kader van dit boek) vermelden we de uiterst belangrijke productregel. Werp je bijvoorbeeld twee keer met een dobbelsteen dan mag aangenomen worden dat de uitkomst van de eerste worp niet van invloed is op de tweede worp. Omdat bij elk van de zes mogelijkheden van de eerste worp weer zes mogelijkheden voor de tweede worp horen, zijn er in totaal 6´6=36 mogelijkheden. De kans op een zes bij elke worp is 1/6. De kans om twee achter 1 1 1 elkaar een zes te gooien is dus = ´ ; waarmee de productregel geïllustreerd is: 36 6 6 Voor de onafhankelijke gebeurtenissen A en B geldt: P(A en B) = P(A)´P(B) Laten we ook dit principe als een gegeven accepteren. OPGAVE 13.
Creëer 400 randomgetallen in L1, 400 nieuwe randomgetallen in L2 en doe L1*L2->L3. Hoe kun je nu via de gemiddelde waarden de (on)afhankelijkheid van al deze random trekkingen experimenteel onderzoeken?
Inventies 03/05/05
- 31 -
2.3
Theorie en praktijk
Het wordt weer tijd voor een simulatie. De theorie moet uiteindelijk wel kloppen met de praktijk. We experimenteren met een gewone dobbelsteen (een kubus dus, waarvan we het bovenliggende ogenaantal met een D aangeven) en een viervlaksdobbelsteen (een regelmatig viervlak waarvan we het onderliggende getal met een V aangeven). Als je met beide stenen tegelijk gooit, zijn er in totaal 24 verschillende mogelijkheden. Bij elk van de zes mogelijkheden voor D (namelijk 1, 2, 3, 4, 5 of 6) zijn er voor V vier mogelijkheden (namelijk 1, 2, 3 en 4). De uitkomsten zijn onafhankelijk. Een elementaire gebeurtenis (de uitkomst van een worp) is bijvoorbeeld D=6 en V=4, te noteren als (6,4). Let op de ronde haakjes! Deze suggereren een bepaalde volgorde: eerst de 6 (voor de dobbelsteen) en dan de 4 (voor het viervlak). Al deze elementaire gebeurtenissen kun je overzichtelijk weergeven als punten met de coördinaten (D,V) in een roosterpatroon; de D-as horizontaal, de V-as verticaal. Deze puntenverzameling is U met #(U)=24. Bekijk daarin de volgende deelverzamelingen: A = {(D,V) | V³3} zijn alle gebeurtenissen met 3 of 4 als uitkomst van het viervlak. B = {(D,V) | D³5 } betreft alle uitkomsten waarbij de dobbelsteen 5 of 6 aanwijst. C = {(D,V) | D+V£5} bevat alle worpen met een totaal ogenaantal dat hoogstens 5 is. De uitkomsten van V en D zullen onafhankelijk van elkaar zijn, aangenomen dat de stenen niet aan elkaar vastzitten. De vraag is, of die onafhankelijkheid ook voor A, B en C geldt. De programma's ZESVIER1 en ZESVIER2 bootsen de gebeurtenissen A, B en C na en "meten" de kansen (d.w.z. de fracties) op A, B, C, hun doorsnede en vereniging. ZESVIER1
0üA:0üB:0üD:0üE For(N,1,2400) randInt(1,4)üX randInt(1,6)üY If Xù3:A+1üA If Yù5:B+1üB If Xù3 and Yù5:D+1üD If Xù3 or Yù5:E+1üE End
"VIERVLAK" "KUBUS" "DOORSNEDE" "VERENIGING"
ZESVIER2
0üA:0üB:0üD:0üE For(N,1,2400) randInt(1,4)üX randInt(1,6)üY If Xù3:A+1üA If X+Y÷5:C+1üC If Xù3 and X+Y÷5:D+1üD If Xù3 or X+Y÷5:E+1üE End
"VIERVLAK" "KUBUS" "DOORSNEDE" "VERENIGING"
Laten we deze uitkomsten eens op een rijtje zetten. Uit de volgende samenvatting blijkt (binnen een nauwkeurigheid van twee decimalen) goede overeenstemming tussen theorie en praktijk in ZESVIER1. Kennelijk kunnen we de definitie van Laplace, de uitgebreide somregel en de productregel vertrouwen, althans in dit beperkte experiment.
Inventies 03/05/05
- 32 -
De gebeurtenissen A en B zijn onafhankelijk, want de gewone dobbelsteen kan de viervlak dobbelsteen niet beïnvloeden. De productregel gaat in ZESVIER2 niet op, want de uitkomsten van V³3 en D+V£5 zijn duidelijk afhankelijk: de som van de ogenaantallen D+V is natuurlijk afhankelijk van het aantal ogen op het viervlak. Als V groot is zal D+V ook groter zijn dan gemiddeld. ZESVIER1
Kans P(A) = 12/24 = 0,50 p(B) = 8/24 = 0,33 P(A).P(B) = 0,17 P(A)+P(B)-P(A).P(B) = 0,66
Fractie f(A) = 1201/2400 = 0,50 f(B) = 784/2400 = 0,33 f(AÇB) = 393/2400 = 0,16 f(AÈB) = 1592/2400 = 0,66
Gelijk? ! ! ! !
f(A) = 1195/2400 = 0,50 f(C) = 1006/2400 = 0,42 f(AÇC) = 314/2400 = 0,13 f(AÈC) = 1887/2400 = 0,79
! ! ? ?
ZESVIER2
P(A) = 12/24 = 0,50 P(C) = 10/24 = 0,42 P(A).P(C) = 0,21 P(A)+P(C)-P(A).P(C) = 0,71
De verzameling D (doorsnede) is via het logische and ontstaan uit A en B (resp A en C); E is ontstaan via or. Het wekt dus geen verwondering dat het volgende precies uitkomt! (1) #(E) = #(A) + #(B) - #(D) dus (2) #(E) = #(A) + #(C) - #(D) dus
f(AÈB) = f(A) + f(B) - f(AÇB) f(AÈC) = f(A) + f(C) - f(AÇC) :
en
(1) 1592 = 1201 + 784 - 393 dus (2) 1887 = 1195 + 1006 - 314 dus
0,66 = 0,50 + 0,33 - 0,16 (na afronding) 0,79 = 0,50 + 0,42 - 0,13
Kan het nog sneller? Jazeker, de volgende truc is al eerder toegepast. Werk met 100 worpen tegelijk volgens randInt(1,4,100)üL1 en pas de logische voorwaarden toe op de lijsten. Hieronder zijn de resultaten van 10 000 simulaties (100´100) weergegeven. ZESVIER3
0üA:0üB:0üD:0üE For(N,1, 100) randInt(1,4,100)üL1 randInt(1,6,100)üL2 sum(L1ù3)+AüA sum(L2ù5)+BüB sum(L1ù3 and L2ù5)+DüD sum(L1ù3 or L2ù5)+EüE End ZESVIER4
0üA:0üB:0üD:0üE For(N,1,100) randInt(1,4,100)üL1 randInt(1,6,100)üL2 L1+L2üL3 sum(L1ù3)+AüA sum(L3÷5)+CüC sum(L1ù3 and L3÷5)+DüD sum(L1ù3 or L3÷5)+EüE End De tabel met frequenties kunnen we nu zelfs met goed fatsoen in drie decimalen geven:
Inventies 03/05/05
- 33 -
ZESVIER3
Kans P(A) = 12/24 = 0,500 P(B) = 8/24 = 0,333 P(A).P(B) = 0,167 P(A)+P(B)-P(A).P(B) = 0,666 P(A|B) = 0,5 P(B|A) = 0,333
Fractie f(A) = 0,497 f(B) = 0,335 f(AÇB) = 0,167 f(AÈB) = 0,665 f(AÇB)/f(B) = 0,499 f(BÇA)/f(A) = 0,336
Klopt? ! ! ! ! ! !
f(A) = 0,504 f(C) = 0,416 f(AÇC) = 0,126 f(AÈC) = 0,793 f(AÇC)/f(C) = 0,303 f(CÇA)/f(A) = 0,250
! ! ? ? ! !
ZESVIER4
P(A) = 12/24 = 0,500 P(C) = 10/24 = 0,417 P(A).P(C) = 0,208 P(A)+P(C)-P(A).P(C) = 0,709 P(A|C) = 0,300 P(C|A) = 0,250
De uitroeptekens staan voor bevestiging van de theorie. Op de vraagtekens komen we later terug. In ieder geval is duidelijk dat de productregel niet werkt bij afhankelijke gebeurtenissen. De onderste twee regels betreffen voorwaardelijke kansen. P(A|B) is de notatie voor de kans op A onder de voorwaarde dat B geldt. Definitie: P ( A | B ) =
# ( A Ç B ) P( A Ç B ) = # ( B) P( B )
Uit de plaatjes hiervoor leid je gemakkelijk af wat die voorwaardelijke kansen in theorie zijn. Eén voorbeeld: P ( A | C ) =
3 = 10
3
24
10
= 0,3
24
Ook hier is er overeenstemming tussen de theorie en de praktijk. PANORAMA # ( A) # (U ) Voor elkaar uitsluitende gebeurtenissen geldt: P(A of B) = P(A) + P(B) Uitgebreide somregel: P(A en/of B) = P(A) + P(B) - P(A en B) Voor onafhankelijke gebeurtenissen geldt: P(A en B) = P(A)´P(B) Complement: P(A) + P( not(A) ) = 1 # ( A Ç B) P( A Ç B) = Kans op A onder voorwaarde B: P ( A | B ) = # ( B) P( B)
Kansdefinitie van Laplace: P ( A) =
Inventies 03/05/05
- 34 -
Combinaties Op hoeveel manieren kun je van (0,0) naar (2,4) bewegen in gehele stapjes naar rechts (positieve X-richting) of omhoog (positieve Y-richting)? Getekend is de route (0,0) ® (0,1) ® (0,2) ® (1,2) ® (1,3) ® (1,4) ® (2,4). De letters X en Y gebruikend kan dit sneller genoteerd worden als YYXYYX en nu is de vraag, hoeveel rangschikkingen er mogelijk zijn van de letters XX YYYY. Met genummerde letters staat er: X1X2 Y1Y2Y3Y4. Op de eerste plek kan gekozen worden uit 6 tekens, bij elk van die keuzes zijn er 5 mogelijkheden voor de volgende plek en zo door. In totaal dus 6.5.4.3.2.1 = 6! rangschikkingen. Echter zijn veel van die mogelijkheden hetzelfde omdat de letters niet genummerd zijn. Zo is Y1X1X2Y4Y2Y3 niet te onderscheiden van Y3X2X1Y4Y2Y1. De 2 letters X zijn op 2! manieren te ordenen, de 4 letters Y op 4! manieren. Het totaal aantal routes van (0,0) naar (2,4) is dus 6! 6.5.4.3.2.1 = = 15 ; 2! 4! 2.1.4.3.2.1
dit noemt men de combinaties van 2 uit 6. Op de TI-83 worden de combinaties in dit geval berekend met MATH 6 nCr 2. Stel dat de kans op een stapje naar rechts p is en de kans op een stapje omhoog q (dus p+q=1) dan is de waarschijnlijkheid om vanuit (0,0) in (2,4) terecht te komen: P (2,4) =
6! 2 4 . p .q ; 2! 4!
zo ontstaat de binomiale kansverdeling. In het geval dat p = q = 0,5 is de uitkomst P ( 2,4) = 15.0,56 =
15 64
We gaan nu over op een toevalswandeling. Op de lijn x + y = 6 liggen de roosterpunten waarvoor in totaal 6 keer een aselecte (random) keuze tussen X of Y moet worden gemaakt. De aantallen routes staan hier aangegeven, de bijbehorende kansen zijn: P(0,6)=P(6,0)= 641 ; P(1,5)=P(5,1)= 646 ; 20 P(2,4)=P(4,2)= 15 64 ; P(3,3)= 64
Dit binomiale kansproces is op een bekende manier zichtbaar te maken met het spijkerbord van Galton. Maak spijkers op de plaats van de roosterpunten, draai het bord zo, dat het spijkertje (0,0) bovenaan komt en laat een groot aantal knikkers van bovenaf naar beneden stuiteren. Als alles mooi symmetrisch en horizontaal is opgesteld is de kans op linksaf even groot als de kans op rechtsaf en ontstaat een ongeveer symmetrisch histogram patroon. In het vorige plaatje kun je de dikke stippen op de lijn beschouwen als de verzamelbakjes van het spijkerbord. Kijk even naar het (helaas vierkante) knikkertje dat vlak boven de tweede spijker zweeft en moet kiezen tussen linksaf of rechts af. Een knikker die 6 keer linksaf geslagen is (linksaf, gezien door de ogen van de lezer, rechtsaf vanuit het gezichtspunt van het knikkertje) komt in opvangbakje nummer 0 terecht. Het simulatieprogramma dat de binomiale verdeling illustreert laten we achterwege. Er is een vertragingsfactor U ingebouwd (anders kun je de vallende knikkers nauwelijks met het blote oog volgen). De kernregels van het programma zijn gemarkeerd.
Inventies 03/05/05
- 35 -
OPGAVE 14.
Vergelijk de hierboven gevonden aantallen met de theoretisch verwachte aantallen. Gebruik binompdf.
De driedimensionale uitbreiding van het binomiale kansexperiment heet trinomiaal. Bekijken we als voorbeeld de wandeling van (0,0,0) naar (4,5,3) via 2 stappen omhoog, 4 stappen naar voren, 3 naar rechts, 1 omhoog en 2 naar rechts. Symbolisch: 12 stappen in de volgorde ZZXXXXYYYZYY. Hoeveel verschillende wegen leiden naar het punt (4,5,3)? Kies er één speciale volgorde uit bijvoorbeeld: XXXX YYYYY ZZ. Net als in het tweedimensionale geval realiseren we ons dat het totaal aantal rangschikkingen gelijk is aan 12!, dat de X'en op 4! manieren, de Y'en op 5! manieren en de twee Z'en op 2! manieren gerangschikt kunnen worden zonder dat dat tot een ander resultaat zou leiden. De conclusie moet zijn dat het aantal routes gelijk is 12! aan . 4! 5! 3! Zijn de kansen op een stapje in de x-, y- en z-richting respectievelijk p, q en r (met p+q+r=1) dan kan de kans dat een knikkertje in een denkbeeldig driedimensionaal spijkerbord in het vakje (4,5,3) terechtkomt geschreven worden als: 12! . p 4 .q 5 .r 3 . 4! 5! 3! Uitgaand van gelijke kansen in de drie richtingen wordt dit: P (4,5,3) =
12! 1 4 1 5 1 3 . . . » 0,05216 4! 5! 3! 3 3 3
Voor de controle van deze theorie via een simulatie moeten we een kleiner aantal stappen nemen, om te voorkomen dat ons eenvoudige rekenapparaat urenlang moet blijven rekenen. We gaan uit van slechts vier stappen en gelijke kansen in de drie richtingen. Ons virtuele driedimensionale spijkerbord is dan de gelijkzijdige driehoek die hier getekend is in het vlak met vergelijking x+y+z=4. De dikke stippen stellen weer de opvangbakjes voor. In het binnengebied van de driehoek liggen de bakjes (2,1,1), (1,2,1) en (1,1,2). Het aantal wegen 4! naar die punten is = 12 en de kans daarop is 1!1!2! 12 4 12. 1 3 = » 0,148 . 81 4
Om gehele verwachtingswaarden te krijgen is een veelvoud van 3 (dus van 81) handig. Gekozen is voor 810 simulaties. De verwachting is dan dat de drie aangegeven punten {1,1,2} = ((1,1,2), (1,2,1), (2,1,1)} ongeveer 3´120 keer een knikker opvangen. De punten aan de buitenrand van de driehoek zullen naar verwachting ongeveer 3´10, 6´40 en 3´60 keer geraakt worden. Het experiment levert dit keer een verbluffend resultaat (rechts), haast te mooi om waar te zijn. Als je zo'n uitslag ziet, wees dan op je hoede! Inderdaad, tegen mijn gewoonte heb ik dit keer gesjoemeld (net zolang uitgeprobeerd tot het resultaat me beviel).
Inventies 03/05/05
- 36 -
Met twee dobbelstenen (kijkend naar de som van de ogen) Deze simulatie is al eerder aangestipt. We geven nu de kern van een programma dat sneller werkt. Het nadeel daarvan is dat je tussentijds de uitkomsten van de worpen niet kunt zien. Er wordt namelijk 500 keer tegelijk geworpen met de twee dobbelstenen. Eén ronde van 500 worpen kost ongeveer 16 seconden op de TI-83 SE (de gewone TI-83 werkt ongeveer twee keer zo traag). Het voordeel van deze methode is dat je binnen een redelijk tijdsbestek een erg fraai resultaat krijgt. De theorie. Op hoeveel manieren krijg je een som acht? De "gunstige" gebeurtenissen met X+Y=8 ( (6,2) t/m (2,6) ) kunnen we aangeven in een roosterpatroon van 6 bij 6. Zo wordt, bijvoorbeeld, de kansberekening P(X+Y=8) geïllustreerd en het antwoord 5/36 onmiddellijk begrepen. We verwachten dus ongeveer 3000×5/36 = 417 keer som acht na 3000 worpen. DOB2SNEL seq(X,X,1,12)üL1 For(J,1,N) randInt(1,6,500)+randInt(1,6,500)üL3 For(I,1,12) L2(I)+sum(L3=I)üL2(I) End End
In de vijfde regel wordt er, iedere keer als L3=I waar is (dus de waarde ervan 1 is) 1 bij sum(L3) opgeteld. Aldus sommeer je de gunstige uitkomsten in L2(I).
Drie dobbelstenen Het toevoegen van een enkele dobbelsteen compliceert de theoretische zaak aanmerkelijk. Kijken we bijvoorbeeld naar het geval dat het ogentotaal van de drie dobbelstenen negen is: x+y+z=9 {1,2,6} heeft {1,3,5} heeft {1,4,4} heeft {2,2,5} heeft {2,3,4} heeft {3,3,3} heeft Totaal:
Inventies 03/05/05
3!= 3!= 3!=
6 rangschikkingen 6 rangschikkingen 3 rangschikkingen 3 rangschikkingen 6 rangschikkingen 1 rangschikking ---- + 25 rangschikkingen
- 37 -
Het totaal aantal mogelijkheden is 6´6´6=216 dus P(x+y+z=9) = 25/216 = 0.11574 Het is erg moeilijk om daar een model voor te vinden. Tot en met een som s=8 verloopt het aantal mogelijkheden volgens de rij ½(s-1)(s-2) maar daarna klopt die formule niet meer. Echter ... Wie niet slim is moet sterk zijn. We laten de rekenmachine het werk voor ons doen. Hij krijgt de opdracht domweg alle mogelijkheden te onderzoeken in drie "geneste" for-lussen. Zie het programmadeel van DOB3THEO. S is de som van de ogen, T is de teller. In L2 komen de verwachte frequenties, voor de kansverdeling moet je L2 nog door 216 delen. DOB3THEO 0üT For(S,3,18) For(X,1,6) For(Y,1,6) For(Z,1,6) If X+Y+Z=S:T+1üT End:End:End Output(1,5,S) TüL2(S-2):0üT End
Het programma DOB3PRAK is gemakkelijk te construeren, na DOB2SNEL. Ik geef alleen het fundament en de schermplaatjes na 50´216 simulaties. For(J,1,N) randInt(1,6,216)+randInt(1,6,216)+randInt(1,6,216)üL3 For(I,3,18) L2(I-2)+sum(L3=I)üL2(I-2) End End
Meer munten Het programma MUNTEN simuleert het werpen met maximaal vijf geldstukken. Je kunt de teller "aantal kop" zien lopen tijdens de simulatie.
Inventies 03/05/05
- 38 -
Pascal en Chevalier de Meré Het meningsverschil tussen Pascal en Chevalier de Meré. Ridder Chevalier de Méré (eind 17de eeuw) wedde met succes dat hij in 4 worpen met een dobbelsteen minstens één zes zou gooien (spel A). De kans daarop is namelijk ietsje groter dan 0,5 (ongeveer 0,5177) terwijl zijn simpele verwachting 4. 1 6 = 2 3 was. Ook probeerde hij spel B uit: na 24 worpen met twee dobbelstenen hoopte hij minstens één dubbelzes te gooien met dezelfde kans (volgens dezelfde simpele redenering: 24. 1 36 = 2 3 ). Het verhaal gaat dat tot de Méré's teleurstelling en woede (na uitgebreid experimenteren) bleek dat de kans op succes in spel B iets kleiner dan 0,5 was. De wiskundige Pascal toonde dit aan en ontwikkelde zo een van de eerste kansmodellen. De kansen op minstens één zes kunnen we bepalen met de complement regel. In TI-83 taal: 1 - binompdf(4,1/6,0) » .5177 voor A en 1 - binompdf(24,1/36,0) » .4914 voor B
Ook met de kans op precies één (dubbel)zes kom je niet op ongeveer ½ en al helemaal niet in de buurt van 2 3 uit: binompdf(4,1/6,1) » .3858: binompdf(24,1/36,1) » .3488 Als je het eindeloze werpen van De Meré simuleert, begint de conclusie zich op te dringen dat het hoogst onwaarschijnlijk is dat hij voldoende tijd en uithoudingsvermogen had om het kleine verschil tussen kansA en kansB experimenteel aan te tonen. Iemand heeft de geschiedenis dus een beetje aangedikt. Een schatting. Hoe vaak moet je (bij kansB = 0,4914) 24 keer met twee dobbelstenen gooien, om met (zeg) 95% zekerheid te kunnen constateren dat het gemiddelde m kleiner is dan 0,5? Gebruikmakend van m = np en s = Ö(np(1-p)) » Ö(n.½.½) = ½Ön en uitgaand van z=invNorm(0.05)=-1.645 komt er volgens de regels van het toetsen: (0,5n-0,4914n) = 1,645.0,5Ön waarvan de oplossing is n>9091. [Of, geheel in TI stijl via MATH 0: 0=normalcdf(-E99,.4914N,.5N,.5Ö(N))-.05 ] Alleen al om met redelijke zekerheid te constateren dat kansB<0,5 is moet je dus minstens 9000 keer gooien; en dan is er nog dat andere experiment (kansA=0,5177)! Stel dat De Meré 10 keer per minuut wierp met een paar dobbelstenen (hij was ook tijd kwijt met het noteren, met een ganzenveer, ballpoints zijn pas na 1960 in zwang gekomen) en dat 24 keer, dan moet hij voor 9000 experimenten in totaal minstens 40 uur bezig geweest zijn. Waar verslaving al niet toe kan leiden... OPGAVE 15.
Reken uit hoeveel keer er minstens geworpen moet worden met een geldstuk, om met 95% waarschijnlijkheid te kunnen besluiten tot p = 0,50 op twee decimalen nauwkeurig. Ga dus uit van 0.495 < p < 0.505.
PASCMERE For(I,1,100) randBin(4,1/6)üP If P>0:A+1üA randBin(24,1/36)üQ If Q>0:B+1üB Output(1,9,I) Output(4,4,A) Output(5,4,B) End
Inventies 03/05/05
- 39 -
Het vaasmodel Eerst de theorie. Gegeven: in een vaas liggen z zwarte en w witte knikkers (totaal z+w=n). Hieruit wordt m keer aselect een knikker gepakt: daarvan zijn x zwart. æ mö z w MET terugleg is de kans daarop çç ÷÷. p x .q m - x met p = en q = z+w z+w è xø Dit is het binomiale model binompdf(m,p).
æzöæ w ö çç ÷÷.çç ÷ x ø è m - x ÷ø è ZONDER terugleg is de kans ; het hypergeometrische model. æ z + wö çç ÷÷ è m ø Z zwarte en W witte knikkers (samen N knikkers) zitten in de vaas; er worden P knikkers uit gepakt. X is het aantal getrokken zwarte knikkers (het aantal succesen); X loopt van 0 tot P. Er zijn S simulaties.
Hier volgt de simulatie waarbij getrokken wordt MET teruglegging. Het aantal getrokken zwarte knikkers komt in L2; de theoretische kansverdeling komt in L3. For(J,1,S) 0üX For(I,1,P) randInt(1,N)üR If randInt(1,N)÷Z:X+1üX End L2(X+1)+1üL2(X+1) Output(8,1,J) End round(S*binompdf(P,Z/N),0)üL3
En hier komt de trekking ZONDER teruglegging. XüN:YüM For(J,1,S) For(I,1,P) If randInt(1,N+M)÷N
"ZWARTE GEPAKT ZONDER TERUGLEG"
Then N-1üN:T+1üT Else M-1üM End End
Inventies 03/05/05
- 40 -
L2(T+1)+1üL2(T+1) XüN:YüM:0üT Output(8,1,J) End For(K,0,P) (X nCr K)((Y nCr (P-K))/((X+Y) nCr P)üQ round(SQ,0)üL3(K+1) End
"THEORIE"
OPGAVEN 16.
Trek n knikkers tegelijk uit een vaas met 1 zwarte en 99 witte knikkers. Bereken de kans dat de zwarte knikker er bij zit. Simuleer dit met n=37.
17.
In één van 10 dozen zit een geldprijs. Tien deelnemers moeten om de beurt een doos openen, tot iemand de prijs gewonnen heeft. Wat is de gunstigste positie: als eerste deelnemer een doos openen of als laatste? Of maakt het niet uit? Simuleer de keuze dat je als laatste een doos wilt openen met het programma VAASMODL. Wat is (na bijvoorbeeld 100 simulaties) de kans dat je 9 voorgangers allen gefaald hebben zodat de prijs in het laatste, door jou nog te openen doosje zit?
Balletjes in bakjes leggen Bekeken wordt de kansverdeling van M balletjes die in N bakjes worden geplaatst. Het spiegelbeeld van trekken met terugleg is het plaatsen zonder terugnemen. Het wekt dan ook geen verwondering dat we in het laatste geval te maken hebben met een binomiale verdeling met de inverse kans P = 1/N, als N het aantal bakjes is waarin de balletjes geplaatst worden. Neem, om dit verder te verduidelijken, bijvoorbeeld vier balletjes (M=4) die aselect in twee bakjes (N=2) geplaatst worden. X is het aantal balletjes in een willekeurig bakje. Hoe groot is de kans dat er respectievelijk 0, 1, 2, 3, 4 balletjes in terechtkomen? P(X=0) is de kans dat er geen balletje in komt. 4 Die kans is ½.½.½.½ = (½) = 1. 116 P(X=1) vinden we door te bedenken dat één van de vier balletjes uitverkoren wordt en de andere drie niet. Er zijn vier mogelijkheden om uitverkoren te worden (want er zijn vier balletjes). Dus P(X=1) = 4. 1 2 .( 1 2 ) 3 = 4. 116 Vervolgens. Hoeveel combinaties van twee uitverkoren balletjes uit vier zijn er? Het woord verraadt 4! de uitkomst. Er zijn = 6 combinaties. 2!.2!
Inventies 03/05/05
- 41 -
Dus P(X=2) = 6. 1 2 2 . 1 2 2 = 6. 116 ; Verder nog P(X=3) = 4. 116 en P(X=4) = 1. 116
1
234
12
34
2
134
13
24
3
124
14
23
4
123
23
14
24
13
34
12
1234
Herken de binomiale verdeling! Als het gaat om M balletjes in N vakjes dan is de succeskans p = 1/N (want alle bakjes hebben een even grote kans, ze worden immers aselect gevuld) en er moeten X combinaties gemaakt worden (X = 0, 1, 2, …, M). De verwachtingswaarde van X wordt dus berekend met binompdf(M,1/N,X). BALINBAK 0üP ClrAllLists seq(X,X,1,N)üL1 For(K,1,S) ClrList L2:Nüdim(L2) For(X,1,M) randInt(1,N)üJ L2(J)+1üL2(J) End max(L2)üQ If Q>P:QüP P+1üdim(L3) P+1üdim(L„) seq(X,X,0,P)üL3 For(L,0,P) L„(L+1)+sum(L2=L)üL„(L+1) End Output(6,12,K) End
"S SIMULATIES" "BAL NR.X IN BAKJE J OPGETELD"
"IN L4 DE BAKJES MET L BALLEN" "K = SIMULATIENR."
Pause:ClrHome Disp L3 ,L 4 Pause
De laatste regels zijn toegevoegd om tussentijds te laten zien hoe vaak er 0, 1, 2, 3 of 4 balletjes in een bakje komen. Op het schermplaatjes hierboven is dat te zien na 100 simulaties. Hierna wordt aangegeven in L2 welke fractie van de ballen in een willekeurig bakje terechtgekomen is. Hoe fraai de fracties in L2 (altijd volgens het toeval) kloppen met de theoretische kansverdeling in L3 zie je bij de rest van het programma:
Inventies 03/05/05
- 42 -
L„/(SN)üL„ For(X,0,P) binompdf(M,1/N,X)üL…(X+1) End ClrList L1,L2 L3üL 1 :L„üL2:L…üL3 ClrList L„,L…:ClrHome
"FRACTIE" "THEORIE"
Als er 50 balletjes over 100 vakken verdeeld worden ontstaat (omdat n groot is en p klein) bij benadering een Poissonverdeling met p=0.01 en n=50 dus gemiddelde m=0.5. In formule: P ( x = k ) =
m k -m ×e k!
Series nullen en enen Als een rij enen en nullen (denk aan worpen met een geldstuk) gesimuleerd wordt, valt op dat er nogal wat lange rijen gelijke uitkomsten (series) bij zijn. Het volgende programma telt de series met gelijke lengte. De kans op een L+1 serie met lengte L is ½ . Dat is eenvoudig in te zien. Een serie met L=5 verschijnt als MKKKKKM of KMMMMMK. Noem de i-de uitkomst u i, dan is bij een serie met lengte L: P(u i-1 ¹ u i) = ½ ; P(u i = u i+1) = ½ ; P(u i+1 = u i+2) = ½ … P(u i+L-1 ¹ u i+L) = ½. L+1 Uitgaande van de onafhankelijkheid van alle worpen krijg je zo het product ½ . Hierbij is geen L rekening gehouden met de randen van de hoofdrij. De eerste serie namelijk heeft kans ½ en het laatste stuk van de rij kan geen serie meer bevatten. Vandaar dat we de series halen uit een oneindige rij. Aangezien de lijsten veel geheugenruimte opslokken, beperken we ons tot 512 simulaties die tijdelijk in L3 worden opgeslagen: randInt(0,1,512)üL3 . Begin met serielengte L=1. De voorafgaande redenering volgend, wordt gezocht naar opvolgend gelijke uitkomsten: If L3(X)=L3(X+1)
Als dat het geval is, wordt de lengte van de serie (L) met 1 verhoogd: L+1üL Zoniet, dan wordt L weer op 1 gezet. Aan het eind wordt L3 schoongeveegd, om plaats te maken voor L+1 de theoretische verwachting 512 . ½ : {128,64,32,16,8,4,2,1,.5,.25,.125}üL3
Inventies 03/05/05
- 43 -
SERIESIM 1üL seq(X,X,1,15)üL1 Output(7,1,"WORPNR.:") For(X,1,511) Output(8,1,X) If L3(X)=L3(X+1) Then L+1üL Else L2(L)+1üL2(L) 1üL End End L2(L)+1üL2(L)
Omdat het turven nogal snel gaat, is het verleidelijk om meerdere runs van 512 simulaties uit te voeren en pas daarna naar het totaal gemiddelde te kijken. Volgens de wet van de grote getallen lijken de frequenties steeds meer op de door de theorie verwachte waarden. Je kunt voor 100 runs van 512 worpen beginnen met: ClrAllLists For(R,1,100) 512üdim(L3 )
…. End
waarna de frequenties gecumuleerd (gestapeld) in L2 komen. De theoretische waarden moeten dan met 100 vermenigvuldigd worden. In de eerste sessie van 512 worpen kwam een recordlengte voor van 14 enen en dat record werd niet meer verbeterd in de negenennegentig sessies daarna.
2.4
Het versterkte toeval
Van kop af winnen Met toevalsprocessen gaat het anders dan bij de eindsprint van een wieleretappe. Wie in de statistiek aan kop ligt, blijft aan kop (in het algemeen). Stel we werpen twintig keer met een muntje. Als het gemiddelde begint met de waarde 1 (eerste worp) dan zal in het algemeen het voortschrijdend gemiddelde van bovenaf de ½ naderen. Hoe komt dat? Veronderstel dat je eerste worp een 1 was, gemiddelde dus 1. Na de tweede worp is de verwachting van het gemiddelde gedaald tot het gemiddelde van 1 en ½ is 0,75; na de derde worp tot 2/3 » 0,67. Bekijken we het gemiddelde na 4 worpen, dan is de verwachting dat het gemiddelde 0,625 zal zijn. Kijk maar: eerste tweede derde vierde worp 1 1 1 1 1 1 1 0 1 1 0 1 1 1 0 0 1 0 1 1 1 0 1 0 1 0 0 1 1 0 0 0
gemiddelde 1 0,75 0,75 0,5 0,75 0,5 0,5 0,25
Totaal gemiddelde 0,625 (optellen en door acht delen).
Inventies 03/05/05
- 44 -
AANKOP For(X,1,S) Output(3,12,X) randInt(0,1,20)üL1 cumSum(L1=0)üL2 cumSum(L1=1)üL3 sum(L2ùL3)üI L„(I+1)+1üL„(I+1) End
Het vaasmodel van Pólya Het vaasmodel (urn model) van Pólya beschrijft het volgende. In een vaas zit één rode en één witte knikker. Pak er een uit, leg die weer terug en voeg een knikker van dezelfde kleur toe. Herhaal dit. Wat gebeurt er met de verhouding rood/wit in de vaas na een groot aantal trekkingen? Je zou drie eindsituaties kunnen verwachten: (1) ten slotte zijn er vrijwel 100% rode (of witte) knikkers in de vaas (2) de evenwichtssituatie zit op één waarde tussen de 0 en 100% (bijv 50%-50%) (3) de situatie blijft instabiel Verrassend genoeg voorspelt geen van deze drie opties de werkelijkheid! De vierde, juiste optie is: (4) Er komt uiteindelijk een evenwicht, maar je kunt niet voorspellen in welke verhouding rood/totaal het evenwicht bereikt wordt. Dit Polya proces komt heel wat vaker voor in de praktijk dan je zou denken. Bij koersschommelingen op de beurs bijvoorbeeld, of bij de natuurlijke selectie (genetische drift) blijkt dat kleine toevalstreffers in het begin van grote invloed zijn op het eindresultaat door dit principe van de positieve, versterkte terugkoppeling. Een bekend voorbeeld is dat van de eerste video-recorders. Aanvankelijk waren er gelijktijdig twee gelijkwaardige en even dure types (VHS en Betamax). Om onverklaarbare redenen (beter: door onverklaarbare oorzaken) nam het type VHS in het begin een kleine voorsprong, waarna Betamax uit de markt verdween. Niet door een kwaliteitsverschil of prijsverschil, maar door het versterkte toeval.
PROPOLYA Lbl 0 AüR:BüW:R+WüN For(J,1,100) For(I,1,P) R/NüS If rand<S Then R+2üR Else W+2üW End N+2üN End Pt-On(J,S) End Goto 0
Inventies 03/05/05
- 45 -
Genetische drift Als een kleine populatie zich voortplant in een geïsoleerde situatie (op een eiland bijvoorbeeld), zullen kleine genetische veranderingen (mutaties) zich versterkt en versneld ontwikkelen. Onder die voorwaarden is de vorming van nieuwe soorten waarschijnlijker dan in gewone omstandigheden. Dat heet genetische drift. We gaan in het programma GENDRIFT uit van een startwaarde p = 0,5 en veranderen die geleidelijk aan door bij iedere stap (X+1->X stelt een nieuwe generatie voor) een verandering in p aan te brengen (volgens binomiaal toeval) die omgekeerd evenredig is met de grootte van de populatie (N): randBin(N,P)/N. Zie hoe na 100 generaties bij een kleine startpopulatie N=3 de eindtoestanden ver uiteen liggen (de nieuwe soorten); en zie hoe bij de relatief grote populatie N=20 de eindtoestand zich stabiliseert rond één constante p-waarde » 0,5. Vergelijk deze onverwachte en verrassende plaatjes met die van de twee vorige programma's AANKOP en PROPOLYA. De kern van dit programma is simpel: GENDRIFT Lbl A randBin(N,P)üT X+1üX:S+T/NüS:S/XüY line(A,B,X,Y) YüP:XüA:YüB If X<100:Goto A
2.5
Wanneer verwacht je succes?
In een vaas liggen 10 knikkers, 8 rode en 2 witte: {R,R,R,R,R,R,R,R,W,W}. Hieruit wordt aselect een aantal keren een knikker gepakt met teruglegging. De kans op een witte knikker is p, de kans op een rode knikker is q = 1-p. In dit voorbeeld dus p = 0,2 en q = 0,8. De verwachtingswaarde van een gebeurtenis is al eerder ter sprake gekomen. Daarvoor moet je alle voorkomende waarden met hun kans vermenigvuldigen en optellen: S(xi.pi). Na hoeveel trekkingen (gemiddeld) verwachten we voor het eerst een witte knikker? Het aantal pogingen (trekkingen) noemen we xi = 1, 2, 3 … De verwachtingswaarde van het gemiddeld aantal pogingen X is als volgt opgebouwd. Als je direct succes hebt (na de eerste poging al een witte getrokken hebt) is xi.pi gelijk aan 1´0,2; voor het daarop volgende succes zijn er X+1 pogingen nodig (dus: de eerste keer nog geen succes, daarna verloopt het volgens de verwachting X pogingen later) en komt er 0,8.(X+1) bij. In formule: X = S(xi.pi) = 1.0,2 + 0,8.(X+1) waaruit X opgelost kan worden: X = 0,2 + 0,8X + 0,8 dus 0,2X = 1 en X =
1 = 5. 0,2
In het algemeen (met een succeskans p in plaats van 0,2 en q = 1-p) krijg je X = 1.p + q.(X+1) uitgewerkt tot X = p + qX + q en (1-q)X = p+q. 1 Omdat p+q=1 is kun je hiervoor schrijven: p.X = 1 en X = p
Inventies 03/05/05
- 46 -
De verwachtingswaarde van het gemiddeld aantal pogingen is dus het omgekeerde van de succeskans. Dat is natuurlijk nog zo gek niet. Als je met een dobbelsteen gooit (kans op een zes (succes) is 1/6), dan is het te verwachten aantal worpen voordat je 1 een zes gooit = 6 . Dat controleren we met de TI-83 via: 1
6
sum(randInt(1,6,999)=6)/999. Het gemiddeld aantal pogingen is dus
ongeveer 0,16 à 0,17: goed in overeenstemming met 1/6 » 0,167. OPGAVE 18.
Terug naar de vaas met tien knikkers. Noemen we het trekken van een rode knikker succes (p = 0,8) dan geldt evenzeer dat het verwachte aantal trekkingen 1/p is, dus verwachten wij gemiddeld 1/0,8 = 1,25 pogingen voordat een rode knikker getrokken wordt. Controleer dit een aantal keren met rand(999)<.8. Met rand<.8 worden toevalsgetallen tussen 0 en 0,8 geproduceerd om het trekken van een rode knikker te simuleren.
Wanneer is de verzameling compleet? Een dobbelsteen wordt geworpen. Na hoeveel pogingen (gemiddeld) zijn alle zes de mogelijkheden aan de beurt geweest? Met andere woorden: wanneer is de verzameling {1, 2, 3, 4, 5, 6} compleet? Gebruikmakend van het voorafgaande kunnen we het volgende stellen. Noem een geschikte worp een worp die nog niet aan de beurt geweest is. Noem de wachttijd van een worp het gemiddeld aantal nodige worpen voordat hij geschikt is. Worp nummer 1 is altijd nodig; worp nummer 2 is geschikt met een kans p = 5/6 dus de wachttijd is 1/p = 6/5; worp nummer 3 is geschikt met een kans p = 4/6 dus de wachttijd is 1/p = 6/4; enzovoorts. Het gemiddeld aantal verwachte worpen voor een complete verzameling is dus: 1+
6 6 6 6 6 6 6 6 6 6 6 1 1 1 1 1 1 + + + + = + + + + + = 6.( + + + + + ) 5 4 3 2 1 6 5 4 3 2 1 1 2 3 4 5 6
met de GR berekend via 6*sum(seq(1/X,X,1,6))=14.7 In theorie geldt dus voor het verwachte aantal worpen om een verzameling van n elementen compleet te krijgen: n.(1 + 1 2 + 1 3 + 1 4 + ... + 1 n ) . De controle op de theorie wordt uitgevoerd in het programma COMPLEET, in de lus: Repeat I=N (herhaal tot I gelijk is aan N) waarbij telkens een element A random uit de uitkomstenverzameling gekozen wordt. sum(A=L1)=0 onderzoekt of A al in L1 stond. Zo nee, dan wordt A alsnog in L1 geplaatst. X telt het aantal benodigde pogingen bij elke simulatie.
Inventies 03/05/05
- 47 -
OPGAVE 19.
Het gemiddeld aantal trekkingen om een serie compleet te krijgen valt nogal mee. a) Na hoeveel trekkingen (gemiddeld) heb je een serie van 100 compleet? b) Na gemiddeld 2000 trekkingen is een bepaalde serie van n compleet. Bereken n met de MATH 0:Solver en controleer je oplossing met COMPLEET .
COMPLEET Lbl A ClrList L1 0üI:0üX "X=AANTAL POGINGEN" 0üL1(1) "L1 WORDT OPGEBOUWD" Repeat I=N "HERHAAL TOT I=N" randInt(1,N)üA "A=ELEMENT VAN UITKOMSTENVERZ" If sum(A=L1)=0 "ALS A NOG NIET IN L1 ZIT" Then I+1üI:AüL1(I) "DAN WORDT A IN L1 GEPLAATST" End X+1üX End V+1üV:S+XüS:T+1üT Output(5,1," "):Output(5,1,X) round(S/V,2)üM "GEMIDDELDE" Output(5,11," "):Output(5,11,M) Output(2,1,V) Goto A
Inventies 03/05/05
- 48 -
2.6
Beroemde problemen
Het probleem van de twee kaarten Iemand heeft twee kaarten. Een ervan (kaart A) heeft twee witte zijden, de ander (kaart B) heeft een witte en een zwarte kant. Hij pakt er aselect een van en laat je een willekeurige zijde zien. Stel dat die wit is: wat is dan de kans dat ook de achterzijde wit is? Je kunt dit experiment op twee manieren bekijken.
model I
Volgens model I zijn er twee, even waarschijnlijke mogelijkheden. Ofwel het was kaart A met de achterkant wit.
W
A
W A
Ofwel het was kaart B met de achterkant zwart. Fifty-fifty dus. De kans op wit is ½.
B A
W
Z
model II Volgens model II zijn er drie, even waarschijnlijke mogelijkheden (1 is de voorkant, 2 de achterkant): Bij kaart A: (W1,W2) en (W2,W1); bij kaart B: (W1,Z2); (Z1,W2) vervalt. De kans op wit is dus 2 3 Laat dit keer het experiment beslissen!
W1 A
W
W2
W
W1
Z
B Z2
Het schermplaatje rechts hierboven toont het resultaat na slechts tien simulaties. Dat zegt uiteraard nog niets. Maar kunnen we na bijvoorbeeld duizend simulaties misschien een conclusie trekken?
Inventies 03/05/05
- 49 -
KAARTEN2 0üW:0üZ:0üX:0üT While T<S "KAART A HEEFT 2 WITTE KANTEN" randInt(0,1)üA "A=0 IS KAART A, A=1 IS KAART B" randInt(0,1)üV "V=0 IS WITTE VOORK, V=1 ZWART" W+(A=0)üW Z+(A=1 and V=0)üZ W+ZüT Output(1,12,T) Output(2,12,W) Output(3,12,Z) End round(100W/T,2)üP:Output(5,1,P) Output(5,7,"PROCENT") Output(6,1,"ACHTERKANT WIT") Pause :ClrHome
Het probleem van de oppas Er zijn twee kinderen om op te passen. De oppas belt aan. Een meisje opent de deur. Hoe groot is de kans dat het andere kind ook een meisje is? Is hier model I of model II op van toepassing? Of geen van beide? Probeer het antwoord via simulatie te vinden. Maar gebruik daarvoor meer dan 11 simulaties (liefst 1000). OPPAS 0üM:0üT Lbl 0 randInt(0,1)üA randInt(0,1)üB "0=MEISJE" "M TELT DE MEISJES" "T IS TOTAAL" If A+B=2:Goto 0 T+1üT If A+B=0:M+1üM Output(1,1," ") 100M/TüP round(P,1)üP Output(1,1,P) Output(4,1,T) Goto 0
OPGAVE 20.
Teken het hierbij behorende blokdiagram.
Inventies 03/05/05
- 50 -
Het probleem van de drie deuren Je bent gast in een spelshow. Voor je zie je drie deuren, maar achter slechts één ervan ligt een (formidabele) prijs. Jij kiest een van de drie deuren. Nu komt het: de quizmaster opent één van de twee andere deuren en laat je zien dat daarachter de prijs niet ligt. (De quizmaster weet welke deur de goede is!). Nu krijg jij de kans alsnog te wisselen, dus voor die derde dichte deur te kiezen. Je kunt ook bij je keus blijven, de deur van je eerste keus. Wat doe je: wissel je of wissel je niet? Dit probleem staat bekend als het Monty Hall probleem of het Willem Ruis probleem, genoemd naar twee grote quizmasters uit de jaren tachtig. De kranten zijn volgeschreven met commentaar van lezers, waaronder veel wiskundigen en statistici. Niemand hoeft zich te schamen als hij dit ogenschijnlijk simpele vraagstuk verkeerd aanpakt. Veel wiskundigen zijn Quizmaster hem daarin voorgegaan! We bieden de lezer -net als in het probleem met de twee kaarten- twee oplossingsmodellen aan.
Kies deur: opent:
Kies deur:
1
Wissel:
1
1
3
3
½
In model I veronderstellen we dat de ongeopend 2 overgebleven deuren gelijke kans (dus ½) hebben op succes. ½ Als je bijvoorbeeld deur 2 het eerst koos en de quizmaster 3 opent deur 1, dan maakt het niet uit of je van keuze verandert (dus deur 3 kiest), want deur 2 heeft dezelfde kans op succes. Wel of niet wisselen van deur maakt dus niet uit. Aldus oplossingsmodel I. Model II. Stel dat je weer deur 2 kiest. Er is een even grote kans ( 1 3 ) dat de prijs achter één van de drie deuren ligt. Stel ook, dat je altijd van keuze wisselt. Als je prijs achter deur 2 lag, heb je pech in dat geval want je opent straks een andere deur. Kans op pech dus 1 3 . Maar als de prijs achter deur 1 lag (kans 1 3 ) loopt het goed af want de quizmaster moest deur 3 openen waarna jij van keuze wisselde en deur 1, waarachter de prijs ligt, opende. Advies is dus niet te aarzelen maar te wisselen van mening, met winstkans 2 3 .
Kies deur:
1
Prijs achter:
Wissel:
1
Raak
1/3 2
Mis
2
Mis
1/3 3
3
Raak
Het programma DEUREN3 bootst de situatie na. Je moet echter een groot aantal keer het spel naspelen voordat het verschil tussen kans 1 2 en 1 3 duidelijk begint te worden. Uiteraard is er ook een programma dat voor je speelt, een automatisering van het DEUREN3. We hebben dat programma DEURAUTO genoemd. Probeer het maar eens uit. (Waarom is het totaal gewisseld+niet gewisseld niet 100 procent?).
Inventies 03/05/05
- 51 -
DEURAUTO 0üP:0üQ:0üR:0üS Lbl A randInt(1,3)üD:randInt(1,3)üW If DøW:6-D-WüT randInt(0,1)üA If D=W Then If D=1:2+AüT If D=3:1+AüT If D=2:1+2AüT End randInt(0,1)üB If T=1:2+BüE If T=3:1+BüE If T=2:1+2BüE If D=E and E=W:P+1üP If D=E and EøW:Q+1üQ If DøE and E=W:R+1üR If DøE and EøW:S+1üS Output(2,10,R):Output(2,14,S) Output(3,10,P):Output(3,14,Q) Output(4,10,P+R):Output(4,14,Q+S Output(6,1,"WINSTPERCENTAGE:") Output(7,1,"GEWISSELD:") Output(8,1,"NIET GEW.:") If R+Sù1:Output(7,12,round(100R/(R+S),1)) If P+Qù1:Output(8,12,round(100P/(P+Q),1)) Goto A
Volledige inductie De som van de rekenkundige rij 1 + 2 + 3 + … + n is gelijk aan ½n(n+1). Er is een prachtige manier om dat te bewijzen, volgens het eeuwenoude principe van de volledige inductie. Dat werkt als volgt. Voor n=1 klopt de formule, want 1 = ½.1.2 Stel even dat de formule voor een bepaalde waarde n bewezen is, dus ga uit van: 1+2+3+…+n = ½n(n+1) ……….. (*) Als we kunnen bewijzen dat de formule ook voor de opvolgende waarde n+1 geldt, dan zijn we klaar. Immers, voor n=1 klopt hij, voor de opvolger n=2 dus ook, voor de opvolger n=3 ook, enzovoorts. Hoe bewijs je dat formule (*) ook voor de opvolger n+1 geldt? Voeg links de n+1-ste term toe aan de rij en vul rechts in n+1 voor n: Is 1+2+3+…+n + (n+1) = ½ (n+1)(n+1+1) voor elke waarde van n groter gelijk 1?? Gebruik makend van de juistheid van (*): Is ½n(n+1) + (n+1) = ½(n+1)(n+2) ?? Delen door (n+1) mag, omdat n+1¹0 is: Is ½n.1 + 1 = ½.1.(n+2) ?? Ja! Want ½n + 1 = ½n + 1 voor elke waarde van n (³1) Dus, nogmaals: voor n=1 klopt formule (*) (vul maar in), daaruit volgt dat hij voor de opvolger n=2 ook klopt en voor de opvolger daarvan n=3 ook. Hij klopt dus voor alle n. Nog een voorbeeld.
Inventies 03/05/05
- 52 -
2
Voor de somrij van de kwadraten geldt: 1+4+9+…+n =
1 n(n + 1)(2n + 1) 6
Bewijs: voor n=1 staat er 1 =
1 6
(1 + 1)( 2 + 1) = 1 en dat is juist. 2
Voeg links de n+1-ste term (n+1) toe en vervang rechts n door n+1: 2
2
1+4+9+…+n + (n+1) = en onderzoek of dit klopt: 1 n(n + 1)(2n + 1) + (n + 1) 2 6
1 (n + 1)(n + 6
2)(2n + 2 + 1)
= 16 (n + 1)(n + 2)(2n + 3) ???
Deel links en rechts door (n+1), dan is de vraag of het volgende klopt: 1 n(2n + 1) + (n + 1) = 16 (n + 2)(2n + 3) ??? `6 Vermenigvuldig met 6 en werk uit: 2n 2 + n + 6n + 6 = 2n 2 + 7 n + 6 dit is juist voor alle n ³ 1
Conclusie: voor n =1 is de formule juist en voor iedere volgende waarde van n ook.
Pak twee getallen uit n. Hoe groot is de grootste van de twee? (volgens de verwachting) We hebben een uitkomstenverzameling {1,2,3,…,n}. Zoals de uitkomsten van een dobbelsteen: {1,2,3,4,5,6}. Een simulatie. Pak aselect twee uit die n getallen. We kijken naar de verwachtingswaarde van het grootste getal (maximum) van de twee. Hiernaast staan in een roosterpatroon van 6 bij 6 de 7 worpen van twee dobbelstenen gemarkeerd waarvoor het maximum 4 is, namelijk (1,4) (2,4) (3,4) (4,4) (4,3) (4,2) en (4,1). Voor het trekken van 2 uit 6 met teruglegging is P(max=4) dus 7/36. 2
2
Met teruglegging is de verwachtingswaarde 1/n .S k(2k-1) = (4n +3n-1)/(6n) Deze betrekking is te bewijzen met volledige inductie. Met de GR kan het ook: sum(seq(X(2X-1),X,1,N)/N2). In het geval zonder teruglegging moet je de diagonaal (1,1) (2,2) (3,3) … weglaten. Zonder teruglegging is de verwachtingswaarde dus: 1/(n(n-1)).S 2k(k-1) = (2n+2)/3 oftewel sum(seq(2X(X-1),X,1,N)/(N(N-1))). Hierna doen we 400 simulaties met twee dobbelstenen. Dat is dus een trekking MET terugleg.
Inventies 03/05/05
- 53 -
MAX2UITN Met teruglegging: Input "SIMULATIES? ",S For(X,1,S) Output(5,1,X) randInt(1,N)üA randInt(1,N)üB max(A,B)üM 1+L1(M)üL1(M) End
Zonder teruglegging: For(X,1,S) Output(5,1,X) randInt(1,N)üA Repeat AøB randInt(1,N)üB End max(A,B)üM 1+L1(M)üL1(M) End
De verwachtingswaarde (Expectation Value) voor de hoogste waarde is dus 4n 2 + 3n - 1 bij trekking van 2 uit n met terugleg 6n 2n + 2 Exp zonder ( MAX ) = bij trekking van 2 uit n zonder terugleg 3 Expmet ( MAX ) =
Welke formules krijg je voor de laagste waarde van de twee? Merk eerst het volgende op over de verschillende kansen: P(MAX=k) = P(MIN=n+1-k), hier geïllustreerd voor n=6 en k=3. hetgeen in beide gevallen leidt tot de conclusie: Exp( MIN ) + Exp( MAX ) = n + 1
waarna het antwoord op de vraag gegeven kan worden. 2n 2 + 3n + 1 6n n +1 Exp zonder ( MIN ) = 3 Expmet ( MIN ) =
Inventies 03/05/05
- 54 -
OPGAVEN 21.
a) Uit het roosterpatroon hiernaast kun je de formule 2
1+3+5+7+…+(2n-1) = n aflezen. Hoe? Bewijs deze formule ook met volledige inductie. Aanwijzing: de volgende term is 2n+1.
b) En hoe zie je aan het roosterpatroon in het tweede plaatje dat de somformule voor de rekenkundige rij 1+2+3+...+n s n = 1/2n(n+1) deugt?
c) Verander in het programma max(A,B) in min(A,B) en controleer experimenteel de formules voor de verwachtingswaarde van de laagste trekking. 22.
Herhaal het getoonde experiment voor trekking van 2 uit 6 zonder terugleg.
23.
Bereken met kansrekening de kansen (met/zonder) voor een trekking van 2 uit 4 en doe een paar honderd simulaties ter controle.
24.
Bewijs de betrekking 1/(n(n-1)).S 2k(k-1) = (2n+2)/3 met volledige inductie.
Eenentwintigen De kans om een aantal ogen precies te gooien. Bij het dobbelspelletje Makao probeer je zo dicht mogelijk bij totaal 9 ogen te komen. Wie de negen overschrijdt valt af. Wie precies op negen uitkomt heeft altijd gewonnen. Hiermee verwant zijn de spellen Eenentwintigen en Black Jack. We simuleren in TREFKANS het volgende. Je gooit telkens met een dobbelsteen, telt op, en probeert met de totaalscore precies op een doelwaarde N uit te komen. Hoe groot is de kans P(N=n) dat dit lukt? (Bij overschrijding van N moet je overnieuw beginnen). Voor de doelwaarde 1 is die kans P(N=1)=1/6. Voor N=2 zijn er twee wegen die naar succes leiden, namelijk: direct 2 gooien met kans p(2)=1/6 of indirect via twee keer een 1 met p(1,1)=1/36 De totale trefkans P(N=2) is dus 1/6+1/36=7/36=0,19444 En P(N=3) is p(3)+p(1,2)+p(2,1)+p(1,1,1)=49/216=0,22685 Bij P(N=4) hebben we een paar grafen getekend die je van links naar rechts moet lezen. Plaatje 1. Je kunt precies 4 gooien in één keer. De kans daarop is p(4)=1/6. Plaatje 2. Je kunt via 1 en daarna 3 met kans p(1,3) = 1/36 ook op 4 uitkomen. Totaal 1 plus 2: 1/6 + 1/6´P(N=1) Plaatje 3. Via N=2 is het p(2,2) + p(1,1,2) Totaal: 1/6 + 1/6´P(N=1) + 1/6´p(N=2) Plaatje 4. Via N=3: p(3,1) +p (1,2,1) + p(2,1,1) + p(1,1,1,1) Totaal: zie opgave 32.
Inventies 03/05/05
- 55 -
plaatje 1
1
plaatje 2
2
3
4
1
3
4
2
3
4
plaatje 4
plaatje 3
1
2
2
3
4
1
Voor grote doelwaarden is het niet gemakkelijk een formule te geven. Wel is duidelijk dat P(N=n) voor grote waarden van n naar een limiet convergeert (ongeveer 0.286). In opgave 27 wordt gevraagd deze limiet exact (dat wil zeggen als niet-decimale breuk) te berekenen. Het programma TREFKANS simuleert 1000 keer en berekent (recursief) de theoretische trefkansen t/m P(N=50). OPGAVEN 25.
Geef een recursieve formule die voor n£6 P(N=n) uitdrukt in P(N=1) t/m P(N=n-1) en voor n³7 uitdrukt in P(N=n-6) t/m P(N=n-1).
26.
Geef voor n£6 een directe formule die P(N=n) uitdrukt in n. Zie ook de grafiek hiernaast.
27.
Bepaal de exacte limietwaarde voor grote N. Gebruik daarvoor het eerder (bij het programma COMPLEET) behandelde principe: verwachting =
TREFKANS For(T,1,1000) While S
Inventies 03/05/05
- 56 -
1 kans
Lootjes trekken voor Sinterklaas Een gezelschap van N personen, genummerd {1, 2, 3, … , N} trekt lootjes. Als iemand zijn eigen naam op het lootje ziet, moet er opnieuw getrokken worden. Hoe groot is de kans dat niemand zichzelf trekt? Voor weinig personen, zeg 3, is de kans te berekenen door alle mogelijkheden na te gaan. Er zijn in dat geval zes mogelijkheden, symbolisch 1 2 3, 2 1 3, 3 1 2, 1 3 2, 2 3 1, 3 2 1 . Lettend op de volgorde 1 2 3 en op de onderstreping, zie je dat vier van de zes keer er iemand zichzelf getrokken heeft. Er zijn twee niet onderstreepte rangschikkingen dus de kans dat niemand zichzelf trekt is 2/6. De theoretische uitleg die hierbij hoort, is nogal moeilijk te volgen, de formule voor de kans dat (-1) k , in TI taal: k = 2 k! sum(seq(((ú1)^K)/(K!),K,2,N)). We komen er straks op terug. n
niemand van n personen zichzelf trekt is: å
OPGAVE 28.
Schrijf alle 24 mogelijkheden op voor 4 personen in 4 groepjes van 6 , tel de gunstige mogelijkheden en bereken de kans dat van 4 personen niemand zichzelf trekt. Voer ook 200 simulaties uit met SINT en vergelijk de uitkomsten.
Inventies 03/05/05
- 57 -
Schudden De rij {1, 2, ..., n} in L 1 wordt geschud. De geschudde rij zetten we in L2. Schudden is als het ware de inverse van ordenen. Goed schudden lijkt gemakkelijker dan het is. Bij een grote rij is je computertje al gauw een hele tijd bezig voordat er een beetje resultaat is. Een redelijk principe (maar vast niet het beste) is dan het telkens verwisselen van een paar getallen: Lbl 0 randInt(1,N)üX: randInt(1,N)üY L2(X)üZ: L2(Y)üL2(X): ZüL2(Y) Goto 0
Laten we eerst eens kijken of we de mate van wanorde (de entropie) van de geschudde rij kunnen meten. Daarvoor kun je kijken naar I het aantal matches (de op hun plaats gebleven getallen) of naar II de afstand tussen de getallen van de oorspronkelijke rij en de geschudde rij I Matches. De verwachting dat een getal op zijn plaats blijft is 1/n; aangezien er n getallen zijn is het totaal aantal verwachte matches gemiddeld n × 1/n = 1. Deze redenering wordt wel vaker toegepast en de uitkomst schudt (om in het jargon te blijven) je misschien wakker. Je kunt maar moeilijk geloven dat in een goed geschud spel speelkaarten (n=52) er gemiddeld precies één kaart op zijn plaats blijft. Straks gaan we de geloofwaardigheid van de redenering nog maar weer eens toetsen met een simulatie. De kans op m matches in een geschudde rij van n getallen, notatie p(m | n), kunnen we berekenen met de volgende formule waarvan het bewijs achterwege gelaten wordt: p ( m | n) =
1 1 1 1 1 (-1) n - m × ( - + - + ... + ) waarin 0! = 1 m! 0! 1! 2! 3! ( n - m) !
In TI taal: (1/M!)*sum(seq(((-1)^X)/X!,X,0,N-M)) Het geval m=0 zijn we bij het Sinterklaas lootjes probleem tegen gekomen. De kans dat niemand zichzelf trekt is 1 1 1 1 (-1) n ; - + - + ... + 0! 1! 2! 3! n! voor grote waarden van n komt hier bij benadering 1/e uit (volgens de reeks van MacLaurin). p (0 | n ) =
Samengevat voor n £ 5: n \ m® 0 ¯1 0 2 ½ 2 3 6 9 4 24 44 5 120
Inventies 03/05/05
1 1 0 3 8
2
6 24
45
120
3
½ 0 6
1
24
20
120
4
5
6
0
1
10
0
120
24 1 120
- 58 -
II Afstand Onder de afstand van de rijen L1 en L2 zullen we de som van de absolute verschillen verstaan: n
sum(abs(L1 -L2 )) in TI taal,
å | L1(k ) - L 2(k ) | in wiskunde taal. Zo is de afstand tussen 1 2 3 4 en k =1
2 4 1 3 gelijk aan |2-1| + |4-2| + |1-3| + |3-4| = 1 + 2 + 2 + 1 = 6. Deze rij van 4 elementen heeft 4! = 24 permutaties. Laten we eens kijken hoe het zit met het aantal matches (m) en de afstand (d) die al die permutaties hebben, vergeleken met de startrij 1 2 3 4. De matches zijn onderstreept. rij
m
d
1234
4
0
1243 1432 1324 4231 3214 2134 1342 1423 3241 4213 2431 4132 2314 3124 2341 2413 2143 3412 3421 3142 4123 4321 4312
2 2 2 2 2 2 1 1 1 1 1 1 1 1 0 0 0 0 0 0 0 0 0 -----24
2 4 2 6 4 2 4 4 6 6 6 6 4 4 4 6 4 8 8 6 6 8 8 ------ + 120
totaal:
Notabene: het geval m=3 doet zich niet voor, als er drie passen dan past ook de vierde. 24 Waaruit het gemiddeld aantal matches volgt: m = = 1 (dat klopt dus met de voorspelling) en de 24 120 gemiddelde afstand: d = =5. 24 Hoe kunnen we dat laatste getal verklaren? Als het lukt om een formule te vinden voor de gemiddelde afstand van de geschudde rij tot de startrij, hebben we meteen een getal dat de grondigheid van het schudden aangeeft (de wanorde zo je wilt). In het roosterpatroon hierboven staat de startpositie {1,2,3,4} op de x-as. De y-coördinaat geeft het getal dat na schudden op dezelfde positie staat. Het punt (4,1) betekent dat op de vierde positie een 1 terechtgekomen is. De afstand op elke positie vind je op de diagonalen linksonder/rechtsboven. De vierkantjes (1,1) (2,2) (3,3) en (4,4) horen bij een afstand d = 0; de plusjes bij d = 1. Hieruit is af te lezen om welke kansen het hier gaat.
p ( d = 0) = 4 16 , p (d = 1) = 6 16 , p ( d = 2) = 4 16 en p ( d = 3) = 2 16
Inventies 03/05/05
- 59 -
De verwachte gemiddelde afstand op één positie is dus d = 0 × 4 16 + 1 × 2 × 316 + 2 × 2 × 2 16 + 3 × 2 × 116 = 20 16 De verwachte afstand van het hele rijtje van vier is 4 keer zo groot, dus verklaring gegeven is.
80
16
= 5 waarmee de gewenste
De afleiding voor het algemene geval met n getallen gebruikt (1) de formule voor de som van een rekenkundige rij: n
å k = 1 2 n(n + 1) k =1
(2) de al eerder (met volledige inductie) bewezen somrij van kwadraten: n
å k 2 = 1 6 n(n + 1)(2n + 1) k =1 n
(3) het " buiten de sigma brengen van een constante":
n
åc × k = c × åk k =1
k =1
Daar gaan we. d = 0 × 1 n + 1 × 2 × n -1 n + 2 × 2 × n - 2 n + 3 × 2 × n - 3 n + ... = n -1
n -1
(3)
n -1
= n2 ´ å k × (n - k ) = 2n å k - 2 å k 2 k =1
k =1
2 n
´ [1 × ( n - 1) + 2 × ( n - 2) + 3 × ( n - 3) + ...]
(1) en( 2)
=
2 × 1 2 (n - 1)n - 2 × 1 6 (n - 1)(2n - 2 + 1)
k =1
Tenslotte komt er: d = n(n - 1) - 1 3 (n - 1)(2n - 1) = (n - 1)[n - 1 3 (2n - 1)] = (n - 1)( 1 3 n + 1 3 ) = 1
3 ( n - 1)( n + 1)
=
1
3 (n
2
- 1)
Zodat de formule voor de verwachte gemiddelde afstand van een rij voor en na het grondig schudden gevonden is: d=
1
3 (n
2
- 1)
We controleren het behandelde geval met n =4 nog even: d = kunnen zijn.
1
3
(16 - 1) = 5 waarmee we gelukkig
Dan wordt het nu tijd om de achterliggende theorie te toetsen met de praktijk. Simuleren dus maar. De perfectionist die op zoek gaat naar de maximumafstand tussen L1 en L2 zal ontdekken dat perfecte wanorde soms gelijk is aan perfecte orde! Dus zover zullen wij maar niet gaan. Voor n = even namelijk is d MAX = 1 2 n 2 ; voor n = oneven is d MAX = 1 2 (n 2 - 1) . Die "ideale" schudsituatie hoort bijvoorbeeld bij de omgekeerde rij {n, ... ,3,2,1}; het schudden is dan 2 te lang doorgegaan. Ik laat het aan de lezer over, om zelf een norm te bepalen voor d tussen 0×(n -1) 2 en ½×(n -1) die de mate van het door elkaar schudden vastlegt. In het programma SCHUDRAN wordt een randomrij met lengte N geproduceerd waarvan de nog niet gebruikte getallen in L2 worden opgeslagen, net zo als dat eerder bij het trekken zonder terugleg gebeurde. De matches komen in L3 en de afstand in A.
Inventies 03/05/05
- 60 -
Bij de uitvoering van SCHUDRAN zal blijken dat deze manier van "schudden zonder terugleg" bij lange rijen (n groter dan ongeveer 15) enorm traag verloopt. Het voordeel van de randomschudding is echter dat het gesimuleerde aantal matches en de gemiddelde afstand aardig voldoen aan de theoretische voorspellingen. Bij N=10 en slechts 182 simulaties kloppen de experimentele waarden voor m en d al erg aardig met de theoretische waarden 1 en 33. Zie het schermplaatje. Lbl HH Fill(0,L2) 0üT:H+1üH Lbl 0 randInt(1,N)üR If sum(L2=R)=0 Then T+1üT:RüL2(T) End If T
Het tweede schudprogramma SCHUDIN verwisselt herhaaldelijk (aselect) twee getallen. Ongeveer zoals een onhandige kaartspeler dat zou doen.
Lbl 0 W+1üW randInt(1,N)üX randInt(1,N)üY L2(X)üZ L2(Y)üL2(X) ZüL2(Y) sum(abs(L1-L2))üA sum(L1=L2)üM Output(1,10,M) Output(2,10,A) Output(8,10,W) If A
"KIES 2 WILLEKEURIGE POSITIES" "EN VERWISSEL DE DAARBIJ" "BEHORENDE GETALLEN IN L2" "A=AFSTAND"
Het schudden "kaart-voor-kaart" via de verwisseling van telkens twee "kaarten" gaat met een constante snelheid. Aanvankelijk (bij kleine waarden van N) vinden we dat nogal traag. Maar bij grote waarden van N (bij een spel van 52 kaarten bijvoorbeeld) verdient zich dat terug. In de laatste programmaregel hebben we de norm voor voor een aanvaarbare mate van schudding gelegd bij een afstand van 1 3 n 2 ; je zou ook met minder wanorde genoegen kunnen nemen (bijvoorbeeld bij een 2 afstand ¼ n ) of je zou kunnen kijken naar het aantal matches.
Inventies 03/05/05
- 61 -
Matches Simuleer het schudden van N getallen in een niet al te lange rij {1,2,...,N} en kijk naar het aantal matches (niet de lucifers). De theorie is enkele bladzijden hiervoor beschreven. We hebben het gemiddeld aantal matches meteen maar even uitgerekend (onder THEORIE).
MATCHES 0üT For(U,1,S) Output(1,5,U) Lbl 0 randInt(1,N)üR If sum(L2=R)=0 Then T+1üT:RüL2(T) End If T
Inventies 03/05/05
"SCHUDDEN" "VOLGENS" "SCHUDRAN"
- 62 -
2.7
Continue kansvariabelen
De kanssimulaties tot dusver betroffen voornamelijk discrete situaties, waarbij de waarnemingsgetallen (X) gehele waarden aannamen, zoals het aantal ogen bij een dobbelsteen. Ingewikkelder wordt het bij continue kansexperimenten, met x-waarden die niet per definitie geheel zijn. Ik gebruik hier met opzet de cursieve, kleine letter x als continue variabele.
Een duel A en B houden een duel en schieten om de beurt A schiet met een trefkans P; B met een trefkans Q. A begint. Wie het eerst raak schiet, heeft gewonnen. Wat is de kans dat A wint? ClrHome Prompt P,Q 0üT:0üU Lbl 0 randüA If A
De theorie achter deze simulatie berust op een meetkundige rij. De kans op winst van A wordt immers berekend via het patroon RAAK of MIS-MIS-RAAK of MIS-MIS-MIS-MIS-RAAK of ... Dus: 2 2 3 3 p + (1-p)(1-q)p + (1-p) (1-q) p + (1-p) (1-q) p+ ... = (volgens de somformule van een oneindige meetkundige rij) 1 p p q = . = 1 1 1 - (1 - p )(1 - q ) p + q - pq q + p -1 Duidelijk is dat A hierbij het voordeel van de eerste zet heeft. De winstkansen voor A en B zijn gelijk als de laatste breuk gelijk aan ½ gesteld wordt. Dit leidt tot: 1 - 1 = 1. p q Probeer maar eens met bijvoorbeeld p = 0.20 en q = 0.25.
Een meting van p, met darts We kunnen de waarde van p (pi) op een natuurkundige manier "meten". De oppervlakte van een figuur is evenredig met het kwadraat van een lengte (of straal, in dit geval). Ga dus uit van de oppervlakteformule voor een cirkel: 2 p.r . We werpen een groot aantal keren met een denkbeeldig pijltje (dart) naar een 2 eenheidscirkel, dat is een cirkel om O(0,0) met straal 1 (en oppervlakte p.1 = p). Om die eenheidscirkel is een vierkant beschreven (het dartsbord) met zijde 2 en oppervlakte 4, zodat de kans (bij lukraak gooien) om binnen de cirkel uit te komen p/4 is.
Inventies 03/05/05
- 63 -
Met -1+2rand krijg je randomgetallen tussen -1 en 1. We noteren een treffer, als de afstand tot de 2 2 oorsprong (0,0) kleiner dan 1 is, dus x +y <1. Je zult merken dat deze meting nogal onnauwkeurig is, zelfs als je 5000 keer simuleert. SIMULPI 0üT "T=TELLER" For(I,1,N) ú1+2randüX "RANDOM TUSSEN -1 EN 1" ú1+2randüY If XÜ+YÜ÷1 "PIJLTJE BINNEN CIRKEL" Then T+1üT "TELLEN" End Output(6,11,I):Output(7,11,T) round(4T/I,3)üP Output(8,4,P) End
OPGAVE 29. Schrijf een programma dat de darts treffers op de hiernaast getekende wijze illustreert na 2000 worpen. De stippen moet je achter elkaar zien verschijnen. Het duurt wel een paar minuten.
Ontwerp zelf een randomgenerator Een randomgenerator is een eindeloos voortgaande rij willekeurige getallen tussen 0 en 1, recursief opgebouwd volgens het principe:
ì x0 = kiem í î xn +1 = f ( xn ) Voor het startgetal kiem nemen we een getal dat niet te dicht bij nul ligt, bijvoorbeeld Ö11. Voor de hand liggend is om voor f een breukdeel (Fraction-Part) te gebruiken omdat het decimale gedeelte van een getal altijd tussen 0 en 1 ligt. Nou zijn deze getallen xn bepaald niet aselect ontstaan. Elk getal volgt volgens een vast voorschrift uit zijn voorganger. Afhankelijker dan dat kan het haast niet. Vandaar dat we het woord pseudo-random gebruiken. Ik doe maar eens wat, f (x)= fPart(1234×p× x 1/7) bijvoorbeeld. Deze doe-het-zelf randomgenerator noem ik een pseudo-pseudo-randomgenerator, omdat hij gemaakt is door een beunhaas (schrijver dezes). Van de uitkomsten kun je een klassenverdeling maken (de x is hieronder in tien klassen verdeeld, 0-0.1 t/m 0.9-1.0) om na te gaan of alle getallen tussen 0 en 1 wel ongeveer even vaak aan de beurt komen. En dat is aardig gelukt, kijk maar. Input "KIEM?",X For(N,1,2000) fPart(1234ÄX^(1/7))üX iPart(10X)üI L2(I+1)+1üL2(I+1) Output(8,1,N) End
Inventies 03/05/05
- 64 -
De professionele pseudo-randomgenerator rand zorgt voor willekeurige (aselecte) getallen tussen 0 en 1. Kies eerst een startwaarde (nul bijvoorbeeld) met 0®rand en druk een paar keer op ENTER. Zo krijg je op alle modellen TI-83 en TI-84 dezelfde reeks randomgetallen (zie het schermplaatje), omdat al deze modellen dezelfde microprocesser (Z-80) ingebouwd hebben. Bij een andere startwaarde wordt een ander rijtje "gegenereerd". Andere microprocessors, andere computers en andere startwaarden leveren andere randomgetallen. Dat maakt niet uit, mits de geproduceerde getallen -hoe zal ik het zeggen- een beetje normaal verdeeld zijn. Normaal verdeeld is eigenlijk een buitengewoon onhandige woordkeuze, de suggestie wekkend dat de getallen in het midden (rond 0.5) vaker voorkomen dan aan de rand. Een beetje regelmatig verdeeld, is dat een betere formulering? Nee, want hierbij denk je wellicht dat de onderlinge verschillen min of meer constant zijn, het rijtje 0.28 0.38 0.48 0.58 (ik neem voor het gemak maar twee decimalen) wekt bepaald niet een indruk van willekeurigheid. Afwisselend misschien? Maar de afwisselende getallen 0.28 0.72 0.23 0.77 0.21 0.79 zijn duidelijk niet aselect ontstaan! Tel ze maar eens op. Het is moeilijk een geschikte term te vinden voor de bedoelde aselectheid. Wiskundigen, liefhebbers van ondubbelzinnigheid, gebruiken de woorden homogeen of uniform. Een goede lukraakrij moet op zijn minst voldoen aan een vooraf te berekenen gemiddelde en een bepaalde spreiding (variantie). De zogenaamde kansdichtheid van de randomfunctie rand is gedefinieerd door f (x) = 1 voor x tussen 0 en 1 en f(x) = 0 voor andere x-waarden.
Het woord kansdichtheid is ook weer niet exact, het suggereert immers dat elk randomgetal een kans (ongelijk nul) heeft. Maar de kansen op 0.9435974025 en 0.908318861 zijn beide 1 op de10^10 (de rekennauwkeurigheid van het machientje is 10 decimalen) en je kunt hier evenmin van een kans spreken als bij "de kans dat iemand precies 1 meter 83,76 cm lang ben is ...". Een lijn heeft immers geen breedte. Wel zinvol is te kijken naar x-waarden tussen twee grenzen, een intervalletje Dx. De oppervlakte van een staafje met deze breedte is f(x).Dx = 1.Dx; de totale oppervlakte van alle staafjes 1
in het eenheidsvierkant is S(1.Dx)=1, in limiet hebben we daar de integraalnotatie ò 1. dx = 1 voor. 0
De kans P(X
Inventies 03/05/05
- 65 -
Met het begrip kansverdeling (distribution) valt beter te werken. De kansverdelingsfunctie, hier aangeduid met de hoofdletter P, R
ò f ( x) dx ,
P( X < R) =
-¥
is te vergelijken met de cumulatieve discrete kansverdeling k
P ( X £ k ) = å pi . i =1
De verwachtingswaarde E van X (E komt van expectation. m is de Griekse letter m), +¥
m = E( X ) =
ò x. f ( x) dx -¥
is te vergelijken met het gemiddelde in het discrete geval X =
n 1 n xi . f i of X = å xi . pi . å n i =1 i =1
2
De verwachtingswaarde van X is dus +¥
E( X 2 ) =
òx
2
. f ( x) dx .
-¥
2
En de variantie var(X) = s (X) als spreidingsmaat, volgend uit var ( X ) = E ( X - E ( X )) 2 , is analoog aan het discrete geval met 2
2
s 2 = ( X - X )2 = ( X 2 - 2 X X + X 2 ) = X 2 - 2 X ×X + X = X 2 - X . 2
De standaarddeviatie s is uiteraard de wortel hieruit: s = X 2 - X . PANORAMA R
P( X < R) =
ò f ( x) dx ; de kansverdeling is een integraal van de kansdichtheid -¥
dus de kansdichtheid is de afgeleide van de kansverdelingsfunctie 1
+¥
X =
ò x. f ( x) dx -¥
dus R = ò x.1dx =
1
2x
]
2 1 0
=
0
1
R 2 = ò x 2 .1dx = 13 x3
]
1 0
=
1
3
en
0
2
s 2 = R2 - R =
Inventies 03/05/05
1
3
- 14 =
1 ; 12
s
0.2887
- 66 -
1
2;
m = 0.5
Ik ben nieuwsgierig naar de kwaliteit van mijn pseudo-pseudo randomgenerator, vergeleken met de professionele randommaker. En dat valt, aan het histogram te zien, best mee! Het professionele plaatje (pseudo generator) lijkt zelfs wat minder mooi omdat rondom het midden een beetje een deuk zit. Het oog wil ook wat, natuurlijk, maar op getallen en berekeningen kun je blindelings vertrouwen, om een bij het onderzoek passend woord te gebruiken. We gaan dus het gemiddelde en de variantie berekenen na 4 keer 500 simulaties van de twee beschouwde randomgeneratoren en die vergelijken met de theoretische waarden. theorie m = 0.5 s = .289
pseudo random m = .490 s = .293 m = .497 s = .296 m = .498 s = .294 m = .515 s = .281 na 2000 simulaties: m = .500 s = .291
pseudo-pseudo random m = .480 s = .295 m = .509 s = .286 m = .497 s = .288 m = .500 s = .284 na 2000 simulaties: m = .497 s = .288
Nou blijven we nog met één hoogst fundamentele vraag zitten. De randomgetallen die volgens het recursieve model zijn geproduceerd, zijn per definitie afhankelijk. En onafhankelijkheid is beslist een noodzakelijke voorwaarde voor verantwoorde kansexperimenten. Onafhankelijkheid kan getoetst worden met de productregel. Als voor opvolgende getallen op den duur (na een groot aantal simulaties) geldt: rand ´ rand = rand ´ rand dus rand ´ rand = 12 ´ 12 = 14 dan zullen we aannemen dat de randomgenerator ook in dit aspect bevredigend werkt. En kijk:
leverde na een tijdje:
Ook na 5000 tests kwam ook de pseudo-pseudo-randomgenerator tot de hoogst bevredigende waarde 0.2514 voor het gemiddeld product van opvolgende randomgetallen. Waarmee dit onderzoek naar de betrouwbaarheid van randomgenerators afgesloten wordt. Laten we gauw beginnen te experimenteren met continue kansvariabelen.
De afstand tot een cirkelrand Punt P ligt willekeurig binnen een cirkel met straal 1. Wat is de verwachtingswaarde van de (gemiddelde) afstand van P tot de cirkelomtrek?
Inventies 03/05/05
- 67 -
0üS:0üT Lbl 0 randüX:randüY ð(XÜ+YÜ)üR If R>1:Goto 0 1-RüA:T+1üT:S+AüS Disp S/T Goto 0
De theoretische achtergrond. Stel a is de afstand van P tot de cirkel. De kansverdeling wordt gegeven door een oppervlakte verhouding: opp ring p ×12 - p × (1 - a ) 2 = = 2a - a 2 opp eenh cirkel p ×12 De kansdichtheid is de afgeleide hiervan, namelijk de gemiddelde afstand tot de rand van de cirkel is 1
a = ò a × (2 - 2a ) da = a 2 - 23 a 3 0
]
1 0
d da
a 1-a
(2a - a 2 ) = 2 - 2a dus
= 13
OPGAVE 30.
Bereken de kans dat een randompunt binnen de eenheidscirkel op een afstand kleiner dan ½ ligt van de omtrek. Controleer met simulatie of deze berekening klopt.
De afstand tot de rand van een vierkant P ligt random binnen een vierkant met zijde 1. Wat is verwachtingswaarde van de (kortste) afstand van P tot de zijden van dat vierkant? In het programma veronderstellen we dat het vierkant in het eerste kwadrant ligt met O als een van de hoekpunten en dat P de coördinaten (x,y) heeft. ClrHome 0üS:0üT Lbl 0 randüX:randüY min({X,Y,1-X,1-Y})üD T+1üT: S+DüS Disp S/T Goto 0 1 a P
1-y 1
a x
1-x
P
1 -2a 1
y 0
Inventies 03/05/05
1
- 68 -
Stel a is de afstand van P tot een zijde. Merk op dat a £ ½ is. P ligt tussen de twee vierkanten in. Het 2 2 binnenste vierkant heeft een zijde 1-2a dus een oppervlakte (1-2a) = 1-4a+4a . De kans dat P op een 1 - (1 - 4a + 4a 2 ) afstand kleiner dan a van de omtrek ligt is = 4a - 4a 2 . De kansdichtheid is de 1 1
2
afgeleide hiervan, dus 4-8a. De gemiddelde afstand is dus a = ò a × (4 - 8a ) da =2a 2 - 83 a 3 0
]
1
0
2
= 16 .
OPGAVEN 31.
Bereken de kans dat een randompunt binnen het eenheidsvierkant op een afstand kleiner dan 0.2 van de rand ligt. Controleer met simulatie of deze berekening klopt.
32.
Een punt beweegt random binnen een rechthoek van 3 bij 2. Noem a de afstand van dat punt tot de dichtstbijzijnde zijde van die rechthoek. a) bepaal (door theoretische berekening en met simulatie) de kans dat a < 0.5 is. b) laat zien (theoretisch en via simulatie) dat de gemiddelde afstand van P tot de dichtstbijzijnde zijde 7/18 is.
a a 2-2a
2
3-2a
P
3
De stomphoekige driehoek Binnen de eenheidscirkel (middelpunt O, straal 1) liggen, willekeurig, twee punten A en B. De vraag is, hoe groot de kans is dat driehoek AOB stomphoekig is. Geef de punten de coördinaten A(P,Q), B(R,S) en O(0,0). De snelste manier om te constateren of een 2 2 2 hoek stomp is is met het inproduct. Niet iedereen weet dat, maar met de regel c >a +b kan het ook. 2
2
2
2
2
2
2
2
(1) Als O een stompe hoek is geldt AB > OA + OB dus (R-P) +(S-Q) > P +Q +R +S 2 2 2 2 2 2 2 2 2 (2) Als B stomp is geldt OA > OB + AB dus P +Q > R +S +(R-P) +(S-Q) 2 2 2 2 2 2 2 2 2 (3) Als A stomp is geldt OB > OA + AB dus R +S > P +Q +(R-P) +(S-Q)
2
ClrHome 0üT:0üU Lbl 0 U+1üU 2rand-1üP:2rand-1üQ:2rand-1üR:2rand-1üS PÜ+QÜüB:RÜ+SÜüA (R-P)Ü+(S-Q)ÜüC If B>1 or A>1:Goto 0 If C>A+B or B>A+C or A>B+C: T+1üT Disp T/U Goto 0
Het vermoeden rijst dat het antwoord ¾ is. Econometriestudent Hung Tran van de Vrije Universiteit in Amsterdam kwam met het volgende wonderschone (dus korte) bewijs dat dit vermoeden juist is.
Inventies 03/05/05
- 69 -
Noem het verst van O liggende hoekpunt A en bekijk de cirkel C1 met middelpunt O die door A gaat. Hoek A kan nu niet stomp zijn. Er zijn twee gebieden waar het andere hoekpunt (B) kan liggen, ingeval de driehoek stomphoekig is en OB
Dating Twee geliefden proberen elkaar dagelijks te ontmoeten voor een innige omhelzing. Beiden arriveren random tussen 17 en 18 uur bij het meeting point. Afgesproken is om hoogstens 10 minuten te wachten op de ander. Hoe groot is de kans op een omhelzing?
Stel de aankomsttijden zijn resp x en y minuten na 17.00 uur. Bekijk nu het kansvierkant met 2 oppervlakte 60´60 = 3600 min (vierkante minuten dus). Elk punt (x, y) daarbinnen staat voor één van de mogelijke gebeurtenissen. Het tijdsverschil tussen de geliefden x-y of y-x moet (liefst) kleiner zijn dan 10 minuten: voor het ontmoetingsgebied geldt dus |x-y|<10. De lijn y = x beschrijft gelijktijdigheid; het gebied buiten de lijnen y = x + 10 en y = x – 10, de twee rechthoekige driehoeken, 2 bestrijkt een oppervlakte van in totaal 2500 min . 2 Voor de gelukzalige momenten zijn dus 3600-2500=1100 min over. Met andere woorden: de kans op 1100 11 een omhelzing is = » 0,3056 . Deze laatste eis wordt in tibasic weergegeven met vooraf 0üS 3600 36 en daarna: S+(abs(60rand-60rand)<10)üS Een vergelijkbaar vraagje is: Trek twee keer een randomgetal tussen 0 en 1. Hoe groot is de kans dat het product minder is dan 0,5?
Aangezien x× y < ½ is, moeten we binnen het kansvierkant de oppervlakte onder de kromme 0,5/x in rekening brengen:
Inventies 03/05/05
1 1 1 + dx = 2 0ò,5 2 x
1
2 (1 + ln 2)
» 0,8466 en dat is de gevraagde kans.
- 70 -
DATING 0üS:0üT Lbl 0 T+1üT S+(abs(60rand-60rand)<10)üS Output(1,11,T) Output(4,10,round(S/T,3) Goto 0
RANDPROD 0üS:0üT Lbl 0 T+1üT S+(rand*rand<.5)üS Output(1,11,T) Output(4,10,round(S/T,3) Goto 0
Maak een driehoek van een stok Martin Gardner beschrijft in "The Colossal Book of Mathematics" in hoofdstuk 21 en 22 hoe verraderlijk sommige ogenschijnlijk simpele kansberekeningen zijn. Befaamde wiskundigen als Leibniz, d'Alembert en Erdös zijn ons voorgegaan in het maken van fouten. Eerstgenoemde dacht dat de kans op 12 even groot is als de kans op 11 bij het werpen met twee dobbelstenen; d'Alembert veronderstelde dat na het werpen van erg veel keer "Munt" achter elkaar de kans op "Kop" groter zou zijn, leidend tot de conclusie dat een dobbelsteen een geheugen heeft. Een bekend probleem is dat van de stok die at random (aselect) in drie stukken geknipt wordt. Hoe groot is de kans dat uit die drie stukken een driehoek gevormd kan worden? [De driehoeksongelijkheid zegt, dat de langste zijde van een driehoek altijd korter is dan de som van de andere twee zijden]. Stel dat onze stok 1000 millimeter is. Hij wordt doorgeknipt op twee plaatsen. Methode 1: knip tegelijkertijd op twee willekeurige plekken .Methode 2: knip de eerste keer willekeurig, pak blindelings (willekeurig) een van de twee stukken, en knip een tweede keer. Methode 3: hetzelfde als methode 2, echter pak voor de tweede knip het grootste stuk van de twee; dat geeft een grotere kans maar gaat natuurlijk ten koste van de aselectheid (je selecteert het grootste stuk, omdat je daarmee twee keer zoveel kans krijgt op succes). Het programma STOKIN3 biedt methode 1 en 3 aan (de volledig aselecte experimenten) in een stapvoor-stap demo-versie en een doorlopende versie, die we echt wel nodig hebben want pas na vele honderden simulaties komt er enige lijn in. Alle beeldschermwisselingen kosten erg veel rekentijd, vandaar dat het "kale" programma STOKSNEL gemaakt is voor degene die graag zoveel mogelijk simulaties wil doen (en over een SilverEditie beschikt waarmee ruim twee keer sneller gerekend kan worden).
Inventies 03/05/05
- 71 -
De theorie bij STOKIN3 (1) Twee keer tegelijk knippen. Knip tegelijk (random, uiteraard) op twee plaatsen: x en y (neem even y < x). Dat geeft een punt (x, y) in het kansvierkant met de volgende eigenschappen: x > ½ en x – y < ½ en y < ½ Het hierbij behorende gebied is de gearceerde driehoek met een oppervlakte die eenachtste is van het eenheidsvierkant. Wanneer je de tweede mogelijkheid (y > x) erbij neemt geeft dat nog zo'n driehoek zodat de kans dat van een stok, die tegelijk op twee plaatsen gebroken wordt, een driehoek gemaakt kan worden gelijk is aan ¼. (2) Knip een keer, daarna in het grootste stuk nog een keer. Knip eerst op een willekeurige plek x (stel eerst weer even dat x groter is dan ½). Knip het grootste stuk (tussen 0 en x) willekeurig in twee stukken. Er geldt: x – ½ < y < ½ . De lengte van het toegestane gebied voor y is ½ – (x – ½) = 1 – x en omdat y random ligt tussen 0 en x geldt: y = x*rand dus y × x < 1 – x oftewel y < 1-x x De oppervlakte van het toegestane gebied is dan 1
ò 1
1 1- x x
dx = ò ( 1x - 1) dx = - 1 2 + ln 2 » 0,19315
2
1
2
In het geval x < ½, is het toegestane gebied x + ½ - ½ = x. En dan zal y = (1 – x)*rand moeten zijn dus y ×(1-x) < x oftewel y < 1-x x met 1
de voorwaarde ½ < y < x + ½ en als oppervlakte
2
ò 1-xx dx met hetzelfde 0
antwoord. In totaal is de kans op een driehoek dus 2 ´ ( - 1 2 + ln 2) = -1 + 2 ln 2 » 0,3863 .
Inventies 03/05/05
- 72 -
De knekelman Een stok wordt in tweeën gebroken. Wat is de verwachtingswaarde van het quotiënt
kleinste stuk ? grootste stuk
STOKIN2 ClrHome 0üT:0üQ Lbl 0 T+1üT randüR If R>.5:1-RüR Q+R/(1-R)üQ Disp Q/T Goto 0 Als de stok een lengte 1 heeft (waarom niet?) en k de lengte van het kortste stuk is, gaat het hier om het quotiënt k / (1-k). 1
Voor 0 < x < ½ moet dus de oppervlakte
2
x
ò 1 - x dx berekend worden; voor 0
½ £ x £ 1 krijg je een andere integraal, maar dezelfde oppervlakte: 1 1 (1 - x) 1 dx = ò x ò ( x - 1)dx . 1 1 2
2
De totale oppervlakte, en daarmee de verwachtingswaarde van het quotiënt
kleinste , wordt dus grootste
2 × [ln x - x ]11 = -1 + 2 ln 2 » 0,3863 . 2
Een aardige, simpele oplossing dus. Maar wiskundigen weten bij iedere aardige, simpele oplossing wel weer een nieuw probleem te bedenken. Ik citeer uit The Mathematics of Oz, Mental Gynastics from Beyond the Edge van Clifford Pickover (Cambridge U.P., 2002): The Bone Man Problem Dorothy and Dr. Oz peer into a deep hole in the ground. The bone man comes closer and opens and closes his mouth spasmodically. "In the pit", he says, "are 10 000 leg bones. I have cracked each bone at random into two pieces by throwing them against a rock. What do you think is the average ratio of the length of the long piece to the length of the short piece for each time I crack a bone? You can reason from a purely theoretical standpoint. If you cannot find the solution within two days, I will add your leg bone to the pit." Let op de subtiele omkering van het quotiënt. In het geval kleinste/grootste hebben extreem kleine stukjes vrijwel geen invloed op het verwachte quotiënt (die staan namelijk in de teller). Maar in het probleem van de Bone Man is de breuk omgekeerd en hebben extreem kleine stukjes (in de noemer) een extreem grote invloed op de waarde van de breuk! En dan hebben we echt een probleem.
Inventies 03/05/05
- 73 -
Bekijk het bovenste plaatje na 100 000 simulaties voor de verhouding langste/kortste van de Bone Man. Horizontaal het aantal simulaties (n), verticaal het verloop van het voortschrijdend gemiddeld quotiënt Q . Het lijkt erop dat Q erg graag tot rust wil komen tussen de 20 en 30 maar op onverwachte momenten telkens weer opgeblazen wordt (door een noemer die akelig dicht bij nul zit). In mijn experiment moest Q zich vijf keer herstellen na een explosie. Rond simulatie nummer 80000 was er zelfs een (of meer, dat is niet te zien) soort cambrische explosie, tot buiten het schermbereik, vermoedelijk ver boven de 100. Aan de puntenwolk van het volgende plaatje is te zien dat Q nogal schommelt (n is horizontaal op een logaritmische schaal gezet). Zo registreerde ik na twee keer 10 miljoen simulaties de eerste keer Q = 53.3 en de tweede keer Q = 32.2 (de twee plusjes uiterst rechts) en na een bepaalde serie van 10 000 de uitschieter Q = 87.8 . Logaritmische regressie via [STAT] 9:LnReg leverde als best passende formule op Q = 4.4 + 2 ln n ; zie de rechte lijn. De breuk kortste/langste streeft naar een limiet van 0,3863 zoals we zagen. Waarom streeft het omgekeerde van die breuk langste/kortste niet gewoon naar het omgekeerde daarvan: 1 » 2.59 ??? 0.3863 Om daar iets van te begrijpen schakelen we terug naar het begrip verwachtingswaarde. Daarvoor moeten de Q-waarden vermenigvuldigd worden met hun kans. De randomwaarden X liggen tussen 0 en 1. Stel dat we een verdeling hebben in tien klassen, met de klassenmiddens 0.05 t/m 0.95. Alle randomwaarden (X) in de eerste klasse, tussen 0 en 0.1 vervangen we door één enkele waarde, 0.95 m=0.05; het quotiënt hierbij is Q = = 19 . De waarschijnlijkheid van zo'n quotiënt is 0.1 (er zijn 0.05 immers tien even waarschijnlijke mogelijkheden). Na n simulaties verwachten we in het ideale geval n klassen – in elke klasse één random uitkomst. Zo ontstaat voor n=10 de volgende tabel voor de berekening van de verwachtingswaarde. X 0-.1 .1-.2 .2-.3 .3-.4 .4-.5
m 0.05 0.15 0.25 0.35 0.45
Q 19 5.67 3 1.86 1.22
p 0.1 0.1 0.1 0.1 0.1
Q.p 1.9 0.567 0.3 0.186 0.122 ------- + 3.075
dus Q = 2 ´ 3.075 = 6.15 oftewel Q = (2/N)*sum(seq((1-X)/X,X,.5/N,.5,1/N)). Voor n=100 komt er Q =10.75 en voor n=999 Q =15.36.
Inventies 03/05/05
- 74 -
De som S Q.p moet, als we de indeling in n klassen verder verfijnen, omgezet worden in de integraal: 1
2×
2
ò
1
2n
[
1
2 1 1- x 1 dx = 2 × ò ( - 1) dx = 2 × [ln x - x ]12 x x 2n 1
= 2 × ln
2n
1
1
2 - 2 - ln
1 2n
]
[
+ 21n = 2 × - ln 2 - 1 2 + ln 2n + 21n
]
1 1 = -1 - 2 ln 2 + 2 ln 2 + 2 ln n + n n » -1 + 2 ln n , als het aantal klassen/simulaties n ® ¥ gaat. = -2 ln 2 - 1 + 2 ln 2n +
Het is dus onmogelijk om de verwachtingswaarde te berekenen! Het venijn zit 'm in de gearceerde staart, lim ln x gaat namelijk op een x ®0
exponentiële wijze naar min-oneindig. Merk op dat de trendlijn Q = 4.4+2ln n door de puntenwolk flink wat hoger ligt dan (maar wel dezelfde helling heeft als) de verwachte waarde Q = -1+2ln n. Als je de vier hoogste Q-waarden weglaat klopt het iets beter: Q = 1.5+2ln n. Wellicht is de mediaan of het gemiddelde van de mediaan een betere maat voor het centrum van de uitkomsten. Zoals bekend, is de mediaan minder gevoelig voor extreme uitkomsten. STOK2MED ClrHome:ClrAllLists Output(1,1,"SERIENR:") Output(2,1,"MED=") For(M,1,100) Output(1,10,M) For(N,1,100) of: For(N,1,999) randüR If R<.5:1-RüR R/(1-R)üQ QüL1(N) End 1-Var Stats L1 MedüX:XüL2(M) Output(2,5,round(X,3)) End 1-Var Stats L2 Output(4,1,"MEDIAAN GEM :") Output(5,1,Ë)
Aldus vond ik 3.06 als gemiddelde mediaan, zowel bij n = 100 als bij n = 999. Maar daarmee is de afhankelijkheid van n verdwenen. Zo is er gelukkig weer iets om over na te denken.
Onnodige ongerustheid Een stelling die aan de stelling van Bayes voorafgaat luidt: P(B) = P(B|A).P(A) + P(B|A').P(A') De juistheid hiervan bewijzen we met enkele van de eerder gegeven stellingen. Ga maar na:
Inventies 03/05/05
- 75 -
B = BÇU = BÇ(AÈA') = (BÇA) È (BÇA') volgens resp stelling 4, 7 en 15. De doorsnede is leeg want (BÇA) Ç (BÇA') = (BÇB) Ç (AÇA') = BÇÆ = Æ volgens stelling 11, 13 en 2. Dus P(B) = P(BÇA) + P(BÇA') = P(B|A).P(A) + P(B|A').P(A'). Een, maatschappelijk gezien, buitengewoon belangrijk gevolg van deze stelling is de notie dat de uitslag positief/negatief van een onderzoek niet voor honderd procent te vertrouwen is. Contraexpertise is absoluut aan te bevelen! Met name wat men noemt vals-positieve uitkomsten kunnen tot grote, onnodige ongerustheid leiden. Een onderzoek (bij een grote groep mensen) wordt altijd uitgevoerd met een test die niet voor 100% betrouwbaar (correct) is. Een voorbeeld. Aangenomen dat 1% van de mensen feitelijk besmet (ziek, gedrogeerd) is (B=0,01 is de fractie die besmet is) en aangenomen dat de test (het bloedonderzoek, de Röntgenfoto) in 99% van de gevallen een correcte uitslag geeft (C=0,99 is de fractie correcte uitslagen) dan is de geloofwaardigheid van een positieve uitslag (positief wil zeggen: "Helaas, U bent ziek/besmet/gedrogeerd"): G = P(besmet | test pos) = BC / [BC + (1-B)(1-C)] = 0,5 Met andere woorden: in dit geval hoeft iemand die een positieve uitslag krijgt ("Helaas, …") nog niet te wanhopen, want er is maar liefst 50% kans (hoop) op een gunstiger uitkomst, een vals-positieve uitkomst. Gauw contra-expertise aanvragen dus! De volgende tabel illustreert de verwachting volgens Bayes bij het bovenstaand voorbeeld (N=10 000, B=0.01, C=0.99). test correct
test fout
totaal aantal
besmet
B.C.N=99
B(1-C).N=1
B.N=100
niet besmet
(1-B).C.N=9801
(1-B)(1-C).N=99
(1-B).N=9900
totaal aantal
C.N=9900
(1-C).N=100
N=10 000
Inventies 03/05/05
- 76 -
Wetenschappelijk? Soms halen wiskundige of statistische overwegingen de krant. Na het typen van de vorige regels las ik (in de NRC van 11 oktober 2003) het volgende in een ingezonden brief.
UMTS onderzoek Volgens een bericht over een onderzoek naar de mogelijke effecten van straling van mobiele telefoon zendmasten, zou er een 'statistisch significant' (d.w.z. met 95% betrouwbaarheid) verband zijn tussen de blootstelling aan straling van UMTS-antennes en het optreden van lichamelijk (on)welbevinden. Deze conclusie is fout. De onderzoekers zijn in een bekende (en beruchte) statistische valkuil getrapt. In werkelijkheid is het verreweg het waarschijnlijkst dat de uitkomst te wijten is aan puur toeval, en is er dus geen reden om UMTS-masten nu als 'verdacht' te bestempelen. Ik heb serieuze twijfels over de manier waarop het onderzoek is uitgevoerd. Maar aangenomen dat het onderzoek inderdaad een betrouwbaarheid heeft van 95%, is er dus 95% kans dat, als er in werkelijkheid geen verband is, er ten onrechte geconcludeerd wordt dat dat er wel is. Er is dan sprake van een vals-positieve uitkomst. De onderzoekers verbinden hieraan echter de verkeerde conclusie dat er dus met 95% zekerheid is vastgesteld dat blootstelling aan UMTS-straling waarneembare effecten oplevert. Dat dit fout is kan als volgt worden aangetoond. Ik schat de kans dat er inderdaad een effect is op (bijna) nul. Voorafgaand aan het onderzoek van TNO is er immers geen verband aangetoond. Ook geeft het TNO onderzoek zelf aan dat soortgelijke straling van GSM-antennes blijkbaar geen waarneembare effecten heeft. Laten we aannemen dat er bij voorbaat 1% kans is dat er inderdaad een effect is. De kans op een valspositieve uitkomst is dus 0.99´0.05 en is dus ongeveer 5 maal groter dan de kans van 0.01´0.95 dat het onderzoek de juiste uitkomst geeft. Dus is er maar liefst 84% kans dat de verkeerde conclusie getrokken is. Totaal anders dan de 5% onzekerheid gesuggereerd door de onderzoekers. Het bovenstaande ligt ten grondslag aan de formule van Bayes. De Tweede Kamer dient te overwegen of het nuttig is om nog meer belastinggeld te steken in een onderzoek waarvan het vrijwel onvermijdelijk is dat de uitkomst voornamelijk op toeval berust. Prof. Dr. Ir. B.J. van Wees, Groningen Ik maak hier een tabelletje bij. Dat komt voort uit een dwangmatige behoefte om uit te leggen.
conclusie:
effect geen effect totaal
werkelijk effect: ja nee 0.01´0.95 0.95´0.99 0.01´0.05 0.05´0.99 0.01 0.99
De kans op een verkeerde conclusie =
Inventies 03/05/05
totaal 0.95 0.05 1
0.05 ´ 0.99 = 0.84 0.05 ´ 0.99 + 0.01 ´ 0.95
- 77 -
2.8
Extra opgaven over simulaties
33.
Laat zien dat in een klas van 30 leerlingen de kans dat er twee gelijk jarig zijn minstens 70% is. Doe dat op twee manieren: (a) Via 200 simulaties in een programma JAARSIM waarbij je 30 getallen zonder terugleg trekt uit U={1,2,3,…,30}. Sorteer deze 30 getallen (ASort) en onderzoek of de verschilrij (DList) nullen bevat. Zo ja, dan 30 nieuwe getallen genereren. Deze controle op het niet-terugleggen kost tijd waardoor je een beetje geduld moet hebben. Tweehonderd simulaties echter is wel het minste wat je kunt doen om duidelijkheid te krijgen. (b) De formule voor het verjaardagenprobleem in een klas van 30 leerlingen is:
1-
365 364 363 336 × × × ... × 365 365 365 365
Bedenk een procedure om de TI-83 dit te laten uitrekenen. Dat is niet zo gemakkelijk als je zou denken, want uitdrukkingen met een faculteit erin geven al gauw een OVERFLOW foutmelding. Misschien is het handig, om de MATH functie nPr te gebruiken. De functie N nPr K staat voor het aantal permutaties van rijen met K elementen, gekozen uit een totaal aantal van N elementen. Het is een soort machtsverheffen met teruglopende factoren: 10 nPr 3 geeft niet 10´10´10 maar 10´9´8=720. Neem, om dit toe te lichten, alle getallen van drie cijfers van 000 t/m 999. Hoeveel van die 1000 getallen bestaan uit drie verschillende cijfers? Het antwoord op die vraag is 10´9´8 = 10 nPr 3 = 720. Zet een formule in Y1 voor alle mogelijke klasgroottes X£40 in het verjaardagenprobleem en lees de tabel af die hoort bij Y 1. 34.
Het dronken beeldschermpunt. Programma RANDWALK. Startend links-midden op positie (30,5) beweegt pixel (X,Y) met stapgrootte 1 in principe naar rechts. Echter: het pixel is lichtelijk aangeschoten. De kansen op een stapje omhoog,omlaag en naar links hebben een (random) kans 0.2; het stapje naar rechts heeft een tweemaal zo grote kans (0.4 dus). Bijvoorbeeld. Als rand>0.6 doe je X+1 ® X; als rand<0.2 dan Y+1®Y; als rand tussen 0.2 en 0.4 dan Y-1®Y; als rand tussen 0.4 en 0.6 komt er X-1® X. Schrijf hiervoor een programmaatje. Pas op: na Pixl-On(X,Y) wordt de Y op nul gezet (de X niet, vreemd genoeg); dat is een fout in TIbasic die ook speelt bij de Pt-On en line functies. Je moet dus eerst Y even opzij zetten met Y®Z en na Pixl-On deze coördinaat weer oproepen met Z ®Y.
35.
Schrijf een simulatieprogramma BIN4KANT dat de gemiddelde afstand berekent tussen twee punten (A,B) en (C,D) binnen een eenheidsvierkant. Een eenheidsvierkant heeft de hoekpunten (0,0), (1,0), (1,1) en (0,1). Je kunt dus voor de coördinaten simpelweg de instructie rand nemen. De afstandsformule is volgens Pythagoras:
(C - A) 2 + ( D - B ) 2 36.
Dezelfde vraag voor twee punten binnen een eenheidscirkel. Let op 2 2 2 2 de voorwaarden: A + B < 1 en C + D < 1. Het programma heet BINCIRKL.
37.
De algemene kwadratische vergelijking ax + bx + c = 0 heeft, zoals je weet, geen 2 oplossing als de "discriminant" b - 4ac < 0 is. Je kunt dit ook anders formuleren: 2 De parabool y = ax + bx + c heeft geen snijpunt of raakpunt met de 2 x-as, als b - 4ac < 0. Zo te zien is de kans op het al of niet snijden van de x-as ongeveer fifty-fifty.(Het geval met maar één oplossing, het raken, is zo zeldzaam dat we het gevoeglijk kunnen vergeten). Maar …. Is dit weer een voorbeeld van gezichtsbedrog, zoals als we al veel vaker hebben meegemaakt of kunnen we dit keer op het gezonde verstand vertrouwen?
Inventies 03/05/05
2
- 78 -
We noemen het programma WORTELS2. Je kunt a, b en c random nemen tussen bijvoorbeeld -1 en 1 (of -10^10 en +10^10). Maar verstandiger is het, te beginnen met a=1, dus eerst te 2 kijken naar de wortels van x + bx + c = 0. 38.
a) Simuleer het werpen met een munt. Het verschil tussen het werkelijke aantal keren kop en het verwachte aantal kop neemt langzaam toe. Het verschil tussen de werkelijke fractie kop en de verwachte fractie kop (0.5) echter neem snel af naar nul. Laat dit zien in een grafiekje in het Draw scherm. Neem Ymin=-30 en Ymax=30, Xmin=0 en Xmax=94. Hierin is X het worpnummer en Y = (aantal kop - verwachte aantal kop). Zorg ervoor dat je de serie van 94 worpen telkens kunt herhalen, want 94 is te weinig om iets te kunnen zien van deze "stochastische wandeling". Onderaan het scherm is nog plek voor het verschil van de fracties. Daar zou je tegelijkertijd het fractieverschil -30+60´ fractieverschil kunnen weergeven. Dat zou naar nul moeten gaan. Je zult zien dat hoe groter het aantal worpen is, des te langer het duurt voor de eerstgenoemde stochastische wandeling terugkeert op nulniveau. Daar hebben we weer een voorbeeld van de grilligheid van de statistiek. Onze intuïtie heeft vaak moeite met zulke verschijnselen. Het programma hebben we STOWAND genoemd. b) Het duurt veel langer dan je zou denken voordat de gevonden fractie (de "zweetkans") een beetje gaat lijken op de theoretische kans (de "weetkans"). Hoeveel worpen (n) met een geldstuk heb je minstens nodig om de de-decimaal (d=1 is de eerste decimaal) met 95% waarschijnlijkheid goed te hebben? Geef een formule die n in d uitdrukt; bedenk dat in dit geval de standaarddeviatie s gelijk is aan Ö(n.p.q) dus Ö(n.½ .½) = ½Ön. en dat je volgens een vuistregel een afwijking 2s moet nemen.
Inventies 03/05/05
- 79 -
3.
Statistiek
Is STATISTIEK een exacte wetenschap? (Of een verzameling nauwkeurig geformuleerde onnauwkeurigheden ...). De statistiek is een betrekkelijk jong vakgebied. Voorheen genoten statistici weinig aanzien. Het ordenen van vaak duizenden gegevens in tabellen was een buitengewoon eentonig en arbeidsintensief werk, een noodzakelijk kwaad bij (verzekerings)banken en bevolkingsonderzoek en dergelijke. En zijdelings toch ook bij wetenschappelijke experimenten, zoals het erfelijkheidsonderzoek van de Oostenrijkse monnik Gregor Mendel, halverwege de negentiende eeuw. Deze beschrijvende statistiek of statistische analyse was wat je noemt monnikenwerk. Sinds de opmars van de computer die saai rekenwerk met liefde en grote precisie uitvoert, is dat alles ingrijpend veranderd. Niet alleen het elektronische rekenwerk, maar vooral ook de conclusies die er uit getrokken kunnen worden (de verklarende of inductieve statistiek) hebben de statistiek tot een veelzijdige hulpwetenschap gemaakt. Thans is er nauwelijks meer een vakgebied te vinden waar statistische technieken geen rol spelen. Het vak is geen typisch exact vak, eerder een soort kookboek vol met recepten. Gelukkig zijn onze scholieren er tamelijk mee doodgegooid zodat ik me kan permitteren het onderwerp en die scholieren grotendeels met rust te laten. Ik beperk me tot twee buiten het leerprogramma vallende voorbeelden, de regressie naar het midden en de chi-kwadraat test. Maar nu eerst een kleine samenvatting van de te gebruiken terminologie en formules.
3.1
Beschrijvende statistiek
De totale verzameling waaruit de waarnemingen (data) gehaald worden noemt men de populatie. De deelverzameling van waarnemingsgetallen is de steekproef (Eng. sample). De waarnemingsgetallen krijgen de letter X, de populatiegrootte de letter N. De Griekse letter m (mu) wordt gebruikt voor het gemiddelde, soms wordt een gemiddelde gesymboliseerd door een streep boven de letter: N
å Xi X =m=
i =1
N
; 2
De Griekse letter s (sigma) hoort bij de standaardafwijking en s bij de variantie: s2 =
å ( X - m )2
De kwadratensom straks.
N
= ( X - m )2 = X 2 - ( X )
å ( X - m )2
2
speelt een overheersende rol bij de verklarende statistiek, dat blijkt
De gestandaardiseerde normale verdeling is gekenmerkt door x = 0 en s=1 en z =
x-x . s
De correlatiecoëfficiënt r is het gemiddelde product van de z-waarden, namelijk:
r = zx × z y =
x - x y - y xy - x × y × = sx sy s x ×s y
De TI-83 heeft o.a. de lijsten L1 t/m L6 beschikbaar voor data. Hebben we maar één lijst met gegevens dan komt die in L1. Je kunt dan de mediaan en de kwartielen uit STAT1-Var Stats aflezen en de boxplot tekenen met [2nd]STATPLOT. Wanneer de waarnemingsgetallen al zodanig geordend zijn dat we ook over de frequenties ervan beschikken, zetten we die frequenties meestal in L2. De statistische analyse wordt dan bereikt via 1-Var Stats L1,L2.
Inventies 03/05/05
- 80 -
Mendel sjoemelde: Verklarende statistiek Het hiernaast staande plaatje illustreert het vuistregeltje, dat 95% van de waarnemingen in het algemeen niet meer dan twee standaard-deviaties afwijkt van het gemiddelde. In het binnengebied staan de "gewone", veel voorkomende waarnemingen. De waarnemingen aan de buitenkant zou men buitenstaanders, of significant afwijkende waarnemingen kunnen noemen. low (van lower) staat voor de ondergrens; up (upper) voor de bovengrens van de gewone, veel voorkomende waarnemingsgetallen. Bij hypothese toetsen gebeurt er het volgende. Men wil een uitspraak over wat als "gewoon", en wat als significant afwijkend moet worden verstaan. Dergelijke uitspraken kunnen nooit met 100% zekerheid gedaan worden. Men doet ze met een waarschijnlijkheid P. De nulhypothese (H0) geeft aan welke waarnemingen als normaal zullen worden beschouwd; de alternatieve hypothese (H1) geeft de afwijkende waarnemingsgetallen aan. De oppervlakte onder de klokvormige kromme (of: het histogram) is in het getekende plaatje 0.95 (of 95%) van de totale oppervlakte die 1 is (of 100%). Aan beide uiteinden is de overschrijdingskans P=0.025 in zo'n tweezijdige toetsing. In mijn boekenkast staat een prachtig standaardwerk uit 1974 van David Freedman onder de onwaarschijnlijke naam Statistics. Daarin wordt het werk van Gregor Mendel (1822-1884) nader bekeken. Mendels experimenten werden uitgevoerd met de plantjes van een erwtensoort. De zaadjes ervan waren geel of groen en na kruising van de oudergeneraties ontstond een tweede generatie waarin de verdeling geel-groen ongeveer 75%-25% leek te zijn. Mendels levenswerk heeft een grote invloed gehad. Maar de wiskundige Fisher heeft aangetoond dat zijn data naar alle waarschijnlijkheid (een rechter zou zeggen met aan zekerheid grenzende waarschijnlijkheid) mooier gemaakt zijn. In een van zijn experimenten bijvoorbeeld kreeg Mendel 8023 tweede-generatie zaadjes waarvan er 2001 groen waren. Dat komt neer op 8023 keer trekken met terugleg uit de verzameling {0,0,0,1} als we 0 gebruiken voor geel en 1 voor groen. De verwachting van het gemiddelde is 8023/4 » 2006 en de kans dat een gemeten aantal hier maximaal 5 van afwijkt is normalcdf(2000.5,2011.5,8023*.25,Ö(8023*.25*.75))=.113
Dat wil zeggen dat van elke negen experimenten er maar één (ongeveer) zo dicht bij de verwachtingswaarde komt. Dat is nog net niet te mooi om waar te zijn. Maar het probleem met Mendels andere (zeer grote aantallen) experimenten is dat in alle andere gevallen de uitkomsten eveneens "bijna te mooi zijn om waar te zijn". Fisher paste de zogenaamde chi-kwadraat toets toe (daar komen we nog op terug) op het totaal aan waarnemingen van Mendel en vond dat het smalle strookje binnengebied met "normale" uitkomsten zo smal is (4 op de 100 000 oftewel 0.00004) dat men moet constateren dat er geknoeid is met de waarnemingen (onwelgevallige zaadjes werden simpel niet meegeteld). Mendels gedrag is niet uitzonderlijk en misschien zelfs vergeeflijk, omdat zijn theorie wel juist was. Maar wees er op bedacht dat nog steeds -onderzoekers zijn ook maar mensen- de wens de vader van de gedachte is. Fisher formuleert het heel mild: There are two possibilities: - either Mendel's data were massaged - or he was pretty lucky The first possibility is easier to believe.
Inventies 03/05/05
- 81 -
Ontwerp zelf een puntenwolk Van 600 vaders (op de x-as) en hun zoons (op de y-as) is de lichaamslengte gesimuleerd. Elk punt (x,y) stelt een combinatie (vader,zoon) voor. Zo krijg je een "wolk" van 600 punten (een scatter diagram) . De gemiddelde lengte en standaarddeviatie van de vaders en zoons zijn voor het gemak gelijk gekozen, namelijk x = y = 180 cm en s x = s y = 7 cm . Een random normale verdeling voor de vaders wordt gehaald uit randNorm(180,7,600)üX en XüL1 , met de zoons ligt het iets ingewikkelder.
y - y = a × ( x - x)
y
y
x x Veronderstellen we in eerste instantie even dat lichaamslengte enigszins erfelijk is, dus dat lange vaders gemiddeld zoons hebben die ook (iets) langer zijn dan het gemiddelde (180 cm). Hoe moeten we die correlatie in de puntenwolk terugzien? Het is geen gek idee om een lineair verband te nemen, dat wil zeggen dat de punten rond een lijn gespreid liggen met richtingscoëfficiënt a. In dit geval dus de lijn
y-180 = a(x-180) oftewel y = ax + (1-a)×180 De lengtes van de zoons echter zijn onderhevig aan twee varianties, de zogenaamde verklaarde variantie van de vader (72 ) plus de onverklaarde variantie van de zoons (ook 72 ). De totale variantie is 49+49=98 (de standaarddeviatie Ö98 is dus ongeveer 10). Hierdoor moet ons model eigenlijk gecorrigeerd worden voor sy, maar voor de plaatjes en het principe dat we willen illustreren maakt dat allemaal gelukkig weinig uit. We bekijken twee modellen. Model I
Lichaamslengte is niet erfelijk (a=0): randNorm(180,7,600)üX randNorm(180,7,600)üY
en XüL1 en YüL2
Model II De richtingscoëfficiënt a = ½ dus de lijn y = 0.5x + 90 bevat de gemiddelde ycoördinaat, de punten schommelen dus rond deze lijn: randNorm(180,7,600)üL1 For(I,1,600) L1(I)üX: .5X+90üY randNorm(Y,7)üL2(I) End
Wat een zekere verwantschap veronderstelt. De geplotte puntenwolk kan geanalyseerd worden met LinReg(ax+b) waaruit we in deze simulatie een correlatiecoëfficiënt 0.42 vinden. (Model III
Perfecte correlatie zou betekenen dat alle zoons precies even lang zijn als hun vaders. Dan klapt de puntenwolk samen tot een lijnstuk en verliezen wij onze belangstelling.)
Regressie naar het midden Links zijn in de puntenwolk van model II drie lijnen getekend. De lijn y=x beschrijft de zoons en vaders die even lang zijn. De verticalen
Inventies 03/05/05
- 82 -
x=170 en x=190 tonen de lichaamslengten (y-waarden) van zoons die een vader van 170 cm respectievelijk 190 cm lengte hebben. Het scherm wordt zo in zes gebieden verdeeld. Wat opvalt is, dat in het "sextant" rechtsonder meer punten liggen dan rechtsboven; idem (maar dan omgekeerd) bij de sextanten links. In woorden: extreem lange vaders (zeg boven de 1.90) hebben zoons die weliswaar langer zijn dan gemiddeld, maar niet extreem veel langer. En extreem kleine vaders (onder de 1.70) hebben kleine zoons in het algemeen minder extreem klein zijn. En dat is de beroemde wet over de regressie naar het midden. Deze wetmatigheid is een zuiver statistisch verschijnsel en heeft niets te maken met oorzaak of gevolg of erfelijkheid. Als de waarnemingen volledig onafhankelijk zijn (de correlatie dus nul is) is de regressie naar het gemiddelde nog veel sterker dan in het vorige voorbeeld. Het gemiddelde van de zoons van lange vaders zal dan in de buurt van de 180 liggen. Regressie naar het midden is dus louter een gevolg van het toeval. Als je drie keer achtereen een vijf of een zes gegooid hebt met een dobbelsteen, is de kans dat je voor de vierde keer opnieuw hoog zult gooien niet groot. Niet omdat de dobbelsteen z'n uitkomsten onthouden heeft en denkt "Kom, laten we eens wat anders proberen", maar simpelweg omdat de kans op een vijf of zes twee keer zo klein is als de kans op een vier of lager.
Het chi-kwadraat certificaat Waarnemingsgetallen X schommelen rond hun verwachtingswaarde ü. De variantie is een maat voor 2 de spreiding van waarnemingen rond hun gemiddelde, zoals de definitie van s aangeeft. Wil men toetsen of de waarnemingen min of meer normaal volgens de verwachting zijn gespreid, dan kan men 2 de chi-kwadraat toets hanteren. De Griekse letter c spreekt men uit als "chi"; de definitie van c bevat 2 de genoemde kwadratensom en is te vergelijken met die van s . Als alle uitkomsten even waarschijnlijk zijn met gemiddelde E geldt: c2 =
å ( X - x) 2 = å (O - E ) 2
(O = Observed, E = Expected) E x De (theoretische) verwachtingswaarden E (of ü) doen we meestal in L2, de waarnemingen in L1. 2
De c -test gebruikt men om te kijken of de waarnemingen op een geloofwaardige manier afwijken van de verwachting. Als een soort certificaat van echtheid. Waarnemingen die te dicht op hun verwachtingswaarde zitten zijn te "mooi", waarnemingen die extreem veel afwijken van hun verwachting hebben misschien een verkeerde verwachting gehad. 2
2
De c -test vind men op de TI-83 onder de menuknop STAT; de c verdelingsfunctie staat onder de knop DISTR. Bij deze verdeling wordt meestal gekeken naar de "oppervlakte rechts van", en dat levert dan de kans op extreme uitkomsten (de P-waarde). Het aantal vrijheidsgraden (df = degrees 2 of freedom) van c is 1 minder dan de grootte van de steekproef: df = n - 1. De gemiddelde 2 verwachtingswaarde van c is, in normale gevallen, gelijk aan df. In het programma TSTCHIKW zijn bij de eerste menukeuze drie gevallen van frequenties na 600 dobbelsteenworpen bedacht. De verwachte frequentie is dan 100 en df = 6-1 = 5. Bij het eerste 2 gedachtenexperiment liggen de frequenties dicht bij 100. De berekende c (ongeveer 1) is dan ook veel lager dan df en de P-waarde duidt erop dat de verwachte afwijkingen veel groter zijn. Conclusie: de frequenties zijn te mooi om geloofwaardig te zijn. Het tweede gedachtenexperiment vertoont een 2 normalere uitslag (c ligt in de buurt van df). Het derde experiment vertoont zeer grote schommelingen. De kans op minstens zo'n uitkomst is 7% (P=0.071).
Inventies 03/05/05
- 83 -
kleine afwijkingen
normale afwijkingen
grote afwijkingen
OPGAVE 39.
Bij de toelichting op het programma SERIESIM, leverde een simulatie van 512 worpen met eenmuntje de hiernaast weergegeven series op. Serielengte 1 kwam 141 keer voor, enzovoorts. Serielengte 8 kwam 1 keer voor; neem dus L2 (8)=1. L+1
De verwachtingen (in L3) waren 512´(½) . Onderzoek of deze verwachtingswaarden kloppen met de simulaties. Zijn de afwijkingen een beetje redelijk gespreid?
Bedenk zelf eens, zonder hulp van een randomgenerator, een rij van 128 worpen met een geldstuk (0 of 1). Ik vermoed dat je daar geen zin in hebt. Daarom heb ik het zelf maar even voor je gedaan. Op het met nullen en enen gevulde schermpje (plaatje 1) staan mijn bedachte uitkomsten (van links naar rechts en van boven naar onder lezen). Ik heb erg mijn best gedaan om een zo normaal mogelijke uitslag te krijgen en op het eerste gezicht lijkt dat goed gelukt. Bij een ideale randomrij van 128 nullen en enen zou het gemiddelde m=0.5 en de standaarddeviatie s=Ö (½.½) = 0.5 moeten zijn. En zowaar, daar kwam ik erg dicht bij (plaatje 2). Maar niet te vroeg juichen: na een chi-kwadraat test volgt de ontmaskering (plaatjes 3 en 4)! De P-waarde van 0.01 betekent dat er maar 1% kans is op zo'n extreem hoge kwadratensom (15 in plaats van de verwachte 5). Er zaten dus (veel) te veel korte series in mijn fantasiereeks. Het is kennelijk erg moeilijk om zelf randomwaarden te bedenken.
Inventies 03/05/05
- 84 -
3.2
Welke functie past bij de meetpunten?
Het kleinste kwadraat?
X2X2X2
2
2
X X2 X2 X2 X
2
X
X2X
2 2
X
Stel we hebben een aantal meetpunten (xk, yk) (k = 1,2,3,…,n) waarbij we een zo goed mogelijk passend functievoorschrift willen vinden. Neem bijvoorbeeld een dobbelsteen en gooi daar tien keer mee. Hiernaast is dat geïllustreerd in fig.1. Op de horizontale as staat het worpnummer, verticaal de uitkomst. We zoeken nu een constante functie y = a die optimaal past bij deze uitkomsten {2, 3, 3, 5, 1, 3, 3, 6, 3, 4}. Hoe vinden we de waarde van a die in totaal een zo klein mogelijke afwijking van het functievoorschrift y = a zal opleveren? Neem aan dat de n uitkomsten normaal verdeeld zijn rond y = a, volgens Gauss: 1
- 2 ×( x - m ) 2 1 × e 2s s 2p
2
dus hier evenredig zijn met exp[-(yk - a) ]. Ik gebruik exp voor het grondtal e, om formules in vier etages te vermijden. Als alle schommelingen toevallig zijn, dus onafhankelijk van elkaar, geldt de productregel voor de totale kans. De maximale totale kans op een zo klein mogelijke gemiddelde 2 2 2 afwijking is dus evenredig met het product exp[-(y1 -a) ]× exp[-(y2 -a) ]× exp[-(y3 -a) ]× (aangenomen dat de dataschommelingen onafhankelijk zijn) dus evenredig met de som van de exponenten (volgens 2 de eerste machtsregel moet je de exponenten optellen): exp[-S(yk -a) ]. 2
Een maximale kans op minimale afwijkingen krijg je dus door de kwadratensom S(yk -a) te minimaliseren.
Dit is het principe der Kleinste Kwadraten. Volgens dit principe moet in ons voorbeeld de functie 2
2
2
2
2
2
2
2
2
2
2
f (a ) = (2-a) + (3-a) + (3-a) + (5-a) + (1-a) + (3-a) + (3-a) + (6-a) + (3-a) + (4-a) = 10a - 66a + 127
minimaal zijn. De afgeleide ervan naar a moet dus nul zijn: 20a - 66 = 0, leidend tot de optimale waarde van a: 3,3 hetgeen juist het gemiddelde ü is van de tien waarnemingsgetallen! Kijk naar het inleidende programma KK. Wie de beschikking heeft over een TI83 hoeft niet te differentiëren! Het commando fMin(Y1,X,L,R) doet het immers ook.
KK randInt(1,6,10)üL2 seq(X,X,1,10)üL1 Plot1(Scatter,L1,L2,Ð) DispGraph 1-Var Stats L2 55-9.5ËüP:round(P,0)üP Pause "sum((L2-X)Ü)"üY1 DispGraph Pause ClrHome Output(1,1,"Ë="):Output(1,3,Ë) Disp "MINIMUM":Disp "KWADRATENSOM" Disp "BEREIKT VOOR A=" Min(Y1,X,2,5)üA:round(A,1)üA:Disp A X-.3üTblStart:.1ü¾Tbl:DispTable
Inventies 03/05/05
- 85 -
OPGAVE 40.
Een variatie rond het thema KK1. Creëer een tiental punten die fungeren als meetpunten rond de lijn y = ½ x met behulp van 0.5L1+randNorm(0,1.5,10)üL2. De bedoeling hiervan is om de richtingscoëfficiënt a te bepalen van de lijn y = a x door O die het beste bij deze tien meetpunten past. Je verwacht natuurlijk dat die optimale waarde van a ongeveer 0.5 is. Zet de kwadratensom in Y1 met "sum((L2-XL1)Ü)"üY1 en bepaal het minimum ervan met fMin(Y1,X,0,1)üA . Maak een programma KK2 dat soortgelijke schermplaatjes produceert als hierboven.
Het principe der Kleinste kwadraten (Least Squares) is gebruikt bij een tiental regressiemodules in de TI-83, die te bereiken zijn via STAT CALC. De populairste daarvan is LinReg(ax+b) L1,L2,Y1 om de best passende rechte lijn Y1 = ax + b te vinden bij een verzameling meetpunten (L1,L2). Een groot nadeel van deze modules is dat je de parameters (hier: a en b) niet in de hand hebt. Als we onze rechte lijn per se door de oorsprong willen hebben (b=0) of perse horizontaal (a=0) kan daar niet voor gezorgd worden. Neem het voorbeeld met de dobbelsteen. Als je daar LinReg op loslaat, wordt de lijn y = 0,18x + 2,33 aangeboden als beste benadering. Maar een oplopende trendlijn heeft bij de uitkomsten van een dobbelsteen weinig zin. Een ander voorbeeld zou kunnen zijn het meten van de veerconstante C bij de uitrekking van een veer (F = C×u); je bent daar, lijkt me, niet echt geïnteresseerd in een veer die al een bepaalde uitrekking u ¹ 0 vertoont als er een gewicht 0 aan hangt. Straks zullen we kijken of daar iets aan te doen is. Maar eerst een stukje theorie. De methode der kleinste kwadraten resulteert dus in de regressielijn voor aanpassing aan de lineaire functie y = ax + b. 2 2 Minimaliseer daarvoor S (y - (ax+b) ) = S (y – ax – b) . Er moeten nu twee afgeleiden nul gesteld worden, onderweg de kettingregel gebruikend: d/da = 0 geeft 2×S (y-ax-b).-x = 0 en d/db = 0 geeft 2×S (y-ax-b).-1 = 0 Let op, je differentieert naar a en b want dat zijn de onbekenden dus bijvoorbeeld
d
da
(ax) = x .
Hierna ontstaan er twee vergelijkingen in a en b: 2
a.Sx + b.Sx = Sxy en a.Sx + b.n = Sy met voor a de oplossing: a=
SxSy - nS( xy ) xy - x × y = 2 2 (Sx) - nSx ( x 2 ) - ( x) 2 2
a
Als een niet-lineaire functie in a (zoals y = (x - a) of y = x ) gezocht wordt, is linearisatie van a de aangewezen weg. Maak in dat geval een eerste (zo nauwkeurig mogelijke) schatting van a (die noemen we even a 0) en neem in plaats van f (a) de eerste twee termen (het lineaire deel) van de Taylorreeks: f (a) = f (a 0 ) + (a-a 0).f '(a0 ) waarbij f '(a0 ) op de TI83 gehaald wordt uit nDeriv(Y1,A,A). Gebruik vervolgens de uitkomst van a als start voor een nieuwe, betere schatting. De herhaling van dit ons inmiddels bekende, door Newton bedachte proces heet iteratie.
Inventies 03/05/05
- 86 -
Dat ziet er niet vriendelijk uit, maar als gezegd: het minimaliseren van een functie hoeft op onze rekenmachine niet via differentiëren te verlopen. We gebruiken de voorgebakken functie die het minimum van een functie Y1 berekent, fMin(Y1,X,L,R), om een aanpak te zoeken in de volgende gevallen.
Een functie F (x, a) met één parameter Dit programmadeel werkt simpel en is bedoeld voor functies als f (x) = a.x x (de eenvoudigste) en f (x) = a (die als éénterm ook met PwerReg behandeld 2 zou kunnen worden) maar ook bijvoorbeeld: f (x) = (x - a) . Bij de hiernaast getekende punten (x, y) geeft LinReg L1,L2 als regressielijn y = 3,29x 0,57. Als we de regressielijn per se door (0,0) willen, gebruiken we ons Kleinste Kwadraten programma en komt er y = 3,15x. Nog een voorbeeld. We zoeken een wortelfunctie Ö(x + a) die zo goed mogelijk (dat wil zeggen met de kleinst mogelijke kwadratensom) door een zestal punten gaat. De meetpunten komen vooraf in L1 en L2. Schat A en stop F(X,A) in Y1. De kwadratensom sum((Y1-L2)Ü) wordt geminimaliseerd wat een optimale waarde van A oplevert. "Y1(L1)"üL3 fMin(sum((L3-L2)Ü),A,B,C)üA
"FUNCTIE NAAR L3" "MINIMALISEREN KWADRATENSOM"
De x (in L1) en y (in L2) van de meetpunten en de functie (in Y1) worden vooraf ingevoerd. Na een (grove) eerste schatting van de parameter is een enkele iteratie voldoende voor een redelijke aanpassing, zoals uit het grafiekje blijkt.
Een functie F (x, a, b) met twee parameters 2
Zodra een tweede parameter gebruikt wordt (zoals in f (x) = a.x + b.x) moeten we het nodige geduld betrachten met de tweede methode. Belangrijk is een goede eerste schatting voor a en b, want "de" oplossing is al gauw niet eenduidig meer! "Y1(L1)"üL3 fMin(sum((L3-L2)Ü),A,P,Q)üA fMin(sum((L3-L2)Ü),B,S,T)üB Output(6,1,"KWADRATENSOM:") sum((L3-L2)Ü)üE Output(7,1,round(E,3))
"MINIMALISEREN KWADRATENSOM"
o
Heet water koelt af naar kamertemperatuur (20 C). Het model hierbij wordt gegeven door t T = 20 + a ×b met t in L1 en T in L2. Bereken a en b.
Inventies 03/05/05
- 87 -
Een lineaire combinatie van twee functies We proberen de beste aanpassing te vinden van het type y = a×f (x) + b×g(x) + c aan een serie meetpunten (x in L1, y in L2). Stel f (x) = x en g (x) =
1 ; x +1
we zoeken in dat geval de meest geschikte waarden voor a, b en c in de lineaire combinatie
y = a×x+
b +c x +1
In het bijbehorende programma is met matrices gewerkt om de drie vergelijkingen met drie onbekenden a, b en c op te lossen. Later wellicht iets meer over het oplossen van stelsels vergelijkingen. Op deze plek volsta ik met wat plaatjes.
Deze drie regressiemodellen zijn samengevat in het programma RGREXTRA.83P waar een minimale toelichting (intro) gegeven wordt. De gebruiker wordt geacht te weten dat hij vooraf de data in L1 en L2 zet en het functievoorschrift in Y1 (eventueel Y2). Daarmee is dat programma een aanvullende applicatie geworden op de tien regressiemodellen in STAT CALC.
Inventies 03/05/05
- 88 -
4.
Analyse
We betreden hier het terrein van de analyse (calculus, zeggen de Amerikanen), in de tweede helft van de zeventiende eeuw door Newton en Leibniz ontwikkeld. Onomstreden is dit het belangrijkste onderwerp van de wiskunde. Jonge lezers geloven mij natuurlijk niet, daarom moet het met nadruk gezegd worden: de invloed ervan op wetenschap en techniek is immens geweest. Veel groter nog dan die van de informatietechnologie. Uit het voorwoord van het prachtige boek Calculus van Swokowski (1998, uitgeverij PWS) komt, vrij vertaald, de volgende tekst. Calculus is een van de schitterendste creaties van de menselijke geest. Het combineert analytische en meetkundige ideeën tot een machtig stuk gereedschap bij de oplossing van problemen. Hoewel calculus oorspronkelijk opgezet werd voor de aanpak van natuurkundige problemen (t.a.v. snelheid en versnelling) heeft het zijn nut ook op veel andere terreinen bewezen. Moderne toepassingen van het differentiëren zijn tot stand gekomen bij onderzoek naar bevolkingsgroei, naar de snelheid van chemische reacties, naar wisselstromen, naar het gedrag van atomen, naar de groei van tumoren, naar economische verschijnselen zoals beurskoersen en winstvoorspellingen, naar de verspreiding van epidemieën, naar CO2 uitstoot en naar trillingen van mechanische een elektrische systemen. We kunnen de afgeleide ook gebruiken bij het oplossen van optimaliseringsproblemen zoals het berekenen van de goedkoopste rechthoekige doos met een gegeven volume, de maximale afstand die een raket bereikt, de gunstigste stromen van verkeersfiles, het minimale aantal boorgaten in een olieveld, het construeren van raaklijnen in een tekenprogramma. Een ander fundamenteel concept van de calculus -de integraalrekening- ontstond uit het onderzoek naar oppervlakten en inhouden van gekromde figuren. Daarvan zijn toepassingen bij het onderzoek naar de ligging van een zwaartepunt, naar de benodigde brandstof voor ruimtereizen, naar de bloedstroom door (slag)aders, naar de hoeveelheid kleurstof in fysiologische experimenten, …
4.1
De afgeleide is de helling
De hoofdstelling van de differentiaalrekening is eigenlijk geen stelling, maar een definitie die in principe aangeeft hoe je de mate van verandering (de helling, steilheid) van een functie f kunt Df benaderen door , waarin de Griekse hoofdletter D gebruikt wordt om "de toename van" aan te Dx 2 geven. Willen we de helling weten in het punt (1,1) van de parabool y = x dan benaderen we die door x een klein beetje te veranderen (Dx = 0,001 bijvoorbeeld) en de daaruit voortvloeiende verandering 1,0012 - 12 . 0,001 dy Dy De hellingfunctie kan op de TI83 benaderd en getekend worden door = lim D x ® 0 dx Dx (Y 1 (X+.001)-Y1 )/.001 op te slaan in Y2 en GRAPH te doen of met nDeriv(Y1,X,X).
(Dy) in y te berekenen via
2
De theorie vindt als volgt de hellingfunctie (afgeleide functie) van y = x : ( x + Dx ) 2 - x 2 x 2 + 2 xDx + ( Dx ) 2 - x 2 = lim = lim ( 2 x + Dx) = 2 x Dx ® 0 Dx ® 0 Dx ® 0 Dx Dx lim
Hieronder de illustratie. De dikke grafiek Y3 zie je mooi over de dunne (Y2=2X) heen lopen.
Inventies 03/05/05
- 89 -
Bij wijze van inleiding volgt nu de iteratieve methode die Newton gebruikte om het nulpunt van een functie te benaderen. Het nulpunt is de oplossing van de vergelijking f (x) = 0; je kunt ook zeggen dat het gaat om het snijpunt van de grafiek van f (x) met de x-as. Wil je bijvoorbeeld Ö7 berekenen, dan 2 pas je zijn methode toe op het (rechter) nulpunt van de functie f (x) = x - 7. We hebben hier Dx = 0.001 genomen. Zet de functie in Y1 en draai het programmaatje NEWTON af. ClrHome Disp "ZET VOORAF DE" Disp "FUNCTIE IN Y1..." Pause :ClrHome Disp "SCHAT OPLOSSING:" Input "X0=? ",X "nDeriv(Y1,X,X)"üY2 Lbl 0 X-Y1/Y2üX Disp X Pause Goto 0
Kijk naar de figuur. De kromme lijn stelt de grafiek voor van een (in Y1 opgeslagen) functie. X0 is het nulpunt, het snijpunt met de X-as, daar gaat het om. Begin met een eerste (desnoods grove) schatting X1 van het nulpunt. Teken de raaklijn in het punt P van de grafiek (de x-coördinaat van P is X1), die snijdt de X-as in X2. In het algemeen zal X2 een Y1 betere benadering zijn van X0 dan X1. De verhouding , de helling van de raaklijn, is X1- X 2 Y 1( X 1 + 0.001) - Y 1( X 1) ongeveer [ of nDeriv(Y1,X,X)] die in Y2 gezet wordt. 0.001 Y1 Dit leidt tot de betrekking: = Y 2 waaruit de tweede schatting voor het nulpunt berekend kan X1 - X 2 Y1 worden via Y 2( X 1 - X 2) = Y 1 dus X 2 = X 1 Y2 En nu komt de geniale inval. Beschouw de tweede schatting X2 als een nieuwe, betere schatting en herhaal de hele procedure. Zo'n proces, dat iteratie heet, is heel goed door de computer uit te voeren. Het hele proces tussen Lbl 0 en Goto 0 beslaat eigenlijk slechts één instructie die herhaald wordt. De benadering van Ö7 laat zien hoe snel deze iteraties tot een goed resultaat leiden. De derde benadering is al in acht decimalen nauwkeurig! Vooraf werd X2-7 in Y1 gezet. Het volgende voorbeeld bereidt voor op het belangrijke grondtal e. x
In welke mate verandert f (x) = 2 op de plek x = 0? Verander de x een heel klein beetje, van x = 0 naar bijvoorbeeld x = 0,001; die toename wordt aangegeven met Dx of ook wel met h. Dus hier h = 0,001. Het gevolg van die kleine verandering in x is dat de y (de functiewaarde) 0 ook een beetje verandert, namelijk van f (0) naar f (0,001) dus van 2 =1 0,001 naar 2 » 1,000693; de helling ter plaatse DDyx is dus ongeveer 0,00069/0,001 = 0,693. Wat netter opgeschreven: f ¢(0) = lim
h®0
Inventies 03/05/05
- 90 -
f (h) - f (0) 2h - 1 = lim » 0,693 h®0 h h
De veranderingssnelheid (helling, steilheid) van een functie f (x) is weer te geven als: f ¢( x) = lim Dx ® 0
Df df d = = dx f ( x) Dx dx
Een bijzonder grondtal OPGAVEN 41.
Benader op deze manier de helling op de plek x = 0 van de functie x g(x)= 3 .
42.
Bekijk de grafieken van 2 en 3 en hun afgeleiden:
x
x
a) Stel het venster in zoals hiernaast. Zet de functie in Y1 en de afgeleide functie in Y2. Teken beide grafieken, de afgeleide iets dikker (beweeg de cursor links van het gelijkteken en druk ENTER). b) Verander het grondtal in een 3 en teken de twee grafieken nogmaals. c) Verander 3^X in 2.7^X en kijk opnieuw.
Conclusie: "ergens" tussen de 2 en de 3 (iets dichter bij de 3) ligt een grondtal g zodanig, dat de grafiek van de afgeleide functie samenvalt met die van de functie zelf. Voor welk grondtal geldt:
g (x) = g ' (x)?
Het programmaatje GRONDTAL is ontworpen om snel een beter inzicht te krijgen in dat bijzondere x grondtal. Daarbij proberen we de afgeleide van g op de plek x = 0 zo dicht mogelijk bij 1 te krijgen. Zodra de helling 1 wordt overschreden, schakelt het programma over naar de volgende decimaal. ClrHome 2üG:.1üE Lbl 0 G+EüG nDeriv(G^X,X,0,ûú5)üD If D<1 Then Disp G Goto 0 End Disp "STOP" G-EüG :.1EüE Pause :Disp G Goto 0 x
Conclusie: De functie 2,718281828 heeft zichzelf als afgeleide functie! Het bijzondere grondtal 2,718281828… heeft een aparte naam gekregen: e. Dus: x eh - 1 x h = 1 volgt e » 1 + h voor h » 0. f (x) = e heeft f '(x) = e en uit lim h®0 h Hieruit volgt: e » (1 + h)
1/h
of netter: lim (1 + h) h®0
1
h
= e. Overgang op het (grote) getal n met n = 1 h
geeft: lim (1 + 1 ) n = e n n®¥
Inventies 03/05/05
- 91 -
Op de GR bijvoorbeeld: 1.0000001^10000000 = 2.2718281693 De herhaling van de cijfers 1828 berust op toeval; het getal e is geen repeterende breuk, maar een nietrationaal, reëel getal. Waarmee de waarde en het bestaan van e hopelijk voldoende is toegelicht.
De natuurlijke logaritme x
De machtsuitdrukking y = e heeft een inverse, namelijk de natuurlijke logaritme. Verwissel x en y [ x dy y x = e ] en pas hierop de definitie van logaritme toe: y = ln x. De afgeleide van y = e : = e x levert dx dx (na verwisseling van x en y) = e y . De breuk omkerend en gebruikmakend van e y = x komt hier dy dy 1 1 = = , waarmee de afgeleide functie van de functie y = ln x gevonden is! tenslotte dx e y x OPGAVE 43.
Zet ln(X) in Y1. Controleer nu of de grafieken van Y 2=fnDeriv(Y1,X,X) en Y 3=1/X inderdaad samenvallen.
Raaklijn Op de grafiek van Y1 = f (x) ligt het punt P(p,q). De raaklijn in dat punt volgt uit de regel, dat de afgeleide op die plek tevens de helling is. De vergelijking van de raaklijn is dus y = a x + b met a = f ¢( p ) =
y-q x- p
waaruit volgt: y = f ¢( p ) × ( x - p ) + q Zet vooraf de functie in Y1 en stel het venster in. In het voorbeeld is daarvoor de functie f ( x) = x - 1 genomen; de vergelijking van de raaklijn in het punt (5,2) is: y = 14 x + 43 RKLNINP "nDeriv(Y1,X,X)"üY‚ Disp "XCOORD RAAKPUNT:" Prompt X XüP:Y1(P)üQ Y‚(P)üM "M(X-P)+Q"üYƒ ""üY‚ DispGraph Text(57,90,"E") Pt-On(P,Q,2) Pause Q-MPüB round(B,4)üB round(M,4)üA ClrHome Disp "Y=AX+B:" Output(3,1,"A=") Output(3,3,A) Output(4,1,"B=") Output(4,3,B)
Inventies 03/05/05
- 92 -
4.2
Optimaliseren
Raaklijn vanuit een punt Q buiten de grafiek gelegen. Dit probleem vergt enig nadenken. Aan te bevelen is een oplossingsmethode,waarbij de helling van de lijnenwaaier door Q geoptimaliseerd wordt. Laat punt P(X,Y1) de kromme doorlopen en bepaal het maximum of minimum van de helling van lijn QP. Je zoekt naar een maximum, als de lijn QP in de buurt van het raakpunt boven de grafiek ligt (uiteraard op het raakpunt na). En als de raaklijn onder de grafiek ligt, moet er naar de minimale helling gezocht worden. Op de TI-83 zijn onder MATH beschikbaar de functies fMin( en fMax(. Het programma heet RKLNUITQ. We gaan er vanuit dat vooraf het functievoorschrift in Y1 is ingevoerd en een geschikt venster is ingesteld. Tussen de X-waarden L (van links) en R (van rechts) wordt de maximale (of minimale) helling gezocht. De belangrijkste regels uit het programma zijn dan ook: "(Y1-B)/(X-A)"üY‚ en fMin(Y‚,X,L,R)üP.
Wie niet houdt van de wat grove afrondingen op 3 decimalen, moet round(A,3) veranderen in round(A,6) of het afronden zelfs helemaal schrappen. De klant is koning.
OPGAVE 44.
2
Teken de grafiek van Y1=X(6-X ) voor -5£X£5 en -12£Y £12 a) bepaal de vergelijking van de raaklijn vanuit Q(4,-8) aan de grafiek b) bepaal vergelijkingen van de raaklijnen vanuit Q(4,10) aan de grafiek
De afstand van een punt tot een kromme Gegeven is een punt P (P,Q) en de grafiek van een in Y1 staande functie. We willen de kortste afstand weten van P tot de grafiek. De lengte van het loodlijntje dus. Het antwoord op deze vraag is te vinden door minimaliseren van die afstand. Het programma heeft de naam AFSTPUFU. Disp "INVOER P(P,Q):" Prompt P,Q "(Y1-Q)Ü+(X-P)Ü"üY‚ fMin(Y‚,X,Xmin,Xmax)üA Y1(A)üB:ð(Y‚(A))üC Output(7,1,"AFST=" Output(7,6,C)
"AFSTAND MINIMALISEREN"
Inventies 03/05/05
- 93 -
De maximale kijkhoek Punt P(x,0) met x>0 beweegt over de x-as. Op de y-as liggen de vaste punten A(0,a ) en B(0,b). Hoe berekenen we de maximale hoek APB, de hoek waaronder P het lijnstuk AB "ziet"? Ook dit is een voorbeeld van optimaliseren. De kunst is, om Ð APB in x uit te drukken en daarna de afgeleide ervan gelijk te stellen aan 0. Dat is lastige, maar niet onuitvoerbare algebra. De kijkhoek is namelijk het verschil van twee hoeken: Ð APB = Ð OPB - Ð OPA met tan ÐOPB = arctan
b a en tan ÐOPA = dus Ð APB is een functie van x: x x
b a - arctan x x
OPGAVE 45.
Een uitdaging. Neem a=4 en b=9 en bepaal via differentiëren de x-waarde waarvoor deze hoek maximaal is. Je moet bekend zijn met de afgeleide van arctan x en de kettingregel.
Dat is mooi, maar als volgt kan het ook. Er moet natuurlijk wel een passend verhaaltje bij, over een billboard en optimale leesbaarheid van de reclametekst daarop. KIJKHOEK Input "OA?",A Input "OB?",B "tanñ(B/X)-tanñ(A/X)"üY1 fMax(Y1,X,1,2.5B)üP
4.3
Vergelijkingen
Het eerste deel van dit boek ging, zoals gezegd, voornamelijk over getallen en (kans)berekeningen met getallen. Als je getalverzamelingen bewerkt, krijg je te maken met functies en als je veranderingen in die functies bestudeert, betreed je het terrein van de analyse. De betrekkingen tussen die functies kunnen weergegeven worden als vergelijkingen. Een vergelijking is een open bewering met een variabele (de "onbekende", in het volgende meestal x genoemd) en een gelijkteken. Het oplossen van die vergelijking is het zoeken naar de waarde(n) van x die er een juiste bewering van maken. Een vergelijking is dus eigenlijk niets anders dan de vraag: "voor welke waarde(n) van x geldt … ?". Op de plaats van de stippeltjes staat de vergelijking.
Inventies 03/05/05
- 94 -
De programma's die vergelijkingen voor je oplossen zijn typische black box programma's, automaten waar je een vergelijking in stopt, soms ook nog een eerste schatting van het antwoord, waarna de oplossingen er automatisch uitrollen. Dat soort programma's komt hier nauwelijks aan de orde. Het is thans moeilijk voor te stellen, dat de hedendaagse algebra van betrekkelijk recente datum is. Newton en Kepler (rond 1700) hebben hun fundamentele wetten over kracht en versnelling (de hemelmechanica dus) geformuleerd en bewezen op een meetkundige wijze, gebruikmakend van strenge redeneringen en erg veel woorden. Functies, formules en vergelijkingen werden pas geïntroduceerd door Euler, halverwege de achttiende eeuw. Van hem stamt de -door wiskundigen uitgeroepen tot mooiste- formule, Miss Mathematica dus,
e
ip
+1 = 0
die de vijf belangrijkste mathematische constanten in één betrekking verenigt: de 0 als neutraal element van de optelling, de 1 als neutraal element van de vermenigvuldiging en de constanten e en p. Het imaginaire getal i = Ö-1 stippen we straks eventjes aan. Scholieren die zich zwetend door algebra leerstof heen zwoegen moeten zich troosten met de gedachte dat het grootste deel van wetenschap en techniek onbereikbaar en onbegrijpelijk zou zijn zonder algebra (en analyse). En leraren moeten zich inspannen om dat laatste duidelijk en hapklaar te maken. We gaan dus voor twee bladzijden op een zijspoor om de mooiste formule van de wiskunde toe te lichten.
De reeks van MacLaurin MacLaurin (en Taylor) hebben aangetoond dat een functie f (x) in het algemeen (onder bepaalde voorwaarden dus) als een oneindig voortlopende machtreeks geschreven kan worden: 2 3 4 f (x) = a0 + a 1 ×x + a2 ×x + a3 ×x + a 4 ×x + ... Voor x=0 geldt dan: f (0) = a 0 En voor de afgeleide functies geldt: 2 3 4 f ' (x) = a 1 + 2a 2x + 3a3 x + 4a 4x + 5a 5x + ... met f '(0) = a 1 =1!×a 1 2
3
f ''(x) = 2a2 + 2×3×a 3 x + 3×4×a 4 x + 4×5×a 5 x + ... met f ''(0) = 2a 2 =2!×a 2 dus a2 = f '''(x) = 3!×a3 + 4!×a 4 ×x + ... met f '''(0) = 3!×a3 dus a3 =
f ¢¢(0) 2!
f ¢¢¢(0) 3!
zodat, tenslotte, voor de functie f (x) geldt: f ' (0) f ' ' (0) 2 f ' ' ' (0) 3 x+ x + x + .... 1! 2! 3!
f ( x ) = f ( 0) +
Het mooiste voorbeeld hiervan is de reeksontwikkeling x van e in de buurt van x=0: 1
0
0
e = e + 1.e + 1+1+
1 2
+
1 6
Inventies 03/05/05
1 2
+
0
e + 1 24
1 6
0
e +
1 24
0
e ... =
...
- 95 -
(reeks van MacLaurin)
Je krijgt ook fraaie ontwikkelingen bij de sinus en de cosinus van x in de buurt van x = 0, omdat sin 0 = 0 en cos 0 = 1: 2 3 sinx = sin0 + 1×cos0×x - 1 2 sin0×x - 1 6 cos0×x + ... 3
5
= x - 1 6 x + 1120 x ... hetgeen prachtig geïllustreerd wordt in het plaatje hiernaast. Met elke toegevoegde term gaat de grafiek steeds meer lijken op de sinusgrafiek. Wat de MacLaurin reeks oplevert voor de cosinus kun je hiernaast zien.
Complexe getallen Ooit ontdekte men dat je "gewoon", dat wil zeggen met behoud van de algebraïsche regels, kunt rekenen met negatieve getallen, met breuken (rationale getallen) en zelfs met reële getallen als p of Ö3. Er is nog zo'n gedurfde uitbreiding van onze werkruimte. Ga uit van het imaginaire bestaan van de wortel uit -1 en geef Ö-1 de naam i van imaginair. Pas daarop brutaalweg de gewone rekenregels toe en kijk wat er gebeurt. 2
3
2
4
2 2
2
i = Ö-1 dus i = -1, i = i .i = -i, i = (i ) = (-1) = 1 enzovoorts. 2 Maar ook: (5+4i)(3+2i) = 15 + 10i + 12i + 8i = 15 + 10i + 12i - 8 = 7 + 22i. 8 2 2 2 2 2 2 2 2 En (1+i) = (((1+i) ) ) = ((1+2i-1) ) = ((2i) ) = (-4) = 16. Zo ben je aan het werk in de verzameling van wat men noemt de complexe getallen. Binnen deze verzameling krijgt elke kwadratische vergelijking oplossingen, zelfs als de discriminant negatief is! Gebruik gewoon de abc formule. Zo zijn de oplossingen van 2
x – 6x + 25 = 0 te schrijven als x1, 2 =
6 ± - 64 = 3 ± 4i 2 x
Nu even terug naar de reeksontwikkelingen van e , sinx en cosx; vervang brutaalweg in de eerste daarvan de x door ix en kijk wat er gebeurt: ix
2
3
4
2
3
4
e = 1 + ix + (ix) /2! + (ix) /3! + (ix) /4! + ... = 1 + ix - x /2! - i.x /3! + x /4! + ... 2 4 6 3 5 = 1 - x /2! + x /4! - x /6! + ... + i.[ x - x /3! + x /5! - ...] = cosx + i . sinx ix
Deze formule van Euler verdient een kadertje: e = cosx + i × sinx Geef x de waarde p en er staat e
ip
= cos p + i sin p = -1 + i×0 = -1
Waarna we de rode draad in dit boek weer op kunnen pakken.
Inventies 03/05/05
- 96 -
Twee onbekenden De oplossingen van het stelsel
ì ax + by = c zijn: í îdx + ey = f
ì ïx = í ïy = î
ce - bf ae - bd af - cd ae - bd
Mits er eenduidige oplossingen zijn natuurlijk (de noemer mag niet 0 zijn). Zie het volgende programma VGL2ONB. Dit is een voorbeeld van een black box of applicatieprogramma: je stopt er wat in en het antwoord komt er automatisch uitrollen. De lol zit hem voor mij in het componeren, niet in het uitvoeren. ClrHome Disp "(1) AX+BY=C" Disp "(2) DX+EY=F" Prompt A,B,C,D,E,F ClrHome Disp "OPL.:" Output(3,1,"X=") Output(4,1,"Y=") AE-BDüP (CE-BF)/PüX (AF-CD)/PüY Output(3,4,X) Output(4,4,Y) Pause :ClrHome
OPGAVE 46.
Los op:
ì x+ y = 5 í î4 x - y = 2
Meer vergelijkingen Een stelsel van drie of meer vergelijkingen kan het best opgelost worden met behulp van de inverse van de coëfficiënten matrix. Een matrix bestaat hier uit n rijen en n kolommen. Met een matrix kun je ook rekenen: optellen, vermenigvuldigen en zelfs kun je de omgekeerde van een matrix bepalen. é3 2ù é 1 5ù Nemen we als voorbeeld de 2 bij 2 matrix [ A] = ê en de matrix [B ] = ê ú ú. ë4 3û ë 2 3û é4 7 ù Hoe je ze optelt zal geen verrassing zijn: [ A] + [ B ] = ê ú. ë6 6 û Het vermenigvuldigen is minder helder: é 7 21ù [ A] ´ [ B ] = ê ú , hierbij is bijvoorbeeld het getal 21 (in de eerste rij en tweede kolom) ontstaan ë10 29û door de eerste rij maal de tweede kolom van [A] en [B] te nemen: 3´5 + 2´ 3 = 21.
Je kunt zelfs de inverse van deze matrix laten uitrekenen. Hoe dat precies gebeurt zullen we hier niet behandelen. Maar we hoeven op dit moment alleen te weten dat de volgende berekening zinvol is: é 3 - 2ù é 3 2 ù é 3 - 2 ù é1 0 ù , want [ A] ´ [ A]-1 = ê [ A]-1 is ê ú ú´ê ú=ê ú (de eenheidsmatrix). ë- 4 3 û ë 4 3 û ë - 4 3 û ë0 1 û
Inventies 03/05/05
- 97 -
De TI-83 kan het ook:
De oplossing van [A] ´ [X] = [B], zo die bestaat, is [X] = [A] -1 ´ [B]. [A] is hierin de n bij n coëfficiëntenmatrix; [X] is de kolommatrix van de n onbekenden X1 t/m/ X n . De oplossing van opgave 45 met de TI-83 is nu op de schermpjes te volgen.
Je kunt deze oplossingsmethode heel fraai vergelijken met die in het allereenvoudigste model, de vergelijking van het type a ´ x = b. Nemen we als voorbeeld daarbij de vergelijking 3 ´ x = 6 met de oplossing x = 2 die geschreven kan worden als x = 3-1 ´6 dan wordt de overeenkomst tussen beide methoden direct zichtbaar. Daar gaan we met het programma NVGLNONB dat het volgende stelsel oplost. ì x + 2 y + 3 z + 4u = 10 ï 5 x + 4 y + 3 z + 2u = 14 ï í ï 6 x + 7 y - 13 z = 0 ïî5 x + 8 y - 10 z + 4u = 7
OPGAVE
47.
Los op:
Inventies 03/05/05
=5 ì x- y - z -u ï x + 4 y - 10 z - 3u = 10 ï í ï 2 x + 3 y - 3 z + 3u = 0 ïî x + y + z + u =7
- 98 -
4.4
Nanowiskunde
Een typisch aspect van de analyse is het onderzoek naar limieten. Pak de TI-83 er maar weer bij. x 2 - 3x , x-3 dan ZOOM ZStandard en kijk. Niets bijzonders,
Doe Y1
=
f ( x) =
zou je zeggen. Maar vreemd is wel, dat er een rechte lijn verschijnt die wel erg veel weg heeft van de lijn y=x. Dat is om twee redenen vreemd: (1) het is een kwadraat en een breukfunctie dus zou je zeker geen rechte lijn verwachten en (2) voor x=3 zou er een V.A. moeten komen (Een Verticale Asymptoot). Nieuwsgierig geworden, gaan we inzoomen rond deze kritische x-waarde: zie de vensters. Er zit dus geen asymptoot! Maar er is plotseling een gaatje in de grafiek verschenen (een perforatie). Wat is hier aan de hand? De tabel geeft een antwoord: als je x=3 invult komt er f (3) =
32 - 3 × 3 0 = en dat is onbepaald. 3-3 0
Maar dat antwoord bevredigt ons natuurlijk niet. Door verwondering gedreven gaan we op zoek naar inzicht (straks blijkt dat dit woord inzicht ook letterlijk genomen moet worden!). Weet je het verschil tussen de breuken
0 7 en ? In het eerste geval komt er 0 uit, want 7 0
0 = 0 Û 0 = 7 × 0 klopt. In het tweede geval is er geen enkel getal N te vinden, hoe groot ook, om de 7 7 gelijkwaardigheid = N Û 7 = N × 0 ??? kloppend te krijgen. Delen door nul mag dus niet. Het geval 0 0 0 is een geval apart. Ga maar na: = N Û 0 = 0 × N klopt namelijk altijd, wat voor waarde je ook voor 0 0 N bedenkt! Kijk in de tabel: er staat ERROR. Dat simpele woord is een stil water met diepe gronden.
Als er in de teller en in de noemer nul staat, zoals hier, kun je proberen de nulmakende factor uit de 2 breuk "weg te delen". Dat is gemakkelijk, want de teller is x - 3x = x (x - 3). Als x = 3 wordt de teller dus nul (maar de noemer ook) en door nul mag je niet delen. Helaas. Maar niemand kan ons beletten om erg dicht bij nul te gaan zitten; door nul delen mag niet maar door bijvoorbeeld 0,00001 = 10 -5 delen mag best! Zo gezegd zo gedaan. Als x » 3 dan is f (3) » 3. Volg de berekening. f (3,00001) =
3,00001 × (3,00001 - 3) 3,00001 × 0,00001 = = 3,00001 » 3 (3,00001 - 3) 0,00001
Men drukt dit zo uit: de limiet van de functiewaarde is 3, als x tot 3 nadert. Genoteerd als lim f ( x) = 3 . x® 3
Inventies 03/05/05
- 99 -
Elke computer kent zijn grenzen. Onze GR geeft maar tien decimalen. Intern rekent de processor nog wat nauwkeuriger (afgerond tot op 12 of 13 decimalen), maar wat er gebeurt als er met afgeronde getallen achtereenvolgens gekwadrateerd, afgetrokken, vermenigvuldigd met 3, gedeeld en weer afgetrokken wordt, is volstrekt onduidelijk. Herhaaldelijke tussentijdse afrondingen kunnen de grootste, onvoorspelbare ellende opleveren voor het eindresultaat! Laten we een experiment opzetten.
Ontwerp zelf een rekenmachine met vier decimalen Stel je een computer voor die "maar" op vier decimalen nauwkeurig rekent; de vijfde decimaal is onzeker en wordt afgerond. Een ingevoerde X-waarde kun je dan vervormen tot XüX+0.0001rand (maar dan komt er in de vijfde decimaal telkens iets bij en gaat er nooit iets af). Met -1+2rand krijg je een getal tussen -1 en 1. Beter dus: XüX+0.0001(-1+2rand), als je de vijfde decimaal ook af en toe wilt verlagen. Na invulling hiervan in de beschreven functie (X2-3X)/(X-3) kun je de functiewaarden bestuderen. Aangezien deze functie op de perforatie na gelijk is aan f (x) = x, moeten de functiewaarden gelijk zijn aan de X-waarden (op X=3 na). De in te voeren X stellen we gelijk aan P+0.0001(ú1+2rand), zodat de functiewaarde volgens onze verwachting in de buurt van P moeten komen. Een programma voor deze nabootsing is gauw geschreven. ZOOMIN00. Prompt P ClrList L1 100üdim(L1) For(T,1,100) P+0.0001(ú1+2rand)üA P+0.0001(ú1+2rand)üB P+0.0001(ú1+2rand)üC (AÜ-3B)/(C-3)üF round(F,4)üF Disp F FüL1(T) End 1-Var Stats L1 Disp "P:",round(P,4) Disp "Ë:",round(Ë,4) Disp "Çx:",round(Çx,4)
Je ziet dat er, in plaats van één vaste X-waarde, drie licht verschillende X-waarden ingevoerd worden (A, B en C) die in de vijfde decimaal afwijken. Die vijfde decimaal is onzichtbaar gemaakt door de afronding in vier decimalen round(F,4).
OPGAVE 48.
Voer in voor P (dus voor X) achtereenvolgens de waarden: 4, 3.1, 3.01, 3.001, 3.0005 en 3.0001 en zet de uitkomsten voor de gemiddelde functiewaarden (Ë) en de standaarddeviatie (Çx) in een tabelletje. De standaarddeviatie geeft, zoals je weet, een idee van de gemiddelde afwijking in de functiewaarden. Ga telkens na, tot op hoeveel decimalen deze functiewaarden betrouwbaar zijn.
Inventies 03/05/05
- 100 -
Conclusie: ons nagebootst computertje dat in 4 decimalen rekent maakt er een puinhoop van in de nabijheid van een perforatie! Endoscopie is het naar binnen kijken door een klein gaatje. Dat doen we met de hiervoor gebruikte functie f ( x ) =
x 2 - 3x in het volgende programma, dat ik ook ENDOSCOP x-3
had kunnen noemen. De kern daarvan is de cirkel Lbl O Zoom In Goto 0.
De rest van het programma is versiering. OPGAVE 49.
Druk bij de uitvoering van het volgende programma ZOOMIN01 telkens op ENTER om het gaatje met een bescheiden factor 2 uit te vergroten (in te zoomen). Na tien keer inzoomen is volkomen onverwacht het gaatje verdwenen (opgevuld). Blijf ENTERen en aanschouw het wonder vanaf de zeventiende tot en met de drieëntwintigste uitvergroting!
"(XÜ-3X)/(X-3)"üY1 0üT Lbl 0 Zoom In T+1üT Pause Goto 0
Een totaal andere scan levert het inzoomen op de perforatie (0,0) in de grafiek van f ( x ) = x sin 1x ; of is het wel een perforatie?
OPGAVE 50.
Y1= Xsin(1/X). Voer minstens twintig vergrotingen met factor 4 (4üXFact) in de x-richting uit in de buurt van de oorsprong en verbaas je (ZOOMIN02).
"Xsin(1/X)"üY1 0üT Lbl 0 Zoom In T+1üT Pause Goto 0
Inventies 03/05/05
- 101 -
4.5
Sommeren en Integreren
Het is niet de bedoeling hier uitgebreid in te gaan op de theorie van de integraalrekening. Maar het kan geen kwaad om heel in het kort te vertellen waar de integraalrekening over gaat. Kijk naar het plaatje. Hoe kan je de oppervlakte (boven de X-as) berekenen onder de grafiek van een functie f (X), tussen 0 en X? Maak X een klein beetje groter (bijvoorbeeld DX=0.001) en kijk wat dat voor invloed heeft op de oppervlakte O(X). Duidelijk is, dat de oppervlakte ongeveer toeneemt met die van de (smalle!) rechthoek, dus DO » f ( X ) × Dx oftewel: f ( X ) »
DO waar in het limietgeval uit blijkt dat f Dx
de afgeleide is van O. Men noemt, omgekeerd, ook wel O een primitieve functie van f (de 2 Amerikanen spreken duidelijker van de anti-afgeleide van f ). Zo is 13 x 3 een primitieve van x , omdat 2 1 3 dx 3 x = x . De oppervlakte onder de parabool, tussen 2 en 3, is het verschil 1 33 - 1 23 = 6 1 3 3 3
d
O(3) - O(2) =
Nog een voorbeeld, waar we overigens nog op terugkomen: ln x is een primitieve van 1 x , omdat d dx ln x = 1 x . Men gebruikt hierbij het integraal symbool
ò f ( x) dx . De oppervlakte onder de grafiek van e
tussen x = 1 en x = e is precies 1, want
y=
1
x
,
1
ò x dx = ln e - ln1 = 1 - 0 = 1
1
Je moet het integraal-slangetje zien als een langgerekte letter S (van som). In feite is zo'n oppervlakte te beschouwen als de som van oneindig dunne rechthoekjes die een hoogte f ( x ) = 1x hebben en een x =e
breedte Dx:
å 1x × Dx
x =1
OPGAVE 51.
2
De afgeleide van x + x is 2x + 1, zoals je weet. Bereken met een integraal de oppervlakte onder de lijn y = 2 x + 1, tussen x=1 en x=3 en controleer je antwoord met de oppervlakteformule (basis´gemiddelde hoogte) voor een rechthoekig trapezium.
Inventies 03/05/05
- 102 -
Somrijen Even iets heel anders. Meetkundige somrijen met een groeifactor (reden) kleiner dan 1 (maar groter dan -1) hebben een limiet, men noemt ze convergent. De som van een oneindige meetkundige rij met k =¥
groeifactor kleiner dan 1 (en groter dan -1)
å b× gk
2
3
= b + bg + bg + bg + … kan berekend worden
k =0
b 1 4 2 3 via de formule s = . Zo is 1 + ¼ + (¼) + (¼) + … gelijk aan = , hetgeen op de TI-83 1 1- g 1- 4 3
gemakkelijk gecontroleerd kan worden met sum(seq(.25^X,X,0,100))=1.333333333. Dit is een voorbeeld van een snel convergerende somrij (reeks), met een groeifactor die tamelijk ver van 1 afligt. Als het grondtal dichter tegen de 1 aan zit, verloopt de convergentie moeizamer, hetgeen te merken is aan het aantal stappen dat nodig is tot de convergentie duidelijk begint te worden.
OPGAVE k =¥
52.
Bereken met de formule:
å 0,99k
2
3
4
= 1 + 0,99 + 0,99 + 0,99 +0,99 …
k =0
Doe sum(seq(.99^X,X,0,100)) ; kun je daar aan zien wat de limiet is? Doe ook sum(seq(.99^X,X,0,500)) en zie, hoeveel moeite (en tijd) het soms kost om de som van zwak-convergente rijen te berekenen. Met sum(seq kun je niet meer dan 1000 termen optellen. Probeer ook sum(seq(.99^X,X,0,900)). En wat dacht je van sum(seq(1.01^X,X,0,100))?
De harmonische reeks: megawiskunde Speciale belangstelling verdient de harmonische reeks: n
H n = 11 + 12 + 13 + 14 + 15 + ... +
1 n
1 k =1 k
=å
Deze reeks genoot de aandacht van het Zwitserse genie Leonhard Euler (1707-1783) wiens naam al eerder in dit boek opdook. Overbekend is het (ware) verhaal van de doofheid van Ludwig von Beethoven, de componist die door bleef componeren ondanks een complete doofheid op latere leeftijd. Veel minder bekend maar nog indrukwekkender is wat Euler overkwam. Na in 1735 één oog verloren te hebben, werd hij in 1766 (vóór zijn zestigste dus) geheel blind, maar zijn geest werkte door. Met ongekende verbeeldingskracht en voorstellingsvermogen produceerde hij nog tal van mathematische publicaties van een buitengewone diepgang en helderheid. Opschrijven kon hij zijn gedachten niet meer, hij moest ze dicteren.
Inventies 03/05/05
- 103 -
OPGAVE 53.
a) Bereken met sum(seq( de som van de eerste 100, 200, 300 termen van H n. Convergeert deze reeks naar een bepaalde limiet? Zo ja, welke? b) Voer het volgende programmaatje in en uit om voor steeds grotere waarden van N naar "de" limiet te zoeken en spreek een vermoeden uit over de convergentie van de harmonische reeks. ClrHome:0üS:0üN Output(1,1,"N="):Output (2,1,"S=") Lbl 0 sum(seq(1/X,X,N+1,N+500))üT S+TüS:N+500üN Output(1,3,N) Output(2,3,S):Pause Goto 0 c) Bereken
3000 1
å
k
k =1
Een onbetwistbare conclusie is nog niet te trekken maar een vermoeden hebben we wel: de harmonische reeks lijkt te divergeren. Deze divergentie is echter van een onvoorstelbare traagheid! Na een miljoen termen is de som pas gevorderd tot iets voorbij de 14; in 1968 berekende J. Wrench het aantal benodigde termen om boven de 100 te komen, dat aantal was: 15 092 688 622 113 788 323 693 563 264 538 101 449 859 497. Wie denkt dat dit getal simpel door een computer is uit te rekenen, vergist zich. Stel je een supercomputer voor die elke seconde een miljard optellingen verricht en stel je voor dat die supercomputer daar dag en nacht mee doorgaat, 26 onvermoeid. Deze zou er ruim 10 jaar voor nodig hebben, onvergelijkelijk veel langer bijvoorbeeld 9 dan het heelal bestaat (15´10 jaar). Aldus Julian Havil in Gamma - Exploring Euler's Constant. In de veertiende eeuw (!) gaf de Franse bisschop Nicholas Oresme een bewijs voor de divergentie van de harmonische reeks. Hij groepeerde de termen van de reeks en gebruikte de eigenschap van een breuk dat vergroting van de noemer leidt tot verkleining van de breuk: zo is
1 1 > want 7 is kleiner dan 8. In 7 8
moderne notatie is het bewijs van de divergentie simpel: 1 + ... + 1 ) + ... H ¥ = 1 + 12 + ( 13 + 14 ) + ( 15 + 16 + 17 + 18 ) + ( 19 + 10 16
>
1 + 1 + ... + 1 ) + ... 1 + 12 + ( 14 + 14 ) + ( 18 + 18 + 18 + 18 ) + ( 16 16 16
=
8 + ... = 1 + 1 + 1 + 1 + 1 + ... en dat divergeert. 1 + 12 + 24 + 84 + 16 2 2 2 2
Vier eeuwen later kwam Euler hierop terug en weer drie eeuwen later komen wij op Euler terug.
Inventies 03/05/05
- 104 -
Gamma Euler heeft gezocht naar het verband tussen de harmonische reeks en een integraal. De oppervlakte onder de grafiek van f ( x ) = 1 x , rechts van de lijn x = 1, kan namelijk bij benadering geschreven n
worden als een som van rechthoekjes met breedte 1 en hoogte
1
å 1 x ×1 en dat lijkt wel heel erg op
x :
x =1 n
ò 1 x dx waarvan de uitkomst ln n is. 1
En tegelijkertijd is de totaaloppervlakte van die rechthoekjes juist de som van de harmonische reeks! Laten we eerst zelf eens wat proberen. De oppervlakte onder de grafiek van 1/x, tussen de lijnen x = 1 en x = n kan door rechthoekjes benaderd worden. De hoogste rechthoekjes leveren, als we ln n proberen te benaderen duidelijk teveel op. Die bovensom is Bn = 1 + 1 2 + 1 3 + 1 4 + ... + 1 n -1 De onderste rechthoekjes hebben een oppervlakte die te weinig oplevert, namelijk: On = 1 2 + 1 3 + 1 4 + ... +
1
n -1
+
1
n
.
Het gemiddelde van de bovensom en de ondersom (On +Bn )/2 is een veel betere benadering. Zo vinden we (zie ook opgave 51): ln n » [( 1 + 1 2 + 13 + 1 4 + ... + 1 n -1 ) + ( 1 2 + 1 3 + 1 4 + ... + 1 n -1 + 1 n )] / 2 = [( 1 + 1 2 + 1 3 + 1 4 + ... + 1 n -1 + 1 n - 1 n ) + ( 1 + 1 2 + 1 3 + 1 4 + ... + 1 n -1 + 1 n - 1 )] / 2 = [ ( H n - 1 n ) + ( H n - 1) ] / 2 = H n - 1 2n - 1 2 ; eigenlijk nog ietsje minder, omdat de kromme 1/x iets onder de schuine lijnstukjes (de "koorden") ligt. Noem "ietsje" even e . De som van de harmonische reeks is dan te schrijven als H n = ln n + 1 2 + 1 2n + e . Als n naar oneindig gaat, komt er voor "de" som: H ¥ = ln n + g De Griekse letter g staat voor gamma, de constante van Euler. Gamma is dus iets groter dan 0,5. Euler slaagde erin, een benadering voor g te vinden die pas in de zesde decimaal afweek van wat we er tegenwoordig van weten. Bedenk wel dat er in de zeventiende eeuw nog geen rekenmachines bestonden. Hoe knap zijn prestatie was kan je inschatten als je de volgende opgave maakt.
OPGAVE 54.
Breid het programma van opgave 53 zodanig uit, dat in L1 de n-waarden komen (500, 1000, 1500, …), in L2 de som Hn en in L3 de schatting van g = Hn - ln n. Noem het programma GAMMA en sla het op, om er later nog eens bij stil te kunnen staan dat je er niet in zult slagen Eulers prestatie te evenaren.
Inventies 03/05/05
- 105 -
4.6
Productrijen
De Griekse hoofdletter pi (P) wordt gebruikt voor productrijen; zo wordt de faculteitenrij 1.2.3.4. ... .n n
afgekort tot
¥
Õ k . Oneindig voortlopende productrijen
Õ an = a1 × a2 × a3 × L wekken onze
k =1
n =1
belangstelling als de factoren op den duur naar 1 gaan, genoteerd als lim an = 1 . Mogelijk (maar niet n®¥
noodzakelijk!) convergeert de rij dan. Een schat ligt begraven, ergens in een stuk grond van tien vierkante meter. Tien personen mogen elk één vierkante meter daarvan afgraven, tot de schat gevonden is. Jij bent een van die personen en je mag kiezen wanneer je aan de beurt wilt zijn, als eerste of als laatste of ergens daar tussenin. Bij welke beurt heb je de grootste kans op succes? De eerste schatgraver heeft 10% (
1 2 ) kans op succes; de tweede heeft nog maar te kiezen uit 9 m 10
1 ;de waarschijnlijkheid dat de eerste faalt en de tweede succes heeft is 9 1 9 1 , want de 9 in de teller × (let op het voegwoord: en wordt keer) en dit is te vereenvoudigen tot 10 9 10
grond, kans op succes dus
wordt geneutraliseerd door de 9 in de noemer: als je eerst vermenigvuldigt met negen en er dan weer door deelt is er aan de breuk niets veranderd. De tweede schatgraver heeft dus dezelfde kans op succes als de eerste en zo gaat het door met de volgende gelukzoekers. De voorlaatste (negende) schatgraver zag zijn acht voorgangers mislukken en heeft dus een succeskans van: 9 8 7 6 5 4 3 2 1 × × × × × × × × en het leuke is dat alle tellers (behalve de 1) wegvallen tegen alle noemers 10 9 8 7 6 5 4 3 2 1 (op de 10 na) waardoor de uitkomst opnieuw is. Na het mislukken van al zijn voorgangers heeft de 10 9 8 7 6 5 4 3 2 1 laatste niets meer te kiezen, zijn kans op succes is dan 1 en uit × × × × × × × × ×1 komt ook 10 9 8 7 6 5 4 3 2 1 weer . Conclusie: het maakt niet uit wanneer je aan de beurt bent! 10 ¥
1 n
Laten we, achterstevoren lezend, het oneindige product p = Õ (1 - ) = 0 met n=2
pn =
1 2 3 n 1 × × ×K× = 2 3 4 n +1 n +1
eens nader bekijken (let op het wegstrepen van bijna alle tellers en noemers). Dit product is te beschouwen als het product van twee deelrijen p1 =
1 3 5 2n - 1 2 4 6 2n en p2 = × × × K × × × ×K× 2 4 6 2n 3 5 7 2n + 1
Op grafische rekenmachines is er maar een beperkte lijstlengte toegestaan. De TI-83/84 modellen hebben ruimte voor maximaal 999 termen (factoren). Dat gaat dan met prod(seq(N/(N+1),N,1,999)) , prod(seq(N/(N+1),N,1,999,2)) en prod(seq(N/(N+1),N,2,999,2))
Inventies 03/05/05
- 106 -
Alle drie de rijen gaan vanzelfsprekend naar nul, maar minder vanzelfsprekend is de convergentie van de verhouding p 2 /p 1 : 2 4 6 2n × × ×K× p2 3 5 7 2 n +1 = 2 × 2 × 4 × 4 × 6 × 6 × 8 ×K = p1 1 × 3 × 5 × K × 2n - 1 1 3 3 5 5 7 7 2 4 6 2n
Delen door een breuk is vermenigvuldigen met het omgekeerde. 8 24 48 n2 - 1 × × K× 2 (n = 3,5,7, ...). 9 25 49 n
Na hergroepering van de factoren kun je dit schrijven als 2 × × De vraag is, of de rij
p2 een limiet heeft. Bekijk de volgende schermplaatjes. De GR rekent er rustig p1
op los, dat is fijn.
Maar de eventuele convergentie verloopt dermate traag, dat we na 999 factoren nog steeds niet overtuigd zijn. Programmeren helpt ons verder.
Het plaatje van P2P1 (met 1.57066...) ontstond na vijf minuten rekenen op de TI-83plus SE. Je kan goed aan de razendsnelle scrolling zien of (en wanneer) tenslotte ook de negende decimaal tot rust is gekomen. Drie keer raden waar dat naartoe gaat. Wie weleens met radialen gewerkt heeft ziet het direct. De virtual TI-83 die, tien keer zo snel, met de microprocessor van mijn modale PC werkt liet ik vijf uur rekenen en kwam voor
p2 uit op 1.570796189 wat pas in de zevende decimaal afwijkt van p1
datgene wat we er erg graag uit zouden willen krijgen: ½ p. De teller en noemer hebben dan inmiddels de 5688000 overschreden.
Inventies 03/05/05
- 107 -
1 3 5 7 2 4 6 8
Terug naar de eerste rij: p1 = × × × × L We hebben p1 × p2 = hier p1 »
p 1 1 1 en 2 » 1 2 p dus p12 × 1 2 p » » dus p1 » p1 n +1 n +1 n
2 ; voor n = 1998 staat np
2 » 0,017850 hetgeen inderdaad een voortreffelijke voorspelling is van 1998p
p 1 = prod(seq((2N-1)/(2N),N,1,999))=0.017848 Op soortgelijke wijze vinden we een formule voor p 2 : 2 p2 × = np 4
2 p )× = np 2
p2 = p1 × 1 2 p = (
p 2n
Het product van Wallis p2 : p1
De verhouding
2 2 4 4 6 6 8 × × × × × × ×K = 1 3 3 5 5 7 7
1
2p
heet, naar de ontdekker, het product van Wallis. Verrassend is het onverwachte optreden van p, maar nog verrassender is het feit dat iemand 340 jaar geleden (nog vóór Newton) niet alleen de uitkomst voorspelde maar tevens een soort van afleiding gaf, waarvoor hij zelf de nodige algebra moest ontwikkelen. Ik vond een beschrijving op www.dovepresent.com van James Taylor. Uitgangspunt is de verzameling grafieken y = (1 - x 2 ) n met -1£x£1 en n³0. In het geval n=0,5 staat er een halve cirkel met oppervlakte ½ p. Wallis was in staat voor gehele waarden van n via de door hem gevonden primitieve n1+1 x n +1 van x n en het binomium 2 n
van Newton voor (1-x ) de oppervlakte An onder deze grafieken te berekenen. Het formalisme daarvoor ontwikkelde hij zelf. Hij vond achtereenvolgens 1
1
1
]
1
A0 = ò (1 - x 2 )0 dx = ò 1× dx = 2 ; A1 = ò (1 - x 2 )1 dx = x - 1 3 x 3 -1 = 4 3 ; -1 1
-1 1
-1
A2 = ò (1 - x 2 ) 2 dx = ò (1 - 2 x 2 + x 4 ) dx = x - 2 3 x 3 + 1 5 x 5 -1
A0 = 2 ; A1 =
]
1
-1
= 16 15 en daarna
-1 4 3
= 2 × A0 ; A2 = 16 = 3
15
4A ; 5 1
met de recursieve veronderstelling:
A3 =
32 35
(reken maar na) = 76 A2
An =
2n × An -1 (n = 1, 2, 3, ...) 2n + 1
Voor gebroken exponenten (n = ½ , 1½ , 2½ , 3½ , ...) ging hij uit van dezelfde betrekking, dus: A1 = 2 p ; 2 1
Inventies 03/05/05
A1 1 = 2
2 ×1 12 2 × 1 12 + 1
× A1 = 3 × 1 2 p ; 4 2
A2 1 = 5 × A1 1 = 5 × 3 × 1 2 p , enzovoorts. 2
- 108 -
6
2
6 4
Vergelijking van de oppervlakten levert: A3 = 6 × 4 × 2 × 2 < A2 1 = 5 × 3 × 1 2 p dus 7 5 3
2
6 4
1
2p
>» 6 × 6 × 4 × 4 × 2 × 2 ; enzovoorts. De formule van Wallis! 7 5 5 3 3 1
Andere oneindige productrijen ¥
De rij
1
Õ (1 + n p )
convergeert voor alle p > 1;
n =1
zo gaat ¥
1
2 5 10 17
Õ (1 + n2 ) = 1 × 4 × 9 × 16 × L n =1
naar de wonderbaarlijke limiet
sinh p ep - e -p . = p 2p
Een minuscule verandering in de rij van Wallis leidt tot een geheel andere uitkomst: de rij ¥
1
1
1 3
Õ (1 - n ) × (1 + n ) = 2 × 2
×
n=2
1 2 4 3 5 4 × × × × L gaat naar ; 2 3 3 4 4 5
op de eerste breuk na, vallen op den duur immers alle tellers en noemers tegen elkaar weg. Waarom is ¥
2
2
1 5
Õ (1 - n ) × (1 + n ) = 3 × 3
×
n =3
2 6 3 7 4 8 5 9 1 ? × × × × × × × L= 4 4 5 5 6 6 7 7 6
· ·
streep de tellers 5, 6, 7, ... weg tegen gelijke noemers, drie breuken verderop streep de resterende noemers 3, 4, 5, ... weg tegen resterende tellers, drie breuken daarvoor
·
over blijft
1 2 1 × = en dat is de limiet. 3 4 6
Lastiger is zo'n vraag te beantwoorden bij productrijen waarin de tellers en noemers opvolgende gehele getallen zijn en de breuken afwisselend kleiner en groter dan 1 zijn, zoals de volgende 1 4 5 8 9 12 13 16 × × × × × × × × L 2 3 6 7 10 11 14 15
die de limiet 0.5990701058 lijkt te hebben (na 50 miljoen bewerkingen). In zulke rijen valt er weinig te schrappen. 4üN:.5üP Lbl 0 PN(N+1)/((N-1)(N+2))üP Disp P N+4üN Goto 0
Is er een exacte uitdrukking (met p misschien) voor dit decimale getal te vinden? Wellicht is er een lezer met een groter denkraam (of grotere bibliotheek) die mij aan het antwoord op deze vraag kan helpen. (*) Denkend aan Holland zie ik brede rivieren traag door oneindig laagland gaan ... (*) Voor gevorderden. Wie als amateur de bal kaatst, moet een professionele bal verwachten. Ronald Kortram (M.I. Nijmegen) zond mij na het lezen van deze tekst een (helaas niet-exact) antwoord dat de gamma-functie (weer van Euler natuurlijk) gebruikte: p
G( 3 4 ) G( 1 4 )
waarbij G de faculteitsfunctie voor rationale getallen is: G(x+1)=x×G(x).
Inventies 03/05/05
- 109 -
4.7
Recursieve rijen
Hier volgt (verkleind) de eerste zin van deze tekst. Hier volgt (verkleind) de eerste zin van deze tekst. Hier volgt (verkleind) de eerste zin van deze tekst. Hier volgt (verkleind) de eerste zin van deze tekst. Hier volgt (verkleind) de eerste zin van deze tekst. Hier volgt (verkleind) de eerste zin van deze tekst.
... De termen van een recursieve rij volgen hun voorganger(s) door een bindend voorschrift. Zo volgt de rij 0 ® 1 ® 2,5 ® 4,75 ® 8,125 het voorschrift: tn = 1,5t n-1 + 1; t1 = 0 Dit is overigens geen interessante rij, want hij rijst de pan uit (is divergent): 0®X en 1.5X+1®X en herhaaldelijk ENTER is het recept. Uit een plaatje is dat uitwaaieren goed te zien. De MODE seq is er voor dit soort rijen. nMin is het eerste rangnummer; u(nMin) de eerste term. MODE Seq: Y= met nMin=1, u(n)=1.5u(n-1)+1, u(nMin)=0, WINDOW xMin=-1, xMax=20, Ymin=-5, Ymax=20 en TRACE ~
De moederlijn y = 1.5x + 1 (de bovenste lijn) geeft de opvolgende rijwaarden; "terugkaatsing" tegen de "muur" y = x zorgt ervoor dat we telkens weer terugkomen bij de moederlijn, maar dan voor een volgende term. Het plaatje heet een WEB grafiek. Kenmerkend voor divergentie is, dat de (absolute waarde van de) helling van de moederlijn (hier: 1,5) groter is dan de helling van de lijn y = x (dus: 1). We bekijken nu een rij waar meer aan te beleven is. Zet het recursieve voorschrift tn = 0,5t n-1 + 10 in Y= via nMin=1, u(n)=0.5u(n-1)+10, u(nMin)=0 WINDOW xMin=-1, xMax=20, Ymin=-5, Ymax=20
en TRACE ~. Dat levert de rij 0 ® 10 ® 15 ® 17,5 ® 18,75 ® … Deze is duidelijk convergent met limiet 20 (probeer maar). De helling van de moederlijn y = 0,5x + 10 is kleiner dan 1, zodat door de herhaalde terugkaatsing de "lichtstralen" tenslotte in een soort fuik opgevangen worden. Van de andere kant af lopen de stralen vast in dezelfde fuik: 60 ® 40 ® 30 ® 25 ® …: kennelijk doet de beginwaarde van de rij (de eerste term) er helemaal niet toe! Hoe bereken je de (vermoedelijke) limietwaarde 20? Uitgaande van de convergentie (dus van een hellingscoëfficiënt kleiner dan 1) naar een limiet L, weten we dat op den duur de termen van een convergente rij niet meer veranderen. In de evenwichtssituatie kunnen we term t n-1 en zijn opvolger tn dan aan elkaar gelijkstellen: L = 0,5L + 10. De oplossing hiervan is L=20. Vandaar. is een programma dat lineaire recursie behandelt, in een algemene vorm. Lineaire recursie is de term die hoort bij x ® ax + b of, in TI-83 taal: RECURLIN
u(n)=A*u(n-1)+B
De grafiek van u(n) tegen u(n-1) levert de (het?) WEB op. Voor de volledigheid zij nog opgemerkt, dat er voor de convergentie, behalve a<1 ook nog een ondergrens voor a bestaat, namelijk a>-1.
Inventies 03/05/05
- 110 -
Samengevat moet dus -1 < a < 1 zijn. Als a negatief is (tussen -1 en 0) ontstaat er een alternerende rij (een rij die om en om van boven en van onder tot de limiet nadert). De volgende schermplaatjes illustreren het programma.
De kern van dergelijke recursieprogramma's is in vijf programmaregels te geven: 20®X Lbl 0 -0.8X+18®X pause X Goto 0
[ pauzeert en vertoont de waarde van X ]
Makkelijk zat dus. Veel meer te beleven is er, als een kwadratische functie is het spel komt. Rechts van snijpunt B divergeert de zaak omdat de helling groter is dan 1, maar links ervan zijn er verschillende manieren om in de fuik bij A te lopen. B is dus een afstotend punt. Rondom A echter bestaan twee (naar later zal blijken, zelfs veel meer dan twee!) webs (of is het webben?). We zullen dit nader onderzoeken in twee kwadratische gevallen. 2 Eerst de elementaire recursie x ® x + p, daarna het beroemde geval x ® ax(1 - x).
Kwadratische recursie:
2
x® x + p
Een uitgebreider overzicht (maar dan zonder het gebruik van een grafische rekenmachine) van het komende onderwerp is bijvoorbeeld te vinden in ZEBRA nr 16: Chaos en Orde (Ferdinand Verhulst). Wij beperken ons hier tot het letterlijk en figuurlijk inzoomen op een aantal opmerkelijkheden. 2 Overigens wordt de recursie x + p waarmee we openen, daar niet behandeld.
Het geval p = ¼ OPGAVEN 2
55.
De parabool y = x + ¼ raakt de lijn y = x. Bewijs dit en bereken het raakpunt.
56.
Bereken met de abc-formule voor vierkantsvergelijkingen ax +bx+c=0 de 2 evenwichtswaarde(n) van de recursie x ® x + ¼ Pak je GR, start met X=0.501 en bekijk de eerste 1000 termen van 2 X + 0.25 ® X met behulp van het vijfregelige programmaatje. Even geduld hebben. Zelfde vraag met de startwaarde X=0.499 Zelfde vraag met startwaarde X=0.
57. 58. 59.
Inventies 03/05/05
2
- 111 -
Wat opvalt is de buitengewoon trage convergentie in de buurt van de evenwichtswaarde. Dat zou ons nieuwsgierig moeten maken. Hoe gaat het met andere waarden voor p, kleiner dan ¼ ? (Als p groter is dan ¼ raakt de parabool los van de lijn y=x en krijg je divergentie).
De gevallen p < ¼ Uit het plaatje met de parabool blijkt dat het punt B niet interessant is, omdat daar de helling groter is dan 1. Punt B laten we dus (figuurlijk) links liggen (letterlijk: rechts liggen). Herhaling van de eerste vier stappen (voor verschillende waarden van p) van het commando: 2 2 x ® x + p in recursietaal: u(n) = {u(n-1)} + p met een startwaarde x=0 ( of u(0)=0 ) levert de volgende functies en grafieken op. 2
y1 (p) = 0 +p = p 2 2 y2 (p) = y1 +p = p +p 2 2 2 y3 (p) = y2 +p = (p +p) +p 2 2 2 2 y4 (p) = y3 +p = {(p +p) +p} +p De X speelt de rol van p. Je krijgt uiteraard het zelfde plaatje met het programma A hieronder.
Nieuwsgierigheid is een belangrijke menselijke drijfveer. Wat zou er uitkomen als we in het programma niet vier, maar bijvoorbeeld zes of 24 stappen nemen? Of 200? Kijk naar de kluwen van grafieken voor grotere waarden van N.
OPGAVE 60.
2
Laat zien dat de oplossingen van de vergelijking x + p = x te schrijven zijn als: x 1,2 = 0,5 ( 1 ± Ö (1 - 4p) ) = 0,5 ± Ö (¼ - p). Voor welke waarden van p heeft de vergelijking oplossingen?
Inventies 03/05/05
- 112 -
Multivergentie WEB ClrHome:Seq Web ú2üXmin:2üXmax ú2üYmin:2üYmax .25üXscl:.25üYscl 1üÖMin Input "Startwaarde?",S Süu(ÖMin) Prompt P "(u(Ö-1))Ü+P"üu
Experimenteer maar eens met verschillende p-waarden kleiner dan -1 en startwaarden S variërend van -1.8 tot 1.8. Na gebruik van dit miniatuurprogrammaatje moet de MODE weer op func gezet worden. Met de vinger na TRACE vastberaden op ~ zie je de spin zich met WEB razendsnel ontwikkelen. Als de spin uiteindelijk één vierkantje draait (zoals bij p = -1) zijn er twee limietwaarden, dat zou je bivergentie kunnen noemen (bi betekent twee). Zie je twee vierkantjes ontstaan, dan zijn er vier limietwaarden (tetravergentie, tetra is vier). Dat gebeurt bijvoorbeeld bij p = -1.3. Zie het middelste schermplaatje. Bij p-waarden kleiner dan ongeveer -1.38 komt de spin nooit meer tot rust. In de omgeving -2 < p < -1.39 ontwaren we buitengewoon merkwaardig dingen!
OPGAVE 61.
Componeer een programmaatje met de naam CHAOS met de regels 0®X For(P,0.25,-2,-0.02) 2 X +P® X: Disp X End
voor een onderzoek naar limietwaarden voor p tussen -2 en +0.25.
Voor p < -2 ontploft de boel al binnen een paar stappen. Een recursieve explosie. Bij p = -2 met startwaarde x = 0 verschijnt "opeens" het verdichtingspunt 2. Bij p = -2 met een iets andere startwaarde (x = 0.01) echter is het resultaat onduidelijk. MAAR WAT IS ER AAN DE HAND VOOR p-WAARDEN TUSSEN -2 EN -1.39? Het onderzoek van opgave 61 is samen te vatten in een grafiekje dat op de horizontale as de p-waarden en op de verticale as de termen van de rij en de eventuele evenwichtswaarden vertoont. De eerste twintig termen of zo zijn er vaak nog heftige fluctuaties, dus beginnen we pas na term nummer vijftig Pt-On(P,X) te tekenen. Daarbij moet rekening gehouden worden met een eerder genoemde onvolkomenheid in de instructie Pt-On(A,B) die de onaangename eigenschap heeft, na het tekenen de B-coördinaat op nul te zetten. Dat alles kost veel tijd. Je moet dus wel over wat zitvlees beschikken. De kern van zo'n programma zit in de regels: For(P,.24,ú1.6,ú.02) 0üX For(I,1,50) "ALLEEN REKENEN, NIET TEKENEN" XÜ+PüX End For(I,1,50) XÜ+PüX XüZ "BEWAAR DE TWEEDE COORD." Pt-On(P,X) ZüX End End
Inventies 03/05/05
- 113 -
Laten we deze toestanden eens samenvatten van rechts naar links. Voor p > 0.25: Voor - 0.75 £ p £ +0.25: Voor -1.25 £ p < - 0.75: Voor -1.36 < p < - 1.25: Voor -1,38 < p < -1.36: Voor p = -1.75: Voor -2 < p < -1,39: Voor p = -2 en start x ¹ 0: Voor p = -2 en start x = 0: Voor p < -2:
divergentie convergentie bivergentie tetravergentie oktavergentie trivergentie chaos chaos convergentie divergentie
Multivergentie dus.
OPGAVE 62.
a) Het rechterstuk van de vork in bovenstaande grafiek wordt beschreven door de functie y = ½ - Ö(¼ - p) voor -.75 £ p £ +.25. Bewijs dit. b) Het gesplitste deel links wordt beschreven door de functies y = -½ ± Ö(-¾ - p) voor p £ -.75. Bewijs dit. Aanwijzing: uitgaande van de limieten x1 en x2 komen er twee vergelijkingen: 2 2 x 1 +p=x2 en x2 +p=x1. Trek deze van elkaar af, om de p (voorlopig) te elimineren. c) Leg uit waarom er bij p = -1.25 een splitsing in vier limieten komt. 2 2 Aanwijzing: gebruik de kettingregel voor de afgeleide van (x +p) +p en vul voor x de limieten uit de vorige vraag in.
Een drieluik vol markante momenten
Inventies 03/05/05
- 114 -
We banen ons een weg door de jungle, weer van rechts naar links, met behulp van CHAOS2. p = 0: Zonder woorden
p tussen -1.3 en -1.4: Het ingezoomde gebied is min of meer gelijkvormig met het oorspronkelijke plaatje. Deze self-similarity is een kenmerk van fractals, een belangwekkend onderwerp dat op deze plek (door het beperkte aantal pixels op het scherm) niet goed besproken kan worden. p = -1.48 en p = -1.75: Vensters in de buurt van een splitsing.
p = -1.7495 en p = -1.7499: Verbazingwekkend. De rij heeft soms de grootste moeite om tot rust te komen. Je zou dat verschijnsel met intervergentie kunnen betitelen.
p = -2: In L2 staan de termen na een startwaarde x0 = 0.1; –5 in L3 staat het verloop met een iets andere startwaarde, namelijk x0 = 0.1 + 10 ; in L4 is het verschil L2 – L3 aangegeven met plusjes. Een uiterst klein verschil in het begin leidt op de lange duur tot enorme verschillen: het beroemde vlindereffect of schaduweffect. E.N. Lorenz opende een artikel over het butterfly effect als volgt: Predictability: Does the flap of a butterfly's wing in Brazil set off a tornado in Texas?
Inventies 03/05/05
- 115 -
Logistische recursie: x ® ax(1-x) Vanwege de factor (1-x) beperken we ons tot 0 £ x £ 1 en als eerste term nemen we steeds x = 0.5 (omdat de eerste term in het algemeen geen invloed heeft op de conclusies). Laten we ons even inleidend oriënteren op deze beroemde rij. Eerst de basisrij x ® a.x, die is meetkundig. Met a = 3 krijg je 0.5 ® 1.5 ® 4.5 ® 13.5 ® … gaat naar oneindig. Met a = 0.5 komt er 0.5 ® 0.25 ® 0.125 ® … gaat naar nul. Wat is de invloed van de tweede factor (1 - x) op het totaalgebeuren? Met a = 3 komt er (ongeveer): 0.5 ® 0.75 ® 0.56 ® 0.74 ® 0.58 ® 0.73 ® 0.59 ® ? Met a = 0.5 krijg je: 0.5 ® 0.055 ® 0.026 ® 0.013 ® gaat naar 0 Met a = 2 daarentegen: 0.5 ® 0.5 ® 0.5 ® constant Met a = 4: 1 ® 0 ® 0 ® 0 ® constant Met a = 4.2 divergeert het zaakje razendsnel: 1.05 ® -1.13 ® -10.1 ® -472 ® … De factor x kun je als een soort groeifactor beschouwen. De factor (1-x) werkt daar in zekere zin tegenin, vandaar dat dit geval ook wel het "geremde groei model" wordt genoemd. Chaotische toestanden. We zullen proberen hier een touw aan vast te knopen. Bekijk het stelsel grafieken f (x)=ax(1-x) voor 0
1 =L. a
Verder weten we dat voor een limietwaarde L de helling ter plaatse tussen -1 en 1 moet liggen. Aangezien f (x) = a x (1-x) als afgeleide f '(x) = a (1 - 2x) heeft, is de voorwaarde voor convergentie - 1 < a{1 - 2(1 - 1a )} < 1 wat we als volgt uitwerken: - 1 < a (1 - 2 + a2 ) < 1 Û -1 < 2 - a < 1 Û -1 < a - 2 < 1 Û 1 < a < 3 .
1 a
Voor deze waarden van a convergeert de rij dus tot de limietwaarde 1- . De vraag is, wat er tussen a = 3 en a = 4 gebeurt. Het antwoord op die vraag zal een programmaatje moeten geven in de stijl van de vorige programma's.
Inventies 03/05/05
- 116 -
OPGAVE 63.
Beschouw de recursie X®AX(1-X). Schrijf een programma BIFURC dat de limietwaarden L zoekt en tekent als punten (A,L) met A tussen 2.2 en 3.8 en venstervariabelen 0<x<1.3 en 1.5
Periodeverdubbeling blijkt op te treden vanaf a>3. De twee limietwaarden van de bivergentie op dat interval zijn: L1,2 =
a + 1 ± (a - 3)(a + 1) 2a
OPGAVE 64.
Wie dit wil bewijzen moet blaken van zelfvertrouwen
Wie inzoomt op geheimzinnige gaten in de chaotische puntenwolk ontdekt tot zijn verrassing dat er ook hier soms, volkomen onverwacht en schijnbaar onvoorspelbaar, orde komt in de chaos! Zo is er in de buurt van a = 3.83 (exact: 1+Ö8) plotseling trivergentie. Op het grote broertje van de TI-83, de TI92 (Voyage), kun je dat beter zien:
Helaas zijn het oplossend vermogen en de rekensnelheid van de TI-83 niet echt geschikt voor zulke details.
Grenzen aan de groei In de natuur groeien populaties vaak exponentieel. Maar na een tijdje wordt deze groei afgeremd door omgevingsfactoren zoals tekort aan ruimte of voedsel. Bij geschikte keuze van de variabelen ontstaat een karakteristiek patroon, dat we logistisch noemen. Het prototype is x®gx(1-ax). Bekijk de rij u(n+1) = 1,02.u(n).(1-0,0003u(n)) met u(0)=10. g=1,02 is de groeifactor in het begin, dus 2 procent; de coëfficiënt a=-0,0003 geeft de mate van afremming. Hiervan zijn de termen uit te rekenen met 10®X ENTER gevolgd door 1.02X(1-.0003X)®X.
Inventies 03/05/05
- 117 -
Het programma RECURLOG is te gebruiken als gereedschap bij verder onderzoek. De broncode daarvan is weggelaten. Dit boek moet leesbaar blijven. Kijk naar de plaatjes. Aanvankelijk is de groeifactor ongeveer u(1)/u(0) » 1,017; na 70 stappen is er minder ruimte (voedsel) en is de groeifactor gedaald tot 1,012; na 200 stappen tot 1,0018.
Het model dat bij deze logistische (geremde) groei hoort wordt in de bovenstaande schermpjes getoond. De theorie met F ( x) =
65,36 1 + 5,536 × e - 0,02 x
sluit in dit voorbeeld bijna volmaakt aan bij het
experiment: F(200) = 59.3429; u(200)= 59.3665. Als je de grafiek van F (x) over de experimentele grafiek heen plot, is er geen verschil waar te nemen.
Een gedachte-experiment Het idee van logistische groei verklaart de mogelijkheid van stabiele en instabiele evenwichtstoestanden. De kromme y =
1 1 + 20e - 6 x
met 0£x£1
en 0£y£1 (hier geschetst samen met de lijn y=x) heeft bij A en C een helling kleiner dan 1. In de omgeving van die twee punten is er dus een stabiel evenwicht (convergentie). Bij punt B echter is een minieme afwijking al genoeg om de zaak te verstoren, het is een labiel evenwicht. De groei zet zich dan voort in de richting van de stabiele punten A of C. In de TI83 (of -84) kun je dat met de TRACE knop prachtig zichtbaar maken na instelling van de Seq functie Y1=1/(1+20e^(-6u(n-1))) met u(nMin)=0.55 of 0.45.
Inventies 03/05/05
- 118 -
Freeman Dyson (befaamd Brits wis- en natuurkundige uit de twintigste eeuw) veronderstelt in Origins of Life (1999) dat leven ontstaan kan zijn door toevallige samenklontering van basismoleculen (aminozuren?) tot complexe ketens (enzymen?). In wat hij noemt een Toy Model wordt mathematisch beschreven hoe dat statistische proces in zijn werk kan zijn gegaan. Het overgrote deel van de deeltjes blijft in de buurt van A en sterft uit, maar heel soms (en er waren genoeg tijd en deeltjes voorhanden, vier miljard jaar geleden) kwam een deeltje rechts van B terecht dat zich ontwikkelde tot een levensvatbaar (reproduceerbaar) supermolecuul. Wie vindt dat dit een vaag verhaal is, vergist zich. De gedachte erachter komt voort uit de theorie van Curie-Weiss over de magnetiseerbaarheid van ferrometalen. Beneden een bepaalde temperatuur richten de elektronen zich naar elkaar, in de buurt van punt C. Hun neuzen staan dan dezelfde kant op en het materiaal wordt spontaan magnetisch. Denk aan een knikker bij B, op de top van een heuvel. Die knikker is in labiel evenwicht, hij raakt na een klein duwtje al uit balans en komt dan in een van de putjes bij A of C terecht, in stabiel evenwicht.
1
C
B
A a
complexiteit --> b
1
c
B
Onverwachte golfverschijnselen Als de remmende kracht, door externe oorzaken, een bepaalde kritische grens overschrijdt (bijvoorbeeld als plotseling roofdieren de groeiende populatie belagen) dan zal de populatie inkrimpen (wolven houden van konijnen) waardoor de roofdieren minder gedijen, zodat de prooidieren weer kunnen toenemen. Enzovoorts. Met een beetje mazzel krijg je dan een golfbeweging. In het dagelijks leven een niet onbekend verschijnsel (koersschommelingen, modeverschijnselen, afwisseling tussen vernieuwende en behoudende krachten).
Inventies 03/05/05
- 119 -
De logistische beweging gaat dus soms over in een golfbeweging. Dat is geschetst in het het programma RELOGOLF. Verander in de logistische recursie de laatste term zodanig dat er komt: u(n+1) = G.u(n).(1 - u(n-1)) , een zogenaamde tweestaps-recursie. Neem bijvoorbeeld G=2 en kijk na 25 stappen wat er gebeurt.
Met de volgcursor (TRACE en ~) kun je de afzonderlijk termen volgen. De periode van de golfbeweging is (in ons voorbeeld) zes, want na zes stappen keren de termen min of meer terug naar hun oude waarde (afgezien van dempingsverschijnselen). Zie de resulaten van RELOGOLF. De demping kan zo groot zijn, dat de populatie niet aan een golfbeweging toekomt. De wisselwerking tussen aantallen roofdieren en prooidieren is een fascinerende toepassing van de recursie theorieën. Zet je de u-waarden af op de horizontale as (de aantallen prooidieren) en de vwaarden op de verticale as dan krijg je een uv diagram (een twee-fasen diagram). Ik geef hierna een aantal plaatjes die opgeleverd werden door RECPROOF (PRooi- en ROOFdieren) zonder verder commentaar.
Inventies 03/05/05
- 120 -
4.8
Functies van twee variabelen
Stapje voor stapje Een functie van twee variabelen F (x, y) heeft als domein een deelverzameling van het Oxy vlak. Aan elk koppel (x, y) (aan elk punt dus) uit dit domein wordt een getal toegekend volgens het functievoorschrift van F. Als het functievoorschrift bijvoorbeeld gegeven is door 2 2 F (x, y) = Ö(x + y ) dan is F (3,4) = 5 de functiewaarde in punt (3,4). 2 2 De vergelijkingen x + y = C (met C ³ 0) stellen grafisch een verzameling cirkels voor met straal ÖC, hierboven getekend. Los van het feit dat die hier meer op sinaasappels lijken dan op cirkels, is er nog een onvolkomenheid. Een gewone grafische rekenmachine is namelijk in het algemeen niet in staat de grafiek van F (x, y) = C te produceren. Slechts in uitzonderlijke gevallen lukt het de y direct (expliciet) in x uit te drukken en de grafiek aldus via een omweg te 2 tekenen. [Hier dus met y = ± Ö (C - x )]. Men noemt F (x, y) = C daarom wel eens een impliciete 2 2 3 functie. Voorbeelden van zulke functies zijn 2x - 3y = 6 en x + 3y - 2x + y - 22Öy = 0. In het eerste geval lukt het nog om de y in x uit te drukken en de grafiek direct te tekenen met: Y1=(2X-6)/3 maar in het tweede geval gaat dat niet. Voor een grafiek van de vorm F (x, y) = 0 is het programma XYKROMME ontworpen. Vooraf moet F (x, y) in Y1 geplaatst worden. Er zit vervolgens niets anders op, lijkt me, dan van elk beeldschermpuntje (X,Y) te testen of het (als Y1=0) "aan" gezet moet worden met Pt-On(X,Y). Kolom voor kolom met For(X,Xmin,Xmax,Dx) en rij voor rij met For(Y,Ymin,Ymax,Dy) worden de pixels afgetast. Dx en Dy zijn de horizontale en verticale afstand tussen de pixels. Als het teken van Y1 verspringt van plus naar min (of andersom) nemen we aan dat daartussen "ergens" Y1 de waarde nul heeft aangenomen. Bij continue functies is dat ook zo. Als P de vorige waarde van Y1 is, dan is het product P*Y1 te gebruiken als de lakmoesproef. Is P*Y1 namelijk negatief dan hebben we een nulwaarde geconstateerd van Y1, dus van F (x, y). De romp van het programma is: XYKROMME ¾XüD:¾YüE For(X,Xmin,Xmax,D) Ymin-EüY:Y1üP For(Y,Ymin,Ymax,E) If P*Y1÷0:Pt-On(X,Y) Y1üP End End Ga koffie drinken terwijl de TI-83 (liefst model SE) nijver bezig is de 94 keer 62 beeldpunten af te tasten. Ik geef drie voorbeelden van grafieken van impliciete functies.
(X-2Y)(X+Y+9)=0
Inventies 03/05/05
X^4+Y^4-1=0
- 121 -
2
2X -X^4-Y2=0
Differentiaalvergelijkingen De vergelijking F (x, y) = 0 kan impliciet gedifferentieerd worden via de kettingregel. Nemen we 2 2 bijvoorbeeld de cirkels x + y = C dan levert differentiatie links en rechts: 2x + 2y × y ' = 0. F (x, y) = 0 differentiëren geeft dus: De partiële afgeleiden DF =
¶F ¶x
×Dx +
¶F ¶y
dF ¶F ¶F dy = + × =0 dx ¶x ¶y dx
¶F ¶x
en
¶F ¶y
×Dy = Fx×Dx + Fy ×Dy
worden korter genoteerd als Fx en Fy zodat er geschreven kan worden:
waarbij DF de toename in F is als gevolg van (kleine) wijzigingen Dx en Dy in de coördinaten x en y. 2
2
Punt (8,6) ligt op de cirkel x + y = 100; na een (niet eens kleine) toename Dx = 1 en Dy = 1 gaat dat punt over in het punt (9,7) en DF = 2x.1 + 2y.1 = 2.8 + 2.6 = 28 waardoor F op 100+28 = 128 komt. In werkelijkheid ligt het 2 2 punt (9,7) op de cirkel x + y = 130. Dat is al een fraaie benadering (130 ligt relatief dicht bij 128). 2
2
In het geval van de cirkels levert impliciete differentiatie van x + y = C de zogenaamde differentiaalvergelijking 2x + 2y× dy dx = 0 die ook wel wordt geschreven als 2x dx + 2y dy = 0 of
dy x =dx y
Omgekeerd zegt men dat de differentiaalvergelijking dy x =dx y
tot oplossing heeft het stelsel vergelijkingen 2
2
x + y = C. Zo'n oplossingskromme kan geschetst worden. Je kunt daarbij in hele kleine stapjes over het XY-vlak lopen en de richting van elk stapje laten bepalen door dy dx als functie van (x, y). Dit is de methode van Euler (die man weer!). Voor ons volgende TI-83 programma is het devies dus: (1) Zet dy dx vooraf in Y1 . (Vergeet niet met FnOff de normale werking van Y1 uit te schakelen). (2) Uitgaande van een bepaalde startpositie (a,b) beweeg je één pixel Dx opzij en tegelijk Y1 *Dx pixels omhoog, naar het volgende punt.
dy dx
× Dx =
Van breuken in Y1, zoals in het bovenstaande geval, houdt de rekenmachine niet erg omdat het bewegende punt onderweg nogal eens gestuit wordt door een noemer die nul is. Maar met het uitproberen van verschillende startpunten ontstaat er toch het bekende beeld van de concentrische cirkels. Zie de voorafgaande figuur. Hieronder de oplossingen van de differentiaalvergelijking
Inventies 03/05/05
- 122 -
dy = x(3 - y ) . dx
DIFEULER Lbl A ClrHome: FnOff Input "XSTART?",A Input "YSTART?",B ClrHome AüX:BüY Pt-On(X,Y) AüX:BüY ¾XüD:AüX:BüY Lbl R Y1üT Y+DTüY:X+DüX YüQ:Pt-On(X,Y):QüY If X<Xmax:Goto R AüX:BüY Lbl L Y1üT:Y-DTüY:X-DüX YüQ:Pt-On(X,Y):QüY If X>Xmin:Goto L Pause Goto A
Het snijpunt van twee XY krommen Het is mogelijk om een snijpunt van twee XY krommen te benaderen via een iteratief proces dat van Newton (weer zo'n kanjer) afkomstig is. Als voorbeeld nemen we de twee eerstegraads functies f (x, y) = 2y - x - 6 en g (x, y) = x + y - 12 waarvan de nulwaarden als de rechte lijnen 2y - x - 6 = 0 en x + y - 12 = 0 getekend kunnen worden. In het snijpunt [ (6,6), maar dat weten we nog even niet ] zijn f en g beide nul: f (6,6) = 0 en g (6,6) = 0. Hoe kunnen we dat snijpunt via een berekening opsporen? (1) Een eerste schatting van dit snijpunt is bijvoorbeeld (4,0). Helemaal mis natuurlijk, maar we zullen straks zien dat dat erg weinig uitmaakt. (2) Bereken f (4,0) en g (4,0): respectievelijk -10 en -8. Dit zou nul moeten zijn. De fout is dus D f = 0 - -10 = 10 respectievelijk D g = 0 - -8 = 8 (3) Bepaal de partiële afgeleiden f x =
df dg df dg , fy = , gx = , gy = dy dy dx dx
en substitueer dat alles in Df = f x×Dx + fy ×Dy resp Dg = g x×Dx + gy ×Dy met f x = -1; f y = 2; g x = 1; g y = 1
Inventies 03/05/05
- 123 -
Dat betekent in dit geval: -1×Dx + 2×Dy = 10 1×Dx + 1×Dy = 8 De oplossingen van deze twee vergelijkingen met twee onbekenden zijn: Dx = 2 en Dy = 6 (4) De tweede schatting van het snijpunt is de eerste schatting (4,0) plus de zojuist berekende correctiewaarden van Dx en Dy. Dit leidt tot een tweede schatting: x2 = x1 + 2 = 4 + 2 = 6 y2 = y1 + 6 = 0 + 6 = 6 (5) Herhaal zonodig het hele proces, uitgaande van de tweede schatting. Stap (5) is hier niet nodig want we zijn direct al klaar. We zullen het gehele iteratieve proces samenvatten in algemene zin.
Gegeven: f (x, y) = 0 en g (x, y) = 0 Te berekenen: Het snijpunt A(a, b) waarvoor geldt: f (a, b) = 0 en g (a, b) = 0 g(x,y)=0
A(a,b)
f (x,y)=0 Dx Dy
B(x1,y1)
Aanpak: Schat de oplossing B(x1 , y1 ) en bereken de afwijkingen Df en Dg t.o.v. nul. Df = f (a,b) - f (x1 , y1) = 0 - f (x1 , y1 ) en Dg = g (a,b) - g (x1 , y1 ) = 0 - g (x1 , y1 ) Bepaal voor B(x1 , y1 ) de afgeleiden f x, f y, g x en g y, eventueel benaderd volgens f x = met Dx = 0.001 Er ontstaan zo twee vergelijkingen met twee onbekenden, Dx en Dy: f x Dx + f y Dy = - f en g x Dx + g y Dy = - g De oplossingen hiervan zijn al eerder vermeld bij VGL2ONB: Dx =
f × g y- g × f y f y × gx - fx × g y
en Dy =
g × fx - f × gx f y × gx - fx × g y
De tweede schatting wordt nu x2 = x1 + Dx, y2 = y1 + Dy
Inventies 03/05/05
- 124 -
Df enzovoorts Dx
Herhaal de hele procedure met de tweede schatting B(x2 , y2 ). In normale gevallen verloopt zo'n iteratieproces razendsnel. Er is daarom een pause opdracht ingelast, om de tussenstappen zichtbaar te maken. Zonder die tussenstops verlopen de iteraties zo snel, dat het menselijk oog ze niet kan volgen. Het bijbehorende programma hebben we UNIVERXY genoemd.
OPGAVEN 65.
Teken met hulp van het programma XYKROMME de grafiek van 4 2 2 y - 8y - 4x +25 = 0 op het domein -4£x£4 en -4£y£4. (Even geduld SVP ...)
66.
Teken m.b.v. DIFEULER en ZStandard een paar oplossingskrommen van de diff.verg: a) dy/dx = x
b) dy/dx = x + y 2
2
2
67.
Teken de grafieken van x + y = 15 en y = 2x in één figuur. 2 2 2 [aanwijzing: gebruik Y1=(X +Y -15)(Y -2X) en XYKROMME ]
68.
Bereken de coördinaten van de twee snijpunten uit opgave 67 met de iteratiemethode van Newton: UNIVERXY.
Inventies 03/05/05
- 125 -
5.
Meetkunde
5.1
De oppervlakte van een polygoon
Op de site van Dick Klingens ( www.pandd.demon.nl) is een fantastisch overzicht gegeven van onderwerpen uit de meetkunde, inclusief bewijzen, geschiedenis, werkbladen en animaties. Dick in Wonderland, zou je dit digitale meesterwerk kunnen noemen. Daar wil en kan deze schrijver niet aan tippen. De op de Nederlandse scholen toegestane grafische rekenmachines zijn niet geschikt voor fraaie meetkundige plaatjes. Daarvoor zijn 96´64 pixels eigenlijk te weinig. Maar meetkundige berekeningen kunnen er natuurlijk prima mee gemaakt worden. Een meetkundige figuur kan vastgelegd worden door coördinaten of vectoren die aan rekenregels onderworpen zijn. En rekenen kunnen onze TI83 programma's als de beste. Dat demonstreren we met het eerste meetkundeprogramma OPPVEELH, dat de oppervlakte berekent van een gesloten polygoon. Een polygoon is een veelhoek (met eventueel inspringende hoekpunten, zoals in figuur 3). De ingesloten oppervlakte verkrijg je door optellen en aftrekken van rechthoekige trapezia. In figuur 1 is aangegeven dat de oppervlakte van zo'n trapezium gevonden wordt door de basis PR te vermenigvuldigen met de gemiddelde hoogte 0,5(AP+BR).
fig.1
In figuur 2 is de oppervlakte van driehoek ABC gelijk aan PABQ + QBCR - PACR. fig.2
Dit principe is gebruikt in het programma.
fig.3
Inventies 03/05/05
- 126 -
Van (A,B) naar (X,Y) is de oppervlakte .5(X-A)(Y+B) van het trapezium:
positief als A<X
negatief als X
waarna het volgende programma ontstaat Disp "EERSTE HOEKPUNT:" Prompt X,Y XüP:YüQ:XüA:YüB:0üS Pt-On(A,B,2) Pause Lbl 0 Disp "VOLGEND HOEKPT:" Prompt X,Y .5(X-A)(Y+B)+SüS If X=P and Y=Q:Goto 1 Line(A,B,X,Y) XüA:YüB Pt-On(A,B,2) Pause Goto 0 Lbl 1 abs(S)üS ClrHome Disp "OPP=",S
Inventies 03/05/05
"OPP. TRAPEZIUM ERBIJ/ERAF"
- 127 -
5.2
Panorama van de driehoeksmeting
Wie wat wil meten (het woord meetkunde brengt je wellicht op die gedachte) zal de sinus, cosinus en tangens moeten hanteren. We zetten de beginselen van de hoekmeting (goniometrie) en driehoeksmeting (trigonometrie) op een rij. In het plaatje is een deel van de eenheidscirkel getekend (r=1). De met een * aangegeven hoek AOB noemen we α. In dit hoofdstuk zullen we alle hoeken in graden meten. Op de TI83 stel je dat in met MODE Degree. De definities zijn: sin α = AB = yA ; cos α = OB = xA ; tan α = AB / OB = sin α / cos α De stelling van Pythagoras leidt tot de regel: 2
2
(sin α) + (cos α) = 1
2
2
korter: sin α + cos α = 1
Punt C vertegenwoordigt een stompe hoek (> 900 ) waarvoor de x-coördinaat, dus de cosinus, negatief is. Dit leidt tot de betrekkingen: sin (180-α) = sin α en cos (180-α) = - cos α.
C
De cosinusregel is een uitbreiding van de stelling van Pythagoras naar willekeurige (niet speciaal rechthoekige) driehoeken. 2
2
a
b h
2
(1) a = b + c - 2bc cos α 2 2 2 (2) b = c + a - 2ac cos b 2 2 2 (3) c = a + b - 2ab cos g
α p
A
q c=p+q
B
OPGAVEN 69.
2
Bewijs cosinusregel nummer (1). Druk eerst h uit in b en p; daarna in a en q en vervang q door p.
C
De sinusregel luidt:
a b c = = sin a sin b sin g 70.
b
Een formule voor de oppervlakte van een driehoek is:
71.
2
bc sin a =
1
2
ac sin b =
1
2
ab sin g
Bewijs deze oppervlakteregel.
Inventies 03/05/05
b
α
A
1
a
h
Bewijs de sinusregel. Kijk naar de figuur hiernaast.
O=
g
- 128 -
c
B
Het middelpunt van de omgeschreven cirkel van een driehoek is het snijpunt van de drie middelloodlijnen. Voor de straal R (hoofdletter!) van de omgeschreven cirkel van een driehoek geldt:
R=
abc waarin O de oppervlakte is. 4O
72. Bewijs deze formule. Merk op dat de met een * aangegeven hoeken aan elkaar gelijk zijn (een middelpuntshoek is het dubbele van een omtrekshoek) en gebruik de oppervlakteregel.
Het middelpunt van de ingeschreven cirkel is het snijpunt van de drie deellijnen (bissectrices). Voor de straal r (kleine letter!) van de ingeschreven cirkel van een driehoek geldt:
r= 73.
O = s
O 1 (a + b + c) 2
Bewijs deze formule. Aanwijzing: opp ABC= opp AMB + BMC + AMC.
De bissectricestelling. Een bissectrice verdeelt de zijde waar hij op staat in stukken die zich verhouden als de andere zijden. In formule: p : q = b: a Het bewijs van de bissectricestelling is van een grote schoonheid. Trek een hulplijn door A evenwijdig aan de bissectrice, kijk naar de gelijke hoeken en de verhouding volgt er direct uit. Klaar is Kees (quod erat demonstrandum, zeiden de Oude Grieken al). *
C
* *
b
b
C
* *
a b
a
* A
p
q
B
A
p
a
b
x
x 2 c = a 2 p + b 2 q - cpq Bewijs ook deze formule. Aanwijzing: Gebruik de cosinusregel t.o.v. hoek α twee keer en elimineer de term 2bcosα uit de twee betrekkingen die je kreeg.
α
p
q
A
D c
Een programma dat x voor je uitrekent zou zich als volgt kunnen manifesteren.
Inventies 03/05/05
B
C
De stelling van Stewart geeft de lengte van een transversaal in een driehoek (een transversaal is een lijnstuk dat een hoekpunt verbindt met een willekeurig punt op de overstaande zijde, zoals een hoogtelijn, zwaartelijn of bissectrice):
74.
q
- 129 -
B
N.B.: helaas ontbreekt de kleine letter q, ik heb me dus moeten behelpen met c-p. Ik kan het niet nalaten hier wat schermplaatjes te tonen van het programma R2DRIEHK. In de broncode van dat programma heb ik alle letters van het alfabet gebruikt, sommige meermalen voor verschillende variabelen. Op zich is dat al een beleving die tot grote voldoening stemt. Vooral als C alles nog blijkt te werken ook! Gek genoeg zijn er mensen die b=2 a=1 0 zo'n bouwwerk van met elkaar samenhangende en uit elkaar 20 1 volgende stellingen mooi vinden. Ik ga er van uit dat de lezer A B B (anders was hij of zij nooit tot tot dat soort mensen behoort deze bladzijde gekomen). Daar put ik moed uit voor de volgende paragraaf, waar we met vectoren een ruimtelijk bouwwerk (in R3) construeren.
Inventies 03/05/05
- 130 -
5.3
Vectoren (in R2)
Een vector (snelheidsvector) is vastgelegd door een grootte (lengte, norm) en een richting. Als ook het aangrijpingspunt ("de staart") van de vector een rol speelt, zoals bij krachten, dan spreken we van een plaatsvector. In het volgende gaat het niet speciaal over plaatsvectoren. "Gewone", reële getallen noemen we scalairen (ter onderscheid van vectoren). æa ö
De vector a is gegeven door zijn kentallen a1 naar rechts, a2 omhoog: a = çç 1 ÷÷ . è a2 ø æ a1 ö ÷÷ kunnen beschouwen als een è a2 ø
Als O(0,0) en A(a1 ,a 2 ) is dan zou je de plaatsvector OA = çç
vertegenwoordiger van de verzameling van alle vectoren met eenzelfde richting die niet speciaal in de oorsprong ontspruiten. Definities: voor het optellen van vectoren moet je hun kentallen optellen: æ a1 ö æ b1 ö æ a1 + b1 ö çç ÷÷ + çç ÷÷ = çç ÷÷ è a2 ø è b2 ø è a2 + b2 ø
Voor het vermenigvuldigen met een getal p (een scalar) geldt: æ a ö æ pa ö p × çç 1 ÷÷ = çç 1 ÷÷ dus è a2 ø è pa2 ø
en
æa ö
æ-a ö
a = - çç 1 ÷÷ = çç 1 ÷÷ è a2 ø è - a2 ø
æ 0ö a + - a = 0 = çç ÷÷ benevens è 0ø
(per definitie): a - b = a + -b C
a + b = OA + OB = OA + AC = OC
c2 a2
want a1 +b1 =c1 en a 2 +b2 =c2 , zie de congruente rechthoekige driehoeken in de figuur hiernaast.
b2
Je kunt ook optellen door de vectoren "kop aan staart" te leggen:
O
A
b
a b a1
b1 B
De verbindingsvector van A naar B is te schrijven als: A
AB = b - a want a + AB = OA + AB = OB = b
a
Stelling: p ( a + b) = p a + pb hetgeen bewezen kan worden door uitschrijven van de kentallen. Definitie:
De norm van a is | a |= a12 + a2 2 (is dus een scalar).
Stelling:
| p × a |=| p | × | a |
immers
Inventies 03/05/05
p 2 a12 + p 2 a2 2 =
p 2 × a12 + a2 2 =| p | × | a |
- 131 -
B
b
c1
Definitie:
Onder de eenheidsvector langs a verstaan we
Stelling:
De lengte van een eenheidsvector is 1
1 |a|
a
Bewijs:
=
|a|
1
× a =|
|a|
1
| ×| a |=
|a|
|a|
a
×a =
|a|
=1
|a|
OPGAVE 75.
In R2 zijn gegeven de punten A(4,3) en B(5,12). ®
Bepaal de eenheidsvectoren langs OA , langs OB en langs AB .
De hoek (g) tussen twee vectoren ( a en b ) wordt bepaald door ze met de staarten tegen elkaar te leggen. Onder de projectie van b op a verstaan we de vector p = a× | b | cos g . De lengte van de projectie is | p |=| a× | b | cos g |=| a | × | b | cos g ; deze is uiteraard gelijk aan de lengte van de projectie van a op b .
b
Men noemt de lengte van de projectie ook wel het inwendig product van de vectoren a en b , kortweg geschreven als a o b . Gezien de typische notatie spreken de Amerikanen ook wel van het "dot product". Een nog weer andere benaming van het inwendig product is het scalair product, de uitkomst ervan is namelijk geen vector maar een getal (scalar). Wij kiezen voor inproduct.
g
| p |= a o b
Definitie: het inproduct van a en b (notatie a o b ) is de lengte van de projectie van b op a : a o b = | a | × | b | cos g , waarbij g de hoek is tussen a en b .
De lengte van de verbindingsvector c = b - a volgt uit: | c |2 = (b - a ) 2 = (b1 - a1 ) 2 + (b2 - a2 ) 2 = b12 - 2a1b1 + a12 + b2 2 - 2a2b2 + a2 2
en kan als derde zijde beschouwd worden in de driehoek hierboven. Toepassing van de cosinusregel leidt nu tot de volgende vereenvoudiging. | c |2 =| a |2 + | b |2 -2 | a || b | cos g = a12 + a2 2 + b12 + b2 2 - 2 | a || b | cos g
Gelijkstellen (waarna de kwadraten wegvallen) en delen door 2 geeft tenslotte:
a o b = | a | × | b | cos g = a1b1 + a2b2 en daarmee zullen we het verder doen. æ5ö
æ1ö
Het inproduct van çç ÷÷ en çç ÷÷ is 5×1 + 4×3 = 17; het inproduct è 4ø è 3ø
æ 10 ö æ 2 ö çç ÷÷ o çç ÷÷ is 20 - 20 = 0 è - 4ø è 5ø
Als a o b = 0 is, zijn er drie mogelijkheden: | a |=0 of | b |=0 of (de belangrijkste mogelijkheid) cos g = 0 dus g = 900 . Conclusie: als twee vectoren loodrecht op elkaar staan, is hun inproduct nul. Inventies 03/05/05
- 132 -
a
a ^b Þ a ob = 0 æ 10 ö æ 2 ö ÷÷ o çç ÷÷ nog even. è - 4ø è 5ø
Het voorbeeld met çç
In nevenstaande figuur zijn de hoeken A en B gelijk aan elkaar, gezien de verhoudingen 4/10 en 2/5; de hoeken A en C zijn samen 90 graden dus ook B en C. æ 10 ö æ 2ö ÷÷ en çç ÷÷ loodrecht op elkaar. 4 è ø è5ø
Dus staan çç
OPGAVEN 76.
Gegeven twee punten A en B; gevraagd hoek AOB in graden. a) A(4,3) en B(3,4) b) A(1,0) en B(-1,Ö3) c) A(3,1) en B(1,2) d) A(3,-2) en B(4,6)
77.
Schrijf een programma HOEK dat de voorgaande vragen in een handomdraai oplost. Invoer: de coördinaten van A en B. Uitvoer: hoek AOB in graden.
De hoek g tussen a en b volgt uit: cos g =
Inventies 03/05/05
- 133 -
aob | a |×|b |
5.4
Vectoren in R3
De uitbreiding van twee naar drie coördinaten is gemakkelijk. Het inwendig product bijvoorbeeld wordt gedefinieerd als a o b = a1b1 + a2b2 + a3b3
en de norm (lengte) wordt | a |= a12 + a2 2 + a32 = a o a dus | a |2 = a o a
De drie assen worden meestal gekozen als in het volgende plaatje (links) aangegeven is. Merk op dat het een rechtsdraaiend stelsel is: draai de x-as naar de y-as als bij een schroevendraaier die omhoog beweegt, in de richting van de z-as. z
a´b a a1
a2 x
a
a3
b
y x
rechtsdraaiend assenstelsel
uitwendig product
In dit assenstelsel is ook een uitwendig product (vectorproduct) gedefinieerd, aangegeven met het symbool ´. Het vectorproduct a ´ b is een vector (geen scalar dus), die loodrecht staat op a en b . Draai de schroevendraaier van a naar b , en je weet de richting van de productvector. Verwisseling van de vectoren levert een tegengesteld vectorproduct. In het plaatje rechts wijst b ´ a naar beneden! Er zijn weer twee definities. Haal eerst even adem. De tweede definitie ziet er onvriendelijk uit. Maar je kunt met hem en op hem rekenen, en daar gaat het om! (1)
a ´ b =| a | × | b | × sin g
g is Ð (a, b)
(2)
æ a1 ö æ b1 ö æ a2b3 - a3b2 ö ç ÷ ç ÷ ç ÷ a ´ b = ç a2 ÷ ´ ç b2 ÷ = ç a3b1 - a1b3 ÷ ça ÷ çb ÷ ç a b - a b ÷ 2 1ø è 3ø è 3ø è 1 2
De indices (subscripts) 1,2,3 zijn in een cirkeltje (cyclisch) doorgeschoven: van 2 naar 3 naar 1 naar 2 naar 3 naar 1 ... Dat (1) en (2) gelijkwaardig zijn, zullen we niet bewijzen. Niet omdat dat erg moeilijk is (je moet 2
2
beginnen met het kwadraat ( a ´ b ) uit te schrijven volgens (1) en daarbij 1-sin g te vervangen door 2 cos g), maar eerder omdat het zo'n vervelend en saai klusje is.
Inventies 03/05/05
- 134 -
Een paar voorbeelden. æ1ö æ0ö æ0ö ç ÷ ç ÷ ç ÷ ç0÷´ ç1÷ = ç0÷ ; ç0÷ ç0÷ ç1÷ è ø è ø è ø
æ0ö æ0ö æ1ö ç ÷ ç ÷ ç ÷ ç1÷´ ç0÷ = ç0÷ ; ç0÷ ç1÷ ç0÷ è ø è ø è ø
æ0ö æ1ö æ0ö ç ÷ ç ÷ ç ÷ ç0÷´ ç0÷ = ç1÷ ; ç1÷ ç0÷ ç0÷ è ø è ø è ø
æ1ö æ1ö æ0ö ç ÷ ç ÷ ç ÷ ç0÷´ ç0÷ = ç0÷ ç0÷ ç0÷ ç0÷ è ø è ø è ø
OPGAVEN
78.
79.
æ1ö æ 4ö æ 4ö æ1ö æ1ö æ 4ö ç ÷ ç ÷ ç ÷ ç ÷ ç ÷ ç ÷ Bereken ç 2 ÷ ´ ç 5 ÷ en ç 5 ÷ ´ ç 2 ÷ en ç 2 ÷ o ç 5 ÷ ç 3÷ ç 6÷ ç 6÷ ç 3÷ ç 3÷ ç 6÷ è ø è ø è ø è ø è ø è ø Schrijf een programma dat na invoering van de kentallen van twee vectoren, hun inproduct en uitproduct berekent.
Vectoren (en hun product) spelen een belangrijke rol in de natuurkunde (mechanica, elektriciteitsleer), scheikunde en de techniek (bouwkunde). In de jaren '70 en '80 maakte de vectorrekening nog deel uit van het Nederlandse leerplan wiskunde op de havo en het vwo (wiskunde II). Om voor mij onbegrijpelijke redenen is het vak eind jaren '80 geruisloos afgevoerd. Het is mogelijk dat de goniometrie die aan de basis ervan ligt, als te zware last werd (wordt, moet ik zeggen: kort geleden zijn voorstellen gedaan om ook de goniometrie in de koelkast te zetten) beschouwd. Hoe het ook zij, leergebieden komen en gaan. Maar de leerplannen wiskunde worden nog vaker gewijzigd dan de spellingsregels van de Nederlandse Taal. Ingevoerd en weer in onbruik geraakt zijn de verzamelingenleer, de matrices en de grafen, de lineaire algebra, de vectorrekening. En het ziet er naar uit dat inmiddels ook de algebra een sterfhuisconstructie heeft ondergaan. Natuurlijk moet de tuin der (middelbare school)wiskunde regelmatig gesnoeid worden, maar het kappen van woudreuzen (en daar bedoel ik de algebra en de vectorrekening mee) gaat te ver. De wetenschap immers trekt zich niets aan van wat leerplanontwikkelaars in hun modieuze wijsheid bedacht hebben. Zodat de nieuwe student na het doorlopen van de tweede fase, in de derde fase in toenemende mate geteisterd wordt door nulmodules en inhaalprogramma's algebra en vectorrekening zonder formuleblad en grafische rekenmachine. Aanschouw de zeven formules op de volgende bladzijde. De eerste is de bekende formule om arbeid te berekenen. De tweede beschrijft de kracht op een in een magneetveld bewegend electron. De derde verklaart de ellipsbanen van planeten. Als je de schoonheid ervan kunt waarderen, adviseer ik je om natuurkunde te gaan studeren. Dan maak je bij elektriciteitsleer kennis met de nog fraaiere formules van Maxwell (formule 4 tot en r r met 7) die veranderingen in elektrische ( E ) en magnetische ( B ) velden beschrijft. Kijk er naar en bewonder ze.
Inventies 03/05/05
- 135 -
W = F os F = B ´ ev
v ´ c = GM u + b r r ÑoE = 0 r r ÑoB = 0
r r r dB Ñ´ E = dt r r r dE Ñ ´ B = em dt Inventies 03/05/05
- 136 -
PANORAMA
Een bouwwerk van stellingen Een stelling is een eigenschap met algemene geldigheid. De volgende stellingen gelden dus voor alle erin voorkomende vectoren en getallen. Na de stellingen over vectoren gecombineerd met reële getallen
a+b =b+a
a + (b + c ) = ( a + b ) + c
a+0=a a + (-a) = 0
1× a = a p ( a + b) = p a + pb
( p + q)a = p a + q a
( pq ) a = p ( q a ) = q ( p a )
0×a = 0
en de stellingen over het inproduct
a o a =| a |2
|
a |= 1 |a|
a o (b + c ) = a o b + a o c
aob = boa
0oa = 0
( p a ) o b = p ( a o b) = a o ( pb)
komen eigenschappen samenhangend met het uitproduct:
b ´ a = -( a ´ b)
a´0 = 0
a´a = 0
a ´ (b + c ) = a ´ b + a ´ c
( p a ) ´ b = p ( a ´ b) = a ´ ( pb)
(a + b) ´ c = a ´ c + b ´ c ( a ´ b ) o c = (b ´ c ) o a = ( c ´ a ) o b a ´ (b ´ c ) = ( a o c )b - ( a o b ) c en (tenslotte) de eigenschap dat a ´ b loodrecht staat op a en b vanwege ( a ´ b) o a = 0 en ( a ´ b) o b = 0 De juistheid van al deze beweringen volgt na het uitschrijven van de kentallen. In het laatste geval ( a ´ b) o a = 0 bijvoorbeeld:
(a2b3 - a3b2 )a1 + (a3b1 - a1b3 )a2 + (a1b2 - a2b1 )a3 waar, na het wegwerken van de haakjes, alles tegen elkaar wegvalt.
Inventies 03/05/05
- 137 -
Muggenzifterij? Zo'n bouwwerk zie je vaker in de wiskunde. Sterker: alle wiskundige modellen zijn, sinds Euclides (300 v C!), gebouwd op een fundament van definities en notaties (de axioma's) met de stellingen als bouwstenen. Jonge (Nederlandse) lezers van dit boek, die hun mathematische intuïtie verworven hebben in de basisvorming en de tweede fase, geloven mij natuurlijk niet. Maar pas op! Niet alles is wat het lijkt. Neem een willekeurige bewerking * (optellen, vermenigvuldigen). " Geloof " je in de commutatieve eigenschap: a*b=b*a Geloof je in de associatieve eigenschap: a*(b*c)=(a*b)*c of is er reden voor twijfel? De vanzelfsprekendheid van de commutatieve (verwisselings) eigenschap verdwijnt, zodra men kennis maakt met het uitproduct ( b´a ¹ a´b ) of met de vermenigvuldiging van matrices ([A]´[B]¹[B]´[A] blijkens de hiernaast staande schermplaatjes of met de machtsverheffing (23 is beslist niet gelijk aan 32 ) ... Ook de associatieve eigenschap is niet algemeen geldig. Bij het uitproduct niet, maar bijvoorbeeld evenmin bij de machtsverheffing: 2^(3^4) is niet hetzelfde als (2^3)^4 want het eerste is 28 1= 2,4.102 4 en het tweede is 21 2 = 4096 en dat scheelt nogal wat! Pas na heldere, eenduidige definities en gebruikmakend van de logica ontstaat er zekerheid in de vorm van stellingen. Ondersteund door al die stellingen krijgen we –stap voor stap- de kans hoger te klimmen. Het berekenen van hoeken en afstanden in figuren waarvan de coördinaten bekend zijn is nu slechts weinig meer dan een fluitje van een cent.
Inventies 03/05/05
- 138 -
5.5
Het berekenen van afstanden en hoeken
5.5.1
HOEKLM
De hoek α tussen twee lijnen AB en CD volgt uit cos a =
| AB o CD | | AB || C D |
In de volgende opgaven mag je het antwoord vinden met behulp van de aangeleverde programmaatjes. Of je legt de TI-83/84 opzij, pakt een stuk papier en rekent op eigen kracht. 80.
Gegeven de punten A(1,2,3) B(6,4,-5) C(0,0,1) en D(10,-1,7) Bereken de hoek in graden tussen de lijnen AB en CD.
5.5.2
HOEKLV AB
Bij de berekening van de hoek tussen een lijnstuk AB en een vlak CDE moet je bedenken, dat eerst een normaalvector n (loodvector) van het vlak bepaald moet worden. Dat kan met
b
n
0
n = CD ´ CE . De hoek α tussen lijn en vlak is 90 min de hoek b tussen de lijn en de normaalvector. En cos α is gelijk aan sin b. Dat leidt uiteindelijk tot de formule:
sin a =
α CDE
| AB o n | | AB || n |
81.
Gegeven de punten A(0,0,0) B(2,2,1) C(0,0,0) D(1,0,0) en E(0,1,0) Bereken de hoek tussen de lijn AB en het vlak CDE.
5.5.3
HOEKVW
Voor de hoek tussen twee vlakken nemen we beide normaalvectoren en de formule cos a =
82.
α
| n ABC o n DEF | | n ABC || n DEF |
α
In een kubus met ribbe 6 zijn gegeven de punten A(0,0,0) B(6,0,6) C(0,6,6) D(0,0,0) E(0,1,0) en F(1,0,0) Bereken (en teken) de hoek tussen de vlakken ABC en DEF.
Inventies 03/05/05
vlak ABC
- 139 -
vlak DEF
5.5.4
Oppervlakte en inhoud
De oppervlakte van de driehoek die gevormd wordt door de plaatsvectoren a , b en b - a is te schrijven als
1
2 | a || b | sin g
dus
als 1 2 | a ´ b | ; de oppervlakte van het grondvlak (parallellogram) in nevenstaand
h
α
c
a b
prisma (scheef blok) is dus | a ´ b | waaruit volgt dat de inhoud van het blok te schrijven is als | a || b || h |=| a || b || c | cos a = | (a ´ b) o c | .
Zo zijn er nog vele voorbeelden van toepassingen te vinden van de vectorrekening. Wij beperken ons verder tot afstandsberekeningen in R3.
B P
Vectorvoorstelling van een lijn
A
b
p
Het punt P doorloopt de lijn AB. Op t=0 is P in A; op t=1 is P in B. Er geldt dus:
a O
OP = OA + t × AB
Kortweg: p = a + t × (b - a )
Men noemt dit een vectorvoorstelling of ook een parametervoorstelling van AB. a heet de steunvector, AB = b - a de richtingsvector van de lijn AB.
5.5.5
R3PTLIJN P
De afstand van punt P en lijn AB. Q is de projectie van P op lijn AB; AQ is de projectie van AP op AB; d is de afstand van P tot AB. De formules hierbij zijn | AQ |=| AP o AB | en OQ = OA+ | AQ | × 83.
d A
AB
α Q
en d = | AP |2 - | AQ |2
| AB | Gegeven zijn het punt P(10,10,10) en de lijn door de punten A(0,0,0) en B(10,0,-20). Bereken - de afstand van P tot lijn AB, - de lengte van AB, - de oppervlakte van D ABP en - de coördinaten van de projectie Q van P op lijn AB.
Inventies 03/05/05
- 140 -
B
5.5.6
R3PTVLAK
Na invoer van de coördinaten van de punten A, B, C en P kan het punt Q, de projectie van P op vlak ABC, bepaald worden waaruit de afstand PQ van P tot het vlak ABC volgt. De eenheids normaalvector langs PQ is n =
AB ´ AC
P
en de
| AB || AC |
n
afstand van P tot ABC is de projectie van AP op deze normaalvector dus C
d = AP o n =
AP o ( AB ´ AC )
Q A
| AB || AC |
B
De coördinaten van de projectie Q volgen uit OP = OQ + d × n dus OQ = OP - d × n
De vergelijking van vlak ABC kan gevonden worden uit de vectorvoorstelling van vlak ABC. Voor een willekeurig punt X(x,y,z) uit vlak ABC geldt namelijk: OX = OA + t × AB + u × AC afgekort x = a + t × AB + u × AC . Links en rechts het inproduct nemend met de normaalvector levert no x = noa
wat de (een) vergelijking van vlak ABC is. Laten we dat nog even toelichten met een voorbeeld. æ1ö æ 1 ö ç ÷ ç ÷ Stel A(1,1,1), B(2,0,1) en C(2,1,-1). Dan is AB = ç - 1÷ en AC = ç 0 ÷ zodat ç0÷ ç - 2÷ è ø è ø æ 2ö ç ÷ AB ´ AC = ç 2 ÷ = n en n o x = n o a leidt tot ç1÷ è ø
æ 2 ö æ x ö æ 2 ö æ1ö ç ÷ ç ÷ ç ÷ ç ÷ ç 2 ÷ o ç y ÷ = ç 2 ÷ o ç1÷ wat weer uitgewerkt kan ç 1 ÷ ç z ÷ ç 1 ÷ ç1÷ è ø è ø è ø è ø
worden tot de vergelijking 2x + 2y + z = 5 Ter controle vullen we nog even de coördinaten van A, B en C in: 2.1+2.1+1.1=5 klopt; 2.2+2.0+1.1=5 klopt; 2.2+2.1+1.-1=5 klopt ook. 84.
Gegeven zijn het punt T(12,1,6) en de punten A(7,0,0) B(1,4,0) en C(1,2,1) Bereken - de afstand van T tot vlak ABC, - de vergelijking van vlak ABC, - de oppervlakte van D ABC, - de inhoud van piramide T.ABC, - de coördinaten van de projectie van T op vlak ABC.
Inventies 03/05/05
- 141 -
Het loodrechte snijlijnstuk van kruisende lijnen
Kruisende lijnen zijn lijnen die geen gemeenschappelijk punt hebben. Het kortste verbindingslijnstuk van die lijnen zal loodrecht staan op beide lijnen. Vandaar dat men wel spreekt van het loodrechte snijlijnstuk van de lijnen. PQ (zowel loodrecht op AB als CD) is inderdaad het kortste verbindings-lijnstuk. Kijk naar de figuur en volg de redenering. De hypotenusa is de langste zijde in een rechthoekige driehoek, want c2 = a2 + b2 > b2 (en a2) dus c>b (en a). P'Q is hypotenusa in DQPP' dus is P'Q > PQ; P'Q' is hypotenusa in DQP'Q' dus is P'Q' > P'Q > PQ dus is elk ander verbindingslijnstuk P'Q' langer dan PQ.
P
P' lijn AB
Q Q' lijn CD
In vectorvoorstelling van de lijnen AB en CD kunnen P en Q geschreven worden als OP = OA + t × AB en OQ = OC + u × CD zodat de verbindingsvector wordt: PQ = OQ - OP = AC + u × CD - t × AB
Gebruikmakend van de loodrechte stand komt er PQ o AB = 0 en PQ o CD = 0 waarna er twee vergelijkingen in t en u ontstaan: (1) AC o AB + u × CD o AB - t × AB 2 = 0 en (2) AC o CD + u × CD 2 - t × AB o CD = 0 met de oplossingen t=
u=
( AC o AB)CD 2 - ( AC o CD)( AB o CD) n2
en
( AC o AB)( AB o CD ) - ( AC o CD ) AB 2 n2
waarin n 2 = ( AB ´ CD ) 2 = AB 2CD 2 - ( AB o CD ) 2 5.5.7
R3LOODLN
Alles is nu uitgedrukt in inproducten. De TI83 kan zijn gang gaan ... P en Q kunnen berekend worden en daarmee de afstand PQ van de kruisende lijnen. Als de lijnen per ongeluk snijden in plaats van kruisen, komt er 0 uit die afstand waarmee duidelijk wordt dat snijden een bijzonder geval van kruisen is! 85.
Gegeven zijn de punten A(0,1,2) B(3,-2,2) C(0,-1,15) en D(4,3,-1) Bereken de coördinaten van de punten P op lijn AB en Q op lijn CD zo, dat PQ loodrecht staat op AB en CD. Bereken ook de afstand van de lijnen AB en CD.
Inventies 03/05/05
- 142 -
ANTWOORDEN 1. ClrHome ClrAllLists Prompt N ClrHome Nüdim(L1) For(D,1,N) For(K,D,N,D) K-L1(K)üL1(K) End:End For(I,1,N) If L1(I)ø0:Disp L1(I) End Het aantal keren drukken is gelijk aan het aantal delers van een rangnummer. Als een lampje op het eind aan geschakeld is moet er een oneven aantal keren gedrukt zijn. Waaruit volgt dat het rangnummer een paar gelijke delers had. Zo krijgen we een rij met kwadraten. 2.
3
3
3
9 + 10 = 12 + 1 3
3
3
64 + 94 = 103 + 1 3 3 3 71 +138 = 144 - 1 3 3 3 73 + 144 = 150 + 1 3 3 3 135 + 138 = 172 - 1 3
3
2
2
3
3.
Gebruik makend van (p + q) = p + 3p q + 3pq + q komt er: 3 9 2 6 3 3 12 3 3 72 a + 3.72 a + 3.72a + 1 + 144 a = {6a(24a +1)} + 1 ??? 3 9 6 3 wegdelen van 216a geeft links en rechts dezelfde coëfficiënten: 4608a + 1728a + 72a + 1
5.
(1/n)^(1/s) » 0,89 geeft 1/s log 1/n » log 0,89 » -0,05
6.
100000 = 2 ´5 2´3´5´76´11´13´17´19 + 1 = 347 ´ 27953 100001 = 11´9091 2´3´5´76´11´13´17´19 - 1 = 53´197´929 100002 = 2´3´7´2381 100003 = 100003 (priem!)
7.
5
5
Voor alle gehele n £ 40 is het priem; voor n = 41 is het voor het eerst niet priem
8.
Oneven getallen vanaf 19 kunnen als de som van 2 of 3 priemgetallen geschreven worden. Vermoedelijk!
9.
x = -3960 + n´29; y = 3168 - n´23. Voor n=137 krijg je het punt (13,17)
10.
a = c - b = (c+b)(c-b) = (c+b).1 met b=c-1 geeft a = 2c-1 2 2 2 2 a = c - b = (c+b).2 met b = c-2 geeft a = 4(c-1)
11.
0.50
12.
37 mensen hadden geen huisdier
2
2
2
0.33 (vermoedelijk 1/3)
2
nee(1/3¹0)
ja (zie opg 17)
13. Met de kansen 0.5 en 0.5: ClrHome:ClrAllLists rand(400)üL1:rand(400)üL2 L1*L2üL3 1-Var Stats L1:ËüA 1-Var Stats L2:ËüB 1-Var Stats L3:ËüC
Inventies 03/05/05
- 143 -
Output(1,1,"Ë1=") Output(1,4,round(A,5) Output(2,1,"Ë2="):Output(2,4,round(B,5):Output(3,1,"Ë3=") Output(3,8,round(C,5):Output(4,1,"Ë1*Ë2="):Output(4,8,round(AB,5)) Met de kansen 0.5 en 0.8: ClrHome:ClrAllLists rand(500)üL1:rand(500)üL2 sum(L1<.5)üA:sum(L2<.8)üB sum(L1<.5 and L2<.8)üC round(A/500,5)üA round(B/500,5)üB round(C/500,5)üC Output(1,1,"Ë1=") Output(1,4,A):Output(2,1,"Ë2="):Output(2,4,B) Output(3,1,"x•ENx‚="):Output(3,8,C) Output(4,1,"Ë1*Ë2="):Output(4,8,round(AB,3)
Theorie
14.
15.
16. 17.
Meting
P( 0,495n £ X £ 0,505n | m=0,5n, s=0,5Ön ) = 0,95 oftewel: 0=normalcdf(0.495N,0.505N,0.5N,.5Ö(N))-0.95) levert N =38414 worpen
æ n ö 1 99 98 × × × ... = n. 1 = 0,01n ; hier is de kans dus 0,37. De kans is çç ÷÷ × 100 99 98 100 1 è ø Alle personen hebben gelijke kans! De laatste bijvoorbeeld heeft de prijs, als al zijn 9 ×8×7×6×5×4×3×2×1 = 1 voorgangers gemist hebben: p = 10 ; bewonder het elegante 9 8 7 6 5 4 3 2 10 wegdelen van gelijke factoren in de tellers en noemers.
18.
b) 0=N*sum(seq(1/X,X,1,N))-2000 geeft N=316
19.
a) 519
20.
Volgens model II is de kans dat het andere kind ook een meisje is 1/3.
21.
a) 1+ 3+...+(2n-1) + (2n+1) = (n+1) ?? n + 2n + 1 = n + 2n + 1 klopt b) de halve rechthoek van 7 bij 8 is gevuld
22.
Na 3000 simulaties vond ik in L1 de lijst met gemiddelde 4.6667 volgens de theorie: met verwachting 4.6763 Haast te mooi, maar desalniettemin waar.
23.
Zonder terugleg: 2/12, 4/12 en 6/12
2
Inventies 03/05/05
2
2
{0, 201, 390, 607, 783, 1019} {0, 200, 400, 600, 800, 1000}
Met terugleg: 1/16, 3/16, 5/16 en 7/16
- 144 -
2
2
24.
1/3 n(n -1) + (n+1)n
= 1/3 (n+1)((n+1) -1) ?? = 1/3 (n+1)n(n+2) links en rechts maal 3/n geeft 2 n -1 + 3n+3 = (n+1)(n+2) ?? 2 2 n + 3n + 2 = n + 3n + 2 klopt
25.
Voor n£6: recursieformule: Voor n³7 is de formule:
26.
Directe formule voor N£6: P(N=n)=1/6.(1+1/6) =7 /6 Een directe formule is voor N³7 niet gemakkelijk te geven. Wel is duidelijk dat P(N=n) voor grote waarden van n naar een limiet convergeert.
27.
De gemiddelde verwachting met een dobbelsteen is 3,5 = 7 2 ogen.
P(N=n)=1/6.[1+P(N=1)+P(N=2)+…+P(N=n-1)] P(N=n)=1/6.[P(N=n-6)+P(N=n-5)+…+P(N=n-1)] n-1
De kans is op den duur dus 28.
1 7
n-1 n
= 2 7 » 0,2857
2
Er zijn 9 van de 24 gunstig. De kans is dus 9/24 of 3/8. De volgende formule geeft de juiste kans voor alle waarden van n: 1 1 1 1 1 - + - + ...( -1) n (in limiet staat hier 1/e). 2! 3! 4! 5! n! Dit kun je uitrekenen op de TI-83 met sum(seq((-1)^K/(K!),K,2,X))üY1
29.
30.
P(a<0.5)=0.75
31.
P(a<0.2)=0.64
32.
a) P(a<0.5)=2/3 b) De gearceerde oppervlakte verhoudt zich tot de totale oppervlakte als
6 - (3 - 2a )(2 - 2a ) 5a - 2a 2 5 = = a - 2 a 2 , met a£1 (want P 3 3 6 3 kan nooit verder dan 1 vanaf de zijden liggen). De afgeleide hiervan is 53 - 43 a ; zodat de verwachte gemiddelde afstand als volgt te berekenen is: 1
a=ò
a × ( 53
0
4 3
5 6
2
- a ) da = a -
]
4 a3 1 9 0
=
7 18
.
a 2
2-2a 3-2a 3
0üS:0üT Lbl 0 3randüX:2randüY min({X,Y,3-X,2-Y})üD T+1üT S+DüS Disp S/T Goto 0
Inventies 03/05/05
a
- 145 -
P
33.
JAARSIM ClrHome 0üS For(X,1,200) randInt(1,365,30)üL1 SortA(L1) ¾List(L1)üL2 (sum(L2=0)ù1)+SüS Output(1,1,X) Output(2,1,S/X) End JAARBER "1-(365 nPr X)/(365^X)"üY1 0üTblStart:1ü¾Tbl DispTable
34.
RANDWALK ClrHome:ClrDraw:AxesOff FnOff :PlotsOff 30üX:5üY Lbl 0 YüZ "Y COORD TIJDELIJK" Pxl-On(X,Y) "OPSLAAN" ZüY "Y WEER OPHALEN" randüR If R<.2:X+1üX If Rù.2 and R<.4:X-1üX If Rù.4 and R<.6:Y-1üY If Rù.6:Y+1üY Goto 0
35.
De gemiddelde afstand is ongeveer 0.52 BIN4KANT ClrHome:0üS For(X,1,200) randüA randüB randüC randüD ð((C-A)Ü+(D-B)Ü)üE S+EüS Output(1,1,S/X) End
36.
De gemiddelde afstand is ongeveer 0.91 BINCIRKL ClrHome 2üA:2üB:2üC:2üD:0üS For(X,1,400) Repeat AÜ+BÜ<1 2rand-1üA 2rand-1üB End Repeat CÜ+DÜ<1 2rand-1üC 2rand-1üD End ð((C-A)Ü+(D-B)Ü)üE S+EüS
Inventies 03/05/05
- 146 -
Output(1,1,S/X) End 37.
De kans op een oplossing lijkt ongeveer 62,6% ClrHome:0üT For(X,1,500) 2rand-1üA:2rand-1üB:2rand-1üC If BÜ-4AC>0:T+1üT Output(1,1,T/X) End Het geval a = 1: Het gaat nu om de kans P op een niet-negatieve discriminant 2 b – 4c ³ 0 met b en c random tussen de grenswaarden –G en +G: G*(2rand-1) dus. Bekijk het vierkant met zijde 2G en daarin drie grafieken van 2
c = ¼ b , voor verschillende waarden van G. De c-as vertikaal, de bas horizontaal. Voor G = 4 gaat zo'n grafiek door het hoekpunt (G, G). Voor G < 4 is de kans op oplossingen te vinden door de gearceerde G
oppervlakte
ò ( 14 b
2
- - G ) db =
1
6G
3
+ 2G 2 te delen door de
-G 2
oppervlakte 4G van het vierkant. Dat levert voor G < 4 dus P = 1 G + 1 ; als G=1 genomen wordt beschrijf je voorgaande 24 2 simulatie en komt er
13 » 0,5417 uit. 24
Voor G ³ 4 is de gearceerde oppervlakte gelijk aan 2 G
ò ( 14 b
2
2 - - G ) db + (G - 2 G ) × 4G ; delen door 4G geeft P = 1-
-2 G
2 3 G
.
Even uitproberen met 16(2rand-1) voor B en C. Voor deze waarde van G (=16) zou de kans P = 0,8333 moeten zijn. Ik vond 0.8334225721 na 69000 simulaties. Niet gek dus. Heel verrassend is dat P naar 1 gaat voor grote waarden van G, hetgeen betekent dat de 2 kans dat een parabool y = x + bx + c de x-as snijdt vrijwel 100% is, voor b,c Î Â. Wie dat begrijpt, mag het zeggen. Het heeft natuurlijk iets te maken met het domein van b en c: voor grote waarden van G telt het witte binnengebied van de parabool nauwelijks meer mee. 2
2
Het algemene geval y = ax + bx + c met b – 4ac ³ 0 en a,b,c Î Â schijnt een ander antwoord, niet minder raadselachtig, op te leveren. Na een groot aantal simulaties met verschillende G-waarden kreeg ik het vermoeden dat P, onafhankelijk van het domein van de randomwaarden, ongeveer 0,626 is. Maar dat zou niet moeten kunnen, omdat de ontaarde waarde a = 0 roet in het eten zou moeten gooien. Zou moeten ... En waarom moet ik nu ineens aan de Bone Man denken?
Inventies 03/05/05
- 147 -
38.
a) STOWAND Lbl 0 For(X,1,94) S+randInt(0,1)üS:X+94TüU round(.5U,0)üV:S-VüY:Pt-On(X,Y) If fPart(U/10)=0:Text(0,32,U) abs(Y/U)üF:ú30+60FüG:Pt-On(X,G) End T+1üT:Goto 0 –d –d 2d b) 2s/ m = 10 geeft 2Ön/n= 10 dus n = 4.10 . Dat wil zeggen, voor een goede (betrouwbare) schatting van de derde decimaal moet je minstens 4 miljoen simulaties uitvoeren!
39.
c klopt ongeveer met de verwachting. Een P-waarde van 0.77 duidt op een een geloofwaardige voorspelling (verwachting) van serielengtes.
40.
KK2
2
ClrHome 0üXmin:0üYmin 21üXmax:11üYmax 2üXscl:1üYscl seq(X,X,2,20,2)üL1 .5L1+randNorm(0,1.5,10)üL2 Plot1(Scatter,L1,L2,Ð) DispGraph:Pause :ClrHome "sum((L2-XL1)Ü)"üY1 0.3üXmin:0.7üXmax .1üXscl:30üYmax DispGraph:Pause ClrHome fMin(Y1,X,0,1)üA Disp "MINIMUM VOOR:",A:Pause :ClrHome:2üXscl:21üXmax:11üYmax "AX"üY1:Plot1(Scatter,L1,L2,Ð) DispGraph:Pause :ClrHome 41.
1,0986
42.
g=2
g=3
44.
a) y = - 6x + 16
45.
hoek a ( x) = arctan b - arctan a afgeleide nul stellen geeft:
b) y = 1.617x + 3.532 en y = 3x - 2
x
x2 =
x
ab(b - a ) = ab met het antwoord x = ab (b - a )
Inventies 03/05/05
g=2.7
- 148 -
-b x2 + b2
-
-a x2 + a2
= 0 dus
46.
x = 1,4 y = 3,6
47.
x = 6 y = 3,5 z = 2,5 u = -5
48.
X
Y=ü
sx
4 3.1 3.01 3.001 3.0005 3.0001
4 3.0998 3.002 2.9574 3.169 9.47
0.0005 0.0044 0.0425 0.4 0.84 49
Aantal betrouwbare decimalen 4 2 1 0 -
chaos…
49.
50.
51.
De oppervlakte is 10
52.
1 = 100 1 - 0,99
63,76
nee
99,35
99,988
173,19
53. a) Dat gaat gestaag, maar zéér traag, omhoog. Na 500 termen nog maar 6,7928. Vermoedelijk divergent. Zelfs als je alleen maar de omgekeerde priemgetallen optelt: 1 1 1 1 1 1 + + + + + + ... en dus oneindig veel termen weglaat, dan nog is de reeks divergent! Super 2 3 5 7 11 traag weliswaar [ongeveer volgens ln (ln n) ], maar onmiskenbaar divergent. c) 8,58
Inventies 03/05/05
- 149 -
54.
GAMMA
ClrHome Disp "AANTAL (N) IN L•" Disp "IN STAPPEN V 500" Disp "" Disp "SOM HARMONISCHE" Disp "REEKS (S) IN L‚" Disp "GAMMA (C) IN Lƒ" Output(8,10,"[ENTER]") Pause :ClrHome ClrAllLists 0üS:0üN:0üI Lbl 0 Output(8,10," ") sum(seq(1/X,X,N+1,N+500))üT S+TüS N+500üN:I+1üI S-ln(N)üC Output(1,1,"N=") Output(1,3,N) Output(2,1,"S=") Output(2,3,S) Output(3,1,"C=") Output(3,3,C) Output(8,10,"[ENTER]") NüL•(I):SüL‚(I):CüLƒ(I) Pause Goto 0 N.B.: de constante van Euler is ongeveer 0,5772156...; Euler kwam tot 0,577218 Ik kwam na een minuut of tien uit op 0,57724 en gaf het toen op. 55.
y = x en y' = x' = 1 geeft x = ½ en raakpunt (½,½)
56.
Evenwichtswaarde ½
60.
p£¼
62.
a) x - x + p = 0 geeft x = ½ ± Ö(¼ - p); de + vervalt, omdat de grafiek door (0,0) moet gaan.
2
De voorwaarde -¾< p < ¼ volgt uit de eis voor de helling die tussen -1 en 1 moet liggen: |2x|<1 geeft -1 < 1 - Ö(1-4p) < 1 dus 0 < Ö(1-4p) < 2 dus 0 < 1-4p < 4 enzovoorts Een soortgelijk verhaal, maar technisch lastiger, geeft de grens voor tetravergentie: 2 2 de helling |4x(x +p)| met x = -½±Ö(-¾ – p) en x +p= ¼(-2±2Ö(-4p-3)) moet < 1 zijn en dat leidt tot |4+4p|<1 met als oplossing -1¼ < p < -¾. 2
2
b) x 1 - x2 = (x2-x 1) -> (x1+x2)(x1-x 2) = (x2-x 1) dit is het type vergelijking A.B=A met de oplossingen A=0 en B=1 hier dus x1=x2 en x1+x2 = -1 (x1=x2 wisten we al, blijft over x2 = -1 - x1) 2 x 2 invullen geeft x1 +x1+p+1=0 enzovoorts.
Inventies 03/05/05
- 150 -
63.
De kern van het programma BIFURC ClrHome Disp "KIES DOMEIN A:" Disp "MET L÷A÷R" Prompt L,R LüXmin:RüXmax (R-L)/94üS .1üXscl:.1üYscl 0üYmin:1üYmax:1üX For(A,L,R,S) For(N,1,30) AX(1-X)üX If N>16:Pt-On(A,X) End .8üX End Pause :FnOn :ClrHome
64.
De formule voor bivergentie van x®ax(1-x)is als volgt te bewijzen.
Gegevens:
x = ax(1 - x) ü ý y = ay (1 - y )þ y = 1-
1 a
Oplossing: Substitueer de tweede betrekking in de eerste: y = a 2 y (1 - y )(1 - ay (1 - y )) ; vanwege
y ¹ 0 is dit te schrijven als ay 3 - 2ay 2 + (1 + a) y - 1 +
1 a2
=0;
1 een oplossing is van deze derdegraads betrekking in y, moeten de coëfficiënten links a en rechts vergeleken worden in: omdat y = 1-
a ( y - 1 + 1a ) × ( y 2 + py + q ) º ay 3 - 2ay 2 + (1 + a ) y - 1 +
1 a2
waaruit volgt dat p = -1- 1 en q = 1 + 1 ; a
a
a2
de kwadratische factor hierin kan geschreven worden als:
a 2 y 2 - a (a + 1) y + a + 1 = 0 met de oplossingen y1,2 =
a (a + 1) ± a 2 (a + 1) 2 - 4a 2 (a + 1)
Inventies 03/05/05
2a
2
=
a + 1 ± (a + 1)(a - 3) 2a
- 151 -
65. t/m 68. 4
2
2
y - 8y - 4x + 25 = 0
2
2
dy/dx =x+y
2
(x +y -15)(y -2x)=0
2
2
2
dy/dx = x
snijpunten: (3;Ö6) en (-3;Ö6)
2
2
2
2
2
2
2
69.
h =b -p =a -q =a -(c-p)
dus a =b +c -2cp met p=bcosα.
70.
h = b sin α, h = a sin b enz.
71.
Opp = ½ c.h = ½ c.b sin α enz.
72.
sin g =
73.
½ cr + ½ br + ½ ar = O
74.
2 2 2 a 2 = b 2 + c 2 - 2bc cos a en x 2 = b 2 + p 2 - 2bp cos a ; uit de tweede volgt: 2b cos a = a - bc - c
c enz. 2R
hetgeen, in de eerste ingevuld, oplevert: x 2 c - a 2 p = b 2 c - b 2 p + p 2 c - c 2 p en dat is gelijk aan
b 2 (c - p ) - cp(c - p ) = b 2 q - cpq
æ 513 ö çç ÷÷ è 12 13 ø
75.
æ 45 ö çç ÷÷ è 35 ø
76.
16 , 120 , 45 , 90
77.
HOEK
0
0
0
æ 182 ö çç ÷÷ è 8182 ø
0
ClrHome Input "XA?",A Input "YA?",C Input "XB?",B Input "YB?",D (AB+CD)/ð((AÜ+CÜ)(BÜ+DÜ))üI Degree cosñ(I)üH:Disp "HOEK IN GRADEN:",H Radian 78.
æ - 3ö ç ÷ ç 6 ÷ ç - 3÷ è ø
Inventies 03/05/05
æ 3 ö ç ÷ ç - 6÷ ç 3 ÷ è ø
32
- 152 -
79.
INUITPRO ClrHome:Disp "INVOER VECTOR A:" Input "X: ",A:Input "Y: ",B:Input "Z: ",C Disp "VECTOR B:" Input "X: ",D:Input "Y: ",E:Input "Z: ",F ClrHome AD+BE+CFüS:BF-CEüP:CD-AFüQ:AE-BDüR Output(1,1,"INPRO:"):Output(1,8,S) Output(3,1,"UITPRO:"):Disp "":Disp "":Disp "" Disp P,Q,R o
80.
90
81.
19.47
o
82.
54.74
o
83.
16.73
22.36
84.
7
2x+3y+6z=14
Inventies 03/05/05
187.08 (-2,0,4) 7
16.33
(10,-2,0)
- 153 -
85.
P(1,0,2)
Inventies 03/05/05
Q(3,2,3)
afst=3
- 154 -
overzicht programma's: AANKOP AANUIT AFSTPUFU AFTELLEN AOBSTOMP BALINBAK BAYES BIFURC BIN4KANT BINCIRKL CHAOS CIJFERS4 CIJFERS5 COMPLEET CORRELA DATING DELERS DEURAUTO DEUREN3 DIFEULER DIOFANT1 DOB2SNEL DOB3PRAK DOB3THEO DOMWERK
Inventies 03/05/05
DUELPQ FIBONAC GALTON GAMMA GENDRIFT GGD GRONDTAL HOEK HOEKLM HOEKLV HOEKVW INUITPRO JAARBER JAARSIM KAARTEN2 KIJKHOEK KK2 KOPMUNT KOPSTUK MATCHES MAX2UITN MUNTEN N3PLUS1 NEWTON NVGLNONB
ONTBIND OPPAS OPPVEELH PASCMERE PIN4KANT PINCIRKL PINRHOEK PRIEMRIJ PRIEMTST PROPOLYA PSFERMAT PYTHAGO2 PYTHAGO3 R2DRIEHK R3LOODLN R3PTLIJN R3PTVLAK RANDPROD RANDWALK RECPROOF RECURLIN RECURLOG RELOGOLF RGREXTRA RKLNINP
- 155 -
RKLNUITQ SCHUDIN SCHUDRAN SERIESIM SIMULPI SINT SITRINOM STOK2MED STOKIN2 STOKIN3 STOKSNEL STOMP STOWAND TREFKANS TSTCHIKW UNIVERXY VAASMODL VGL2ONB WALLIS WORTELS2 XYKROMME ZOOMIN00 ZOOMIN01 ZOOMIN02