Dataverwerking en statistiek

Wintersymposium KONINKLIJK WISKUNDIG GENOOTSCHAP

Dataverwerking en statistiek

ZATERDAG 10 JANUARI 2015 UNIVERSITEIT VAN UTRECHT Academiegebouw (bij de Dom)

DATAVERWERKING EN STATISTIEK Het Wintersymposium 2015 van het Koninklijk Wiskundig Genootschap heeft dit jaar een thema uit het nieuwe examenprogramma voor havo en vwo: Dataverwerking en Statistiek. Het omgaan met grote hoeveelheden data, mogelijk gemaakt door technologische en wiskundige ontwikkelingen, is niet meer weg te denken uit de maatschappij. Onderzoekers uit vier verschillende vakgebieden vertellen over het belang van dataverwerking in hun onderzoeksgebied en de rol van wiskunde daarin.  Fetsje Bijma (VU) zal de inleiding Een frisse blik op statistiek verzorgen. Na de inleiding zullen drie wetenschappers uit verschillende instituten een specifiek onderwerp bespreken.  Maurice Schmeits (KNMI) spreekt over Kansverwachtingen in de meteorologie.  Marjan Sjerps (NFI, UvA) gaat het hebben over Hoe sterk is het bewijs?  Wouter Verkerke (Nikhef) heeft als onderwerp De ontdekking van het Higgs deeltje. VOOR WIE? Het symposium is in de eerste plaats bestemd voor (aankomende) docenten wiskunde in het voortgezet onderwijs, maar ook andere belangstellenden zijn van harte welkom. VERDER … zijn er verschillende stands aanwezig, o.a. van Epsilon Uitgaven, waar men voor een alleszins redelijke prijs Nederlandstalige uitgaven van hoge wiskundige kwaliteit kan kopen. PLAATS EN TIJD Het symposium wordt gehouden in het Academiegebouw van de Universiteit Utrecht, bij de Dom van Utrecht. NB! Gewijzigde begin- en eindtijd! Op zaterdag 10 januari 2015 is de zaal open vanaf 10.30 uur. Koffie en thee staan dan klaar. Het programma start om 11.00 uur en eindigt ca. 16.00 uur. AANMELDING U wordt verzocht zich van tevoren on-line aan te melden via de website van het Koninklijk Wiskundig Genootschap www.wiskgenoot.nl. De kosten voor deelname aan het symposium bedragen bij betaling voor 29 december 2014: voor KWG-leden € 30, voor niet-leden € 35 en voor leerlingen, studenten en standhouders € 15. Lunch, koffie en thee zijn bij de bijdrage inbegrepen. U kunt zich desgewenst eerst online inschrijven als lid van het KWG. Let op: gewijzigd rekeningnummer! Uw bijdrage moet liefst vóór 29 december 2014 worden overgemaakt op rekeningnummer NL12ABNA0588 2580 08 van het KWG te Amsterdam, onder vermelding van “Wintersymposium 2015” (u ontvangt geen acceptgiro). U kunt zich ook nog na 29 december opgeven, maar dan wordt de bijdrage met € 5 verhoogd en bestaat het risico dat het symposium “vol” is. CERTIFICAAT Het is mogelijk om een certificaat van deelname te ontvangen. Indien u dit wenst kunt u dit bij de on-line aanmelding kenbaar maken door uw geboortedatum in te vullen. Nadere inlichtingen: Jenneke Krüger m: 06 16420445

[email protected]

PROGRAMMA 10.30 – 11.00

Ontvangst met koffie en thee

11.00 – 11.30

INLEIDING: EEN FRISSE BLIK OP STATISTIEK Fetsje Bijma Vrije Universiteit Amsterdam

11.30 – 12.30

KANSVERWACHTINGEN IN DE METEOROLOGIE Maurice Schmeits KNMI

12.30 – 13.30

Lunch

13.30 – 14.30

HOE STERK IS HET BEWIJS? Marjan Sjerps Universiteit van Amsterdam, NFI

14.30 – 15.00

Pauze met koffie en thee

15.00 – 16.00

DE ONTDEKKING VAN HET HIGGS DEELTJE Wouter Verkerke Nikhef

EEN FRISSE BLIK OP STATISTIEK

Fetsje Bijma Vrije Universiteit Amsterdam In deze inleiding wordt de kennis van kansrekening en statistiek opgefrist. Statistiek is in zekere zin het omgekeerde van kansrekening. Met behulp van kansrekening kan de kans op verschillende uitkomsten berekend worden, terwijl men met statistiek uit gegeven uitkomsten (gemeten data) een ‘uitspraak’ wil doen omtrent de onderliggende kansverdeling. Zo’n ‘uitspraak’ kan het schatten van een onbekende parameter zijn, of het toetsen van een parameterwaarde of een bewering. De klassieke toetsen zijn de binomiale toets en de normale toets. Wat kan er allemaal ‘mis’ gaan bij het uitvoeren van een statistische toets? Wat is ‘mis’ eigenlijk? En wat is de kans dat er iets ‘mis’ gaat? Dat wordt onder andere gevangen in begrippen als pwaarde (overschrijdingskans) en power. En wat heeft de keuze van de toetsingsgrootheid hier mee te maken? Al deze begrippen passeren de revu en worden geïllustreerd met voorbeelden. Ook de relatie naar de andere drie voordrachten wordt gelegd.

In mijn werk als onderzoeker ben ik betrokken bij het analyseren van gemeten hersendata uit MRI-, EEG- en MEG-scanners en combinaties hiervan. De eerste vraag daarbij is: hoe moeten we de gemeten signalen modelleren? Daarna komt de vraag hoe we de parameters moeten schatten en/of toetsen. Ik vind het leuk om in deze inleiding ook wat te vertellen over dit onderzoek.

KANSVERWACHTINGEN IN DE METEOROLOGIE

Maurice Schmeits KNMI Bij kansverwachtingen in de meteorologie wordt tegenwoordig vaak gebruik gemaakt van zogenaamde ensemble predictie systemen (EPS’s). Dit zijn systemen die bestaan uit een ensemble van weermodelverwachtingen, gestart vanuit verschillende enigszins verstoorde begintoestanden en die vaak ook verschillen in modelfysica. Soms is de atmosfeer voorspelbaarder dan anders; m.b.v. een EPS kan de mate van voorspelbaarheid ingeschat worden. Door het percentage ensembleleden te nemen dat bijv. meer dan 1 mm neerslag geeft, kan een schatting van de kans op meer dan 1 mm neerslag verkregen worden. Er werd echter al lang voordat deze EPS’s beschikbaar waren gebruik gemaakt van kansverwachtingen in de meteorologie, bijv. voor de kans op neerslag. Daarvoor werd dan een archief van neerslagwaarnemingen gekoppeld aan een archief van outputvariabelen van een weermodel, om zo een statistische relatie tussen het optreden van neerslag en relevante modelvariabelen te bepalen. Deze statistische relatie werd dan vervolgens als kansverwachtingsmodel voor neerslag gebruikt. Ook tegenwoordig wordt deze zogenaamde model output statistics (MOS) aanpak nog gehanteerd, o.a. voor kansverwachtingen voor fenomenen die niet in de uitvoer van een weermodel zitten, zoals onweer. In deze presentatie wordt een voorbeeld gegeven van een door ons ontwikkeld MOSsysteem, nl. een kansverwachtingssysteem voor (zwaar) onweer, dat de meteorologen in onze weerkamer ondersteunt bij het uitgeven van waarschuwingen voor gevaarlijk weer (code geel), extreem weer (code oranje) en een weeralarm (code rood). Daarnaast wordt ook ingegaan op kansverwachtingen op basis van het EPS van het Europees weercentrum ECMWF.

HOE STERK IS HET BEWIJS?

Marjan Sjerps Universiteit van Amsterdam, NFI Dat is de centrale vraag in het vakgebied “forensische statistiek”. Hierin wordt op basis van stochastische modellen geprobeerd om de bewijskracht van forensisch bewijsmateriaal in een getal uit te drukken. Het kan bijvoorbeeld gaan om de bewijskracht van een DNA match, een vingerafdruk, of een chemische analyse van een brandversnellend middel. Hoewel de forensische toepassingsgebieden zeer divers zijn, zijn de relevante vragen in veel gebieden hetzelfde. In deze lezing zullen een aantal van deze vragen en de stochastische methoden die worden gebruikt om deze vragen te beantwoorden aan de orde komen. Ook zullen op de praktijk gebaseerde voorbeelden worden gegeven van het gebruik van statistiek en kansrekening in het forensisch zakenonderzoek. “Binnen het instituut houd ik me vaak bezig met het interpreteren van data. Collega’s moeten bijvoorbeeld de karakteristieke kenmerken van een schoenzool noteren: kleine slijtages, deukjes, scheurtjes, een steentje erin, enzovoorts. Vervolgens kunnen ze die vergelijken met een gevonden afdruk, een schoenspoor. Ik help de onderzoekers met het formuleren van hun conclusie over de waarschijnlijkheid dat de schoen het spoor maakte. Ik ben betrokken bij een project om zoveel mogelijk het subjectieve element uit deze beoordeling te halen. Het ene moment help ik bij onderzoek naar glasscherven, dan weer bij gebruikte werktuigen, schoensporen, vingersporen of DNA. Mijn collega’s hebben de meest uiteenlopende achtergronden. Het zijn chemici, technici en biologen, en ik heb ook te maken met politieagenten en juristen. Wanneer ik de kans krijg mee te lopen op de plaats van een misdrijf of een onderzoekstechniek te zien dan doe ik dat natuurlijk.”

De ontdekking van het Higgs deeltje

Wouter Verkerke NIKHEF In Juli 2012 is door de ATLAS en CMS experimenten op CERN het Higgs deeltje ontdekt. Voor deze ontdekking hebben de grondleggers van de achterliggende theorie, Peter Higgs en Francois Englert in 2013 de Nobelprijs voor de natuurkunde gewonnen. In deze lezing wil ik ingaan op de statistische en data analyse technieken die gebruikt zijn om het Higgs deeltje te vinden. Moderne deeltjesfysica experimenten zoals de ATLAS en CMS experimenten bij de Large Hadron Collider zijn echte ‘big data’ ondernemingen en leveren vele petabytes aan data per jaar op. Een groot deel van het experimentele werk van de onderzoekers bij deze experimenten bestaat uit data analyse. In de triljoenen botsingen die zijn gedetecteerd sinds 2009 bevindt zich echter slechts een klein handjevol botsingen waarin een Higgs deeltje geproduceerd is geweest dat is vervallen met een voor ons herkenbare signatuur. Veel van de technieken die gebruikt worden voor datareductie en het kwantificeren van de ontdekking hebben een wiskundige achtergrond en statistische modellering speelt hierbij een belangrijke rol. Ik zal in de voordracht een aantal van de gebruikte technieken toelichten (boosted decision trees, likelihood ratios) om de spreekwoordelijke speld in de hooiberg te vinden, en uitleggen hoe we wiskundige modellen gebruiken om de kans te berekenen dat onze data bewijs is voor de ontdekking van een nieuw deeltje.

PROFIELEN VAN DE SPREKERS Fetsje Bijma studeerde wiskunde aan de universiteit van Groningen. Ze promoveerde in 2005 aan de VU in Amsterdam (cum laude) met als titel Mathematical modelling of magnetoencephalographic data. Ze houdt zich bij de VU vooral bezig met statistische methoden voor levenswetenschappen, in het bijzonder neurowetenschap. Fetsje is medeauteur van Inleiding in de statistiek, een uitgave van Epsilon, geeft master classes en werkt mee aan bijscholing voor leraren wiskunde door het Regionale Steunpunt Amsterdam. Homepage: http://www.few.vu.nl/~fetsje/ Maurice Schmeits studeerde af in meteorologie aan de universiteit van Utrecht; hij promoveerde in 2001 aan dezelfde universiteit in Fysische Oceanografie. Maurice werkt sinds 2001 bij het KNMI als onderzoeker op het gebied van kansverwachtingsmethodes voor (met name) gevaarlijk weer. Homepage: www.knmi.nl/~schmeits Marjan Sjerps studeerde wiskunde aan de Radboud Universiteit. Ze promoveerde in 1993 aan de Universiteit Leiden in de mathematische biologie/evolutionaire ecologie. Marjan werkt sinds 1993 bij het Nederlands Forensisch Instituut, en is sinds 2010 verbonden aan de Universiteit van Amsterdam als bijzonder hoogleraar forensische statistiek. Zij doet onderzoek naar de toepassingen van statistiek en kansrekening in de forensische wetenschappen en het strafrecht. Het gaat hierbij om de interpretatie en evaluatie van (forensisch) bewijs. Kernvragen van haar onderzoek zijn: hoe kan een (forensisch) onderzoeker de bewijskracht van zijn onderzoeksresultaten bepalen? Hoe kan hij deze bewijskracht vervolgens rapporteren aan politie of justitie? Wat is de bewijskracht van een combinatie van verschillende bewijsmiddelen? url: www.forensischinstituut.nl Wouter Verkerke studeerde natuurkunde aan de Universiteit Utrecht. Hij promoveerde in 1998 aan de Universiteit van Amsterdam in de elementaire deeltjesfysica. Wouter werkt sinds 2004 bij Nikhef, het Nationaal instituut voor subatomaire fysica en is direct betrokken geweest bij de ontdekking van het Higgs deeltje in 2012 door het ATLAS experiment op CERN. Wouter was onder meer spreker in het Science Cafe in Leiden en tijdens de vakantiecursus wiskunde 2014. url: www.nikhef.nl/~verkerke

Dataverwerking en statistiek

Recommend Documents