Onderwerpen Masterproef Opleiding Wiskunde Academiejaar 2014-2015 Vakgroep Toegepaste Wiskunde, Informatica en Statistiek
Gestructureerde populatiemodellen Promotor: Prof. W. Govaerts (
[email protected]) Begeleider: Charlotte Sonck (
[email protected])) Doelgroep: Master wiskunde Korte beschrijving In populatiemodellen is de basiseenheid het individu. Er wordt getracht om de kennis over mechanismen op het individuele niveau te vertalen naar modellen voor het aantal individuen. Een voorbeeld van zo’n individu is een cel, zoals biergist, waarvan men de individuele groei kan voorstellen door één of meerdere differentiaalvergelijkingen. Bij het opstellen van populatiemodellen is men geïnteresseerd in wat er een niveau hoger gebeurt: hoe is de verdeling van de celgrootte bij een populatie van cellen in functie van de tijd? De meest natuurlijke aanpak is om de individuele celtoestand zo compleet mogelijk trachten te beschrijven door een beperkt aantal numerieke variabelen (zoals grootte, massa,…) en om vervolgens vergelijkingen op te stellen die het verband vormen tussen de processen in de individuele cel en het statistische en dynamische gedrag van de populatie cellen. Het is de bedoeling dat de student in deze thesis inzicht krijgt in de basis van gestructureerde populatiemodellen aan de hand van het uitwerken van een aantal voorbeelden. Uitgangspunt hiervoor is deel I van [1], een basiswerk voor dit soort modelleringen. Deze voorbeelden omvatten o.a. modellen voor grootteafhankelijke reproductie bij ectothermische dieren en bij ééncelligen. Het uitwerken van deze voorbeelden houdt o.a. het begrijpen van de onderliggende dynamiek in, het bestuderen van de gewone en partiële differentiaalvergelijkingen en het oplossen van de oefeningen uit het hoofdstuk. Naargelang de interesse van de student, kan dit onderwerp dan verder uitgespit worden in een bepaalde richting. Referentie: [1] J.A.J. Metz and O. Diekmann, The Dynamics of Physiologically Structured Populations, Springer-Verlag 1986.
Titel: “Constant term identities” Promotor: Joris Van der Jeugt (
[email protected]) Doelgroep: Studenten uit de tweede master Wiskunde. Korte beschrijving: In de literatuur zijn er tal van intrigerende “constant term identities” te vinden, die dikwijls hun oorsprong vinden in algebra of combinatoriek. Het berekenen of bepalen van de constante term van een rationale functie (van een bepaalde klasse) is niet eenvoudig. Meestal moet men zich wenden tot technieken die dan kunnen geïmplementeerd worden in computeralgebrapakketten.
Voor deze scriptie onderzoekt de student eerst een gebied waarin de berekening van constante termen van belang is, zoals de bepaling van Kronecker coëfficiënten voor symmetrische functies. Hiervoor is kennis van symmetrische functies en karakters van S_n een pluspunt. Vervolgens onderzoekt de student enkele methodes/algoritmes om constante term berekeningen te doen. Implementatie van zulke algoritmes in Maple (of Sage) maakt ook deel uit van het werk. Referenties: A. Garsia, N. Wallach, G. Xin and M. Zabrocki, Kronecker coefficients via symmetric functions and constant term identities. (zie o.a. arXiv:0810.0060 [math.CO]). G. Xin, A fast algorithm for MacMahon’s partition analysis (arXiv:math/0408377 *math.CO+).
Titel: Algoritmen voor symbolische sommatie Promotor: Joris Van der Jeugt (
[email protected]) Doelgroep: Studenten uit de tweede master Wiskunde. Korte beschrijving: De algoritmen van Gosper en Zeilberger dienen voor de symbolische sommatie van reeksen met hypergeometrische termen (zoals bij voorbeeld reeksen met termen bestaande uit producten van binomiaalcoëfficiënten, of rationale vormen). Deze algoritmen dateren uit het begin van de jaren 90 en zijn nu reeds geïmplementeerd in een MAPLE-pakket sumtools. De scriptie bestaat uit: overzicht van de belangrijkste sommatietheorema's voor reeksen; studie van Gospers algoritme en Zeilbergers algoritme; gebruik van programma's in MAPLE. Afhankelijk van de interesse van de student kan de studie uitgebreid worden met het onderzoek van reeksen die voorkomen in “supersymmetrische uitbreidingen”. Referenties: M. Petkovsek, H. Wilf en D. Zeilberger, A=B. A.K. Peters, 1996. (http://www.math.upenn.edu/~wilf/AeqB.html) W. Koepf, Hypergeometric summation. Vieweg, 1998. (http://www.mathematik.unikassel.de/~koepf/hyper.html)
Titel: Risico’s verbonden aan de langere levensduur Doelgroep: master wiskunde Promotor: prof. M. Vanmaele Korte beschrijving De verlengde levensduur, “longevity” genoemd, heeft een grote impact op de levensverzekeringsector. Bij het berekenen van de premie van een levensverzekeringsproduct wordt gebruik gemaakt van geschatte overlevingstabellen. Door een verlenging van de levensduur is er een extra risico, namelijk het systematische sterfterisico, dat in rekening moet gebracht worden. Daarnaast bestaat ook een nietsystematisch sterfterisico dat echter verdwijnt in een goed gediversifieerde portefeuille. De laatste jaren
is men gaan focussen op de ontwikkeling van stochastische modellen voor het sterftecijfer om de onvoorziene veranderingen in de levensduur van polishouders bij verzekeringsmaatschappijen te kunnen in rekening brengen. Er zijn continue modellen en modellen met sprongen om onverwachte veranderingen zoals door een epidemie of een catastrofe te modelleren (zie bijvoorbeeld HainautDevolder 2008). Anderzijds ontwikkelt men zogenaamde longevity bonds en survivor swaps die kunnen aangewend worden als indekking tegen het longevity risico. De bedoeling is om zowel de modellen voor sterfte als het prijzen van longevity bonds en andere levensverzekeringsproducten te bestuderen. Daarnaast kan ook een hedgingstrategie zoals de risicominimiserende strategie (zie Barbarin 2008 en Biagini-Schreiber 2013) bestudeerd worden. Een belangrijke stap bij het prijzen is de verandering van maat. De invloed hiervan op het model voor het sterfterisico en bijgevolg op het prijzen van levensverzekeringsproducten kan ook geanalyseerd worden (zie Biffis et al. 2010).
Voor deze studie kan gesteund worden op de volgende artikels: J. Barbarin. Heath-Jarrow-Morton modelling of longevity bonds and the risk minimization of life insurance portfolios. Insurance: Mathematics and Economics, 43(1):41-55, 2008. F. Biagini, I. Schreiber. Risk-Minimization for Life Insurance Liabilities. SIAM Journal on Financial Mathematics, 4:2243–264, 2013. E. Biffis, M. Denuit, P. Devolder. Stochastic mortality under measure changes. Scandinavian Actuarial Journal, 4:284-311, 2010. M. Dahl, S. Glar, Th. Møller. Mixed dynamic and static risk-minimization with an application to survivor swaps. European Actuarial Journal, 1(Suppl 2):S233–S260, 2011. D. Hainaut, P. Devolder. Mortality modelling with Lévy processes. Insurance: Mathematics and Economics 42:409–418, 2008.
Targeted maximum likelihood estimation (TLME) voor het schatten van causale effecten in observationele studies Promotor: Prof. dr. S. Vansteelandt Begeleider: Karel Vermeulen Doelgroep: studenten wiskunde met interesse in mathematische statistiek Korte beschrijving In heel wat epidemiologische studies is men geïnteresseerd in het schatten van het causaal effect van een blootstelling op een bepaalde uitkomst; bijvoorbeeld, het causaal effect van roken op het risico op sterfte. Dit wordt vaak bemoeilijkt door confounding: de aanwezigheid van factoren die zowel de blootstelling als uitkomst beïnvloeden, waardoor de associatie tussen beiden niet langer een zuiver causaal effect weerspiegelt. Bijvoorbeeld, niet-rokers zijn doorgaans individuen met een gezondere levensstijl dan rokers. Het niet in rekening brengen van confounding leidt tot een vertekende inschatting van het effect van roken. Over de laatste jaren zijn er heel wat schattingstechnieken ontwikkeld om vertekening ten gevolge van confounding te elimineren. Hiervoor moeten statistische modellen worden gebouwd die de associatie van confounders met de uitkomst en/of blootstelling modelleren. Wanneer deze modellen echter niet
correct gespecificeerd zijn, kunnen vertekende schattingen worden bekomen. Recent werd er in de literatuur een algemene schattingsmethode voorgesteld, targeted maximum likelihood estimation, die om die reden zuinig omspringt met statistische modellering en schatters met gunstige eigenschappen (bvb. kleine variantie) oplevert. Het doel van deze masterproef zal in eerste instantie zijn om inzicht te verwerven hoe deze schattingsmethode te werk gaat en vervolgens de performantie van TMLE door middel van een simulatiestudie te vergelijken met andere bestaande schattingsmethoden om een causaal effect van een blootstelling op een uitkomst te schatten. Uitgangspunt is het boek “Targeted Learning, causal inference for observational and experimental data” van Mark J. van der Laan en Sherri Rose, Springer Series in Statistics, hoofdstukken 1 tot 7.
Optimale inschatting van nuisance parameters in statistische analyses Promotor: Prof. dr. S. Vansteelandt Begeleider: Karel Vermeulen Doelgroep: studenten wiskunde met interesse in ofwel theoretische, ofwel toegepaste statistiek. Korte beschrijving Over de laatste jaren maken statistische analyses meer en meer gebruik van `invers wegen'. Dit is een techniek waarbij de metingen van elk individu op een specifieke manier gewogen worden, met als doel bepaalde vormen van vertekening (bijvoorbeeld, ten gevolge van confounding) te elimineren. Een nadeel van deze techniek is echter dat de gewichten, die op basis van de maximum kans methode bekomen worden, voor sommige individuen soms zeer hoog kunnen oplopen. Dat heeft tot gevolg dat deze individuen zeer invloedrijk worden in de analyse, en bijgevolg de analyse danig in de war kunnen sturen. In deze masterproef zult u betrokken worden in een lopend onderzoeksproject waarbij een algemene theorie werd ontwikkeld om deze gewichten op een veel betere manier in te schatten (niet via de maximum kans methode). Het doel zal er meer concreet in bestaan om, na een studie van deze theorie, ze toe te passen op een concrete probleemstelling die momenteel zeer veel aandacht krijgt in de literatuur. Met name zullen we de theorie toepassen om (via zogenaamde directe en indirecte effecten) inzicht te krijgen in het causale mechanisme waarbij een bepaalde blootstelling een bepaalde uitkomst beïnvloedt. Deze toepassing is gemotiveerd door de concrete probleemstelling waarom bepaalde genen met longkanker geassocieerd zijn: omdat ze mensen ertoe aanzetten te roken, of omdat ze rechtstreeks het risico op longkanker beïnvloeden. De focus van deze masterproef kan, afhankelijk van de interesses van de student, van zeer theoretisch tot zeer toegepast variëren.
Een ander onderwerp in het domein van de mathematische statistiek en/of toegepaste data-analyse Promotor: Prof. dr. S. Vansteelandt Doelgroep: studenten uit de tweede master Wiskunde. Bespreekbaar
Option Pricing with Bayesian Learning Promotor: David Vyncke Begeleider: Hilmar Gudmundsson Doelgroep: Toegepaste Wiskunde Korte beschrijving Currently, standard option pricing theory struggles to accommodate certain empirical characteristics of real life option prices, such as smirks in the implied volatility surface. Various technical improvements have been explored, including the introduction of stochastic volatility and jumps to better capture the real life pricing process in the market. While the empirical fit can be significantly improved through these modifications, they are ad hoc in nature and lack a clear connection to the decision making of investors that drives price formation in the market. The purpose of this project is to introduce a decision theoretic modification to jump diffusion, with the aim of constructing a pricing model that has the potential to capture these empirical characteristics, i.e. to get a model that has a good fit with prices in the market and has a clear economic justification. This project requires solid knowledge of 1) stochastic processes, including Brownian motion and Poisson processes, 2) the foundations of mathematical finance, including arbitrage pricing and option theory such as the Black Scholes framework. In addition, the project might require some familiarity with 3) time series analysis in financial markets, 4) the concept of Nash equilibrium, and 5) programming in Matlab.
Onderwerp Masterproef Frank-copula’s
Promotor: Prof. H. De Meyer (
[email protected]) Begeleider: Prof. H. De Meyer Doelgroep: Master Wiskunde (toegepaste wiskunde)
Korte beschrijving: Tweedimensionale copula’s worden in stochastische modellen voornamelijk gebruikt om de afhankelijkheid tussen twee stochastische veranderlijken, los van hun marginale verdelingen, te modelleren. Mathematisch kunnen ze ge¨ıdentificeerd worden met bijzondere functies van twee re¨ele veranderlijken gedefinieerd over het eenheidsvierkant en met waarden in het eenheidsinterval. Frank-copula’s vormen een belangrijke en frequent gebruikte geparametrizeerde familie van copula’s, met volgend functievoorschrift: "
#
1 (e−αx − 1)(e−αy − 1) Fα (x, y) = − log 1 + , α e−α − 1
α 6= 0 ,
waarbij α een re¨ele parameter is en waarbij in de limiet geldt F−∞ (x, y) = max(x + y − 1, 0) , F0 (x, y) = xy , F+∞ (x, y) = min(x, y) . Het is de bedoeling om een aantal bijzondere eigenschappen van deze familie van copula’s te bewijzen en te interpreteren. Voor dit werk kan gesteund worden op een aantal recente publicaties en onderzoeksnota’s van de promotor, meerbepaald over de eigenschappen van subadditiviteit, straalconvexiteit en een karakterizerende ongelijkheid die nooit eerder in de literatuur bestudeerd werd. Referenties: M. Frank, On the simultaneous associativity of F (x, y) and x + y − F (x, y), Aequationes Mathematicae 19 (1979) 194–226. H. De Meyer, B. De Baets, On a conjecture about the Frank copula family, Fuzzy Sets and Systems, 228 (2013) 15-28.
Steiner trees in FiberPlanIT Promotor: Veerle Fack Contactpersoon Comsof: Stéphanie Vanhove Doelgroep: master wiskunde / wiskundige informatica
Achtergrond Comsof is een spin-off van Universiteit Gent en ontwikkelt o.a. FiberPlanIT, een tool voor planning van glasvezelnetwerken. Via de verwerking van GIS-data die het wegennetwerk, de adressen van de klanten en eventuele bestaande infrastructuur documenteren, wordt een geoptimaliseerd netwerkplan berekend. Hier zijn heel wat algoritmen en heuristieken voor nodig, vooral in de grafentheorie. De uitvoer bestaat uit GIS-data die het netwerk documenteren en een Excelbestand met een overzicht van de kosten. FiberPlanIT werd in de voorbije jaren reeds gebruikt voor de planning van meer dan 14 miljoen adressen wereldwijd.
Voorbeelduitvoer van FiberPlanIT
Probleemstelling Ieder gebouw moet via een kabel worden verbonden met een distributiepunt. Een belangrijk probleem is bepalen hoe dit zo goedkoop mogelijk kan gebeuren. Hiervoor wordt gebruik gemaakt van Steiner trees. Het Steiner tree probleem is een veralgemening van het probleem van de minimaal opspannende boom, waarbij men een boom zoekt met zo laag mogelijk gewicht die alle toppen van de graaf verbindt. Het probleem van de minimaal opspannende boom wordt voor een samenhangende graaf meestal opgelost met het gekende algoritme van Prim. Het verschil is echter dat bij het Steiner tree probleem niet alle, maar slechts een deelverzameling N van de toppen verbonden moeten worden. Dit betekent dat ook toppen die geen deel uitmaken van N zich in de Steiner tree kunnen bevinden. Dit maakt het probleem aanzienlijk complexer dan het bepalen van een minimaal opspannende boom, waardoor in de praktijk meestal heuristieken worden gebruikt.
In de context van FiberPlanIT is een efficiënte heuristiek voor het Steiner tree probleem zeer belangrijk, aangezien het om grote netwerken gaat en dit een bewerking is die vaak wordt opgeroepen. Ook een heuristiek voor dynamische Steiner trees zou zeer nuttig zijn voor FiberPlanIT. Hier is het de bedoeling snel de Steiner tree te herberekenen wanneer men een top toevoegt aan of verwijdert uit de verzameling N.
Steiner tree in FiberPlanIT. De gebouwen (paars) worden geprojecteerd op de straat in een droppunt (blauw). Deze droppunten worden verbonden door een Steiner tree (groen). Het distributiepunt (DP) is aangeduid in roos.
Doelstelling
Literatuurstudie Ontwerpen en implementeren (in Java) van een efficiënte heuristiek voor het Steiner tree probleem Testen binnen de FiberPlanIT software Eventueel: uitbreiden met een heuristiek voor dynamische Steiner trees
Meer info
[email protected] [email protected] http://www.comsof.com http://www.fiberplanit.com
Een studie van de theorie en de implementatie van Constant Pertubation-methoden Doelgroep: master wiskunde / master wiskundige informatica promoter/begeleider : prof. M. Van Daele Beschrijving Klassieke methoden voor de numerieke integratie van gewone differentiaalvergelijkingen zijn vaak gebaseerd op veelterminterpolatie. Dit zorgt ervoor dat wanneer de oplossing van het probleem een veelterm is van voldoend lage graad, de exacte oplossing wordt teruggevonden, terwijl voor vele andere problemen een numerieke oplossing gevonden kan worden die, binnen een bepaalde afgesproken toleratie, aanvaardbaar is. Er kunnen echter problemen rijzen wanneer de oplossing sterk oscillatorisch is. In dat geval dient men met een klassieke methode zeer kleine stapjes te nemen om de oplossing accuraat te kunnen beschrijven. Dit resulteert in enorm veel rekenwerk, waardoor die klassieke methoden praktisch onbruikbaar zijn. Een alternatief wordt geboden door de klasse van de CP-methoden, wat staat voor Constant Perturbation methods. Als concrete toepassing beschouwen we het berekenen van de golffunctie y van een Schr¨odinger-probleem. Het Schr¨odingerprobleem bestaat uit een tweede orde gewone differentiaalvergelijking (ODE) van de vorm y ′′ = (V (x) − E)y,
a < x < b,
(1)
met randvoorwaarden in de eindpunten a en b. De Schr¨odingervergelijking vormt de fundamentele vergelijking in de kwantummechanica. Een waarde voor de parameter E waarvoor een niet-nul oplossing bestaat, wordt een eigenwaarde genoemd. De eigenwaarden worden typisch geordend als E0 < E1 < E2 < . . . en de golffunctie of eigenfunctie yk (x), horende bij Ek , heeft dan exact k nulpunten in het interval (a, b). Dit betekent dat de “hogere” eigenfuncties sterk oscilleren. De eerste stap van een CP methode bestaat er in de functie V (x) stuksgewijs te benaderen door een constante, d.w.z. in het interval [xi , xi+1 ] wordt de vergelijking (1) gewijzigd in y ′′ = (V¯ − E)y,
xi < x < xi+1 ,
(1) ,
waarbij V¯ een geschikte constante is. Deze vergelijking, waarvan de co¨effici¨enten constanten zijn, kan analytisch exact opgelost worden. Aldus verkrijgen we de waarde van de golffunctie y en van de eerste orde afgeleide y ′ in een aantal roosterpunten. Deze oplossing is uiteraard maar een benaderende oplossing, want V (x) werd vervangen door V¯ . Deze benaderende oplossing, laat ze ons y (0) noemen, wordt vervolgens gecorrigeerd door het in acht nemen van V (x) − V¯ . Via een perturbatieprocedure bekomt men uiteindelijk alsmaar betere benaderingen y (1) , y (2) , . . . die telkens analytisch kunnen worden bepaald. Het doel van de thesis is een studie van de theorie en de implementatie van deze CP-methoden, die de basis vormen van de succesvolle code MATSLISE, onwikkeld in de onderzoeksgroep Numerieke Wiskunde van de UGent. Literatuur Enkele wetenschappelijke artikels: 1. L. Gr. Ixaru, Numerical operations on oscillatory functions, Computers and Chemistry 25 (2001). 2. L. Gr. Ixaru, CP methods for the Schr¨odinger equation, J. Comput. Appl. Math. 125 (2000). Een link naar MATSLISE: 3. http://www.twist.ugent.be/index.php?page=onderzoek&ot=SLsoftware
1
Het oplossen van randwaardeproblemen Doelgroep: master wiskunde/ master wiskundige informatica promoter/begeleider : prof. M. Van Daele Beschrijving In de cursussen Numerieke methoden voor Differentiaalvergelijkingen (opleiding wiskunde) en Wetenschappelijk rekenen (opleiding informatica) worden beginwaardeproblemen opgelost. Hierbij worden alle voorwaarden, die opgelegd worden aan de oplossing van de differentiaalvergelijking, uitgedrukt in hetzelfde punt. Bij tweede-orde differentiaalvergelijkingen gebeurt het echter vaak dat de er een voorwaarde opgelegd wordt in het beginpunt en het eindpunt van het interval. Men spreekt in dat geval over randwaardeproblemen. Het doel van deze thesis is de studie van een aantal technieken (shooting, collocatie, deferred correction, Galerkin, . . . ) om zo’n randwaardeproblemen op te lossen. Literatuur Enkele wetenschappelijke werken : 1. M. Heath, Scientific Computing, An Introductory Survey, Mc Graw-Hill (2002) 2. J.R. Cash, Numerical integration of non-linear two-point boundary-value problems using iterated deferred corrections I : A survey and comparison of some one-step formulae. Comput. Math. Appl. 12, 10, Part 1 (1986), 1029-1048. 3. U. Asher, R. Mattheij, R. Russell, Numerical Solution of Boundary Value Problems for Ordinary Differential Equations, SIAM (1995)
Numerieke methoden voor tweede-orde differentiaalvergelijkingen Doelgroep: master wiskunde/ master wiskundige informatica promoter/begeleider : prof. M. Van Daele Beschrijving In de cursussen Numerieke methoden voor Differentiaalvergelijkingen (opleiding wiskunde) en Wetenschappelijk rekenen (opleiding informatica) worden methoden besproken voor eerste orde differentiaalvergelijkingen. In principe volstaan deze om tweede-orde differtiaalvergelijkingen y ′′ = f (x, y) op te lossen, want elke tweede-orde vergelijking kan omgezet worden in een stelsel eerste-orde vergelijkingen. Hierdoor wordt echter y ′ ge¨ıntroduceerd in het probleem. Om dit te vermijden, zijn er ook methoden ontwikkeld die rechtstreeks geschikt zijn voor tweede-orde (of algemeen gesproken hogere orde) differentiaalvergelijkingen. De meest bekende methode hiervoor is wellicht de Numerov methode. Het doel van deze thesis is na te gaan hoe deze methoden kunnen geconstrueerd worden. Wat is hun orde? Hoe zit de stabiliteitstheorie voor deze methoden in elkaar? . . . Literatuur o.a : E. Hairer, S.P. Norsett, G. Wanner, Solving Ordinary Differential Equations I, Springer-Verlag (1991)
2
Exponential fitting Doelgroep: master wiskunde/ master wiskundige informatica promoter/begeleider : prof. M. Van Daele Beschrijving Heel veel numerieke methoden (voor de benadering van afgeleiden, de berekening van integralen, het oplossen van differentiaalvergelijken, . . . ) steunen op veelterminterpolatie. Voor sommige toepassingen (bvb. als geweten is dat het integrandum of de af te leiden functie periodiek is), zijn veeltermen niet zo geschikt, maar zijn trigonometrische of exponenti¨ele functies eerder aangewezen. Daarom werden nieuwe methoden ontwikkeld die met dit oscillerend of exponentieel karakter rekening houden. Deze techniek heet exponential-fitting. Het doel van deze thesis is dieper in te gaan op de exponential-fitting techniek en zo’n methoden toe te passen op een aantal typische problemen. Literatuur o.a. Liviu Gr. Ixaru and G. Vanden Berghe, Exponential Fitting, Kluwer, Boston - Dordrecht - London, 2004.
3