Anthony Liekens • Geboren in Sint-Niklaas, 1975 • Gehuwd met Els De Ketelaere • ir. architect met eigen zaak
• • • •
2 zoontjes, Staf (2,5j) en Louis (7 weken) Wij wonen in Borsbeek Momenteel: Werken in Eindhoven Gemotiveerd om te werken in Antwerpse
Opleiding • Kandidaat Informatica (UA, 1998) • Eerste wetenschappelijke contacten: • Artificial Life, Santa Fe Institute, BBC, ...
• Licentiaat Informatica (VUB, 2000) • Verhuis naar VUB voor opleidingsonderdelen • AI, adaptieve systemen, genetische algoritmen, machine learning, parallel computing
• 20 studiepunten bij faculteit Biologie, UA • algemene ecologie, evolutiebiologie, gedragsecologie, genetica, populatie ecologie
• Thesis: From individuals to populations
Eerste publicaties • Publicatie bij thesis •
A.M.L. Liekens, From Individuals to Populations, Approaches to the Study of Biological Emergent Phenomena, in Artificial Life VII; Editors: Mark A. Bedau, John S. McCaskill, Norman H. Packard, Steen Rasmussen; Portland, OR, United States, refereed conference proceedings, 2000
• Book chapters •
•
•
A.M.L. Liekens, Artificial Life, in Encyclopaedia of Computer Science, Fourth Edition; Editors: Anthony Ralston, Edwin D. Reilly and David Hemmendinger; Nature publishing group, ISBN 0 333 77879 0, book chapter, 2000 A.M.L. Liekens, Artificial Life, in Computer Graphics Companion; Editors: Jeffrey J. McConnell, Anthony Ralston, Edwin D. Reilly, David Hemmendinger; Nature publishing group, ISBN 0 333 997859, reprint of book chapter, 2002 A.M.L. Liekens, Artificial Life, in Encyclopaedia of Computer Science, Concise Edition; Editors: Anthony Ralston, Edwin D. Reilly and David Hemmendinger; John Wiley and Sons, reprint of book chapter, 2004
Doctoreren in Eindhoven • Technische Universiteit Eindhoven • 1999-2000: faculteit Wis/Inf, prof.dr. Emile Aerts, EU Metaheuristics project • Modelleren van diploïde genetische algoritmen
• 2000-2005: faculteit Biomedische Technologie, prof.dr. Peter Hilbers • Modelleren van evolutie dynamica d.m.v. eindige populatiemodellen
Doctoraat, “Promotie”
Finite populations in dynamic fitness environments 5 juli 2005
Probleemstelling • Evoluerende populaties: standaard model • oneindige grote populaties • laat studie van effecten van “genetische drift” (i.e. stochastische effecten t.g.v. eindigheid) niet toe
• statische omgeving • wat met veranderingen in de omgeving, co-evolutie met andere soorten, competitie binnen populatie?
• haploïd/diploïd in deze context?
• Eindige Markovketens als modellering voor genetische algoritmen, populatie genetica, evolutionaire speltheorie
Voorbeeld: Uta stansburiana
Voorbeeld: Uta stansburiana
Blauw
Oranje
Geel
Voorbeeld: Uta stansburiana
Blauw Trouwe partner
Oranje Vrouwelijke Groot gedaante grondgebied
Geel
Voorbeeld: Uta stansburiana
Blauw Trouwe partner
Oranje Vrouwelijke Groot gedaante grondgebied
Geel
Voorbeeld: Uta stansburiana
Blauw Trouwe partner
Oranje Vrouwelijke Groot gedaante grondgebied
Geel
Probleemstelling • Observaties in natuurlijke habitat, groep van 500 dieren (Sinervo et al, 1996-2001) • Aantallen mannetjes van 3 soorten oscilleert over de jaren (=generaties) heen • Observatie komt niet overeen met standaardmodellering • evolutie in observatie is trager dan in model
• Ons model kan het verschil verklaren en voorspellen
Lange termijn
Conclusie • Verklaring voor Uta stansburiana: • Eindige populatie ondergaat “genetische drift” • Hierdoor wordt ze aangetrokken door extremen (“genetische fixatie”) • Dit veroorzaakt “punctuated equilibria”
• “Grote” groep van 500 individuen • Effect nog merkbaar • Verklaart verschil observatie <-> model • Technisch detail: Oplossing = eigenvectors van 130GB grote matrix (parallel) uitrekenen
Publicaties doctoraat • •
•
•
•
•
•
H.M.M. ten Eikelder, A.M.L. Liekens, First Order Parallel Shop Scheduling Problems, internal report for the Metaheuristics Network, 2001 A.M.L. Liekens, H.M.M. ten Eikelder, P.A.J. Hilbers, Modeling and Simulating Diploid Simple Genetic Algorithms, in FOundations of Genetic Algorithms VII (FOGA VII); Editors: K.A. Dejong, R. Poli, J.E. Rowe; Malaga, Spain, pages 151-167, refereed conference proceedings, 2003 A.M.L. Liekens, H.M.M. ten Eikelder, P.A.J. Hilbers, Finite Population Models of Dynamic Optimisation with Alternating Fitness Functions, in Workshop on Evolutionary Algorithms for Dynamic Optimisation Problems, 2003 Genetic and Evolutionary Computation COnference (GECCO 2003); E. Cantu-Paz; Chicago, IL, United States, pages 113-117, refereed conference proceedings, 2003 A.M.L. Liekens, H.M.M. ten Eikelder, P.A.J. Hilbers, Finite Population Models of Co-Evolution and their Application to Haploidy versus Diploidy (nominated for best paper at GECCO award), in 2003 Genetic and Evolutionary Computation COnference (GECCO 2003); E. Cantu-Paz; Chicago, IL, United States, pages 344-355, refereed conference proceedings, 2003 A.M.L. Liekens, H.M.M. ten Eikelder, P.A.J. Hilbers, A Finite Population Model Analysis of Co-Evolution with Matching Pennies, in Fifth International Workshop on Frontiers in Evolutionary Algorithms (FEA 2003); P.P. Wang; Cary, North Carolina, United States, pages 199-203, refereed conference proceedings, 2003 A.M.L. Liekens, H.M.M. ten Eikelder, P.A.J. Hilbers, Finite Population Models of Dynamic Optimisation with Stochastically Alternating Fitness Functions, in 2003 Congress of Evolutionary Computation (CEC 2003); Editors: B. McKay, H. Abbass; Canberra, Australia, refereed conference proceedings, 2003 A.M.L. Liekens, H.M.M. ten Eikelder, P.A.J. Hilbers, Genetic Drift in 2x2 Games, in 2004 Genetic and Evolutionary Computation COnference (GECCO 2004); Seattle, WA, United States, refereed conference proceedings, 2004
Post-doc: ESIGNET • BMI, Faculteit BMT, Technische Universiteit Eindhoven, juli 2005-heden • ESIGNET (Evolving Cell Signalling Networks, in silico), Europees 6th Framework NEST • Computation in signaaltransductienetwerken • Modelleren: Welke rekenmetaforen gebruiken netwerken van eiwitinteracties? • Synthese: Welke berekeningen kunnen we op basis van dit begrip zelf engineeren (in silico en in vitro)? • Evolutie: Kunnen we zo’n netwerken evolueren d.m.v. genetische algoritmen? • Fundamenteel/theoretisch van aard • Toepassingen: biosensors, intelligente medicatie
Enkele resultaten (1/2) • Biochemische netwerken kunnen algebraïsche functies uitdrukken •
H.J. Buisman, H.M.M. ten Eikelder, P.A.J. Hilbers, A.M.L. Liekens, Computing Algebraic Functions with Biochemical reaction Networks, Artificial Life Journal, Special Issue on Artificial Chemistries, 2008
• Kunstmatige neurale netwerken kunnen dienen als metafoor voor fosforyleringscascades •
•
H.M.M. ten Eikelder, S.P.M. Crijns, M.N. Steijaert, A.M.L. Liekens, P.A.J. Hilbers, Computing with Feedforward Networks of Artificial Biochemical Neurons, 2nd International Workshop on Natural Computation (IWNC 2007), 2007 M.N. Steijaert, A.M.L. Liekens, H.M.M. ten Eikelder, P.A.J. Hilbers, Multiple Functionalities of Biochemical reaction Networks, Computational Methods in Systems Biology (CMSB 2007), 2007
• Biochemie is Turing compleet •
A.M.L. Liekens, C.T. Fernando, Turing Complete Catalytic Particle Computers, European Conference on Artificial Life (ECAL 2007), 2007
Enkele resultaten (2/2) • Synthese van Hebbian learner in bacterieel model m.b.v. plasmiden •
C.T. Fernando, A.M.L. Liekens, L. Bingle, C. Beck, T. Lenser, D. Stekel, J. Rowe, Synthesis of Bacterial Hebbian Learning Circuits, submitted to PNAS
• Stochastische modellering van fosforyleringscascades •
A.M.L. Liekens, M.N. Steijaert, H.M.M. ten Eikelder, P.A.J. Hilbers, Stochastic Behavior of a Bistable Phosphorylation Network, in preparation
• In silico ziektemodel van coagulatienetwerk •
H. van Ooijen, N.A. van Riel, A.M.L. Liekens, P.A.J. Hilbers, Towards an In Silico Disease Model for Coagulopathies, in preparation
Onderwijs • Ontvangen (recent): • Biostatistiek, Systeembiologie, Bioinformatica, Organische scheikunde, ...
• Gegeven: • Informatica (voor BMT), Bio-informatica (o.a. transcriptomics), Seminaries i.v.m. onderzoek, Optimalizatietechnieken, Parallelle systemen, Grafenalgoritmen ...
• Afstudeerders: • Bio-informatica (metabolomics), Genetische algoritmen, Fosforyleringscascades, Parallelle systemen...
Extra CV, Hobby’s
Verband met huidig voorstel • Achtergrond: • Informatica-opleiding, gegroeid naar biologie • 7 jaar in biomedische omgeving (sys.bio., bio-inf.) • Vaardigheden in disciplines, technieken & jargons
• Herkenning: • Gelijkaardige vraagstelling gehad, onbeantwoord • Bvb. coagulatienetwerk: 108 eiwitten, 142 variabelen, 104 publicaties, 2 boeken => text mining?
• Methoden: • Constructie van netwerken op basis van literatuur • Data mining, grafenalgoritmen, stochastische modellen, parallelle algoritmen • Steeds toegepast in systeembiologische & biomedische context
• In staat om zonder inwerken te kunnen starten
Verband met huidig voorstel • Achtergrond: • Informatica-opleiding, gegroeid naar biologie • 7 jaar in biomedische omgeving (sys.bio., bio-inf.) • Vaardigheden in disciplines, technieken & jargons
• Herkenning: • Gelijkaardige vraagstelling gehad, onbeantwoord • Bvb. coagulatienetwerk: 108 eiwitten, 142 variabelen, 104 publicaties, 2 boeken => text mining?
• Methoden: • Constructie van netwerken op basis van literatuur • Data mining, grafenalgoritmen, stochastische modellen, parallelle algoritmen • Steeds toegepast in systeembiologische & biomedische context
• In staat om zonder inwerken te kunnen starten
Verband met huidig voorstel • Achtergrond: • Informatica-opleiding, gegroeid naar biologie • 7 jaar in biomedische omgeving (sys.bio., bio-inf.) • Vaardigheden in disciplines, technieken & jargons
• Herkenning: • Gelijkaardige vraagstelling gehad, onbeantwoord • Bvb. coagulatienetwerk: 108 eiwitten, 142 variabelen, 104 publicaties, 2 boeken => text mining?
• Methoden: • Constructie van netwerken op basis van literatuur • Data mining, grafenalgoritmen, stochastische modellen, parallelle algoritmen • Steeds toegepast in systeembiologische & biomedische context
• In staat om zonder inwerken te kunnen starten
Visie op huidig voorstel • Data vergaring • Afbakenen van input voor probleemstelling • Bronnen omzetten in graafrelaties
• Data mining • Biases, non-obvious vs biologische netwerken • PageRank & Markov keten eigenschappen
• Toepassing • Pathway informatie als extra bron • Meer toepassingen dan disease causing genes?
Selecteren van input (1/2) • Welke literatuur dient als input? • Alles (over ziekte) = te veel => limiteren • Literatuur biases: • • • • •
Data mining: Wat erin gaat, komt eruit Trends/hypes in ziekten en genen Citatienetwerk = small-world met literatuurhubs Bias zal steeds probleem zijn (Jensen) Wanneer is een selectie neutraal?
• Hoe starten? • Selectie voor genen en ziekte in probleem • Beperking in aantal: Welke artikelen? • Op basis van citations? IF? • Seed zal bepalend zijn
Selecteren van input (2/2) • Hoe uitbereiden? • Literatuur uitdiepen • Graaf uitdiepen • Bvb knopen met lage graad, dicht bij startknoop • Bvb knopen die “hot” zijn, of net niet? (PageRank) • Oppassen voor small network hubs • Bvb MAPK netwerk is zo’n biologische hub: apoptosis, mitose, genexpressie, Alzheimer, Down
• Wanneer stoppen? • Zijn eerste “hits” voldoende? • Wanneer wordt graf neutraal/statisch? • Hoe afhankelijk van het voorgestelde algoritme? • Multiple runs om neutraliteit te onderzoeken?
Opbouwen graaf • Nodes & Edges • Ziekten en genen (startnodes) te beperkt • Eiwitproducten, complexen, metabolen, signalen, ...? • Nodes beperken tot fysische entiteiten?
• Zijn eenvoudige edges voldoende? • Interacties meestal niet 1-op-1 (A causes B) • Systeembiologie oplossing: Interacties = ook knopen • Complexvorming (Clb2-Cdc28), reacties (fosforylering en hyperfosforylering Swe1, afhankelijk van Cdc5)
• Hoe input quantificeren? • Biases: impact factors, referenties, hypes, ... • Hoe links uit verschillende bronnen wegen?
Opbouwen graaf • Nodes & Edges Mitotic cyclin (Clb2)-bound Cdc28 • Ziekten en genen (startnodes) te beperkt (Cdk1 homolog) complexen,directly metabolen, signalen, ...? • Eiwitproducten, beperken tot fysische • Nodes phosphorylates Swe1entiteiten? and this eenvoudige edges voldoende? • Zijn modification serves as a priming step • Interacties meestal niet 1-op-1 (A causes B) to promote oplossing: subsequent Cdc5-= ook knopen Interacties • Systeembiologie (Clb2-Cdc28), • Complexvorming dependent Swe1 reacties (fosforylering en hyperfosforylering Swe1, hyperphosphorylation and afhankelijk van Cdc5) degradation • Hoe input quantificeren? -- Jensen, Bork,hypes, 2006... impactSaric factors,and referenties, • Biases: • Hoe links uit verschillende bronnen wegen?
Opbouwen graaf • Nodes & Edges • Ziekten en genen (startnodes) te beperkt • Eiwitproducten, complexen, metabolen, signalen, ...? • Nodes beperken tot fysische entiteiten?
• Zijn eenvoudige edges voldoende? • Interacties meestal niet 1-op-1 (A causes B) • Systeembiologie oplossing: Interacties = ook knopen • Complexvorming (Clb2-Cdc28), reacties (fosforylering en hyperfosforylering Swe1, afhankelijk van Cdc5)
• Hoe input quantificeren? • Biases: impact factors, referenties, hypes, ... • Hoe links uit verschillende bronnen wegen?
PageRank & Markov ketens • PageRank = evenwichtsverdeling van DTMM die netwerkovergangen voorstelt • Geeft onderlinge belangrijkheid van concepten • Helaas kan dit onafhankelijk zijn van de input (ziekte) van de probleemstelling
• Andere eigenschappen van Markov model • Bvb first-passage time, levert ook “link summary” op
• Problemen met PageRank assumpties? • Link uniformity vs link importance • Hoe negatieve relaties aangeven? • CTMM kan oplossingen bieden met “rates”
• All link information available (en unbiased)? • Neutraal => voldoende
Extra toepassingen • (Metabolische-, Signaal-) Pathways als input • Expliciet kwalitatieve data breed beschikbaar • Pathway verbanden zijn expliciet • Eenvoudig vertaalbaar naar voorgestelde graaf • Databanken kunnen gebruikt worden om annotering van artikelen te automatiseren
• Disease related pathways modelleren • Coagulatie, Hartritmestoornissen, Groeifactoren, Diabetes
Samengevat • Herkenbare probleemstelling & aanpak • Relevante achtergrond in disciplines en technieken • Uitdagingen in vergaren, representeren, minen en interpreteren van data • Weinig inwerktijd • Enthousiast om het project aan te pakken