Table Of ContentEnseignements d’Approfondissement de Mathématiques
Appliquées Période 2
19 janvier 2009
www.enseignement.polytechnique.fr/mathematiques-appliquees/enseignements/cycle_
polytechnicien/annee3.php
Table des matières
1 Introduction 1
1.1 Présentation des sujets . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
1.2 Choix des sujets . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2
1.3 Calcul numérique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2
1.4 Soutenance orale et rapport . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2
1.5 Encadrement . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
2 Modèles aléatoires en écologie et évolution 3
2.1 Mesures quasi-stationnaires et systèmes de particules du type Fleming-Viot . . . 3
2.2 Etude d’un modèle d’aggrégation . . . . . . . . . . . . . . . . . . . . . . . . . . 4
2.3 Détection du vieillissement des cellules . . . . . . . . . . . . . . . . . . . . . . . 4
2.4 Prolifération de parasites . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
2.5 Processus de coalescence et corrélation de fertilité . . . . . . . . . . . . . . . . . 5
2.6 Modèles graphiques gaussiens pour l’inférence de réseaux de gènes . . . . . . . . 6
2.7 In silico chemogenomique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
2.8 Méthodes statistiques pour l’analyse de données de puces à ADN . . . . . . . . 7
2.9 Dynamique adaptative . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
2.10 Coalescents avec mutation, le cas des arbres de ramification . . . . . . . . . . . 8
2.11 Spéciation sur un anneau et coalescent . . . . . . . . . . . . . . . . . . . . . . . 9
2.12 La reproduction sexuée offre-t-elle un avantage sélectif? . . . . . . . . . . . . . . 9
2.13 Un automate étonnant : le rotor-routeur . . . . . . . . . . . . . . . . . . . . . . 10
3 Simulation stochastique et méthodes de Monte-Carlo 11
3.1 Rédution de variance en finance par calcul de Malliavin . . . . . . . . . . . . . . 11
3.2 Simulation de diffusions réfléchies et conditions au bord de Neumann . . . . . . 11
3.3 Discrétisation d’équations différentielles stochastiques à coefficients irréguliers;
application à des modèles de taux d’intérêt . . . . . . . . . . . . . . . . . . . . . 11
1
3.4 Approximationdeloisinvariantesdesolutionsd’équationsdifférentiellesstochas-
tiques . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
3.5 Modèles pour le protocole TCP . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
3.6 Modèles de réseaux pair à pair (peer to peer) . . . . . . . . . . . . . . . . . . . . 13
3.7 Traitement probabiliste des équations cinétiques non-linéaires . . . . . . . . . . 13
3.8 Discrétisation d’EDS : étude du schéma de Ninomiya et Victoir . . . . . . . . . 14
3.9 Simulation exacte des EDS en dimension 1 . . . . . . . . . . . . . . . . . . . . . 15
3.10 Processus de branchement et calcul de valeurs propres . . . . . . . . . . . . . . . 15
4 Processus et estimation 15
4.1 Test de linéarité dans un modèle a volatilité stochastique . . . . . . . . . . . . . 15
4.2 Estimation de la volatilite intégrée et bruit de microstructure . . . . . . . . . . . 16
4.2.1 Résumé . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
4.3 Modèle à volatilité stochastique . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
4.4 Modèle autorégressif à régimes . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
4.5 Choix de modèles ARMA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
4.6 Décomposition Tendance-Cycle :
Application à une série de PIB . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
4.7 Décomposition Tendance-Cycle :
Approche spectrale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20
4.8 Désaisonnalisation multivariée :
Application à des données macro-économiques ou financières . . . . . . . . . . . 21
4.9 Modèles ARCH : Application à l’inflation ou à un indice boursier . . . . . . . . 22
4.10 Modèle ARCH localement stationnaires . . . . . . . . . . . . . . . . . . . . . . . 23
4.11 Tests d’indépendance . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
4.12 L’intégrale de corrélation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
4.13 Réversibilité du temps . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
5 Modèles en finance et simulation 25
5.1 Estimation haute fréquence de la volatilité, application au trading d’options . . 25
5.2 Smile de volatilité implicite . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26
5.3 Assurance de portefeuille . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26
5.4 Estimation de la volatilité à partir de données bruitées . . . . . . . . . . . . . . 27
5.5 Mesure de corrélation : asynchronicité et données bruitées . . . . . . . . . . . . 27
6 Optimisation et recherche opérationelle 28
1 Introduction
Ces enseignements sont l’occasion d’appliquer, sur un problème particulier, la démarche d’un
mathématicien appliqué, à savoir, comprendre l’essence d’un problème, en faire la modélisation,
étudier les mathématiques sous-jacentes et calculer les solutions numériques.
Compte tenu de l’étendue du travail, il est très fortement recommandé d’effectuer ce projet en
binôme. Sauf exception rare, une note unique est attribuée par binôme, il vous faut donc faire
un véritable travail d’équipe.
2
Ce travail se terminera par la remise d’un rapport (au moins une copie papier et le fichier
électronique) pour le mardi 17 mars 12h00 et par une soutenance orale le lundi 23 mars, le
mercredi 25 mars, le jeudi 26 mars, ou le vendredi 27.
Cet enseignement d’approfondissement permet aussi de découvrir la recherche dans un domaine
spécifique des mathématiques appliquées. De plus, choisir un enseignement d’approfondisement
dans un domaine, est généralement une condition nécessaire pour obtenir un stage d’option à
l’étranger dans ce domaine.
1.1 Présentation des sujets
Vous trouverez dans ce catalogue la liste des sujets proposés, regroupés en 5 thèmes :
– Modèles aléatoires en écologie et évolution (MAP563, Sylvie Méléard, Jean-François Delmas,
Christophe Giraud, Amaury Lambert)
– Simulation stochastique et méthodes de Monte-Carlo (MAP564, Denis Talay, Carl Graham,
Benjamin Jourdain)
– Processus et estimation (MAP565, Stéphane Gregoir, François Roueff)
– Modèles en finance et simulation (MAP552, Nizar Touzi)
– Optimisation et recherche opérationelle (MAP557, Frédéric Bonnans et Stéphane Gaubert)
Les deux derniers thèmes concernent des cours du premier semestre et non du deuxième, ils
sont donc réservés aux élèves ayant suivi le cours en question sans faire une EA sur ce cours au
premier semestre.
Ces sujets seront par ailleurs présentés en détail le lundi 19 janvier 2009 à 15h dans l’am-
phithéâtre Monge. Nous commencerons par présenter globalement les différents domaines et
leurs interactions, puis rapidement les sujets de chaque domaine. Ensuite, les élèves intéressés
pourront discuter plus à fond avec les enseignants responsables. L’amphithéâtre Gay Lussac a
été réservé en cas de besoin.
Vous pouvez aussi proposer un sujet qui vous intéresse particulièrement, et le discuter avec l’un
des enseignants participant à ces approfondissements.
1.2 Choix des sujets
Il vous faudra choisir votre sujet avant le lundi 26 janvier 08h et communiquer une liste de
2 choix par courrier électronique ayant pour sujet "choix sujet EA" à :
Sandra Schnakenbourg
Secrétariat du Département de Mathématiques Appliquées
[email protected]
Une répartition définitive des sujets sera ensuite faite très vite, préférablement le jour même
(lundi 26 janvier), en essayant au mieux de respecter les choix des élèves. Vous devrez alors
prendre immédiatement rendez-vousavecvotreenseignantquivouspreciseralesmodalités
de travail.
1.3 Calcul numérique
La plupart des sujets proposés demanderont d’effectuer des simulations numériques, le plus
souvent avec le logiciel Scilab, pendant “libre” de Matlab, qui permet de faire des calculs avec
3
un minimum de programmation. Suivant les goûts et compétences, l’utilisation de langages de
programmation, à choisir parmi C, C++ et Java, est également envisageable.
Dans votre travail, il vous faut utiliser l’informatique comme outil de compréhension et d’expé-
rimentation.Uneanalysecritiquedesrésultatsdevraêtrefaitedanslerapportetlaprésentation
orale, montrant comment cet outil a été utilisé au cours du projet. Mais il ne s’agit pas d’un
projet d’informatique.
1.4 Soutenance orale et rapport
La soutenance orale dure 40 minutes par binôme. Elle se compose d’un exposé de 30 minutes
(environ 15 mn par élève) suivi de 10 minutes de questions. Il est extrêmement important de
bien préparer cette présentation, qui doit tenir dans le temps imparti, et dont la qualité de
l’exposé sera notée tout comme le contenu. Il est fortement recommandé de préparer des trans-
parents bien présentés.
Vous devez considérer que le jury ne connaît rien au problème et donc le présenter, montrer son
importance, expliquer votre approche ainsi que vos résultats analytiques et numériques, avec
une conclusion faisant un bilan de votre travail.
En plus de ces éléments, le rapport devra comprendre une bibliographie des ouvrages et articles
étudiés. Vous êtes fortement encouragés à aller chercher de la documentation sur votre sujet à
la bibliothèque.
1.5 Encadrement
Cet approfondissement est un travail personnel dont l’intérêt et la richesse ne dépendront que
de vous-même. Les enseignants vous guideront dans votre démarche. Surtout n’hésitez pas à
contacter l’enseignant qui vous encadre. Il vous faudra commencer vos recherches dès le mois
d’octobre car vous pouvez vous attendre à être très occupé lors des dernières semaines, par la
finition des calculs numériques, l’écriture du rapport, la préparation de votre présentation, les
examens des autres cours et les dossiers pour la quatrième année.
Si vous avez besoin d’une lettre de recommandation pour des dossiers d’admission dans les
universités étrangères, vous pourrez éventuellement demander cette lettre à l’enseignant qui
vous encadre, qui s’appuyera pour la faire de manière importante sur la qualité de votre travail
en EA.
2 Modèles aléatoires en écologie et évolution
2.1 Mesures quasi-stationnaires et systèmes de particules du type
Fleming-Viot
Sujet présenté par Sylvie Méléard, [email protected]
Le concept de distribution quasi-stationnaire est apparu dans l’étude des comportements à long
terme des systèmes aléatoires qui sont absorbés : par exemple une évolution de population qui
va vers l’extinction. Ainsi, pour le processus de Galton-Watson sous-critique (qui s’éteint donc
presque-sûrement), la distribution conditionnée à la non-extinction du nombre d’individus à
4
la n-ième génération converge quand n → ∞. Cette notion est fondamentale en Ecologie, car
elle permet de décrire des états stables avant extinction. L’obtention de distributions quasi-
stationnaires est souvent prouvée par des méthodes analytiques, qui donnent des résultats
d’existence et d’unicité. Mais il fondamental de pouvoir les obtenir quantitativement et numé-
riquement. La méthode présentée par Ferrari et Maric dans le cas d’un espace discret consiste
à construire un système de particules, facilement simulable, dont la distribution asymptotique
est celle du processus conditionné à la non-extinction. Un tel système est appelé système de
Fleming-Viot. Le but de cette étude est d’analyser l’article [1] et d’implémenter le système.
On pourra ensuite développer cette méthode numérique dans le cadre des diffusions de Feller
généralisées étudiées dans [2]. On construira un système de particules de Fleming-Viot dans
ce cadre de diffusions en temps continu et implémentera la méthode numérique. Des éléments
théoriques pourront être trouvés dans [3].
Références :
[1] - P.A. Ferrari, N. Maric (2006). Quasi-stationary distributions and Fleming-Viot processes
in countable spaces, Electronic Journal of Probability, vol. 12 (2007), paper 24.
[2] - P. Cattiaux, P. Collet, A. Lambert, S. Martinez, S. Méléard, J. San Martin (2006). Quasi-
stationarity distributions and diffusion models in population dynamics,
http ://arxiv.org/pdf/math.PR/0703781
[3] - I. Grigorescu, M. Kang (2004). Hydrodynamic limit for a Fleming-Viot type system,
Stochastic Processes and their Applications 110, 111-143.
2.2 Etude d’un modèle d’aggrégation
Sujet présenté par Sylvie Méléard, [email protected]
En biologie et en médecine, de nombreux exemples montrent l’apparition d’un comportement
collectif conduisant à la formation d’aggrégats. Cela peut se passer à de nombreuses échelles :
formation de tissu, de tumeurs, aggrégats de bactéries ou regroupement d’animaux, tels des
essaims d’insectes ou des mouvements collectifs de bancs de poissons ou de troupeaux de mou-
tons (voir [1]). Notre intérêt est de comprendre le mécanisme de formation de ces aggrégats :
quelle est la motivation biologique de ces aggrégats, comment l’adhésion est-elle maintenue?
L’environnement a-t-il une influence sur l’aggrégation? Des observations issues de [2] sur des
fourmis montrent l’importance de l’environnement. Le papier [3] introduit un modèle probabi-
liste individu-centré, incluant un phénomène d’aggrégation à longue portée, un phénomène de
répulsion à courte portée, et un déplacement individuel décrit par un mouvement brownien. Le
but de cette étude est d’analyser l’article [3] et d’implémenter le système. Notre propos est alors
d’observer l’influence des paramètres sur le phénomène d’aggrégation. On pourra comparer ce
modèle Lagrangien au modèle déterministe d’advection-réaction-diffusion introduit dans [3].
Références :
[1] A. Okubo : Dynamical aspects of animal grouping : swarms, school, flocks and herds, Adv.
BioPhys. 22, pp. 1-94 (1986).
[2] - S. Boi, V. Capasso, D. Morale : Modeling the aggregative behavior of ants of the species
Polyergus Rufescens, Nonlinear Analysis, Real World Applications I, pp. 163-176, (2000).
5
[3] - D. Morale, V. Capasso, K. Oelschläger : An interacting particle system modelling aggre-
gation behavior : from individuals to populations.
2.3 Détection du vieillissement des cellules
Sujet présenté par Jean-François Delmas, [email protected]
La dissymétrie de la division d’une cellule mère E. coli en deux cellules peut permettre d’expli-
quer le vieillissement de certaines cellules. Le vieillissement est ici mesuré par la diminution du
taux de croissance d’une cellule par rapport aux autres cellules. Il n’est toutefois pas évident
que la dissymétrie modélisée par J. Guyon dans [1] avec des chaînes de markov bifurcantes ait
lieu à chaque division. On construira un modèle de chaînes de markov cachée qui rend compte
de l’apparition aléatoire d’agrégats, susceptible de diminuer le taux de croissance de la cellule.
L’agrégat d’une cellule mère est transmis de manière asymétrique (voir [1]). On pourra ensuite
le comparer (en utilisant des simulations) avec le modèle de chaînes de markov bifurcante.
En particulier, on pourra étudier le comportement des estimateurs présentés dans [1] pour un
modèle de chaîne de markov cachée, et estimer l’erreur de modèle sur les résultats. On pourra
également regarder des modèles qui tiennent compte de la mort des cellules, voir [2].
Référence
[1] J. Guyon. Limit theorems for bifurcating Markov chains. Application to the detection of
cellular aging. Annals of Applied Probability 2007, Vol. 17, No. 5,6, 1538-1569.
[1] J.-F. Delmas and L. Marsalle. Detection of cellular aging in a Galton-Watson process.
http://hal.archives-ouvertes.fr/docs/00/29/34/22/PDF/agingGW_06_27.pdf
2.4 Prolifération de parasites
Sujet présenté par Jean-François Delmas, [email protected]
On considère un modèle développé par V. Bansaye [1] pour la diffusion de parasites dans une
population de cellules. La répartition des parasites lors de la division cellulaire est aléatoire
et peut intégrer une dissymétrie systématique pour rendre compte du vieillissement cellulaire.
Aprèsavoirimplémentélemodèle,onvérifieraparsimulationlesrésultatsde[1]pourdifférentes
valeurs des paramètres. Si on considère un modèle où les parasites sont peu mobiles dans la
cellules, on peut supposer que chaque parasite a une probabilité p d’être dans une des deux
cellules lors de la division cellulaire. Pour p fixe (qui peut être différent de 1/2 pour modéliser
le vieillissement cellulaire), on obtient un cas particulier de [1]. Le cas où p dépend de la cellule
et est aléatoire n’est pas traité dans [1]. On pourra étudier par simulation la différence entre le
modèle p fixe et p aléatoire, et proposer une méthode pour tester lequel des deux modèles est
pertinent.
Référence
[1] V. Bansaye. Proliferating parasites in dividing cells : Kimmel’s branching model revisited.
Annals of Applied Probability, Volume 18, Number 3, 967-996 . http://arxiv.org/pdf/math.
PR/0701917
6
2.5 Processus de coalescence et corrélation de fertilité
Sujet présenté par Jean-François Delmas, [email protected]
Les taux élevés de maladie génétique dans la population de Saguenay-Lac Saint Jean peuvent
être expliqués par des corrélations de fertilité : une personne ayant une grande fratrie est sus-
ceptible d’avoir un grand nombre d’enfants. Le but de cette étude est d’analyser les articles
[1,2,3,4], de simuler les processus et de comparer les résultats obtenus concernant l’arbre de
coalescence avec celui obtenu dans un processus de coalescent multiple en comparant le com-
portement asymptotique du nombre de mutations, voir [5].
Références
[1] F. Austerlitz and E. Heyer. Allelic association is increased by correlation of effective family
size. Europ. J. of Hum. Gen. (2000) 8, 980-985.
[2] F. Austerlitz and E. Heyer. Social transmission of reproductive behavior increases frequency
of inherited disorders in a young-expanding population. Proc. Natl. Acad. Sci. USA, Vol 95,
pp. 15140-15144, December 1998
[3]A.Sibert,F.AusterlitzandE.Heyer.Wright-Fisherrevisited:thecaseoffertilitycorrelation.
TPB 62, 181-197 (2002).
[4] M. Blum, E. Heyer, O. François and F. Austerlitz. Matrilineal fertility inheritance detected
inhunter-gathererpopulationsusingtheimbalanceofgenegenealogies.PlosGenet.2(8)(2006).
[5]J.F.Delmas,J.S.DhersinandA.Siri-Jegousse.Asymptoticresultsonthelengthofcoalescent
trees. http://cermics.enpc.fr/~delmas/Publi/long.pdf
2.6 Modèles graphiques gaussiens pour l’inférence de réseaux de gènes
Sujet proposé par Christophe Giraud, [email protected]
Les systèmes biologiques mettent en oeuvre des réseaux complexes d’interactions entre des
entités moléculaires telles que des gènes ou des protéines. La détermination de ces réseaux à
partir de données protéomiques ou transcriptomiques est un des principaux challenges de la
post-génomique. Cette tâche est très ardue du fait de la très grande dimension de ces données.
Un outil intéressant pour analyser les réseaux d’interactions est la modélisation graphique
gaussienne (à noter que cette modélisation est aussi utilisée pour analyser des données de
grandes dimensions en finance). Les objectifs de ce mémoire sont :
– d’assimiler cette modélisation
– comprendre son utilisation en post-génomique
– mettre en oeuvre un algorithme récemment proposé pour estimer des réseaux de gène à partir
de données transcriptomiques et évaluer ses performances sur des données synthétiques.
Mots clefs : Réseaux de gènes, modèles graphiques gaussiens, PC-algorithme, puces à ADN.
Références
[1] S. L. Lauritzen "Graphical models" (1996) Clarendon Press, Oxford.
[2] Kalisch, M. and Bühlmann, P. "Estimating high-dimensional directed acyclic graphs with
the PC-algorithm" (2007). Journal of Machine Learning Research 8, 613–636
[3] A. Dobra et al "Sparse graphical models for exploring gene expression data" (2004) J. Mult.
Anal. 90, 196–212
7
2.7 In silico chemogenomique
Sujet proposé par Christophe Giraud, [email protected]
L’experimentation in silico est une voie prométeuse pour découvrir de nouvelles molécules
thérapeuthiques. L’idée est de cribler un très grand nombre de molécules et d’inférer par des
algorithmes d’apprentissage statistique leur capacité à interagir avec un récepteur cible de la
cellule.
La famille des GPCR (G-protein coupled receptor) est la cible d’environ 40% des prescriptions
pharmaceutiques actuelles et joue un rôle dans un très grand nombre de maladie (allergies, pro-
blèmes cardiovasculaires, obésité, dépression, cancer, etc). La prédiction d’interactions entre de
petites molécules et les GPCRs présente donc un grand intérêt à la fois pour l’industrie phar-
maceutique mais aussi pour la biologie fondamentale (identification de processus biologiques).
L’objectif du mémoire sera de
– comprendre les méthodes d’apprentissage statistique dites "à noyaux reproduisants",
– comprendre leur utilisation pour le criblage virtuel des GPCRs
– implémenter cette méthode sur des données issues de la base GLIDA.
Mots clefs : apprentissage statistiques, RKHS, criblage virtuel, GPCR.
Références
[1] B. SchŽlkopf, K. Tsuda et J.-P. Vert, "Kernel methods in computational biology", MIT
Press, 2004.
[2] L. Jacob, B. Hoffmann, V. Stoven and J.-P. Vert, "Virtual screening of GPCRs : an in silico
chemogenomicsapproach".ToappearinBMCBioinformatics.http://arxiv.org/pdf/0801.4301v1
[3] Y. Okuno et al. "GLIDA : GPCRÑligand database for chemical genomics drug discoveryÑ-
database and tools update" Nucleic Acids Research, 2008, Vol. 36, Database issue D907-D912.
http ://nar.oxfordjournals.org/cgi/content/full/36/suppl 1/D907
2.8 Méthodes statistiques pour l’analyse de données de puces à ADN
Sujet proposé par Christophe Giraud, [email protected]
Le développement de la technologie des biopuces permet de générer des quantités massives de
données biologiques nécessitant des outils statistiques appropriés pour les analyser.
Une puce à ADN peut mesurer simultanément le niveau d’expression de quelques milliers de
gènes. Il est souvent pertinent d’utiliser ces puces pour mesurer le niveau d’expression des
gènes d’une cellules dans deux conditions expérimentales différentes (par exemple une condition
"normale" et une condition de stress). L’objectif d’une telle expérience est de déterminer quels
gènes ont une expression significativement différentes entre les deux conditions, car ces gènes
sont vraisemblablement impliqués dans la réponse de la cellule au stress (cela doit être ensuite
validé par l’expérience). Les données récoltées étants très bruitées, leur analyse conduit à des
problèmes de tests multiples en très hautes dimensions (très grand nombre de gènes testés).
L’objectif de ce mémoire est de
– comprendre comment fonctionne une puce à ADN
– comprendre quelles analyses doivent être menées pour exploiter leurs données
– analyser quelques biopuces.
8
En particulier, le mémoire devra aborder le problème important des tests multiples et du
contrôle du taux de fausses découvertes (FDR).
Mots clefs : puces à ADN, normalisation des données, tests multiples, FDR, très hautes
dimensions.
Références
[1] T. Mary-Huard, F. Picard and S. Robin, "Introduction to statistical methods for microarray
data analysis". Lecture notes INAPG (2004).
[2] Y. Benjamini, Y. Hochberg, "Controlling the false discovery rate - a practical and powerful
approach to multiple testing" (1995) J. Roy. Soc. B. Met. 57 (1), 289–300.
[3] Reiner A, Yekutieli D, Benjamini Y "Identifying differentially expressed genes using false
discovery rate controlling procedures" (2003) Bioinformatics 19 (3), 368–375.
2.9 Dynamique adaptative
Sujet proposé par Amaury Lambert, [email protected]
On considère une population de taille N (fixée) structurée : chacun des N individus a un
type, dit trait, qui est un réel positif, supposé multiple entier de (cid:15). LorsquŠun individu donne
naissance, il tue un individu au hasard dans la population (qui reste ainsi de taille constante),
indépendamment de leurs traits.
Un nouvel enfant hérite le trait de son parent avec probabilité 1−θ, ou alors mute de −(cid:15) avec
probabilité θ/2, ou mute de +(cid:15) avec probabilité θ/2. On cherche à régler les paramètres (N
grand, (cid:15) et θ petits) de manière à obtenir une distribution des traits qui reste concentrée autour
dŠune valeur moyenne du trait, qui elle se déplace de manière aléatoire.
Deux extensions possibles de ce modèle sont les cas i) où le taux de naissance dŠun individu
croît linéairement avec son trait (sélection directionnelle); ii) où les taux de naissance varient
quadratiquement avec le type de manière à atteindre un minimum pour un certain trait donné
(sélection disruptive). Des éléments théoriques pourront être trouvés dans la littérature sur la
dynamique adaptative [1, 2].
Références :
[1] Champagnat, N., Ferrière, R., Méléard S. (2006)
Unifying evolutionary dynamics : from individual stochastic processes to macroscopic models
via timescale separation. Theor. Popul. Biol. 69 297–321.
[2] Champagnat, N., Lambert, A. (2007)
Evolution of discrete populations and the canonical diffusion of adaptive dynamics. Ann. Appl.
Prob. 17 102–155.
2.10 Coalescents avec mutation, le cas des arbres de ramification
Sujet proposé par Amaury Lambert, [email protected]
Onsaitcaractériserlecoalescentdespopulationsbranchantes(tailledepopulationnonconstante)
lorsque les individus se reproduisent indépendamment avec la (même) loi suivante : chaque indi-
vidu a une durée de vie aléatoire durant laquelle il donne naissance à taux constant (processus
de Poisson), à un seul enfant à la fois. LŠarbre coalescent est alors donné par une suite de
9
variables i.i.d. A ,...,A , appelée processus ponctuel de coalescence, tel que le temps de coa-
1 n
lescence entre lŠindividu i et lŠindividu j est le maximum des A , pour i < k ≤ j [L8]. Il existe
k
alors des résultats sur la structure allélique de la population, lorsque le taux de mutation est
constant [L]. On souhaite comparer numériquement les spectres de fréquence (nombre dŠallèles
A (n) porté(e)s par k individus parmi n) entre ce modèle (pour diverses lois des durées de vie)
k
et le modèle de référence de Kingman [K2] (voir cours MAP 563).
On pourra également s’intéresser à la suite décroissante (X (n),...,X (n)) des abondances des
1 k
k allèles les plus abondants dans un échantillon de n individus, et de sa limite lorsque n → ∞.
Une autre possibilité (voire une extension de ce problème) serait de répondre à ces questions
pour des dynamiques de population où les individus interagissent, typiquement via la compé-
tition pour les ressources [L5].
Références :
[K2] Kingman, J.F.C. (1982)
The coalescent. Stochastic Process. Appl. 13(3) 235–248.
[L5] Lambert, A. (2005)
The branching process with logistic growth. Ann. Appl. Prob. 15 1506–1535.
[L8] Lambert, A. (2007)
The contour of splitting trees is a Lévy process. Prépublication arXiv :0704.3098v1.
[L] Lambert, A. (2008)
Allelic partitions for coalescent point processes. Prépublication arXiv arXiv :0804.2572v1.
2.11 Spéciation sur un anneau et coalescent
Sujet proposé par Amaury Lambert, [email protected]
Une métapopulation est un réseau de populations interconnectées. On considère ici une mé-
tapopulation en anneau, c’est-à-dire une série de populations répartie autour d’un obstacle
naturel de grande taille (un lac, un massif montagneux, un canyon, une forêt,...). On suppose
enplusquedemanièrealéatoirelelongdel’anneaudélimitantl’obstacle,desbarrièresémergent
puis disparaissent (variation du niveau des eaux, feux de forêt, présence de prédateurs ou de
pathogènes,...), empêchant le contact entre populations adjacentes. Ce modèle est inspiré de
[GAG] et a pour but de rendre compte d’un phénomène propice à la spéciation c’est-à-dire
l’émergence de nouvelles espèces appelées en l’occurrence « ring species » [IBP01, IBIP05]. Il
est étudié en ce moment dans la continuité de [ACL]. Nous voudrions ici exploiter les méthodes
coalescentes [K], c’est-à-dire l’étude des généalogies dans le sens rétrospectif du temps, pour
connaître l’effet de cette dynamique de la métapopulation sur sa structure génétique lorsque des
mutations surviennent à taux constant (voir EA précédent). Notamment, cette méthode permet
de conditionner l’histoire de la population par rapport à l’état présent de la métapopulation
(emplacement actuel des barrières).
Références :
[ACL] Aguilée, R., Claessen, D., Lambert, A. (2008)
Allele fixation in a dynamic metapopulation : founder effects vs refuge effects. Prépublication.
[GAG] Gavrilets, S., Acton, R., Gravner, J. (2000)
Dynamics of speciation and diversification in a metapopulation. Evolution 54(5) 1493Ű-1501.
[IBP01] Irwin, D.E., Bensch, S., Price, T.D. (2001)
Speciation in a ring. Nature 409 333–337.
10
Description:programmation, à choisir parmi C, C++ et Java, est également . http://hal.archives-ouvertes.fr/docs/00/29/34/22/PDF/agingGW_06_27.pdf et al "Sparse graphical models for exploring gene expression data" (2004) J. Mult alors des résultats sur la structure allélique de la population, lorsque le ta