Modélisation hiérarchique Bayésienne pour l'écologie
TYPE DE FORMATION : Ouverte - module de formation initiale de niveau master ouvert aux professionnels
Contexte
Les modèles statistiques hiérarchiques et en particulier les modèles hiérarchiques bayésiens sont devenus des outils absolument incontournables de la modélisation statistique et en particulier en écologie. Au cours de cette formation, nous rappellerons les principes de la modélisation hiérarchique et de l'inférence bayésienne. Le cours sera aussi l’occasion de présenter les méthodes de simulation de Monte Carlo (MCMC) largement mobilisées pour l’estimation des distributions Bayésiennes a posteriori. Une part importante du cours sera consacrée à la manipulation pratique de modèle sous forme de démonstration et de travaux pratiques. Le cours s'appuiera largement sur le langage de programmation BUGS qui est le plus couramment utilisé pour la modélisation hiérarchique bayésienne.
Cette formation (niveau M2) de la spécialisation d’ingénieur/Master Sciences halieutiques et aquacoles est ouverte aux professionnels au titre de la formation continue.
Objectifs
- Comprendre les principaux concepts et méthodes de la modélisation statistique hiérarchique, et de l’analyse statistique Bayésienne et son positionnement par rapport au cadre statistique classique « fréquentiste » pour l’écologie statistique.
- Comprendre les méthodes de calcul des distributions a posteriori, notamment les méthodes d’estimation par simulation de Monte Carlo, et manipulation des logiciels dédiés (BUGS, JAGS, NIMBLE, STAN).
- Savoir les appliquer dans le contexte de la modélisation statistique en écologie
Programme
La formation s’appuie à part égale 50/50 sur des apports théoriques sous forme de cours et de manipulations pratiques sous forme de travaux dirigés.
• Cours
Concepts de la modélisation statistique hiérarchique (effets aléatoires, variables latentes…)
Introduction aux concepts de l’analyse statistique Bayésienne. Positionnement dans la démarche de modélisation et d’inférence statistique, positionnement par rapport au cadre statistique classique « fréquentiste »
Intérêt de ce cadre pour la modélisation statistique, l’inférence et la prédiction dans les sciences de l’environnement.
- Utilisation des distributions de probabilité pour modéliser les incertitudes sur les inconnues d’un modèle
- Mise à jour des distributions de probabilité a priori => a posteriori : la formule de Bayes
- L’utilisation de l’information a priori : bien choisir et construire la loi a priori
- Applications à la quantification des incertitudes et à l’analyse des risques.
Estimations des distributions a posteriori par les méthodes de simulations de Monte Carlo (MCMC)
• TD
Une large part du temps sera consacrée aux applications et à la mise en pratique (incluant la manipulation de logiciels spécifiques de calcul bayésien) à partir d’exemples classiques de l’écologie quantitative.
- Introduction aux méthodes de MCMC
- Programmation JAGS et Nimble
- Modèle Beta-Binomial - Estimation des effectifs par méthodes de capture-marquage-recapture.
- Construction et manipulation de modèles hiérarchiques
- Modèles dynamiques à espace d’état (state-space models)
Responsable(s)
Etienne RIVOT
Public concerné
Doctorants, post-doctorants, chercheur, ingénieur en écologie numérique
Pré-requis
Le cours suppose une connaissance de base de :
- la théorie des probabilités (variables aléatoires, distributions)
- des modèles statistiques courants (théorie de la vraisemblance, modèle de régression)
Aucune expérience requise des méthodes bayésiennes et du langage BUGS
Durée
4.0 jour(s) 28 heure(s)
Informations particulières
Les participants sont vivement encouragés à venir avec leur propre ordinateur portable disposant des logiciels R et Rtools pré-installés.
Des ressources utiles pour approfondir les notions abordées sont présentées dans l’ouvrage « Introduction to Bayesian Hierarchical Modeling fo Ecological Data » (http://www.hbm-for-ecology.org/)
Session(s)
Date à définir