Mathématiques et informatique appliquées - Paris - MIA-Paris
11 février 2022UMR 518 AgroParisTech, INRAE, Université Paris-Saclay
Orientation scientifique générale
L’unité Mia-Paris regroupe des statisticien.ne.s et des informaticien.ne.s spécialisé.e.s dans la modélisation et l’apprentissage statistique et informatique pour la biologie, l’écologie, l’environnement, l’agronomie et l’agro-alimentaire. Leurs compétences portent sur les méthodes d’inférences statistiques (modélisation staochastique stochastique, modèles à variables latentes, inférence bayésienne, apprentissage, sélection de modèle…), et algorithmiques (généralisation, transfert de domaine, représentation des connaissances). L’unité développe des méthodes statistiques et informatiques originales génériques ou motivées par des problèmes précis en science du vivant. Ses activités s’appuient sur une bonne culture dans les disciplines destinatrices : agronomie, agroalimentaire, biologie moléculaire, biologie des systèmes, écologie, environnement.
Champs de recherche
L’unité est structurée en trois équipes de recherche :
- Étudier les risques climatiques, écologiques, environnementaux et développer des méthodes statistiques permettant d’aborder ces domaines où les données et leurs structures sont de plus en plus complexes.
- Thèmes de recherche : statistiques spatiales et spatio-temporelles (modèles hiérarchiques bayésiens, processus ponctuels, simulations conditionnelles de processus), extrêmes multivariés et spatialisés, expériences numériques, propagation d’incertitude et théorie de la décision bayésienne, analyse et inférence de graphes aléatoires, modélisation des trajectoires.
- Développer et diffuser des méthodes statistiques de modélisation et d’apprentissage pour l’analyse de données issues de la (meta)génomique, génétique ou métabolomique.
- Thèmes de recherche : analyse et inférence de réseaux, modélisation et statistique des données de grande dimension, segmentation et séries temporelles, apprentissage supervisé (classification, régression) et non-supervisée (réduction de dimension, clustering).
- Permettre l’exploitation de données issues de sources multiples et hétérogènes voire en flux en s’appuyant sur le choix éclairé de représentations sémantiques partagées et multi-échelles, pour contribuer à l’enrichissement des connaissances expertes et ceci dans le champ des sciences de l’alimentation et du vivant.
- Thèmes de recherche : modélisation et analyse de données hétérogènes multisources, multi-expertise humaine et machine (prise en compte de la sémantique), méthodes d’apprentissage collaboratives et incrémentale, optimisation combinatoire, représentation et intégration des données et connaissances sur le Web sémantique et le Web de données liées, apprentissage de modèles probabilistes, étude de la causalité.