Séminaires


Retour à la liste de tous les séminaires


Construction d'estimateurs PAC-bayésiens par MCMC : le cas de la grande dimension

Le : 04/11/2013 11h00
Par : Benjamin Guedj (Université Pierre et Marie Curie)
Lieu : I 103
Lien web :
Résumé : La théorie statistique de l'agrégation a motivé de très nombreux travaux depuis sa formalisation à la fin des années 1990 : parmi ceux-ci, la théorie PAC-bayésienne est aujourd'hui bien établie, et fournit de puissantes stratégies d'estimation en classification et régression. Parallèlement à ces avancées, nous entrons chaque jour un peu plus dans l'ère de ce que l'on nomme "big data" : les volumes et dimensions des données augmentent avec les progrès constants de l'outil informatique, et leur traitement devient une véritable gageure algorithmique. Les résultats présentés dans cet exposé visent à étendre les techniques PAC-bayésiennes au cas des modèles de régression additif et logistique en grande dimension, et à en fournir une implémentation par méthodes MCMC. Nos résultats théoriques consistent en des inégalités oracles démontrant l'optimalité au sens minimax (à un facteur logarithmique près) de notre approche. L'algorithme que nous proposons est implémenté dans le package R /pacbpred/, dont les performances sur données synthétiques seront commentées.