Séminaires


Retour à la liste de tous les séminaires


Modèle des blocs latents : entre théorie et pratique

Le : 12/01/2015 11h00
Par : Vincent Brault (Agroparistech)
Lieu : I 103
Lien web :
Résumé : Quels mots apparaissent plus dans les œuvres de Charles Baudelaire que dans celles de Victor Hugo ? Les films de science-fiction sont-ils plus proches des films romantiques que ceux d'action ? Utilise-t-on la même partie du cerveau pour apprendre une langue étrangère et les tables de multiplication ? Les armoiries de la ville de Marseille ressemblent-elles plus à celles de Paris qu'à celles de Lyon ? Quels sont les gènes qui réagissent de la même façon suivant différents stress ? Les chiens ont-ils plus de points communs avec les chats qu'avec les loups ? Les politiciens sont-ils tous semblables ? Comment se forment les groupes sur les réseaux sociaux ? Ces quelques questions montrent l'étendue du champ d'applications du modèle des blocs latents. Le principe est de mettre en relation des objets (par exemple des livres, des films...) et des caractéristiques (le nombre de mots, le public...) puis de chercher une structure jointe pour obtenir des groupes. Durant cet exposé, nous commençons par introduire le modèle des blocs latents et les problèmes insolubles reliés à ce dernier comme le calcul en pratique de la log-vraisemblance. Nous abordons ensuite les résultats théoriques récemment obtenus à partir de l'adaptation de l'algorithme Largest Gaps utilisé par Channarond et al. (2012) dans le cadre des modèles de graphes aléatoires. Nous montrons que les estimations renvoyées par l'algorithme sont consistantes en théorie mais trop grossières pour des données réelles. D'un point de vue pratique, nous présentons l'algorithme V-Bayes et l'échantillonneur de Gibbs (Keribin et al., 2014) utilisés pour l'estimation des paramètres du modèle. Afin d'estimer le nombre de classes, nous proposons également une adaptation du critère ICL (Integrated Complete Likelihood) étudié par Biernacki et al. (2000) dans le cadre des modèles de mélange classiques. Enfin, nous appliquons la procédure obtenue sur des données réelles : des blasons mérovingiens Leredde et Perin, 1980) et des votes du parlement américain (Wyse et Friel, 2010).