Séminaires


Retour à la liste de tous les séminaires


Sélection de variables en classification non-supervisée sans estimation de paramètres

Le : 16/03/2015 11h00
Par : Mathieu Marbac (Inserm)
Lieu : I 103
Lien web :
Résumé : Nous commencerons par rappeler le problème de la sélection de variables en classification non supervisée, en nous focalisant principalement sur les approches probabilistes. Celles-ci cherchent à maximiser un critère d'information classique (BIC, ICL) pour répondre à cette problématique de choix de modèle. Cependant, les procédures d'optimisation inhérentes à ces critères sont souvent complexes et chronophages. Ainsi, nous introduirons le critère MICL (Maximum Integrated Complete-data Likelihood) qui est basé sur la forme explicite de la vraisemblance complétée intégrée. Ce critère ne nécessite pas l'estimation des paramètres, ce qui permet de mettre en place une procédure d'optimisation très simple pour la sélection de modèle. Ses propriétés, notamment celles de consistance et de robustesse, restent similaires à celles du critère ICL. L'apport du critère MICL est illustré sur différents jeux de données réelles.