Séminaires


Retour à la liste de tous les séminaires


Imputation multiple par ACP Bayésienne

Le : 22/09/2014 11h00
Par : Julie Josse (Rennes, Agrocampus)
Lieu : I 103
Lien web :
Résumé : Les données manquantes constituent un problème incontournable dans la pratique de la statistique. Une solution commune consiste à remplacer chacune d'entre elles par une valeur plausible. On parle d'imputation simple. Néanmoins appliquer une méthode statistique sur un tableau imputé simplement pose un problème majeur : les données imputées jouent le même rôle que les données observées alors qu'elles sont incertaines. Pour rendre compte de cette incertitude, on peut proposer plusieurs imputations pour chaque donnée manquante. On parle alors d'imputation multiple. L'objet de cette présentation est de proposer une méthode d'imputation multiple basée sur un modèle d'analyse en composantes principales (ACP). L'emploi d'un traitement Bayésien pour les paramètres du modèle d'ACP va permettre de disposer d'une distribution sur ces paramètres et ainsi de refléter l'incertitude sur les paramètres du modèle d'imputation. Nous comparerons cette méthode aux deux références : l'imputation multiple par équations enchaînées, et l'imputation reposant sur l'hypothèse d'une distribution jointe à l'ensemble des données.