Séminaires


Retour à la liste de tous les séminaires


Sélection de variables en grande dimension dans les modèles linéaires et linéaires mixtes

Le : 18/02/2013 10h00
Par : Florian ROHART (Université Paul Sabatier)
Lieu : I 103
Lien web :
Résumé : On propose une nouvelle méthode de sélection de variables dans le cadre du modèle linéaire basée sur des tests d'hypothèses multiples. Cette méthode possède des résultats non asymptotiques de puissance sous certaines conditions sur le signal. Les simulations montrent de très bons résultats en termes de sélection de variables en grande dimension, avec des variables indépendantes ou corrélées. On s'intéresse par la suite au problème de sélection de variables dans les modèles linéaires mixtes. Un nouvel algorithme de type multicycle ECM est développé et il s'avère beaucoup plus rapide que les algorithmes existants qui ont le même objectif. Grâce à sa décomposition en étapes distinctes, l'algorithme peut être combiné à toutes les méthodes de sélection de variables développées pour le modèle linéaire classique. Toutefois, les résultats de convergence dépendent de la méthode utilisée. On montre que la combinaison de cet algorithme avec la procédure de tests multiples donne de très bons résultats empiriques. Toutes ces méthodes sont appliquées à un jeu de données réelles dans le but de prédire des phénotypes d'intérêt pour la production porcine sur la base de données métabolomiques et surtout de mettre en évidence des relations biologiques.