Séminaires


Retour à la liste de tous les séminaires


Estimation Adaptative robuste en régression hétéroscédastique avec design et bruit inconnus.

Le : 10/09/2012 10h00
Par : Michaël Chichignoud (ETH Zurich)
Lieu : I 103
Lien web :
Résumé : Nous étudions le modèle de régression hétéroscédastique avec design aléatoire et bruit symétrique. Dans notre cas, les densités du design et du bruit sont inconnues pour le statisticien, ainsi que le niveau de bruit. Notons que nous ne supposons aucune condition de moment sur le bruit. Nous nous intéressons plus particulièrement à l'estimation ponctuelle de la fonction de régression. Notre estimateur est un M-estimateur construit à partir de l'approche polynomiale locale. Cet estimateur est noté fhp où h est appelé fenêtre d'estimation et p est la fonction de perte qui permet de construire le contrast empirique à minimiser. Il est clair que si le bruit ne possède pas de moment d'ordre deux, la fonction de perte quadratique p(z) = z2 ne convient pas pour ce problème. On privilégiera la fonction valeur absolue ou la fonction de Huber (Huber 1964) ou bien toute fonction de perte deux fois dérivable, à dérivée bornée et strict. convexe au voisinage de 0. La première question à laquelle nous répondons est : Peut-on améliorer la performance de notre estimateur avec un choix judicieux de p où est un espace de fonctions de perte d'entropie finie pour une certaine distance (par exemple l'espace des fonctions de Huber indéxées par l'échelle). Cette question est très intéressante pour les praticiens. Par exemple, dans le domaine du débruitage (reconstruction) d'image, la robustesse du contrast doit être calibrée en fonction de l'homogénéité locale (niveau de bruit) de l'image. Huber (1964) a répondu positivement à cette question avec le critère appelé Variance asymptotique des M-estimateurs. Avec des outils "modernes" (comme les inégalités de concentration Talagrand (1995)), nous proposons un nouveau critère non-asymptotique (minimization de la borne supérieure du risque). Le problème, qui suit, est que la fonction de perte optimale p* dépend de la distribution des observations, inconnue en pratique. Pour y remédier, nous construisons un estimateur de la borne supérieure du risque dont le minimiseur est noté p. Par Plug-in, nous démontrons que l'estimateur fhp est optimal (i.e. minimax au sens de Huber (1964)). De plus, cet estimateur est adaptatif par rapport au niveau bruit et à la distribution. Deuxièmement, on s'intéresse à l'adaptation par rapport à la régularité de la fonction de régression. Pour cela, on utilise la procédure de Lepski (Lepski et al. 1997) pour sélectionner la fenêtre. Ce qui nous permet d'obtenir un estimateur fhp qui est adaptatif optimal simultanément par rapport à la régularité de la fonction de régression, au niveau bruit et à la distribution.