Pascal Ardilly

Estimation sur petits domaines : un aperçu des principales méthodes

Résumé

Lorsqu'on souhaite estimer des paramètres définis sur des populations de petite taille à partir de données d'enquête par sondage, on se trouve confronté au problème de la médiocre qualité des estimations issues des méthodes classiques. C'est une conséquence mécanique de la faible taille de l'échantillon qui recoupe ces populations (appelées "domaines"). Pour améliorer la précision des estimations, il est alors nécessaire d'utiliser de l'information auxiliaire obtenue à partir de sources exhaustives. On dispose ainsi d'un ensemble de méthodes d'estimation dites "sur petits domaines", qui sont structurées par la façon dont on exploite l'information auxiliaire et que l'on peut classer en trois catégories. Une première approche, qui relève des pratiques classiques, est celle du redressement (dit aussi calage) sur une batterie de variables auxiliaires connues sur l'ensemble des individus du petit domaine. Une seconde classe de méthodes s'appuie sur des hypothèses de nature descriptive : on assimile un comportement moyen local (dans le petit domaine) à un comportement moyen global (dans la population complète). Une troisième approche repose sur une modélisation stochastique des comportements, l'unité modélisée étant soit l'individu composant la population, soit le paramètre d'intérêt défini sur le petit domaine : mobilisant une information auxiliaire bien explicative et disponible sur l'ensemble de la population, on estime les paramètres du modèle à partir de l'échantillon global et on forme un estimateur local qui s'appuie sur ces paramètres estimés. Ainsi, on bénéficie d'une grande stabilité des estimateurs locaux.