Imputation par la méthode du plus proche voisin et la méthode "hot deck"
Auteur : John Kovar
Date de publication : 1982
Éditeur : Statistique Canada, Division des méthodes d'enquête-institutions et agriculture
Nombre de pages : 22
Résumé du livre
Cette étude présente une comparaison empirique de l'imputation par la méthode du plus proche voisin et la méthode dite du "hot deck" dans les cas de non-réponse partielle à une enquête sur l'agriculture. Le lecteur peut trouver une description et une comparaison théorique de ces deux techniques d'imputation dans un document précédent du même auteur (Kovar, 1981). On compare ici l'imputation par la méthode du plus proche voisin et la méthode du "hot deck" à partir des données de l'EEA (enquête sur les exploitations agricoles) de 1981. Les données de trois sections du questionnaire, qui portaient sur les dépenses, ont été converties au hasard en éléments de non-réponse dans vingt pour cent de tous les enregistrements de la Saskatchewan. Le fichier "brut" ainsi créé a ensuite été "épuré" à l'aide des deux techniques d'imputation susmentionnées et traité par les programmes existants de totalisation et de repérage des "quarante plus grandes valeurs qui entrent dans le calcul d'un estimé". Les résultats ne révèlent presqu'aucune différence entre les estimés, quoique, en général, la méthode du "hot deck" surévalue très légèrement les "vraies" valeurs (estimées avec les données du fichier original), les CV estimés par la méthode du "hot deck" sont supérieurs ou égaux aux estimés produits à l'aide de la méthode du plus proche voisin. (Dans l'ensemble, la technique du "hot deck" semble créer plus de valeurs extrêmes que la méthode du plus proche voisin.