Généralités ----------- Le recensement de 1996 a été une entreprise complexe et de grande envergure. Bien que l'on ait déployé des efforts considérables pour assurer le respect des normes élevées tout au cours des opérations de la collecte et du traitement, il est inévitable que les estimations résultantes soient entachées d'erreurs. Il faut que les utilisateurs des données du recensement sachent que ces erreurs existent et qu'ils aient une idée générale de ses principales composantes afin d'être en mesure de déterminer si les données produites peuvent leur être utiles et d'évaluer les risques auxquels ils s'exposent en tirant des conclusions ou en prenant des décisions à partir de ces données. Des erreurs peuvent se produire pratiquement à toutes les étapes du recensement, depuis la préparation des documents jusqu'au traitement des données, en passant par l'établissement des listes de logements et la collecte des données. Certaines erreurs, qui surviennent plus ou moins au hasard, ont tendance à s'annuler lorsque les réponses fournies par les divers répondants sont agrégées pour un groupe assez important. Dans le cas des erreurs de cette nature, l'estimation correspondante sera d'autant plus précise que le groupe visé sera grand. C'est pourquoi on conseille aux utilisateurs de faire preuve de prudence lorsqu'ils utilisent des estimations relatives à de petits groupes. Toutefois, certaines erreurs peuvent survenir de façon plus systématique et introduire un «biais» dans les estimations. Comme ce biais persiste quelle que soit la taille du groupe pour lequel les réponses sont agrégées et comme il est particulièrement difficile d'en mesurer l'importance, les erreurs systématiques posent pour la plupart des utilisateurs de données des problèmes plus graves que les erreurs aléatoires mentionnées plus haut. En ce qui concerne les données du recensement en général, les principaux types d'erreur sont les suivants : - les erreurs de couverture qui se produisent lorsqu'on oublie des logements et/ou des personnes, qu'on les englobe à tort ou qu'on les compte deux fois; - les erreurs dues à la non-réponse qui surviennent lorsque l'on n'a pu obtenir de réponses d'un petit nombre de ménages et/ou de personnes en raison d'une absence prolongée ou pour toute autre raison; - les erreurs de réponse qui surviennent lorsque le répondant, ou parfois le recenseur, a mal interprété une question du recensement et a inscrit une mauvaise réponse; - les erreurs de traitement qui peuvent se produire à diverses étapes, notamment au codage, lorsque les réponses en lettres sont converties en codes numériques; à la saisie des données, lorsque les préposés à l'entrée des données transfèrent sur bandes pour ordinateur les réponses figurant au questionnaire du recensement; à l'imputation, lorsqu'une réponse «valide», mais pas nécessairement exacte, est insérée dans un enregistrement par l'ordinateur pour remplacer une réponse manquante ou «invalide» («valide» et «invalide» renvoient à la cohérence de la réponse, compte tenu des autres renseignements compris dans l'enregistrement); - les erreurs d'échantillonnage qui s'appliquent uniquement aux questions supplémentaires figurant dans le questionnaire complet distribué à un échantillon de un cinquième des ménages; elles résultent du fait que les réponses à ces questions, une fois pondérées pour représenter l'ensemble de la population, diffèrent inévitablement des résultats que l'on aurait obtenus si l'on avait posé ces questions à tous les ménages. Les types d'erreur mentionnés plus haut ont tous une composante aléatoire et une composante systématique. Toutefois, la composante systématique de l'erreur d'échantillonnage est d'ordinaire très petite comparativement à sa composante aléatoire. Dans le cas des autres erreurs non dues à l'échantillonnage, tant la composante aléatoire que la composante systématique peuvent être importantes.