Erreurs d'échantillonnage ------------------------- Les estimations obtenues en pondérant les réponses recueillies auprès d'un échantillon sont susceptibles d'être entachées d'erreurs en raison de la répartition des caractéristiques au sein de l'échantillon, qui n'est généralement pas identique à la répartition correspondante au sein de la population dans laquelle l'échantillon a été prélevé. L'erreur susceptible d'être introduite par l'échantillonnage variera en fonction de la rareté relative de la caractéristique étudiée au sein de la population. Lorsque la valeur contenue dans la case est élevée, cette erreur sera relativement faible proportionnellement à cette valeur. Lorsque la valeur contenue dans la case est faible, cette erreur sera relativement importante proportionnellement à cette valeur. L'erreur susceptible d'être introduite par l'échantillonnage est d'ordinaire exprimée sous forme d'«erreur type». Il s'agit de la racine carrée de la moyenne, calculée pour l'ensemble des échantillons de même taille prélevés selon le même plan d'échantillonnage, des carrés de l'écart de l'estimation obtenue à partir de l'échantillon par rapport à la valeur pour l'ensemble de la population. Le tableau ci-dessous fournit des mesures approximatives de l'erreur type due à l'échantillonnage. Ces mesures sont données uniquement à titre indicatif. Tableau: Erreur type approximative due à l'échantillonnage pour les données-échantillon du recensement de 1996 Valeur contenue dans la case Erreur type approximative 50 ou moins 15 100 20 200 30 500 45 1 000 65 2 000 90 5 000 140 10 000 200 20 000 280 50 000 450 100 000 630 500 000 1 400 Les utilisateurs souhaitant déterminer l'erreur d'échantillonnage approximative pour une case de données dont la valeur a été obtenue à partir de l'échantillon de 20 % doivent choisir l'erreur type correspondant à l'entrée dans la colonne «Valeur contenue dans la case» ci-dessus qui se rapproche le plus de celle qui figure dans la case de données de la totalisation en cause. En utilisant la valeur ainsi obtenue pour l'erreur type, l'utilisateur peut, en général et à juste titre, être certain que la valeur réelle pour la population dénombrée (ne tenant pas compte des formes d'erreur autres que l'erreur d'échantillonnage) ne s'écarte pas de la valeur contenue dans la case dans une proportion supérieure ou inférieure à trois fois l'erreur type (p. ex., si la valeur contenue dans la case est 1 000, la fourchette à l'intérieur de laquelle se situe la valeur réelle serait de 1 000 ± (3 x 65) ou de 1 000 ± 195). Les erreurs types données dans le tableau ci-dessus ne s'appliquent pas aux totaux ou aux totaux partiels relatifs à la population ou aux univers (personnes, ménages, logements ou familles) pour la région géographique étudiée (voir Échantillonnage et pondération). On peut déterminer l'effet de l'échantillonnage pour ces valeurs en les comparant à celles des publications correspondantes contenant des données intégrales. Il est à noter que l'effet du plan d'échantillonnage et de la méthode de pondération utilisés dans le cadre du recensement de 1996 variera d'une caractéristique à l'autre et d'une région géographique à l'autre. Il est donc possible que les valeurs de l'erreur type données dans le tableau ci-dessus sous-estiment ou surestiment l'erreur attribuable à l'échantillonnage.