Version PDF | Table des matières | Suivant
La présente annexe résume la méthode utilisée pour mener l’ECÉSCI 2008.
Statistique Canada, en partenariat avec Ressources naturelles Canada, a mené l’ECÉSCI 2008 en vue de recueillir des renseignements détaillés sur la demande d'énergie et les habitudes de consommation des entreprises, des organismes et des établissements canadiens. L’enquête a permis de recueillir des données sur les sources et les quantités d’énergie (notamment l’électricité et le gaz naturel) utilisées par les petits, les moyens et les grands établissements, organismes et entreprises au Canada.
Dans les cas où il était indiqué que le propriétaire payait une partie ou la totalité des factures d’énergie, on a demandé à ce dernier de fournir des renseignements supplémentaires sur la consommation d’énergie.
La population cible et visée par l’enquête sur les établissements commerciaux était toutes les entreprises qui avaient au moins un employé, qui étaient situées dans un endroit autre qu’une résidence privée et qui faisaient partie des catégories SCIAN choisies. Les catégories SCIAN préétablies pour les établissements commerciaux sont énumérées dans la sous-section sur la création de la base de sondage dans le tableau 1 (industries 1 à 14 ainsi que 1918 et 20).
La population cible pour les établissements inclut les hôpitaux et les écoles (écoles primaires, écoles secondaires, collèges et universités). Pour les collèges et les universités, la population de l’enquête excluait les types d’écoles suivants : Premie`res nations et Métis, formation directe du gouvernement, formation en apprentissage, consortium et éducation des adultes dans les conseils scolaires. Pour les écoles primaires et secondaires, la population de l’enquête excluait les types d’écoles suivants : écoles autochtones, éducation à distance (écoles virtuelles/études par correspondance) et écoles à la maison.
La population cible exclut les établissements situés dans les territoires.
La base de sondage a été créée en février 2009 à partir de quatre listes mutuellement exclusives. La première liste comprend les collèges, les cégeps et les universités, alors que la seconde inclut les hôpitaux. La troisième liste comprend les écoles primaires et secondaires (privées et publiques), alors que la quatrième est tirée du Registre des entreprises (RE) et repose sur une liste des catégories du SCIAN données au tableau 1 qui inclut les industries 1 à 14 ainsi que 19 et 20. Toutes les unités tirées du RE sont à l’échelle des établissements. Dans le tableau 1, outre les catégories du SCIAN sélectionnées du RE, les catégories du SCIAN équivalentes pour les unités provenant de listes autres que le RE sont fournies.
| Numéro de l’industrie | Nom de l’industrie | SCIAN |
|---|---|---|
| 1 | Commerce de gros | 41 |
| 2 | Services postaux (491), messageries et services de messagers (492), entreposage (493) | 49 |
| 3 | Commerce de détail | 44 (sauf 445) et 45 |
| 4 | Magasins d’alimentation | 445 |
| 5 | Industrie de l’information et industrie culturelle | 51 |
| 6 | Finance et assurances; services immobiliers et services de location et de location à bail; services professionnels, scientifiques et techniques | 52, 53 and 54 |
| 7 | Services de soins ambulatoires | 621 |
| 8 | Soins infirmiers et soins pour bénéficiaires internes | 623 |
| 9 | Assistance sociale | 624 |
| 10 | Arts, spectacles et loisirs | 71 |
| 11 | Services d’hébergement | 721 |
| 12 | Services de restauration et débits de boissons | 722 |
| 13 | Autres services (sauf l’administration publique) | 81 (sauf 813110) |
| 14 | Administration publique | 91 |
| 15 | Collèges et cégeps | 6112 (de la liste) |
| 16 | Universités | 6113 (de la liste) |
| 17 | Hôpitaux | 622 (de la liste) |
| 18 | Écoles primaires et secondaires | 6111 (base tirée de Culture, tourisme et Centre de la statistique de l’éducation) |
| 19 | Organismes religieux | 813110 |
| 20 | Écoles de commerce et de formation en informatique et en gestion, écoles techniques et écoles de métiers, autres établissements d’enseignement et de formation, services de soutien à l’enseignement | 6114, 6115, 6116, 6117 |
Le tableau suivant présente la ventilation de la population par industrie.
| Numéro de l’industrie | Population |
|---|---|
| 1 | 61 993 |
| 2 | 5 248 |
| 3 | 107 474 |
| 4 | 23 615 |
| 5 | 13 169 |
| 6 | 193 909 |
| 7 | 61 043 |
| 8 | 6 909 |
| 9 | 17 104 |
| 10 | 17 068 |
| 11 | 10 435 |
| 12 | 62 117 |
| 13 | 111 338 |
| 14 | 7 542 |
| 15 | 2 396 |
| 16 | 292 |
| 17 | 700 |
| 18 | 16 218 |
| 19 | 14 838 |
| 20 | 9 079 |
| Total | 742 487 |
L’ECÉSCI 2008 consiste en une enquête par sondage. Statistique Canada a utilisé un plan d’échantillonnage stratifié à l’échelle régionale reposant sur l’industrie; la taille de l’échantillon final était de 9 511 unités. Un échantillon aléatoire simple a été sélectionné pour chaque strate. Le tableau suivant présente la taille des échantillons dans chaque industrie.
| Numéro de l'industrie | Taille de l'échantillon |
|---|---|
| 1 | 632 |
| 2 | 358 |
| 3 | 577 |
| 4 | 463 |
| 5 | 467 |
| 6 | 654 |
| 7 | 611 |
| 8 | 367 |
| 9 | 560 |
| 10 | 568 |
| 11 | 508 |
| 12 | 597 |
| 13 | 639 |
| 14 | 271 |
| 15 | 281 |
| 16 | 202 |
| 17 | 259 |
| 18 | 336 |
| 19 | 562 |
| 20 | 599 |
| Total | 9 511 |
On a d’abord communiqué par téléphone avec les établissements afin d’établir que les unités étaient bien dans le champ de l’enquête et de confirmer l’adresse postale. On a ensuite envoyé par la poste un questionnaire à remplir qui devait être retourné également par la poste. On trouve au tableau 4 la ventilation de l’échantillon selon le code-réponse final.
| Description | Fréquence |
|---|---|
| Complet | 3 342 |
| Rapport combiné | 5 |
| Reçu mais inutilisable | 772 |
| Partiel | 1 |
| Temporairement inactif | 26 |
| Refus | 1 204 |
| Aucune réponse à la date de clôture de la période de collecte de données | 851 |
| Trop tard pour mettre le questionnaire à la poste | 1 |
| Impossible de joindre le répondant | 32 |
| Entreprise fermée | 270 |
| Répondant introuvable | 2 164 |
| Changement de propriétaire | 14 |
| Fusion | 6 |
| Questionnaire reçu en double | 21 |
| Hors du champ de l’enquête | 784 |
| Aucune réponse de l’agent de l’activité spécialisée | 18 |
| Total | 9 511 |
Le taux de réponse calculé est le taux de réponse à l’étape de l’estimation. Il est calculé à l’aide de la formule suivante :
| Taux de réponse = | Nbre d’unités utilisables qui ont répondu |
| (en totalité ou partiellement) | |
| Nbre d’unités résolues en contexte + Nbre | |
| estimatif d’unités non résolues en contexte |
Dans le cadre de l'enquête 2008, il était obligatoire de répondre aux questions sur la surface de plancher et la consommation d'énergie totale. Si un répondant ne répondait pas à ces deux questions ou s'il y avait une erreur évidente dans la réponse à l'une de ces deux questions, on considérait qu'il s'agissait d'une unité sans réponse (après avoir essayé à plusieurs reprises d'obtenir des réponses valides du répondant à ces deux questions). Cette façon de répondre à ces deux questions permettait de calculer l'intensité énergétique de l'unité. En outre, on estimait que la précision des valeurs imputées à ces questions serait douteuse. Par conséquent, on estimait que cette approche était préférable à l’imputation.
La vérification a été effectuée pour toutes les variables demandées dans le questionnaire principal. Par ailleurs, un examen des percentiles les plus élevés des unités (un, deux ou cinq percentiles) reposant sur certaines variables (comme la surface de plancher) a également été effectué afin de relever les données discordantes ou influentes.
Après l’étape de la vérification, on a imputé des valeurs pour les variables dont les valeurs étaient manquantes. La méthode utilisée pour remplacer les valeurs manquantes était la technique d’imputation du donneur par le plus proche voisin. Les groupes donneurs pour chaque question ont été créés en utilisant au moins un des critères de variables suivants selon la nature des données à saisir :
Les groupes donneurs étaient d’abord formés à l’aide des critères de variables ci-dessus qui avaient trait à la question à répondre. Si certains receveurs ne trouvaient pas de donneurs à l’aide des critères de variables sélectionnés (en raison d’un manque de donneurs adéquats dans le groupe), alors un ou plusieurs des critères de variables sélectionnés (en commençant par la variable la moins importante) étaient abandonnés afin de trouver un donneur.
Signalons que pour toutes les questions, le type d’industrie et la région étaient utilisés au départ pour former les groupes donneurs.
Une fois les groupes donneurs formés, les receveurs étaient souvent mis en correspondance avec les donneurs du groupe à l’aide de l’un des champs de correspondance suivants (encore une fois selon la nature des données à saisir) :
Si on ne pouvait pas trouver un donneur après trois exécutions pour la source d’énergie utilisée pour chauffer l’eau ou climatiser les pièces, on imputait alors comme source principale le type d’énergie dont la consommation était la plus élevée.
Aucune imputation n’a été faite pour les questions obligatoires. Si l’une des questions n’avait pas de réponse, ces unités étaient alors considérées comme non répondantes. En outre, aucune imputation n’a été effectuée pour la question sur la cogénération puisque cette dernière ne visait pas à établir le pourcentage global des établissements dotés d’un système de cogénération, mais à relever les utilisateurs qui possédaient ce système.
Pondération
La pondération a été effectuée à l’aide de l’approche des poids normalisés Horvitz-Thompson pour l’échantillon aléatoire simple stratifié. Selon cette approche, le poids initial pour l’unité i (dans la strate h) est obtenu par :
où Nh est la taille de la population pour la strate h et nh est la taille de l’échantillon pour la strate h.
Ajustement pour l’absence totale de réponse
Dans la mesure du possible, une repondération a été effectuée à l’échelle des strates (groupes d’industries, de régions et de tailles) afin de tenir compte de l’absence de réponse. Dans les cas où il n’y avait pas suffisamment de réponses dans une strate, la strate était combinée à une strate similaire afin d’apporter un ajustement pour l’absence de réponse. Pour le processus de repondération, les poids des unités répondantes, hors champ et retirées des affaires ont été accrus afin de tenir compte des unités sans réponse de sorte que la somme des poids pour ces trois catégories (à l’exception des unités sans réponse) corresponde à la population totale. Ainsi, l’ajustement pour l’absence de réponse pour l’unité i dans le groupe sans réponse g est obtenu par :
où la série sr inclut toutes les unités répondantes, hors champ et retirées des affaires de l’échantillon.
Les coefficients de variation, qui indiquent la fiabilité des données, sont utilisés pour déterminer quelles estimations peuvent être publiées. Les estimations dont le coefficient de variation dépasse 40 p. 100 ne sont pas jugées assez fiables pour être publiées. De plus, il importe de souligner que les coefficients de variation ne tiennent pas compte du fait que certaines données ont été imputées. Le tableau 5 décrit les différents indicateurs utilisés pour évaluer la qualité des estimations.
| Coefficient de variation |
Indicateur de qualité |
Qualité de l’estimation |
|---|---|---|
| 20 p. 100 ou moins | A | Très bonne |
| De 21 à 30 p. 100 | B | Acceptable |
| De 31 à 40 p. 100 | C | À utiliser avec prudence |
| Plus de 40 p. 100 | F | Trop peu fiable pour être publiée |
Un indicateur de qualité « F » est aussi utilisé lorsque les données sont supprimées pour des raisons de confidentialité.
18 Pour l’industrie 19 (organismes religieux), il n’y a pas d’exigences relativement au nombre d’employés. Par conséquent, les organismes religieux sans employé étaient inclus.