Ressources naturelles Canada
Symbole du gouvernement du Canada

Liens de la barre de menu commune

Liens de l'Office de l'efficacité énergétique

 

L'Office de l'efficacité énergétique

Menu

Enquête sur la consommation d'énergie du secteur commercial et institutionnel 2008, Sommaire

Version PDF | Table des matières | Suivant

Annexe B – Méthode

La présente annexe résume la méthode utilisée pour mener l’ECÉSCI 2008.

Contexte

Statistique Canada, en partenariat avec Ressources naturelles Canada, a mené l’ECÉSCI 2008 en vue de recueillir des renseignements détaillés sur la demande d'énergie et les habitudes de consommation des entreprises, des organismes et des établissements canadiens. L’enquête a permis de recueillir des données sur les sources et les quantités d’énergie (notamment l’électricité et le gaz naturel) utilisées par les petits, les moyens et les grands établissements, organismes et entreprises au Canada.

Dans les cas où il était indiqué que le propriétaire payait une partie ou la totalité des factures d’énergie, on a demandé à ce dernier de fournir des renseignements supplémentaires sur la consommation d’énergie.

Population cible

La population cible et visée par l’enquête sur les établissements commerciaux était toutes les entreprises qui avaient au moins un employé, qui étaient situées dans un endroit autre qu’une résidence privée et qui faisaient partie des catégories SCIAN choisies. Les catégories SCIAN préétablies pour les établissements commerciaux sont énumérées dans la sous-section sur la création de la base de sondage dans le tableau 1 (industries 1 à 14 ainsi que 1918 et 20).

La population cible pour les établissements inclut les hôpitaux et les écoles (écoles primaires, écoles secondaires, collèges et universités). Pour les collèges et les universités, la population de l’enquête excluait les types d’écoles suivants : Premie`res nations et Métis, formation directe du gouvernement, formation en apprentissage, consortium et éducation des adultes dans les conseils scolaires. Pour les écoles primaires et secondaires, la population de l’enquête excluait les types d’écoles suivants : écoles autochtones, éducation à distance (écoles virtuelles/études par correspondance) et écoles à la maison.

La population cible exclut les établissements situés dans les territoires.

Base de sondage

La base de sondage a été créée en février 2009 à partir de quatre listes mutuellement exclusives. La première liste comprend les collèges, les cégeps et les universités, alors que la seconde inclut les hôpitaux. La troisième liste comprend les écoles primaires et secondaires (privées et publiques), alors que la quatrième est tirée du Registre des entreprises (RE) et repose sur une liste des catégories du SCIAN données au tableau 1 qui inclut les industries 1 à 14 ainsi que 19 et 20. Toutes les unités tirées du RE sont à l’échelle des établissements. Dans le tableau 1, outre les catégories du SCIAN sélectionnées du RE, les catégories du SCIAN équivalentes pour les unités provenant de listes autres que le RE sont fournies.

Tableau 1 Description de la base
Numéro de l’industrie Nom de l’industrie SCIAN
1 Commerce de gros 41
2 Services postaux (491), messageries et services de messagers (492), entreposage (493) 49
3 Commerce de détail 44 (sauf 445) et 45
4 Magasins d’alimentation 445
5 Industrie de l’information et industrie culturelle 51
6 Finance et assurances; services immobiliers et services de location et de location à bail; services professionnels, scientifiques et techniques 52, 53 and 54
7 Services de soins ambulatoires 621
8 Soins infirmiers et soins pour bénéficiaires internes 623
9 Assistance sociale 624
10 Arts, spectacles et loisirs 71
11 Services d’hébergement 721
12 Services de restauration et débits de boissons 722
13 Autres services (sauf l’administration publique) 81 (sauf 813110)
14 Administration publique 91
15 Collèges et cégeps 6112 (de la liste)
16 Universités 6113 (de la liste)
17 Hôpitaux 622 (de la liste)
18 Écoles primaires et secondaires 6111 (base tirée de Culture, tourisme et Centre de la statistique de l’éducation)
19 Organismes religieux 813110
20 Écoles de commerce et de formation en informatique et en gestion, écoles techniques et écoles de métiers, autres établissements d’enseignement et de formation, services de soutien à l’enseignement 6114, 6115, 6116, 6117

Le tableau suivant présente la ventilation de la population par industrie.

Tableau 2 Ventilation de la population par industrie
Numéro de l’industrie Population
1 61 993
2 5 248
3 107 474
4 23 615
5 13 169
6 193 909
7 61 043
8 6 909
9 17 104
10 17 068
11 10 435
12 62 117
13 111 338
14 7 542
15 2 396
16 292
17 700
18 16 218
19 14 838
20 9 079
Total 742 487

Échantillonnage

L’ECÉSCI 2008 consiste en une enquête par sondage. Statistique Canada a utilisé un plan d’échantillonnage stratifié à l’échelle régionale reposant sur l’industrie; la taille de l’échantillon final était de 9 511 unités. Un échantillon aléatoire simple a été sélectionné pour chaque strate. Le tableau suivant présente la taille des échantillons dans chaque industrie.

Tableau 3 Taille de l'échantillon par industrie
Numéro de l'industrie Taille de l'échantillon
1 632
2 358
3 577
4 463
5 467
6 654
7 611
8 367
9 560
10 568
11 508
12 597
13 639
14 271
15 281
16 202
17 259
18 336
19 562
20 599
Total            9 511

Collecte des données

On a d’abord communiqué par téléphone avec les établissements afin d’établir que les unités étaient bien dans le champ de l’enquête et de confirmer l’adresse postale. On a ensuite envoyé par la poste un questionnaire à remplir qui devait être retourné également par la poste. On trouve au tableau 4 la ventilation de l’échantillon selon le code-réponse final.

Tableau 4 Fréquence des codes-réponses de la collecte de données
Description Fréquence
Complet 3 342
Rapport combiné 5
Reçu mais inutilisable 772
Partiel 1
Temporairement inactif 26
Refus 1 204
Aucune réponse à la date de clôture de la période de collecte de données 851
Trop tard pour mettre le questionnaire à la poste 1
Impossible de joindre le répondant 32
Entreprise fermée 270
Répondant introuvable 2 164
Changement de propriétaire 14
Fusion 6
Questionnaire reçu en double 21
Hors du champ de l’enquête 784
Aucune réponse de l’agent de l’activité spécialisée 18
Total 9 511

Taux de réponse

Le taux de réponse calculé est le taux de réponse à l’étape de l’estimation. Il est calculé à l’aide de la formule suivante :

Taux de réponse =  Nbre d’unités utilisables qui ont répondu
 (en totalité ou partiellement)                            
 Nbre d’unités résolues en contexte + Nbre
 estimatif d’unités non résolues en contexte

Vérification

Dans le cadre de l'enquête 2008, il était obligatoire de répondre aux questions sur la surface de plancher et la consommation d'énergie totale. Si un répondant ne répondait pas à ces deux questions ou s'il y avait une erreur évidente dans la réponse à l'une de ces deux questions, on considérait qu'il s'agissait d'une unité sans réponse (après avoir essayé à plusieurs reprises d'obtenir des réponses valides du répondant à ces deux questions). Cette façon de répondre à ces deux questions permettait de calculer l'intensité énergétique de l'unité. En outre, on estimait que la précision des valeurs imputées à ces questions serait douteuse. Par conséquent, on estimait que cette approche était préférable à l’imputation.

La vérification a été effectuée pour toutes les variables demandées dans le questionnaire principal. Par ailleurs, un examen des percentiles les plus élevés des unités (un, deux ou cinq percentiles) reposant sur certaines variables (comme la surface de plancher) a également été effectué afin de relever les données discordantes ou influentes.

Imputation

Après l’étape de la vérification, on a imputé des valeurs pour les variables dont les valeurs étaient manquantes. La méthode utilisée pour remplacer les valeurs manquantes était la technique d’imputation du donneur par le plus proche voisin. Les groupes donneurs pour chaque question ont été créés en utilisant au moins un des critères de variables suivants selon la nature des données à saisir :

  • type d’industrie;
  • région;
  • sources d’énergie utilisées;
  • catégorie d’employés (fondée sur les enregistrements tirés du RE);
  • année de construction du bâtiment;
  • principale source d’énergie utilisée pour chauffer les pièces.

Les groupes donneurs étaient d’abord formés à l’aide des critères de variables ci-dessus qui avaient trait à la question à répondre. Si certains receveurs ne trouvaient pas de donneurs à l’aide des critères de variables sélectionnés (en raison d’un manque de donneurs adéquats dans le groupe), alors un ou plusieurs des critères de variables sélectionnés (en commençant par la variable la moins importante) étaient abandonnés afin de trouver un donneur.

Signalons que pour toutes les questions, le type d’industrie et la région étaient utilisés au départ pour former les groupes donneurs.

Une fois les groupes donneurs formés, les receveurs étaient souvent mis en correspondance avec les donneurs du groupe à l’aide de l’un des champs de correspondance suivants (encore une fois selon la nature des données à saisir) :

  • intensité énergétique;
  • surface de plancher brute totale;
  • nombre d’ordinateurs;
  • nombre d’équivalents temps plein, de personnes pour la capacité maximale, d’étudiants équivalents temps plein ou de lits;
  • pourcentage de la surface de plancher climatisée.

Si on ne pouvait pas trouver un donneur après trois exécutions pour la source d’énergie utilisée pour chauffer l’eau ou climatiser les pièces, on imputait alors comme source principale le type d’énergie dont la consommation était la plus élevée.

Aucune imputation n’a été faite pour les questions obligatoires. Si l’une des questions n’avait pas de réponse, ces unités étaient alors considérées comme non répondantes. En outre, aucune imputation n’a été effectuée pour la question sur la cogénération puisque cette dernière ne visait pas à établir le pourcentage global des établissements dotés d’un système de cogénération, mais à relever les utilisateurs qui possédaient ce système.

Estimation

Pondération

La pondération a été effectuée à l’aide de l’approche des poids normalisés Horvitz-Thompson pour l’échantillon aléatoire simple stratifié. Selon cette approche, le poids initial pour l’unité i (dans la strate h) est obtenu par :

Approche des poids normalisés Horvitz-Thompson pour l’échantillon aléatoire simple stratifié.

Nh est la taille de la population pour la strate h et nh est la taille de l’échantillon pour la strate h.

Ajustement pour l’absence totale de réponse

Dans la mesure du possible, une repondération a été effectuée à l’échelle des strates (groupes d’industries, de régions et de tailles) afin de tenir compte de l’absence de réponse. Dans les cas où il n’y avait pas suffisamment de réponses dans une strate, la strate était combinée à une strate similaire afin d’apporter un ajustement pour l’absence de réponse. Pour le processus de repondération, les poids des unités répondantes, hors champ et retirées des affaires ont été accrus afin de tenir compte des unités sans réponse de sorte que la somme des poids pour ces trois catégories (à l’exception des unités sans réponse) corresponde à la population totale. Ainsi, l’ajustement pour l’absence de réponse pour l’unité i dans le groupe sans réponse g est obtenu par :

Absence de réponse pour l’unité <em>i</em>.

où la série sr inclut toutes les unités répondantes, hors champ et retirées des affaires de l’échantillon.

Indicateurs de qualité des estimations

Les coefficients de variation, qui indiquent la fiabilité des données, sont utilisés pour déterminer quelles estimations peuvent être publiées. Les estimations dont le coefficient de variation dépasse 40 p. 100 ne sont pas jugées assez fiables pour être publiées. De plus, il importe de souligner que les coefficients de variation ne tiennent pas compte du fait que certaines données ont été imputées. Le tableau 5 décrit les différents indicateurs utilisés pour évaluer la qualité des estimations.

Tableau 5 Indicateurs de qualité liés aux coefficients de variation
Coefficient de
variation
Indicateur
de qualité
Qualité de l’estimation
20 p. 100 ou moins A Très bonne
De 21 à 30 p. 100 B Acceptable
De 31 à 40 p. 100 C À utiliser avec prudence
Plus de 40 p. 100 F Trop peu fiable pour être publiée

Un indicateur de qualité « F » est aussi utilisé lorsque les données sont supprimées pour des raisons de confidentialité.

18 Pour l’industrie 19 (organismes religieux), il n’y a pas d’exigences relativement au nombre d’employés. Par conséquent, les organismes religieux sans employé étaient inclus.

Précédent | Table des matières | Suivant