L’Enquête sur les véhicules au Canada est une enquête trimestrielle sur les véhicules. Elle procure des estimations trimestrielles et annuelles sur la distance parcourue par les véhicules routiers au Canada et sur leur consommation de carburant11. En 2007, l’échantillon des provinces était composé de 26 987 véhicules, alors que celui des territoires comportait 11 693 véhicules. Étant donné qu’il s’agit d’une enquête à participation volontaire, aucune donnée n’a pu être recueillie pour une certaine proportion de ces échantillons. Le taux de réponse s’élevait à environ 61 p. 100 dans les provinces et à environ 12 p. 100 dans les territoires, ce qui permet de comparer avantageusement l’EVC à d’autres enquêtes similaires effectuées ailleurs dans le monde.
Malgré tous les efforts déployés pour maintenir une norme de qualité élevée tout au long des activités de l’enquête, les estimations qui en résultent sont inévitablement sujettes à un certain degré d’erreur. L’erreur d’enquête totale est définie comme la différence entre l’estimation de l’enquête et la valeur réelle de la population. Cette erreur d’enquête totale découle de deux types d’erreurs : l’erreur d’échantillonnage et l’erreur non due à l’échantillonnage.
L’erreur d’échantillonnage vient du fait qu’on étudie uniquement une partie de la population au lieu d’effectuer un recensement. Ce type d’erreur dépend de plusieurs facteurs, dont la taille de l’échantillon, le plan d’échantillonnage et la méthode d’estimation. Si la population est hétérogène, comme c’est le cas dans l’EVC, il faut un grand échantillon pour réduire l’erreur d’échantillonnage. De plus, l’utilisation dans l’EVC d’un plan d’échantillonnage stratifié divisant la population en groupes homogènes permet aussi de réduire l’erreur d’échantillonnage en produisant des estimations pour ces groupes homogènes. Les estimations sont ensuite agrégées afin de produire des estimations pour l’ensemble de la population. Chacune des estimations présentées dans le rapport est associée à un coefficient de variation (CV) à partir duquel est déterminé un indicateur global de qualité. Les CV mesurent l’erreur d’échantillonnage des estimations en plus de tenir compte de la variabilité due à la non-réponse et à l’imputation.
Les CV permettent également d’établir un intervalle de confiance (I) qui sert à exprimer la précision d’une estimation de manière concrète. L’I constitue une indication du niveau de confiance selon lequel la valeur réelle d’une caractéristique de la population observée se trouve à l’intérieur de certaines limites. Par exemple, un I de 95 p. 100, I(0,95), signifie que si l’échantillonnage était répété indéfiniment, avec chaque échantillon fournissant un I différent, alors 95 p. 100 des intervalles contiendraient la vraie valeur12.
Afin d’illustrer les liens unissant ces concepts, prenons l’exemple d’une estimation de l’EVC selon laquelle les véhicules routiers ont parcouru 332,3 milliards de véhicules-km au Canada en 2007. Cette estimation est excellente puisqu’elle est associée à un CV de 0,026 et, par conséquent, à un indicateur de qualité « A ». Pour déterminer l’I de 95 p. 100 associé à cette estimation, il suffit de faire le calcul suivant13 :
I(0,95) = [332,3 milliards x (1 – 1,96 x CV),
332,3 milliards x (1 + 1,96 x CV)]
I(0,95) = [332,3 milliards x (1 – 1,96 x 0,026),
332,3 milliards x (1 + 1,96 x 0,026)]
I(0,95) = [315,3 milliards, 349,2 milliards]
En fonction de cet I, on peut affirmer avec un degré de confiance de 95 p. 100 que la distance parcourue au Canada en 2007 s’élevait entre 315,3 milliards et 349,2 milliards de véhicules-km. Plus l’I est petit, plus les chances que l’estimation de l’enquête soit près de la valeur réelle sont grandes. La figure A-1 est une représentation de l’I pour l’exemple précédent. Il importe de tenir compte de l’I dans l’analyse des résultats d’une enquête.

Le tableau A-1 donne des points de repère au lecteur qui souhaite évaluer l’I attribué à une estimation en fonction des indicateurs de qualité présentés dans le rapport. Soulignons que des normes rigoureuses établies par Statistique Canada sont utilisées dans le rapport pour qualifier une estimation comme étant « excellente » ou « très bonne ».
Tableau A-1 Fourchette des intervalles de confiance liés aux estimations de l’EVC
| Indicateur de qualité | Qualité de l’estimation |
Coefficient de variation | Fourchette d’intervalles de confiance |
|---|---|---|---|
| A | Excellente | Moins de 5 % | Estimation ± 0 % à 9,9 % |
| B | Très bonne | 5 % à 9,9 % | Estimation ± 10 % à 19,9 % |
| C | Bonne | 10 % à 14,9 % | Estimation ± 20 % à 29,9 % |
| D | Acceptable | 15 % à 19,9 % | Estimation ± 30 % à 39,9 % |
| E | À utiliser avec prudence | 20 % à 34,9 % | Estimation ± 40 % à 69,9 % |
| F | Données trop peu fiables pour être publiées | 35 % ou plus | Estimation ± 70 % et plus |
L’erreur d’enquête totale peut également être attribuable à des erreurs non dues à l’échantillonnage. Ce deuxième type d’erreur peut se produire à presque toutes les étapes de l’enquête. Des erreurs peuvent notamment survenir lorsqu’un répondant donne des renseignements erronés, ne répond pas ou interprète mal une question. Des erreurs non dues à l’échantillonnage peuvent également survenir lors du traitement des données. Certaines de ces erreurs s’annulent sur un grand nombre d’observations, mais les erreurs systématiques induisent un biais dans les estimations. Par exemple, si des personnes présentant des caractéristiques similaires se montrent régulièrement peu enclines à répondre à l’enquête, il peut en résulter un biais pour les estimations. Certaines erreurs non dues à l’échantillonnage sont difficiles à quantifier et ne sont pas reflétées par les indicateurs de qualité. Par contre, les indicateurs de qualité de l’EVC tiennent compte de la variance due à la non-réponse et à l’imputation et, par conséquent, prennent en compte une partie des erreurs non dues à l’échantillonnage. D’autres mesures, comme le taux de réponse à l’enquête et le taux d’imputation, peuvent aussi servir d’indicateurs pour les erreurs non dues à l’échantillonnage.
11 L'annexe B présente davantage de renseignements sur la portée et la méthode de l'EVC.
12 Satin, A. et W. Shastry, Statistique Canada. L'échantillonage, un guide non mathématique, 2e édition, no de catalogue 12-602F. Ottawa, 1993, p. 14.
13 Si l'on présume que la distribution est normale, l'I de 95 p. 100 correspond à l'estimation plus ou moins deux fois environ l'erreur type. L'erreur type est égale à la racine carrée de la variance, ce qui correspond au produit de l'estimation et du CV.