Toute demande de renseignements au sujet du présent guide ou au sujet de statistiques ou de services connexes doit être adressée à:

Statistique Canada
150 promenade Tunney's Pasture
Ottawa, Ontario, K1A 0T6
Téléphone sans frais: 1-800-565-1685
Facsimile: 1-888-883-7999
Courriel: bdp.enquetes@statcan.gc.ca

Comment obtenir d'autres renseignements.

Pour obtenir des renseignements sur l'ensemble des données de Statistique Canada qui sont disponibles, veuillez composer l'un des numéros sans frais suivants. Vous pouvez également communiquer avec nous par courriel ou visiter notre site Web.

Service national de renseignements
1 800 263-1136

Service national d'appareils de télécommunications pour les malentendants
1 800 363-7629

Renseignements pour le Programme des bibliothèques de dépôt
1 800 700-1033

Télécopieur pour le Programme des bibliothèques de dépôt
1 800 889-9734

Renseignements par courriel
infostats@statcan.gc.ca

Site Web
www.statcan.ca

Ce guide est aussi disponible sous forme électronique sur le site Internet de Statistique Canada. Les utilisateurs peuvent en obtenir un exemplaire en visitant notre site Web à www.statcan.gc.ca et en choisissant la rubrique produits et services.

If you would prefer this guide in English, please telephone 1 (800) 565-1685.

Normes de service à la clientèle

Statistique Canada s'engage à fournir à ses clients des services rapides, fiables et courtois, et ce, dans la langue officielle de leur choix. À cet égard, notre organisme s'est doté de normes de service à la clientèle qui doivent être observées par les employés lorsqu'ils offrent des services à la clientèle. Pour obtenir une copie de ces normes de service, veuillez communiquer avec Statistique Canada au numéro sans frais 1 800 263-1136.

Table des Matières

Partie 1 : Généralités

  • Autorité
  • Confidentialité
  • But des enquêtes
  • Retour des déclarations
  • Méthodes comptables
  • Valeurs monétaires
  • Devises
  • Niveau du détail géographique

Parties 2 : Vue générale des questionnaires

  • Qui reçoit les questionnaires?
  • BP-QT : Investissements trimestriels entre le Canada et les autres pays
  • BP-21SF : Opérations internationales de services commerciaux (annuel)
  • BP-21SQF : Opérations internationales de services commerciaux (trimestriel)
  • BP-22F : Investissements effectués au Canada par des sociétés étrangères (trimestriel)
  • BP-22AF : Investment in Canada by Non-Canadian Corporations (Quarterly)
  • BP-FIC : Investissements étrangers au Canada (annuel)
  • BP-STRUC : Structure des sociétés canadiennes dans l'entreprise déclarante (annuel)
  • BP-CIA : Investissements canadiens à l'étranger (annuel)

Parties 3 : Guide détaillé de déclaration concernant les divers questionnaires

  • BP-QT : Investissements trimestriels entre le Canada et les autres pays
  • BP-21SF : Opérations internationales de services commerciaux (annuel)
  • BP-21SQF : Opérations internationales de services commerciaux (trimestriel)
  • BP-22F : Investissements effectués au Canada par des sociétés étrangères (annuel)
  • BP-22AF : Investissements effectués au Canada par des sociétés étrangères (trimestriel)
  • BP-FIC : Investissements étrangers au Canada (annuel)
  • BP-STRUC : Structure des sociétés canadiennes dans l'entreprise déclarante (annuel)
  • BP-CIA : Investissements canadiens à l'étranger (annuel)

Annexe A - Définitions

Annexe B - Liste des codes de pays

Partie 1 : Généralité

Autorité
Les enquêtes trimestrielles et annuelles de la Division du commerce et des comptes internationaux sont menées en vertu de la Loi sur la statistique, Lois révisées du Canada, 1985, chapitre S19. En vertu de cette loi, il est obligatoire de remplir ces questionnaires.

But des enquêtes
Les données recueillies servent à préparer les états de la balance des paiements internationaux et du bilan des investissements internationaux du Canada. De tels états aident le gouvernement canadien à établir les politiques monétaires et du taux de change.

Confidentialité
La loi interdit à Statistique Canada de divulguer toute information recueillie qui pourrait dévoiler l'identité d'une personne, d'une entreprise ou d'un organisme sans leur permission ou sans en être autorisé par la loi. Les données de cette enquête serviront uniquement à des fins statistiques et seront publiées sous forme agrégée seulement.

Retour des déclarations
Les questionnaires doivent être dûment remplis et complétés, suivant leur réception, dans les trois semaines pour les questionnaires trimestriels et dans les quatre semaines pour les questionnaires annuels.
Votre coopération pour soumettre les questionnaires à temps est essentielle de façon à ne pas retarder la diffusion des statistiques. Si vous avez besoin d'éclaircissements en remplissant les questionnaires, veuillez nous contacter au numéro de téléphone sans frais inscrit à la première page de chaque questionnaire, sous la rubrique 'Renvoi du questionnaire'.

Méthodes comptables
Veuillez déclarer les données selon les principes comptables généralement reconnus (PCGR) à moins autrement spécifié.

Valeurs monétaires
Veuillez déclarer toutes les sommes en milliers de dollars canadiens (CAD$'000). Si le montant est plus ou moins 500$, veuillez rapporter zéro(0).

Devises
Il faut utiliser la liste des codes qui figure au verso du questionnaire pour indiquer la devise de règlement dans le cas du passif.

Niveau du détail géographique
Il faut utiliser la liste des codes qui figure au verso du questionnaire au questionnaire pour indiquer le pays avec lequel les transactions ont été effectuées où se trouvent les actions ou le passif. S'il n'existe pas de données précises par pays, veuillez fournir une estimation.

Parties 2 : Vue générale des questionnaires

Le but des questionnaires de la Division du commerce et des comptes internationaux est de rassembler les données sur les transactions internationales des entreprises au Canada. Ces questionnaires, sauf le BP-22F, s'adressent principalement aux sociétés constituées au Canada. Le questionnaire BP-22F porte sur les opérations et les investissements des sociétés étrangères au Canada (succursales). Les questionnaires de la balance des paiements doivent être remplis selon le point de vue des sociétés canadiennes.

Qui reçoit les questionnaires?
Les grandes entreprises (multinationales) reçoivent la plupart des questionnaires du fait qu'elles effectuent généralement une multitude de transactions internationales. Le cadre d'identification des entreprises pour l'envoi des questionnaires est principalement réalisé à partir du registre centralisé de Statistique Canada.

Certaines entreprises reçoivent le questionnaire BP-FIC car une partie ou la totalité de leur capital-actions ou de leur dette à long terme est détenue à l'étranger. D'autres entreprises reçoivent le questionnaire BP-CIA car elles ont des investissements à l'étranger.

D'autres encore ne reçoivent que le BP-QT ou le BP-21SF. Il s'agit de filiales dont la société-mère a pu faire état dans tous les autres questionnaires en se fondant sur ses comptes consolidés. Toutefois, comme certains détails de ces filiales peuvent difficilement être tirés des comptes consolidés, on demande à ces dernières de remplir un questionnaire séparément. Par ailleurs, certaines sociétés peuvent avoir fait des transactions internationales qui se limitent à l'actif et au passif à court terme (c.-à-d., effets commerciaux à payer à des non-résidents ou à recevoir de non-résidents ou paiements pour services rendus par des sociétés étrangères).

BP-QT : Investissements trimestriels entre le Canada et les autres pays
Ce questionnaire (anciennement BP21AF) sert à recueillir des données sur les transactions avec les non-résidents telles que l'investissement en capital-actions, les créances et dettes et les revenus de placements. Le questionnaire trimestriel est envoyé à un échantillon de grandes entreprises ayant d'importantes opérations internationales.

Pour des indications sur la façon de remplir ce questionnaire, reportez-vous à la page 4.

BP-21SF : Opérations internationales de services commerciaux (annuel)
Ce questionnaire sert à recueillir des données sur les revenus provenant de non-résidents et les sommes payées à des non-résidents au titre des services commerciaux. La gamme de services et de frais pour lesquels il faut fournir de l'information figure au verso du questionnaire.

Pour des indications sur la façon de remplir ce questionnaire, reportez-vous à la page 11.

BP-21SQF : Opérations internationales de services commerciaux (annuel)
Ce questionnaire est une version trimestrielle abrégée du BP-21SF annuel. Il est envoyé à un échantillon de sociétés qui ont d'importantes opérations de services. Les opérations de services commerciaux dont il est fait état dans les déclarations trimestrielles doivent correspondre aux montants indiqués dans les questionnaires BP-21SF.

Pour des indications sur la façon de remplir ce questionnaire, reportez-vous à la page 12.

BP-22F : Investissements effectués au Canada par des sociétés étrangères (annuel)

BP-22AF : Investissements effectués au Canada par des sociétés étrangères (trimestriel)
Ces questionnaires portent sur les activités des entités étrangères au Canada qui ne sont pas constituées en personne morale par l'entremise de sociétés canadiennes. Dans la plupart des cas, ce formulaire s'adresse aux succursales canadiennes de sociétés étrangères.

Pour des indications sur la façon de remplir ce questionnaire, reportez-vous à la page 13.

BP-FIC : Investissements étranger au Canada (annuel)
Cette enquête (anciennement BP-52) vise à mesurer les investissements étrangers dans les sociétés canadiennes ainsi que les engagements de ces dernières envers les non-résidents.

Ce questionnaire sert à recueillir des données sur le niveau d'investissement étranger dans les sociétés canadiennes ainsi que les engagements de ces dernières envers les non-résidents, incluant les obligations, les prêts bancaires et autres dettes à long terme. Le questionnaire doit être rempli en se fondant sur les comptes consolidés et faire état des dettes à long terme et des capitaux propres de la société-mère et de ses filiales canadiennes. Si, pour une raison quelconque, une consolidation complète des comptes n'est pas disponible, il se peut que les filiales canadiennes doivent remplir séparément un questionnaire.

Pour des indications sur la façon de remplir ce questionnaire, reportez-vous à la page 16.

BP-STRUC : Structure des sociétés canadiennes dans l'entreprise déclarante (annuel)
Ce questionnaire (anciennement BP-53) sert à déterminer les filiales canadiennes intégralement consolidées (partie 1) pour fins de déclaration dans le formulaire BP-FIC, de même que la valeur totale des investissements dans des filiales et sociétés affiliées canadiennes non intégralement consolidées (partie 2). Veuillez noter que ce questionnaire ne vise pas à établir un profil d'entreprise semblable à celui dressé par la Division du Registre des entreprises de Statistique Canada.

Pour des indications sur la façon de remplir ce questionnaire, reportez-vous à la page 20.

BP-CIA : Investissements canadiens à l'étranger (annuel)
Ce questionnaire (anciennement BP-59 et BP-59S) sert à recueillir des données sur les investissements de l'unité déclarante dans des sociétés étrangères affiliées. Ces dernières sont des entités étrangères dans lesquelles l'entreprise déclarante canadienne détient une participation d'au moins 10 % des actions avec droit de vote. Une filiale est une société étrangère dans laquelle la société déclarante détient plus de 50% des actions avec droit de vote. Une société associée est une société étrangère dans laquelle la société déclarante détient de 10 % à 50 % des droits de vote. Une succursale étrangère n'est pas une entité légale autonome mais est autorisée à faire des affaires dans un pays étranger et peut englober des opérations liées à une division, une mine ou un projet de construction. Il faut y indiquer tous les investissements à l'étranger de la société déclarante et/ou de ses filiales canadiennes intégralement consolidées.

Pour chaque filiale, société affiliée, succursale ou entreprise conjointe étrangère, il faut fournir, les éléments financiers demandés tels qu'ils apparaissent dans les états financiers de l'entité à l'étranger.

Pour des indications sur la façon de remplir ce questionnaire, reportez-vous à la page 20.

Partie 3 : Guide détaillé de déclaration concernant les divers questionnaires

BP-QT : Investissements trimestriels entre le Canada et les autres pays
Le questionnaire (BP-QT) comprend toutes les opérations de votre entreprise avec des non-résidents, incluant celles avec les sociétés affiliés étrangères (filiales, sociétés associées et succursales), la société mère étrangère et les sociétés non-affiliées étrangères. Les transactions financières et les niveaux d'investissement sous forme de capital-actions, créances et dettes doivent être déclarés aux pages 2 et 3 du questionnaire. Les revenus de placements et les dépenses avec des non-résidents doivent être déclarés aux pages 4 et 5.

Page couverture

Période de déclaration
Veuillez indiquer la période trimestrielle visée selon le format suivant : AAAA MM JJ

Attestation
Veuillez fournir des renseignements sur la personne chargée de remplir ce questionnaire.

Page 2

Section A – Investissements à l'étranger par l'entreprise déclarante canadienne
Cette section couvre tous les investissements ou placements de l'entité canadienne déclarante  dans les entités étrangères (participation sous forme de capital-actions et titres de créances), soient les sociétés affiliées étrangères (A1), les sociétés mères et les sociétés sœurs étrangères (A2) et les sociétés étrangères non-affiliées (A3).

Si des données sur les transactions sont fournies à cette section, les augmentations ou diminutions de placements ne doivent inclure que les transactions financières et exclure les ajustements suivants : 1) les variations de taux de change ; 2) les changements dus aux mouvements des prix du marché ; 3) les radiations de compte, à la hausse ou à la baisse, etc. Tous ces ajustements devraient cependant être inclus dans les données de positions de début et de fin de trimestre. Si vous n'avez pas de transactions pendant le trimestre à déclarer, vous devez toutefois inscrire les positions au début et à la fin du trimestre.

Note : Si, pour un poste donné, vous manquez d'espace pour l'inscription de tous les codes de pays, veuillez joindre une feuille supplémentaire.

A1 – Investissements par l'entreprise déclarante canadienne dans des sociétés étrangères affiliées
Il faut fournir des renseignements à ce poste si l'unité déclarante possède une participation sous forme de capital-actions dans des sociétés affiliées étrangères (filiales, sociétés apparentées ou des succursales étrangères) ou encore si elle des créances (comptes à recevoir, prêts, avances, hypothèques et obligations) auprès des sociétés affiliées étrangères.

  • (i) Actions dans les sociétés affiliées étrangères Il faut déclarer à ce poste la participation sous forme de capital-actions ordinaires et privilégiées ainsi que l'excédent de capital ou surplus d'apport dans des sociétés affiliés étrangères.
  • Exemple
    HIJ Canada Inc. investit 20 millions de dollars pour acquérir une part de 60 % dans une nouvelle société en participation au Costa Rica au cours du trimestre. La valeur du capital-actions est de 5 millions de dollars; les 15 millions de dollars restants représentent le surplus d'apport.
    Au poste A1 (i), il faudrait inscrire 20000 $ (CAD$'000) à titre d'augmentation des placements (recettes), indiquer le code de pays CRI, et fournir la position à la fin du trimestre qui reflète notamment cette augmentation ainsi que d'autres ajustements tels que les variations du taux de change, les radiations de compte, à la hausse ou à la baisse.
  • (ii) Créances commerciales auprès des sociétés affiliées
    Il faut inscrire uniquement les créances commerciales auprès des entités affiliées étrangères. Les autres prêts et avances doivent être déclarés au poste A1 (iii).
  • Exemple
    HIJ Canada Inc. a consenti un prêt de 12 millions de dollars à une filiale en Espagne. La filiale rembourse 50 % de son emprunt au cours du trimestre. Au poste A1 (iii), il faudrait faire état d'une diminution des placements (recettes) de 6 000 $ (CAD$'000), inscrire le code du pays ESP et fournir la position à la fin du trimestre qui reflète notamment cette diminution ainsi que d'autres ajustements tels que les variations du taux de change, les radiations de compte, à la hausse ou à la baisse.

A2 – Investissements par l'entreprise déclarante canadienne dans des sociétés mères étrangères et dans des sociétés sœurs
Il faut fournir des renseignements à ce poste si l'unité déclarante a des créances (comptes à recevoir, prêts, avances, hypothèques et obligations) auprès des sociétés mères et des sociétés sœurs étrangères.

  • (i) Créances commerciales auprès des sociétés mères et des sociétés sœurs étrangères. Il faut déclarer à ce poste que les créances commerciales auprès des sociétés mères et des sociétés sœurs étrangères. Les autres prêts et avances doivent être déclarés au poste A2 (ii).
  • Autres créances auprès des sociétés mères et des sociétés sœurs étrangères Ce poste sert à l'inscription d'autres créances de l'entité canadienne déclarante auprès des sociétés mères et des sociétés sœurs étrangères. Elles comprennent les prêts, avances, hypothèques et obligations.
  • Exemple
    La société mère de HIJ Canada Inc. en France lui doit 5 millions de dollars. La société mère a remboursé 50% du prêt au cours du trimestre. Au poste A2(ii), il s'agirait donc de faire état d'une diminution de placements (recettes) de 2500 $ (CAD$'000), indiquer le code de pays FRA et fournir la position à la fin du trimestre qui reflète notamment cette diminution ainsi que d'autres ajustements tels que les variations du taux de change, les radiations de compte, à la hausse ou à la baisse.

A3 Autres investissements à l'étranger par l'entreprise déclarante canadienne dans des sociétés non affiliées
Ce poste sert à l'inscription des créances de l'entité canadienne déclarante auprès des sociétés non affiliées étrangères. Elles incluent les créances commerciales, prêts, avances, prêts hypothécaires mais excluent les obligations.

  • Créances commerciales auprès des sociétés non affiliées étrangères
    Il s'agit d'inscrire à ce poste les créances commerciales auprès des sociétés non affiliées étrangères. Les autres prêts et les avances doivent être déclarés au poste A3 (ii)
  • (ii) Autres créances auprès des sociétés non affiliées étrangères
    Ce poste inclut les prêts, avances et hypothèques aux sociétés non affiliées étrangères mais exclut les obligations et autres titres obligataires.

Page 3

Section B – Investissements dans l'entreprise déclarante canadienne par des entités non résidentes
Ce section sert à déclarer les investissements ou placements effectuées par les non résidents dans l'unité déclarante canadienne. Figurent ici les investissements faits par : a) les sociétés mères et les sociétés sœurs étrangères (B1) ; b) les sociétés étrangères affiliées (B2) et 3) d'autres entités non résidentes (B3).

Si des données sur les transactions ou flux de capitaux sont fournies à ce poste, les augmentations ou diminutions de capitaux ne doivent inclure que les transactions financières et exclure les ajustements suivants : 1) les variations de taux de change ; 2) les changements dus aux mouvements des prix du marché ; 3) les radiations de compte, à la hausse ou à la baisse, etc. Tous ces ajustements devraient cependant être inclus dans les données de positions de début et de fin de trimestre. Si vous n'avez pas de transactions au cours du trimestre à déclarer, vous devez toutefois inscrire les positions au début et à la fin du trimestre.

Note : Si, pour un poste donné, vous manquez d'espaces pour l'inscription de tous les codes de pays, veuillez joindre une feuille supplémentaire.

B1 – Investissements par les sociétés mères et les sociétés sœurs étrangères dans l'entreprise canadienne déclarante
Il faut fournir des renseignements à ce poste si les sociétés mères et sœurs étrangères possèdent une participation sous forme de capital-actions dans l'entreprise canadienne déclarante. Cette section couvre également les dettes de l'entreprise canadienne déclarante (comptes à payer, prêts, découverts, hypothèques et obligations) envers des sociétés mères et des sociétés sœurs étrangères.

  • (i) Actions dans l'entreprise déclarante canadienne
    Il faut fournir des renseignements à ce poste si les sociétés mères et les sociétés sœurs étrangères ont des investissements sous forme de capital-actions ordinaires et privilégiés dans l'unité canadienne déclarante. Veuillez inclure également le surplus d'apport.
  • Exemple
    HIJ Canada Inc. émet des actions d'une valeur totale de 10 millions de dollars. Une entreprise canadienne et HIJ Allemagne Inc. achètent chacune pour 5 millions de dollars d'actions. Au poste B1(i), il s'agirait de faire état d'une augmentation de placements (recettes) de 5 000 $ (CAD$'000'), indiquer le code de pays DEU et fournir la position à la fin du trimestre qui reflète notamment cette augmentation ainsi que d'autres ajustements tels que les variations du taux de change, les radiations de compte, à la hausse ou à la baisse.
  • (ii) Dettes commerciales envers des sociétés mères étrangères et des sociétés sœurs Il s'agit d'inscrire uniquement à ce poste les dettes commerciales (comptes à payer) de l'unité déclarante canadienne envers des sociétés mères et des sociétés sœurs étrangères. Les autres dettes doivent être déclarées au poste B1 (iii).
  • (iii) Autres créances dues aux sociétés mères étrangères et aux sociétés soeurs
    Ce poste sert à l'inscription des autres créances dues aux sociétés mères et sœurs étrangères qui comprennent les prêts, découverts, hypothèques et obligations.
  • Exemple
    HIJ Canada Inc. doit 7 millions de dollars à sa société-mère, HIJ Italie Inc. HIJ Canada Inc. a remboursé l'emprunt durant le trimestre. Il faut déclarer au poste B1 (iii) 7 000 $ (CAD$'000) à titre de diminution de placements (paiements), indiquer le code de pays ITA et fournir la position à la fin du trimestre qui reflète notamment cette diminution ainsi que d'autres ajustements tels que les variations du taux de change, les radiations de compte, à la hausse ou à la baisse.

B2 – Investissements par les sociétés étrangères affiliées dans l'entreprise canadienne déclarante

Ce poste sert à l'inscription des dettes de l'unité canadienne déclarante auprès des sociétés étrangères affiliées, incluant les dettes commerciales (comptes à payer), prêts, découverts hypothèques mais excluant les obligations.

  • (i) Dettes commerciales auprès des sociétés étrangères affiliées
    Il s'agit d'inscrire uniquement à ce poste les dettes commerciales (comptes à payer) auprès des sociétés affiliées étrangères. Les autres dettes doivent être déclarées au poste B2 (ii).
  • (ii) Autres créances dues aux sociétés étrangères affiliées
    Ce poste sert à l'inscription des autres créances de l'entreprise déclarante canadienne aux sociétés affiliées
    étrangères qui comprennent les prêts, découverts, hypothèques et obligations.
  • Exemple
    HIJ Canada Inc. doit 5 millions de dollars à une société affiliée au Mexique. La société affiliée rembourse 50 % de son emprunt pendant le trimestre. Dans la section B2 (ii), il faudrait faire état d'une diminution des investissements (paiements) de 2500$ (CAD$'000), inscrire le code du pays MEX et fournir la position à la fin du trimestre qui reflète notamment cette diminution ainsi que d'autres ajustements tels que les variations du taux de change, les radiations de compte, à la hausse ou à la baisse.

B3 – Investissements par des sociétés non affiliées étrangères dans l'entreprise canadienne déclarante

Ce poste sert à l'inscription des dettes de l'unité canadienne déclarante auprès des sociétés non affiliées étrangères, incluant les dettes commerciales (comptes à payer), prêts, découverts hypothèques mais excluant les obligations.

  • (i) Dettes commerciales auprès des sociétés non affiliées étrangères
    Il faut inscrire uniquement sous ce poste toutes les dettes commerciales (comptes à payer) de l'unité déclarante envers des sociétés non affiliées étrangères. Les autres dettes doivent être déclarées au poste B3 (ii).
  • (ii) Autres créances dues aux sociétés non affiliées
    Ce poste inclut les prêts, découverts, crédit-bail et hypothèques mais exclut les obligations et autres titres obligataires.
  • Exemple
    HIJ Canada Inc. doit 2 millions de dollars à une banque au Japon qui arrive à échéance durant le trimestre. HIJ Canada Inc. rembourse le prêt durant le trimestre. Au poste B3 (ii), il faut déclarer 2000$ (CAD$'000) à titre de diminution de placements (paiements), inscrire le code du pays JAP et fournir la position à la fin du trimestre qui reflète notamment cette diminution ainsi que d'autres ajustements tels que les variations du taux de change, les radiations de compte, à la hausse ou à la baisse.

Page 4

Section C – Certaines opérations avec des non-résidents au titre de l'état des résultats et des bénéfices non répartis de l'entreprise déclarante canadienne (recettes)

Cette section porte sur les revenus de dividendes et d'intérêts l'entreprise déclarante canadienne provenant des sociétés affiliées et des sociétés mères et sociétés sœurs étrangères payées ou accumulées pendant la période.

Les montants reçus ou imputés aux postes mentionnés ci-dessus doivent être déclarés bruts avant la déduction faite des retenues fiscales.

C1 – Recettes de l'entreprise déclarante canadienne provenant des sociétés étrangères affiliées et des sociétés mères et sociétés sœurs étrangères

  • (i) Dividendes en provenance des sociétés affiliées étrangères
    Il faut faire état à ce poste des dividendes reçus ou déclarés des sociétés affiliées étrangères pendant le trimestre. Ne faites état que de la part des dividendes revenant à l'entreprise déclarante canadienne et non le montant total des dividendes déclaré (à moins que l'entreprise déclarante canadienne détienne 100% du capital actions).
  • Exemple
    HIJ Canada Inc. reçoit un paiement de dividendes d'une filiale en propriété exclusive en Espagne durant le trimestre. Il faut déclarer sous le poste C1(i) le montant brut de dividendes reçus et inscrire le code pays ESP.
  • (ii) Revenu d'intérêt des créances commerciales et autres créances auprès des sociétés affiliées étrangères
    Il s'agit d'indiquer ici les revenus d'intérêts reçus ou courus sur les créances auprès des sociétés affiliées étrangères pendant le trimestre, par exemple ceux liés aux prêts, avances, hypothèques, obligations et créances commerciales.
  • (iii) Revenu d'intérêt des créances commerciales et autres créances auprès des sociétés mères et sociétés sœurs étrangères
    Il faut déclarer à ce poste les revenus d'intérêts reçus ou courus sur des créances auprès des sociétés mères et des sociétés sœurs étrangères pendant le trimestre, par exemple ceux liés aux prêts, avances, hypothèques, obligations et créances commerciales.

C2 –Recettes de l'entreprise déclarante canadienne provenant des sociétés non affiliées étrangères

  • (i) Revenu d'intérêt en provenance d'autres entités non affiliées étrangères
    Report interest received or accrued from debt claims on foreign non-affiliates during the quarter, including trade receivables, loans, advances and mortgages, but exclude interest received from holdings of foreign bonds and other foreign debt securities. Dividends received from holdings of foreign equities must also be excluded.

C3 – Revenu (perte) net(te) des sociétés affiliées étrangères
Il faut déclarer à ce poste le montant total du revenu net (perte) après impôts et non uniquement la part de l'entreprise déclarante canadienne dans le profit net après impôts.

Page 5

Section D – Certaines opérations avec des non-résidents au titre de l'état des résultats et des bénéfices non répartis de l'entreprise déclarante canadienne avec les non résidents (paiements)
Cette section porte sur les paiements de dividendes et d'intérêts de l'entreprise déclarante canadienne aux sociétés étrangères affiliées et aux sociétés mères et sociétés sœurs étrangères payées ou courus pendant la période.

Les montants payés ou courus aux postes mentionnés ci-dessus doivent être déclarés bruts avant la déduction faite des retenues fiscales.

D1 – Paiements de l'entreprise déclarante canadienne à des sociétés mères et sociétés soeurs étrangères et des sociétés étrangères affiliées

  • (i) Dividendes déclarés aux sociétés mères et sociétés soeurs Il faut déclarer à ce poste les montants de dividendes versés ou déclarés aux sociétés mères étrangères et aux sociétés sœurs pendant le trimestre.
  • Exemple
    HIJ Canada Inc. verse un dividende de 1 million de dollars à la société-mère en Allemagne. Il s'agit dans ce cas de déclarer sous D1(i) le montant brut de dividende de 1000$ (CAD$'000) et d'inscrire le code de pays (DEU).
  • (ii) Frais d'intérêts sur des dettes commerciales et autres dettes à l'égard des sociétés mères et sociétés sœurs étrangères
    Il faut déclarer les intérêts payés ou courus sur des dettes à l'égard des sociétés mères et des sociétés sœurs étrangères pendant le trimestre, par exemple ceux liés aux dettes commerciales (comptes à payer) et autres types d'engagements tels que les prêts, découverts, hypothèques et obligations.
  • (iii) Frais d'intérêts sur des dettes commerciales et autres dettes à l'égard des sociétés affiliées étrangères
    Il faut déclarer ici les intérêts payés ou courus sur des engagements à l'égard des sociétés affiliées étrangères pendant le trimestre, par exemple ceux liés aux dettes commerciales, prêts, découverts, hypothèques et obligations.

D2 – Paiement d'intérêts de l'entreprise déclarante canadienne à des sociétés non affiliées étrangères

  • (i) Frais d'intérêt sur des dettes commerciales et autres dettes à l'égard des sociétés non affiliées étrangères
    Ce poste couvre les intérêts payés ou courus sur les dettes envers des sociétés étrangères non affiliées pendant le trimestre, par exemple ceux liés aux dettes commerciales (comptes à payer), prêts, découverts et hypothèques. Il faut exclure les intérêts payés ou courus sur les obligations et autres titres d'emprunt. Les dividendes payés aux actionnaires de portefeuille étrangers doivent être aussi être exclues.

BP-21SF : Opérations internationales de services commerciaux (annuels)

Page couverture

  • Période observée
    Veuillez inscrire la date (jour, mois et année) de clôture de la période de 12 mois sur laquelle portent les renseignements fournis. Si l'exercice en question ne prend pas fin en décembre, veuillez fournir les données pour l'exercice le plus proche.
  • Champ
    Déclarez toutes les opérations de services, y compris celles financées par le gouvernement du Canada (notamment par l'Agence canadienne de développement international) ou d'autres sources au Canada. Voir la page 4 de ce questionnaire pour une description détaillée des types de services mentionnés aux pages 2 et 3. Veuillez utiliser la liste des codes géographiques pour identifier le pays.

Pages 2 et 3

Revenus et dépenses internationaux

  • Annexe A - Exportations des services commerciaux
    Veuillez indiquer la valeur des services vendus à des clients à l'étranger (recettes) durant une période de 12 mois. Déclarez les recettes, nettes de retenues fiscales, en milliers de dollars canadiens. Veuillez, au besoin, ajouter une feuille séparée pour les recettes provenant de plus de quatre pays.
  • Annexe B - Importations des services commerciaux
    Veuillez indiquer la valeur des services achetés auprès de fournisseurs à l'étranger (dépenses) durant une période de 12 mois. Déclarez les dépenses payées ou à payer à des non-résidents, nettes de retenues fiscales, en milliers de dollars canadiens. Veuillez, au besoin, ajouter une feuille séparée si ces dépenses ont été engagées dans plus de quatre pays.
  • Code de pays : Veuillez vous référer à la liste de codes de pays ci-joint.
  • Les entités apparentées comprennent les sociétés-mères étrangères, les investisseurs directs étrangers et les filiales, succursales et autres affiliées, y compris les sociétés étrangères, qui sont contrôlées en grande partie par les mêmes actionnaires ou le même groupe d'actionnaires.

BP-21SQF : Opérations internationales de services commerciaux (trimestriel)

Trimestre civil se terminant le
La déclaration porte sur le trimestre se terminant le mois indiqué.

Champ
Déclarez toutes les opérations de services, y compris celles financées par le gouvernement (notamment par l'Agence canadienne de développement international) ou par d'autres sources au Canada. Voir le guide traitant de ce questionnaire pour une description détaillée des types de services visés. Veuillez utiliser la liste des codes géographiques pour identifier le pays.

Revenus totaux
Veuillez indiquer la valeur des services vendus à des clients à l'étranger (revenus) au cours du trimestre. Le montant indiqué ne doit pas inclure les retenues fiscales et doit être exprimé en milliers de dollars canadiens. Veuillez, au besoin, ajouter une feuille séparée si les revenus proviennent de nombreux pays.

Dépenses totales
Veuillez déclarer la valeur des services achetés auprès de fournisseurs à l'étranger (dépenses) au cours du trimestre. Le montant indiqué ne doit pas inclure les retenues fiscales et doit être exprimé en milliers de dollars canadiens. Veuillez, au besoin, ajouter une page séparée si les dépenses ont été engagées dans de nombreux pays.

Définitions de catégories de services

Redevances : figurent ici les charges se rattachant à l'utilisation exclusive de ressources, aux droits de production et de vente de marchandises ayant une ou plusieurs caractéristiques uniques, de même qu'à l'utilisation d'une œuvre littéraire, artistique, dramatique ou musicale originale ou de toute marque commerciale distincte obtenue par enregistrement légal.

Concessions et droits semblables : figurent ici les privilèges contractuels accordés par une personne ou une société à une autre autorisant la vente d'un produit, l'utilisation d'une marque commerciale ou la prestation d'un service à l'intérieur d'un territoire et/ou d'une manière déterminés.

Services informatiques : figurent ici les services consultatifs, l'utilisation des installations informatiques, l'achat et la mise au point de logiciels, l'analyse organique, l'installation, la mise au point et l'entretien courant, la documentation et la formation.

Services d'administration et de gestion : figurent ici les charges pour les services d'administration et de gestion fournis par un particulier ou une entreprise.

Recherche scientifique et développement : figurent ici les charges se rattachant à des études systématiques faites au moyen d'expériences ou d'analyses pour la réalisation d'une innovation scientifique ou commerciale pour ou par la création de produits ou de procédés nouveaux ou sensiblement améliorés.

Services de consultation et autres services spécialisés figurent ici les services de consultation et autres services professionnels dans des domaines tels que le génie, l'architecture, le droit, la comptabilité, la commercialisation, la planification, la fiscalité, les finances, le forage et la mise en valeur des ressources naturelles et humaines.

Primes d'assurance et sinistres (réglés) : figurent ici: a) les primes d'assurance et/ou de réassurance versées directement au répondant par des personnes et/ou des sociétés non résidentes et les primes payées directement aux assureurs non résidents pour tous les types de risques; b) les sinistres réglés au répondant par les assureurs non résidents et les sinistres réglés par le répondant aux personnes et/ou aux sociétés non résidentes aux termes de tout contrat d'assurance conclu directement entre les deux parties concernées.

Commissions : figurent ici les commissions de financement, les commissions allant aux grossistes, aux agents, aux courtiers et aux succursales de vente des fabricants et tous les autres types de commission commerciale. Les honoraires et les commissions pour les émissions d'actions, nouvelles ou en cours, ne doivent pas figurer dans cette catégorie.

Publicité et promotion des ventes : figurent ici la publicité dans les journaux et les revues, à la radio, télévision et autres médias, la participation à des foires commerciales et le coté de compagnes de promotion des ventes.

Location de matériel : figurent ici les locations de machines, de plate-formes de forage et de navires de ravitaillement, d'instruments, de véhicules, d'aéronefs, d'ordinateurs et d'autre matériel semblable. Exclure tout contrat de crédit-bail financier.

BP-22F : Investissements effectués au Canada par des sociétés étrangères (annuel)

BP-22AF : Investissements effectués au Canada par des sociétés étrangères (trimestriel)

Page couverture

Veuillez indiquer dans la case prévue le numéro correspondant à la principale activité de la société. Inscrivez également la date où prend fin la période sur laquelle portent les renseignements fournis. Enfin, indiquez la date à laquelle la société a été constituée.

Opérations avec des non-résidents touchant les investissements au Canada par des sociétés étrangères

Section 1

Accroissement des investissements

  1. Investissements en espèces, en marchandises ou en services faits par le siège social
    Il s'agit de déclarer uniquement les augmentations des placements faits par le siège social à l'étranger. Pour ce qui est des diminutions, il faut les inscrire au poste 5 et non entre parenthèses. N'oubliez pas d'indiquer le code de pays.
  2. Bénéfices non-répartis au compte de contrôle du siège social
    Il s'agit d'indiquer uniquement la part du bénéfice de la période qui n'a pas été versée au siège social à l'étranger. La part du bénéfice versée à ce dernier doit figurer au poste 27. Veuillez prendre soin, dans l'un et l'autre cas, d'indiquer le bon code de pays. Les pertes inscrites au compte de contrôle du siège social doivent être inscrites au poste 6 et non entre parenthèses à ce poste.
  3. Emprunts contractés auprès d'autres non-résidents
    Ce poste sert à l'inscription des emprunts contractés auprès de banques et d'autres établissements étrangers.  Il ne s'agit pas d'indiquer l'encours des emprunts, mais bien l'accroissement total des emprunts durant l'année.  Pour ce qui est de la diminution totale des emprunts, il faut en inscrire le montant au poste 7 et non pas la soustraire de l'accroissement total.
  4. Autres accroissements des investissements
    Veuillez donner toutes les précisions utiles de manière à ce qu'il ne soit pas nécessaire de communiquer à nouveau avec vous.

Section 2

Diminution des investissements

  1. Diminution des investissements faits par le siège social
    Il faut faire état uniquement de la diminution des investissements.  L'augmentation des investissements doit être déclarée au poste 1.  N'oubliez pas d'indiquer le code de pays.
  2. Pertes imputées au compte de contrôle du siège social
    Il faut faire état uniquement des pertes de l'exercice en cours. Les bénéfices portés au compte de contrôle du siège social doivent être déclarés au poste 2.
  3. Remboursements de dettes à d'autres non-résidents
    On doit distinguer les dettes contractées auprès de banques des autres dettes. Il ne s'agit pas d'indiquer l'encours des emprunts, mais bien le montant de la diminution totale des emprunts durant l'année. Pour ce qui est de l'accroissement total des emprunts, il faut en inscrire le montant au poste 3 et non le soustraire de la diminution totale.
  4. Autres diminutions des investissements
    Veuillez donner toutes les précisions utiles de manière à ce qu'il ne soit pas nécessaire de communiquer à nouveau avec vous.

Section 3

Bilan de la succursale ou de la division canadienne

  • 9. à 22.
    Inscrivez, en milliers de dollars canadiens, les chiffres figurant dans les états financiers de la succursale ou de la division canadienne pour la période en cours et la période précédente.  N'oubliez pas d'indiquer les codes de pays aux postes 10ii, 19, 20 et 21.

Section 4

Certaines opérations avec des non-résidents au titre de l'état des résultats

  • 23. à 27.
    Inscrivez le montant net et le montant des retenues fiscales.  N'oubliez pas d'inscrire les codes de pays appropriés.  Les bénéfices nets pour l'exercice courant (poste 27) ne doivent comprendre que les bénéfices versés au siège social.  Les bénéfices non répartis au compte de contrôle du siège social pour l'exercice courant doivent figurer à la ligne 2 de la section 1.

Section 5

Investissements dans les sociétés en commandite et dans les entreprises en participation au Canada

Questions destinées aux sociétés en activité dans les industries minière, du pétrole et du gaz naturel au Canada

  1. Inscrivez les montants investis par des commanditaires ne résidant pas au Canada dans une société en commandite dans laquelle l'unité déclarante est le commandité. Il s'agit de déclarer ici le capital investi au Canada par l'entremise de sociétés en commandite par des non-résidents (particuliers, entreprises en participation, sociétés, successions, fiducies, fonds de placement, des fonds de pension, etc.). Les sorties de capitaux, représentant un désinvestissement ou un retour de capital en faveur de non-résidents, doivent également être déclarées. Une sortie nette de capitaux du Canada doit être inscrite entre parenthèses
  2. Inscrivez les montants investis par des non-résidents dans les entreprises en participation (joint-ventures) dont l'unité déclarante est l'exploitant. Ces investissements dans des entreprises en participation dans les domaines des mines, du pétrole, etc. au Canada peuvent être faits par des entités non résidentes (particuliers, sociétés, successions, fiducies, fonds de placement, etc.). Les sorties de capitaux, représentant un désinvestissement ou un retour de capital en faveur de non-résidents, doivent également être déclarées. Une sortie nette de capitaux du Canada doit être inscrite entre parenthèses.
  3. Ce poste comprend les paiements au titre de la production et des recettes à des non-résidents qui ont trait à leurs investissements dans des sociétés en commandite ou dans des entreprises en participation où l'unité déclarante est, respectivement, le commandité et l'exploitant. Ces paiements représentent le rendement sur le capital investi dans les sociétés en commandite ou les entreprises en participation en question.

BP-FIC : Investissements étrangers au Canada

Page couverture

Période de déclaration
Les données fournies doivent porter sur l'année civile se terminant le 31 décembre. Lorsqu'il est impossible de remplir le questionnaire pour l'année civile, choisissez la clôture d'exercice qui est la plus proche du 31 décembre.

Attestation
Veuillez fournir des renseignements sur la personne chargée de compléter le questionnaire.

Page 2

Section A – Participation étrangère dans l'entreprise déclarante canadienne
Cette section porte sur la participation des investisseurs directs étrangers et autres investisseurs étrangers dans l'entreprise déclarante canadienne.
Les investisseurs directs sont définis comme étant des sociétés étrangères ou des particuliers qui détiennent au moins 10 % des actions avec droit de vote de l'entreprise déclarante canadienne et qui ont une influence notable sur les décisions touchant l'exploitation de l'entreprise. Les autres investisseurs sont souvent appelés investisseurs de portefeuille et sont considérés comme des investisseurs passifs et détiennent moins de 10% des actions avec droit de vote.

Énumérer chaque investisseur direct étranger, leur pays de résidence et le pourcentage d'actions ordinaires et privilégiées détenues. Pour les autres investisseurs, il faut fournir uniquement le pourcentage d'actions ordinaires et privilégiées détenues par pays. Veuillez noter qu'il se peut que vous ayez à vous enquérir auprès de votre agent de transfert des pays de résidence des autres investisseurs.

  • Exemple
    La société mère de l'unité déclarante, qui est en Grande-Bretagne (GBR), détient 400 actions ordinaires.  Dans ce cas, il s'agirait d'inscrire au poste A1-A3, (Par des investisseurs directs), le nom de la société mère suivi du code de pays (GBR) et le pourcentage du nombre d'actions ordinaires détenues (100%).

Section B – Capitaux propres
Cette section porte sur la valeur totale de l'avoir des actionnaires de l'entreprise déclarante canadienne. Les données doivent être déclarées en fonction d'une consolidation canadienne, c'est à dire des données s'appliquant à l'entreprise déclarante canadienne et à toutes ses filiales et sociétés affiliées canadiennes.

B1 – Capital-actions
Indiquez la valeur du capital d'actions ordinaires et privilégiées.

B2 – Capital des détenteurs d'unités
Indiquez les investissements des propriétaires sous forme d'unités de fiducies ou de fonds, ou sous toutes autres formes.

B3 – Surplus d'apport
Il faut inclure la partie du capital d'apport représentée par :

  • La prime à l'émission d'actions avec valeur nominale
  • La partie du produit d'une émission d'actions sans valeur nominale que l'on ne porte pas au crédit du capital-actions
  • Le produit de la vente d'actions remises à la société à titre gratuit
  • Le gain sur des actions confisquées
  • L'excédent du prix de vente d'actions rachetées sur leur prix de rachat
  • Les dons de capital

B4 – Cumul des autres éléments du résultat étendu
Ce poste sert à déclarer les changements ayant influé sur le solde des actifs nets de l'entreprise déclarante canadienne qui proviennent des opérations, événements et circonstances non attribuables aux contributions des actionnaires de l'entreprise déclarante. Il s'agit d'éléments qui ne sont pas habituellement considérés dans le calcul du bénéfice net tels que :

  • Gains (pertes) non réalisés sur instruments dérivés
  • Gains ou pertes non réalisés sur conversion d'éléments monétaires en devises étrangères
  • Plus/moins value de réévaluation des actifs financiers à la valeur au marché

B5 – État des bénéfices non répartis
Veuillez fournir l'état des bénéfices non répartis de l'exercice sur une base consolidée mondialement.

Inscrivez les bénéfices (pertes) nets après impôts.

Indiquez le solde d'ouverture, les changements ayant influé sur le solde du compte durant la période de déclaration et le solde de fermeture.

Pages 3, 4 et 5

Section C – Passif envers les entités non résidentes

Cette section couvre les engagements à long terme de l'unité déclarante canadienne envers les non résidents. Elle en composée de trois parties : obligations (C1) ; emprunts bancaires (C2) et autres passifs à long terme (C3).
Les engagements à long terme inscrits à la section (C) doivent être fournis sur une base consolidée canadienne, c'est-à-dire en tenant compte des engagements à long terme de l'unité déclarante canadienne et de ses filiales canadiennes intégralement consolidées. Indiquez chaque type d'engagements sur une base individuelle. Pour chaque émission, indiquer le pays de détention et si l'émission est détenue par des investisseurs canadiens, des investisseurs directs étrangers ou d'autres investisseurs étrangers.

C1 – Obligations
Ce poste sert à déclarer les obligations, garanties ou non, dettes à long terme, effets à payer et autres dettes similaires émis par l'entreprise déclarante canadienne qui comportent une date d'émission, une date d'échéance et un taux d'intérêt fixe ou variable. Pour chaque émission, veuillez  indiquer le numéro de CUSIP/ISIN s'il est disponible.

C2 – Emprunts bancaires
En général, un prêt bancaire provient d'une banque unique dans un pays étranger. Dans ces cas, la distribution du prêt sera attribuée à 100 % à un seul pays étranger. Dans le cas de prêts consentis par des syndicats de banques, il faut inscrire tous les pays en cause et non pas seulement les pays des principales banques. Ces renseignements devraient se trouver dans les ententes de prêts.

C3 – Autres passifs à long terme
Ce poste inclut les comptes débiteurs inter-sociétés, les emprunts à long terme auprès de sociétés non apparentées, les emprunts hypothécaires et les contrats de location-acquisition (exclure les dépenses de location non-capitalisées et autres prêts en provenance des investisseurs étrangers)

Section C – Directives générales

Numéro de CUSIP/ISIN
CUSIP est l'acronyme anglais désignant le « Committee on Uniform Securities Identification Procedures » (comité d'immatriculation des valeurs mobilières). Le numéro CUSIP, qui comporte neuf caractères alphanumériques, désigne de façon unique la plupart des titres, notamment les actions de toutes les entreprises américaines et canadiennes enregistrées et les titres gouvernementaux américains et canadiens. Les numéros CUSIP sont attribués aux titres en vue de faciliter les procédures d'acquittement et de règlement.

Le numéro international d'identification des valeurs mobilières dont l'acronyme est ISIN est un code alphanumérique à douze chiffres utilisé à l'échelle mondiale pour identifier des valeurs mobilières spécifiques comme les obligations,  les actions (ordinaires et privilégiées), les opérations à terme, les garanties, les droits de souscription, les fiducies, les effets commerciaux et les options. Les numéros ISIN sont attribués aux titres afin de faciliter les procédures d'acquittement et de règlement. Au Canada et aux États-Unis, les numéros ISIN sont une version prolongée du numéro CUSIP (immatriculation des valeurs mobilières) à neuf caractères.

Date d'émission et d'échéance
Dans le cas des obligations pour lesquelles les données sont fournies, veuillez indiquer la date d'émission et d'échéance de la façon suivante : année, mois, jour.

Taux d'intérêt
Indiquez le taux d'intérêt de la façon suivante :
13 % devient 13,00
12 3/8 % devient 12,375
11 1/4 % devient 11,25

Si le taux d'intérêt est variable, veuillez l'indiquer de la façon suivante :
LIBOR + 1/2 % devient LIBOR + 0,5)
Taux de base + 1 1/4 % devient Taux de base + 1,25
Taux préférentiel + 3/8 % devient Taux préférentiel + 0,375

Devise de l'émission
Indiquez, à l'aide de la liste de codes de pays fournie, dans quelle devise le titre de créance a été émis. Même si la devise originale a fait l'objet d'un swap de devises, veuillez continuer d'indiquer les montants en fonction de la devise originale d'émission.

Solde des prêts
Indiquez les soldes des prêts en milliers de dollars canadiens à la fin de l'exercice. Les montants inscrits doivent être nets des remboursements en série ou des versements à un fonds d'amortissement.

Veuillez vous assurer que les chiffres inscrits dans les colonnes sont exacts, on se basera sur les différences dans les soldes des prêts entre deux périodes, en tenant compte des fluctuations du taux de change, pour vérifier et calculer la réduction ou le remboursement de la dette. Inclure les dettes venant à échéance dans les douze mois et qui ont pu être reclassifiées des comptes de long à court terme.

Répartition géographique des soldes de prêts
Indiquez les instruments d'emprunt (obligations, emprunts bancaires et autres passifs à long terme) détenues par des investisseurs au Canada ou à l'étranger.  Dans le cas des créances détenues par des investisseurs étrangers, veuillez préciser s'il s'agit de créances détenues par des investisseurs directs ou par d'autres investisseurs.

L'information sur la répartition géographique est cruciale aux fins de la balance des paiements.  Utilisez la liste des codes de pays pour identifier les pays où résident les investisseurs étrangers.  Il se peut que vous ayez à vous enquérir auprès de votre fiduciaire des pays de résidence de ces investisseurs.

BP-STRUC : Structure des sociétés canadiennes dans l'entreprise déclarante

Page couverture

Période de déclaration
Les données fournies doivent porter sur l'année civile se terminant le 31 décembre. Lorsqu'il est impossible de remplir le questionnaire pour l'année civile, choisissez la clôture d'exercice qui est la plus proche du 31 décembre.

Attestation
Veuillez fournir des renseignements sur la personne chargée de compléter le questionnaire.

Page 2

Partie 1.  Filiales canadiennes intégralement consolidées pour fins de déclaration sur les autres formules (BP) de la balance des paiements

Veuillez énumérer toutes les filiales comprises dans la consolidation à partir de laquelle a été rempli le formulaire d'enquête BP-FIC (Investissements étrangers au Canada). Indiquez le niveau de l'entreprise, le nom de la filiale et le pourcentage des actions privilégiées et des actions ordinaires détenues.

Partie 2.  Filiales et sociétés affiliées canadiennes non intégralement consolidées pour fins de déclaration sur les autres formules (BP) de la balance des paiements

Veuillez indiquer le niveau de l'entreprise, le nom de la filiale ou de la société affiliée, le pourcentage des actions privilégiées et des actions ordinaires détenues ainsi que la valeur totale de la participation de l'unité déclarante dans des sociétés canadiennes qui ne sont pas intégralement consolidées pour fins de déclaration sur d'autres formulaires (BP) de la balance des paiements tel que BP-FIC (Investissements étrangers au Canada). La valeur de la participation doit être la valeur comptable inscrite dans les livres de l'unité déclarante.  Les autres valeurs mobilières et les avances doivent comprendre uniquement les investissements à long terme.

BP-CIA : Investissements canadiens à l'étranger

Page couverture

Période de déclaration
Les données fournies doivent porter sur l'année civile se terminant le 31 décembre. Lorsqu'il est impossible de remplir le questionnaire pour l'année civile, choisissez la clôture d'exercice qui est la plus proche du 31 décembre.

Attestation
Veuillez fournir des renseignements sur la personne chargée de compléter le questionnaire.

Page 2

Cette partie sert à identifier les sociétés étrangères affiliées qui doivent être rapportées dans le questionnaire BP-CIA. Veuillez prendre note que ce questionnaire a été conçu pour pouvoir accommoder la majorité des répondants qui possèdent, dans la plupart des cas, cinq sociétés étrangères affiliées ou moins. Si vous détenez plus de cinq sociétés étrangères affiliées, veuillez photocopier ce questionnaire pour chacune des sociétés affiliées additionnelles qui doivent être déclarées ou communiquer avec nous pour obtenir des copies supplémentaires de ce questionnaire.

Page 3

Section A – Identité de la société étrangère affiliée

Nom de la filiale étrangère
Veuillez indiquer le pays dans lequel se situe l'investissement de la filiale étrangère (voir le code de pays à la page 14 du questionnaire).

Pays de la filiale étrangère
Veuillez indiquer le pays dans lequel se situe l'investissement de la filiale étrangère (voir le code de pays à la page 14 du questionnaire)

Principale activité industrielle de la société étrangère affiliée
Veuillez indiquer l'activité industrielle principale de la filiale étrangère en consultant la liste de codes à la page 15 du questionnaire. Si le code industriel de l'activité de la filiale n'est pas sur la liste, veuillez utiliser le code le plus proche de son activité.

Section B– Participation dans cette société étrangère affiliée
Veuillez fournir sous ce poste, le pourcentage des actions ordinaires et privilégiées détenu par l'entreprise canadienne déclarante et ses sociétés affiliées canadiennes dans la société étrangère affiliée à la fin de la période de déclaration :

Section C– Éléments des capitaux propres et de l'état des résultats (À partir des états financiers de la société étrangère affiliée)

Veuillez vous assurer que les chiffres inscrits dans cette section sont tirés des livres de la société affiliée étrangère. Veuillez indiquer la valeur totale de chacun des éléments tels qu'ils apparaissent dans les états financiers de la société affiliée à l'étranger.

Si les valeurs de la société affiliée à l'étranger sont libellées en devises étrangères, elles doivent être converties en dollars canadiens. Si les valeurs de la société affiliée à l'étranger ont été converties à partir d'une devise étrangère, veuillez indiquer à la question C1, la devise utilisée à partir de laquelle la conversion a été effectuée. Référez-vous à la page 14 du questionnaire pour les codes de pays.

Si vous avez à convertir les éléments de l'avoir et de l'état des bénéfices non répartis, veuillez utiliser le taux de clôture de la période de déclaration. Par contre, pour les éléments de l'état des résultats tels le revenu (perte) ainsi que les dividendes, utilisez les taux appropriés (i.e. taux moyen à midi ou taux de transaction quotidien).

Total du capital-actions (actions ordinaires et privilégiées)
Pour chacun des éléments, veuillez indiquer la valeur totale et non pas uniquement la part détenue par l'unité déclarante canadienne et de ses filiales canadiennes..

Surplus d'apport
Il faut inclure la partie du capital d'apport représentée par :

  • La prime à l'émission d'actions avec valeur nominale
  • La partie du produit d'une émission d'actions sans valeur nominale que l'on ne porte pas au crédit du capital-actions
  • Le produit de la vente d'actions remises à la société à titre gratuit
  • Le gain sur des actions confisquées
  • L'excédent du prix de vente d'actions rachetées sur leur prix de rachat
  • Les dons de capital

Cumul des autres éléments du résultat étendu
Ce poste sert à déclarer les changements ayant influé sur le solde des actifs nets de la société affiliée étrangère qui proviennent des opérations, événements et circonstances non attribuables aux contributions des actionnaires. Il s'agit d'éléments qui ne sont pas habituellement considérés dans le calcul du bénéfice net tels que :

  • Gains (pertes) non réalisés sur instruments dérivés
  • Gains ou pertes non réalisés sur conversion d'éléments monétaires en devises étrangères
  • Plus/moins value de réévaluation des actifs financiers à la valeur du marché

État des bénéfices non répartis
Veuillez fournir l'état des bénéfices non répartis de l'exercice.

Le montant déclaré doit correspondre à celui qui apparaît dans le bilan de la société affiliée étrangère, converti en dollars canadiens au taux de clôture de la période de déclaration.

Revenu (perte) net(te)
Inscrivez le revenu (perte) nets après impôts. Les gains/pertes extraordinaires doivent être exclus. Inscrivez une perte nette (valeur négative) entre parenthèses. Le montant inscrit doit correspondre au montant au bénéfice (perte) net qui apparaît dans l'état des revenus et dépenses des sociétés affiliées étrangères, converti en dollars canadien au taux de change moyen de la période.

Dividendes déclarés
Ce poste sert à l'inscription de tous les dividendes déclarés par la société affiliée étrangère.

Section D– Solde des dettes

Dettes inter entreprises
Ce poste sert à l'inscription des dettes inter-compagnies entre l'entreprise déclarante canadienne et sa société affiliée étrangère, incluant les dettes commerciales et non commerciales telles que les prêts, avances, découverts, hypothèques, obligations et toutes autres dettes.

Intérêts courus
Veuillez inscrire les revenus et les dépenses d'intérêts sur les dettes commerciales et non commerciales, les prêts, avances, découverts, prêts hypothécaires, obligations et toutes autres dettes entre la société déclarante canadienne et sa société affiliée étrangère.

Section E– Valeur comptable de l'investissement à long terme

Ce poste sert à l'inscription de la valeur comptable de l'investissement à long terme dans la filiale étrangère telle qu'elle figure au bilan de l'entreprise déclarante canadienne à la fin de la période de déclaration.

Section F– Statistiques sur les sociétés affiliées à participation majoritaire (incluant les succursales à l'étranger)
Fournir des statistiques sur les sociétés affiliées à l'étranger qui sont contrôlées et détenues majoritairement à plus de 50% des actions avec droits de vote par l'unité déclarante canadienne.

Nombre total des employés
Indiquer le nombre total d'employés à temps plein au sein de la société affiliée étrangère à la fin de la période de déclaration. S'il vous est impossible de trouver le nombre exact, veuillez fournir votre meilleure estimation.

Ventes totales ou revenu d'exploitation brut
Déclarer les ventes de biens et de services (en excluant les rendus et rabais ainsi que la taxe de vente et la taxe d'accise) ou les revenus bruts d'exploitation tels qu'ils apparaissent dans l'état des résultats de la société affiliée étrangère.

Les revenus de placement et les gains ou pertes en capital réalisés ou non réalisés doivent être exclus.

Nota :

  • Banques
    Les revenus bruts d'exploitation comprennent le revenu brut d'intérêts ainsi que d'autres revenus d'exploitation, tels que les droits, commissions et autres éléments similaires, qui figurent dans les états des résultats des entités étrangères.
    Les revenus de placements et les gains ou pertes en capital non réalisés doivent être exclus.
  • Compagnies d'assurance
    Les ventes de services comprennent le revenu en primes, le capital constitutif de rente et les recettes relatives à d'autres éléments de nature similaire tels qu'ils figurent dans les états des résultats des entités étrangères.
    Les revenus de placement et les gains ou pertes en capital non réalisés doivent être exclus.
  • Sociétés de portefeuille
    Il s'agit d'inscrire ici le revenu total qui figure dans les états des résultats des entités étrangères. Une société de portefeuille est une entreprise dont le revenu total est attribuable en majeure partie à sa part du bénéfice net des sociétés affiliées; règle générale, une société de portefeuille a investi dans les sociétés qu'elle détient une partie appréciable (habituellement au moins 50 %) de son actif total.

Actif total
Veuillez déclarer l'actif total tel qu'inscrit dans les états financiers des sociétés étrangères. Ce montant devrait correspondre à l'actif total figurant au bilan de ces sociétés même si celles-ci ne sont pas nécessairement détenues en entier par l'entreprise déclarante.

Passif total (excluant l'avoir des actionnaires)
Veuillez déclarer le passif total tel qu'indiqué dans les états financiers des sociétés étrangères en excluant l'avoir propre de l'entreprise déclarante dans les sociétés étrangères. Ce montant devrait correspondre au passif total figurant dans le bilan de ces sociétés même si celles-ci ne sont pas nécessairement détenues en entier par l'unité déclarante.

Répartition des ventes
Les montants des ventes déclarés au poste F2 doivent être répartis selon le pourcentage des ventes sur le marché national, canadien et autre.

S'il n'existe pas de données précises relatives à la répartition en pourcentage des ventes, veuillez fournir la meilleure estimation possible.

  • Ventes– marché national
    Déclarer le total des ventes de la filiale étrangère à l'intérieur de son pays de résidence.
  • Exportations - marché canadien
    Déclarer le total des ventes à la société mère canadienne et à toutes les sociétés au Canada qui y sont apparentées ou non.
  • Exportations - marchés autre que canadien
    Déclarer le total des ventes à d'autres pays que le Canada ainsi que le pays de résidence de la filiale étrangère.

Section G– Valeur de l'actif et éléments de revenu de la succursale étrangère

Actif net ou valeur nette des investissements
Ce poste sert à l'inscription de la valeur de l'actif net des succursales étrangères. Le montant de l'actif net déclaré comprend l'actif total à l'extérieur du Canada moins le total des dettes envers des résidents des pays étrangers, autres que le Canada.

Revenu (perte) net(te) de la succursale étrangère
Inscrivez le revenu (perte) nets après impôts. Les gains/pertes extraordinaires doivent être exclus. Inscrivez une perte nette (valeur négative) entre parenthèses. Le montant inscrit doit correspondre au montant au bénéfice (perte) net qui apparaît dans l'état des revenus et dépenses de la société affiliée étrangère, converti en dollars canadien au taux de change moyen de la période.

Annexe A – Définitions

Unité déclarante
L'entreprise déclarante canadienne doit fournir une déclaration consolidée s'appliquant à elle-même et à toutes ses filiales canadiennes, le cas échéant. Si l'unité déclarante est priée de remplir le questionnaire BP-STRUC, elle doit y expliquer la méthode comptable utilisée pour déclarer ses placements dans les filiales et les sociétés affiliées.

Sociétés mères étrangères/ actionnaires détenant le contrôle
Il s'agit des actionnaires qui sont capables d'exercer le contrôle de la société déclarante grâce aux valeurs qu'ils possèdent ou grâce à d'autres moyens. Il faut inclure des sociétés associées étrangères qui sont contrôlées dans une large mesure par les mêmes actionnaires ou le même groupe d'actionnaires.

Sociétés apparentées (sœurs)
Une autre société apparentée est une société qui a la même société-mère que l'unité déclarante, mais dans laquelle l'unité déclarante ne détient pas d'intérêt direct (moins de 10% de l'avoir).  Une société mère peut avoir une ou plus sociétés affiliées et elles sont appelées des sociétés sœurs.

Sociétés affiliées étrangères (Filiales, sociétés étrangères associées et succursales)
Il s'agit des sociétés dans lesquelles l'entreprise déclarante canadienne détient (directement et/ou indirectement par l'intermédiaire de ses filiales) une participation d'au moins 10 % des actions avec droit de vote. Une filiale est une société dans laquelle la société déclarante détient la majorité des actions (plus de 50%) avec droit de vote. Une société affiliée est une société dans laquelle la société déclarante détient de 10 % à 50 % des droits de vote. Une succursale n'est pas une entité légale autonome mais est autorisée à faire des affaires dans un pays étranger et peut englober des opérations liées à une division, une mine ou un projet de construction.

Investisseurs directs
Les investisseurs directs sont des actionnaires qui peuvent être résidents du Canada et des non-résidents qui détiennent 10% ou plus du capital-actions de l'entreprise. Ces actionnaires peuvent être des individus ou des entreprises publiques ou privées dont l'ampleur des investissements dans la société leur permet d'exercer une influence sur la gestion de celle-ci. En général, les investisseurs directs sont les sociétés-mères ou encore les actionnaires qui détiennent le contrôle de la société.

Investissements directs étrangers
Il s'agit des investissements effectués par des étrangers qui détiennent 10% ou plus de l'avoir des actionnaires de l'entreprise ou dont l'intérêt dans l'entreprise est suffisant pour leur permettre d'influer sur la gestion de celle-ci. Ces investisseurs, appelés investisseurs directs étrangers, sont des investisseurs d'autres pays tels que des entreprises, des entités sans personnalité morale ou des particuliers ; on les associe aux sociétés mères ou aux actionnaires qui détiennent le contrôle de la société.

Investisseurs de portefeuille et sociétés non apparentées
Il s'agit des investisseurs ou détenteurs de titres de créance de la société dont l'intérêt dans l'entreprise n'est pas suffisant pour une participation active à la gestion de la société. Les investisseurs de portefeuille et l'entreprise ne sont pas affiliés ni contrôlés dans une large mesure par les mêmes actionnaires ou par le même groupe d'actionnaires. Les investissements faits par ce type d'investisseurs se retrouveront sous la rubrique 'Autres investisseurs non-résidents' dans le questionnaire BP-FIC alors qu'ils seront sous la rubrique 'Sociétés étrangères non affiliées' dans le cas du questionnaire BP-QT.

Investissements de portefeuilles étrangers
Ce type d'investissement est fait par des investisseurs étrangers (des particuliers ou sociétés) qui sont des investisseurs passifs dans l'entreprise (détiennent moins de 10% de l'avoir). Leur participation au capital-actions ou les titres de créances qu'ils détiennent ne leur permettent pas d'influer sur la gestion de l'entreprise. Ces investisseurs sont généralement investisseurs de portefeuilles étrangers. Ils peuvent détenir des actions ordinaires ou privilégiés de l'entreprise ou encore fournir du capital sous forme de prêts ou par l'achat de titres de créance. Il peut s'agir de banques étrangères, de fonds de pension, de fonds de placement, d'institutions financières.

Placements à long terme
Doivent être considérés comme à long terme tous les placements destinés à demeurer en cours durant plus d'un an après la date de placement, ou qui le demeureront probablement. Si des opérations qui se sont traduites par une augmentation et une diminution des créances avec un pays particulier ont été effectuées pendant l'année, il faut indiquer chacune d'elles et non un montant net.

Annexe B - Liste des codes de pays

Veuillez utiliser les codes suivants pour identifier le pays dans lequel les actions ou les passifs sont détenus, ainsi que la devise d'émission pour les passifs :

Nota : Pour la devise euro veuillez coder "EUR".

Annexe B – Liste des codes de pays
Sommaire du tableau
Le tableau montre les résultats de table1. Les données sont présentées selon code (titres de rangée) et pays(figurant comme en-tête de colonne).
CODE PAYS
AFG Afghanistan
ZAF Afrique du Sud, République d'
ALB Albanie
DZA Algérie
DEU Allemagne
AND Andorre
AGO Angola
AIA Anguilla
ATG Antigua et Barbuda
SAU Arabie Saoudite
ARG Argentine
ARM Arménie
ABW Aruba
AUS Australie
AUT Autriche
AZE Azerbaïdjan
BHS Bahamas
BHR Bahrein
BGD Bangladesh
BRB Barbade
BLR Bélarus
BEL Belgique
BLZ Belize
BEN Bénin
BMU Bermudes
BTN Bhoutan
MMR Birmanie (Myanmar)
BOL Bolivie
BIH Bosnie et Herzégovine
BWA Botswana
BRA Brésil
BRN Brunéi Darussalam
BGR Bulgarie
BFA Burkina Faso
BDI Burundi
CYM Caïmanes. Îles
KHM Cambodge
CMR Cameroun
CAN Canada
CPV Cap-Vert
CAF Centrafricaine, République
CHL Chili
CHN Chine
CYP Chypre
COM Comores
COD Congo, République démocratique du
COG Congo, République du
COK Cook, Îles
PRK Corée du Nord
KOR Corée du Sud
CRI Costa Rica
CIV Côte D'Ivoire
HRV Croatie
CUB Cuba
DNK Danemark
DJI Djibouti
DOM Dominicaine (République)
DMA Dominique
EGY Egypte
SLV El Salvador
ARE Émirats Arabes Unis
ECU Equateur
ERI Érythrée
ESP Espagne
EST Estonie
USA États-Unis
ETH Ethiopie
FLK Falkland, Îles (Malvinas)
FRO Féroé, Îles
FJI Fodji
FIN Finlande
FRA France
GAB Gabon
GMB Gambie
GEO Géorgie
GHA Ghana
GIB Gibraltar
GRC Grèce
GRD Grenade
GRL Groenland
GLP Guadeloupe
GTM Guatémala
GGY Guernesey
GIN Guinée
GNQ Guinée Equatoriale
GNB Guinée-Bissau
GUY Guyana
GUF Guyane Française
HTI Haiti
HND Honduras
HKG Hong Kong, region administrative spéciale
HUN Hongrie
IMN Îles de man
IND Inde
IDN Indonésie
IRN Iran
IRQ Iraq
IRL Irlande, République d'
ISL Islande
ISR Israël
ITA Italie
JAM Jamaïque
JPN Japon
JEY Jersey
JOR Jordanie
KAZ Kazakhstan
KEN Kenya
KGZ Kirghizistan
KIR Kiribati
XKO Kosovo
KWT Koweit
LAO Laos
LSO Lesotho
LVA Lettonie
LBN Liban
LBR Libéria
LBY Libye
LIE Liechtenstein
LTU Lithuanie
LUX Luxembourg
MAC Macao region administrative spéciale
MKD Macédoine, République de
MDG Madagascar
MYS Malaisie
MWI Malawi
MDV Maldives
MLI Mali
MLT Malte
MAR Maroc
MHL Marshall, ïles
MUS Maurice
MYT Mayotte
MEX Mexique
MDA Moldova
MCO Monaco
MNG Mongolie
MNE Monténégro
MAM Namibie
TZA Tanzanie
TCD Tchad
CZE Tchèque, République
THA Thaïlande
TLS Timor-Leste
TGO Togo
NPL Népal
NIC Nicaragua
NER Niger
NGA Nigéria
NOR Norvège
NCL Nouvelle-Calédonie
NZL Nouvelle Zélande
IOT Océan Indien, Territoire britannique de
OMN Oman
UGA Ouganda
UZB Ouzbékistan
PAK Pakistan
PAN Panama
PNG Papouasie-Nouvelle-Guinée
PRY Paraguay
NLD Pays-Bas
PER Pérou
PHL Philippines
POL Pologne
PYF Polynésie française
PRI Porto Rico
PRT Portugal
QAT Qatar
ROU Roumanie
GBR Royaume-Uni
RUS Russie, Fédération de
RWA Rwanda
LCA Sainte Lucie
SPM Saint-Pierre-et-Miquelon
WSM Samoa
SEN Sénégal
SRB Serbie
SYC Seychelles
SLE Sierra Leone
SGP Singapour
SVK Slovaquie
SVN Slovénie
SOM Somalie
SDN Soudan
LKA Sri Lanka
SWE Suède
CHE Suisse
SUR Surinam
SWZ Swaziland
SYR Syrie
TJK Tadjikistan
TWN Taiwan
TUR Turquie
UKR Ukraine
URY Uruguay
VEN Vénézuela
VNM Viet Nam
YUG Yougoslavie
TTO Trinité-et-Tobago
TUN Tunisie
TKM Turkménistan
ZMB Zambie
ZWE Zimbabwe

Enquête mensuelle sur le commerce de détail (EMCD) – Énoncé de la qualité des données

Objectifs, utilisation et utilisateurs
Concepts, variables et classifications
Couverture et bases de sondage
Échantillonnage
Conception du questionnaire
Réponse et non-réponse
Opérations de collecte et de saisie des données
Vérification
Imputation
Estimation
Révisions et désaisonnalisation
Évaluation de la qualité des données
Contrôle de la divulgation

1. Objectifs, utilisation et utilisateurs

1.1. Objectifs

L’Enquête mensuelle sur le commerce de détail (EMCD) fournit des renseignements sur la performance du secteur du commerce de détail et, quand les données sont combinées à d’autres statistiques, représente un important indicateur de l'état de l’économie canadienne.

1.2. Utilisation

Les estimations fournissent une mesure de la santé et de la performance du secteur du commerce de détail. L'information recueillie est utilisée pour estimer le niveau et la tendance mensuelle des ventes ainsi que le nombre d’emplacements. À la fin de chaque année, les estimations donnent un premier aperçu de la valeur annuelle des ventes au détail et de la performance du secteur.

1.3. Utilisateurs

Divers organismes, associations sectorielles et gouvernements utilisent l'information. Les détaillants utilisent les résultats de l'enquête pour comparer leurs résultats à ceux d'entreprises similaires, ainsi qu'à des fins de marketing. Les associations de détaillants peuvent surveiller la performance de leur industrie et promouvoir les industries du commerce de détail. Les investisseurs peuvent surveiller la croissance de l'industrie, ce qui peut donner aux détaillants un meilleur accès au capital d'investissement. Les données de l'enquête aident les administrations à comprendre le rôle des détaillants dans l'économie, ce qui facilite l'élaboration des politiques et des encouragements fiscaux. Le commerce de détail étant un important secteur de l'économie canadienne, les données permettent aux administrations de déterminer plus exactement la santé globale de l'économie grâce à l'utilisation des estimations dans le calcul du produit intérieur brut (PIB) national.

2. Concepts, variables et classifications

2.1. Concepts

Le secteur du commerce de détail comprend les établissements dont l’activité principale consiste à vendre des marchandises au détail, généralement sans transformation, et à fournir des services connexes.

Le commerce de détail représente le dernier maillon de la chaîne de distribution; les détaillants sont donc organisés pour vendre des marchandises en petites quantités au grand public. Ce secteur comprend deux grands types d’établissements : les détaillants en magasin et les détaillants hors magasin. L’EMCD couvre uniquement les détaillants en magasin. Leurs principales caractéristiques sont décrites ci-après.

Les détaillants en magasin exploitent des points de vente fixes, situés et conçus de manière à attirer un grand nombre de passants. De façon générale, les magasins de détail ont de grands étalages et font de la publicité dans les médias. Ils vendent surtout des biens de consommation qui intéressent les particuliers ou les ménages, mais certains servent aussi les entreprises et une clientèle institutionnelle. Parmi ces établissements, on compte les magasins de fournitures de bureau, les magasins d’ordinateurs et de logiciels, les stations-service, les vendeurs de matériaux de construction, les magasins de fournitures de plomberie et de fournitures électriques.

En plus de vendre des marchandises, certains types de détaillants fournissent des services après-vente, comme des services de réparation et d’installation. Ainsi, les concessionnaires d’automobiles neuves, les magasins d’électronique et d’appareils ménagers, et les magasins d’instruments et de fournitures de musique assurent fréquemment un service de réparation, alors que les magasins de revêtements de sol et les magasins de garnitures de fenêtres fournissent souvent des services d’installation. En règle générale, les établissements qui vendent des marchandises au détail et qui ont un service après-vente sont classés dans ce secteur.

Les salles d’exposition des sociétés de vente sur catalogue, les stations-service et les marchands de maisons mobiles sont assimilés à des détaillants en magasin.

2.2. Variables

Les ventes sont définies comme étant les ventes de toutes les marchandises achetées pour la revente, nettes des rendus et des escomptes. Sont inclus les honoraires et les commissions résultant de la vente de biens et de services pour le compte de tiers, comme la vente de billets de loterie, de billets d’autobus et de cartes de téléphone. Sont également inclus les recettes provenant des pièces et de la main-d’oeuvre utilisées pour les services d'entretien et de réparation, les revenus de location et de location à bail de biens et de matériel, les revenus provenant de services, y compris les services de restauration, les ventes de biens fabriqués en tant qu’activité secondaire et la valeur des marchandises prélevées par le propriétaire pour son usage personnel. Sont exclus les autres revenus de location de biens immobiliers, les frais de placement, les subventions d’exploitation et autres, les redevances et les droits de franchise.

L’emplacement d’affaires comprend le ou les emplacements physiques où a lieu l’activité commerciale dans chaque province et territoire et dont les ventes sont créditées ou comptabilisées dans les états financiers de l’entreprise. Pour les détaillants, il s’agit normalement d’un magasin.

Dollars constants : La valeur du commerce de détail est mesurée de deux façons : par la prise en compte des effets de la variation des prix sur la valeur des ventes et par l’élimination des effets de la variation des prix. La première mesure est la valeur des ventes au détail en dollars courants et la seconde, la valeur des ventes au détail en dollars constants. Pour calculer l’estimation en dollars courants, on agrège la valeur des ventes pondérées de tous les points de vente au détail. Pour calculer l’estimation en dollars constants, il faut d’abord rajuster la valeur des ventes par rapport à une année de base en utilisant l’Indice des prix à la consommation, puis additionner les valeurs résultantes.

2.3. Classification

L’Enquête mensuelle sur le commerce de détail est fondée sur la définition du commerce de détail adoptée dans le SCIAN (Système de classification des industries de l’Amérique du Nord). Le SCIAN est le cadre commun reconnu pour la production de statistiques comparables par les organismes statistiques du Canada, du Mexique et des États-Unis. L’accord définit les limites de 20 secteurs. Le SCIAN est fondé sur un cadre conceptuel axé sur la production, ou l’offre, en ce sens que les établissements sont regroupés en classes ou branches d’activité d’après la similarité des processus utilisés pour produire les biens et les services.

Les estimations sont calculées pour 21 groupes fondés sur des agrégations spéciales du Système de classification des industries de l’Amérique du Nord (SCIAN) de 2012. Les 21 groupes sont en outre agrégés en onze sous-secteurs.

Du point de vue géographique, les estimations des ventes sont produites pour le Canada et pour chaque province et territoire.

3. Couverture et bases de sondage

La base de sondage de l'Enquête mensuelle sur le commerce de détail (EMCD) est le Registre des entreprises (RE) de Statistique Canada. Ce dernier est une liste structurée d'entreprises productrices de biens et de services au Canada. Cette base de données tenue à jour centralement contient des renseignements détaillés sur la plupart des entités commerciales exploitées au Canada. Le RE couvre toutes les entreprises constituées en société, avec ou sans employés. Pour les entreprises non constituées en société, le RE comprend toutes les entreprises ayant des employés, ainsi que les entreprises sans employés ayant des ventes annualisées provenant d'un compte de la taxe sur les produits et services (TPS) ou un revenu annuel provenant de la déclaration d'impôt individuelle.

Dans le RE, les entreprises sont représentées selon une structure hiérarchique à quatre niveaux ayant pour sommet l'entreprise statistique suivie, par ordre décroissant, par la compagnie statistique, l'établissement statistique et l'emplacement statistique. Une entreprise peut être reliée à une ou à plusieurs compagnies statistiques, une compagnie statistique à un ou à plusieurs établissements statistiques et un établissement statistique à un ou à plusieurs emplacements statistiques.

La population cible de l'EMCD comprend tous les établissements statistiques figurant dans le RE, excluant les entreprises non constituées en société n'ayant pas d'employés dont les ventes annuelles sont inférieures à 30 000 $, qui sont classés dans le secteur du commerce de détail d'après le Système de classification des industries de l'Amérique du Nord (SCIAN) (environ 200 000 établissements). La fourchette de codes du SCIAN pour le secteur du commerce de détail varie de 441100 à 453999. Un établissement statistique est l'entité de production ou le plus petit groupe d'entités de production qui produit un ensemble de biens ou de services homogènes, dont les activités ne débordent pas les frontières provinciales/territoriales, et qui est en mesure de fournir des données sur la valeur de la production, ainsi que sur le coût des matières utilisées et le coût et l'importance de la main-d'oeuvre affectée à la production. L'entité de production est l'unité physique où se déroulent les activités de l'entreprise. Elle doit avoir une adresse de voirie et une main-d'oeuvre directement affectée au processus de production.

Sont exclus de la population cible les établissements auxiliaires (producteurs de services de soutien de l'activité de production de biens et services destinés au marché de plus d'un établissement au sein de l'entreprise, et qui sont considérés comme un centre de coûts ou un centre de dépenses discrétionnaires pour lequel les données sur tous les coûts, y compris la main-d'oeuvre et l'amortissement, peuvent être déclarées par l'entreprise), les futurs établissements, les établissements pour lesquels les signaux économiques indiquent un revenu manquant ou nul, et les établissements appartenant aux catégories du SCIAN non couvertes qui suivent :

  • 4541 (entreprises de télémagasinage et de vente par correspondance)
  • 4542 (exploitants de distributeurs automatiques)
  • 45431 (marchands de combustible)
  • 45439 (autres établissements de vente directe)

4. Échantillonnage

L'échantillon de l'EMCD est formé de 10 000 groupes d'établissements (grappes) classés dans le secteur du commerce de détail et sélectionnés à partir du Registre des entreprises de Statistique Canada. Par définition, une grappe d'établissements comprend tous les établissements appartenant à une entreprise statistique qui font partie d'un même groupe industriel et d'une même région géographique. L’EMCD est fondée sur un plan d'échantillonnage stratifié avec sélection d'un échantillon aléatoire simple dans chaque strate. La stratification est faite selon des groupes industriels (majoritairement mais non exclusivement des SCIAN à quatre chiffres) et selon la région géographique, c'est-à-dire selon la province ou le territoire. Ensuite, la population est stratifiée selon la taille de l'établissement. La mesure de taille est créée en combinant des données provenant d'enquêtes indépendantes et trois variables administratives, à savoir le revenu annuel profilé, les ventes assujetties à la TPS exprimées sur une base annuelle et le revenu de la déclaration d’impôt (T1 ou T2).

Les strates de taille comptent une strate à tirage complet (recensement), au moins deux strates à tirage partiel (échantillonnées partiellement) et une strate à tirage nul (non échantillonnée). La strate à tirage nul est destinée à réduire le fardeau de réponse en excluant les entreprises les plus petites de la population observée. Ces entreprises représentent, en principe, au plus 10 % du total des ventes. Au lieu d'envoyer un questionnaire à ces entreprises, on produit les estimations d'après des données administratives.

L'échantillon est réparti de façon optimale afin d'atteindre les coefficients de variation cibles au niveau du Canada dans son ensemble, de la province ou du territoire, de l’industrie et des groupes industriels selon la province ou le territoire. On procède aussi à un suréchantillonnage pour tenir compte des unités disparues, non répondantes ou classées incorrectement.

L'EMCD est une enquête répétée avec maximisation du chevauchement des échantillons mensuels. On retient l'échantillon d’un mois à l’autre et, chaque mois, on y ajoute de nouvelles unités (naissances). Pour découvrir les nouvelles unités visées par l'EMCD, c'est-à-dire les nouvelles grappes d'établissement(s), on examine chaque mois l'univers le plus récent du RE. On stratifie ces nouvelles unités conformément aux mêmes critères que ceux appliqués à la population initiale, puis on les échantillonne conformément à la fraction d'échantillonnage de la strate à laquelle elles appartiennent et on les ajoute à l'échantillon mensuel. Des disparitions d'entité surviennent également chaque mois. Une entité disparue peut être une grappe d'établissements qui ont cessé leurs activités (fermeture) ou dont les activités principales ne se rattachent plus au commerce de détail (hors du champ). La situation de ces entreprises est mise à jour dans le RE d'après des renseignements de source administrative et les commentaires reçus lors des enquêtes, y compris ceux des entreprises prenant part à l'EMCD. Les méthodes suivies pour traiter les unités disparues et les unités classées incorrectement font partie des procédures d'échantillonnage et de mise à jour de la population.

5. Conception du questionnaire

L’Enquête mensuelle sur le commerce de détail englobe les sous-enquêtes suivantes :

Enquête mensuelle sur le commerce de détail – R8

Enquête mensuelle sur le commerce de détail (avec les stocks) – R8

Enquête sur les ventes et stocks de boissons alcooliques

Le questionnaire est conçu pour recueillir mensuellement auprès d'un échantillon de détaillants des données sur les ventes au détail, sur le nombre d'emplacements commerciaux par province ou territoire et sur les stocks de biens possédés et destinés à la revente. Lors du remaniement de 2004, la plupart des questionnaires n'ont subi que des changements de présentation. Le questionnaire sur les ventes et les stocks de boissons alcooliques a subi des modifications plus importantes. Les modifications ont été discutées avec les intervenants et les répondants ont eu l'occasion de faire des commentaires avant que le nouveau questionnaire ne soit finalisé. Si d'autres modifications devaient être apportées à l'un des questionnaires, les changements proposés seraient soumis à un comité d'examen et ferait l'objet d'un essai sur le terrain auprès de répondants et d'utilisateurs de données pour s'assurer de leur pertinence.

6. Réponse et non-réponse

6.1. Réponse et non-réponse

Bien que les gestionnaires d'enquête et les employés des opérations fassent tout leur possible pour maximiser la réponse à l'EMCD, un certain degré de non-réponse a lieu. Pour qu'un établissement statistique soit considéré comme répondant, il faut que le degré de réponse partielle (situation où une réponse exacte n'est obtenue que pour certaines questions posées au répondant) atteigne un seuil minimal au-dessous duquel la déclaration fournie par l'établissement serait rejetée et l'établissement, considéré comme une unité non répondante. Le cas échéant, on considère que l'entreprise n'a pas répondu du tout.

La non-réponse a deux effets sur les données : premièrement, elle introduit un biais dans les estimations si les non-répondants diffèrent des répondants en ce qui concerne les caractéristiques mesurées et, deuxièmement, elle fait augmenter la variance d'échantillonnage des estimations, parce que la taille effective de l'échantillon est réduite comparativement à celle considérée au départ.

L'ampleur des efforts déployés pour obtenir une réponse auprès d'un non-répondant dépend des contraintes budgétaires et de temps, de l'effet de la non-réponse sur la qualité globale et du risque de biais dû à la non-réponse.

La méthode principalement utilisée pour réduire l'effet de la non-réponse à l'étape de l'échantillonnage consiste à augmenter la taille de l'échantillon en appliquant un taux de suréchantillonnage déterminé d'après les résultats d'enquêtes similaires.

Les cas de non-réponse qui surviennent malgré les méthodes appliquées aux étapes de l'échantillonnage et de la collecte pour réduire l'effet de la non-réponse sont traités par imputation.

Afin de déterminer l'importance de la non-réponse qui a lieu chaque mois, on calcule divers taux de réponse. Pour un mois de référence donné, on produit les estimations au moins deux fois (estimations provisoires et estimations révisées). Entre les deux exécutions, certaines données fournies par les répondants peuvent être jugées inutilisables et des valeurs imputées peuvent être corrigées au moyen de données fournies par les répondants. Par conséquent, les taux de réponse sont calculés après chaque exécution du processus d'estimation.

Pour l'EMCD, deux types de taux sont calculés (non pondérés et pondérés). Afin d'évaluer l'efficacité du processus de collecte, on calcule les taux de réponse non pondérés. Les taux pondérés, fondés sur le poids d'estimation et la valeur de la variable d'intérêt, évaluent la qualité de l'estimation. À l'intérieur de chacun de ces types de taux, il existe des taux distincts pour les unités faisant partie de l'échantillon et pour les unités qui sont uniquement modélisées à partir de données administratives qui ont été extraites des fichiers de TPS.

Afin d’obtenir une meilleure idée du succès du processus de collecte de données, on calcule deux taux non pondérés appelés « taux de résultat de la collecte » et « taux de résultat de l'extraction ». On calcule ces taux en divisant le nombre de répondants par le nombre d'unités avec lesquelles on a essayé de prendre contact ou pour lesquelles on a essayé de recevoir des données extraites. Les déclarants non mensuels (répondants bénéficiant de modalités de déclaration spéciales leur permettant de ne pas produire de déclaration chaque mois, mais pour lesquels des données réelles sont disponibles lors des révisions subséquentes) sont exclus du numérateur ainsi que du dénominateur pour les mois où aucun contact n'est pris avec eux. Brièvement, les divers taux de réponse se calculent comme suit :

Taux pondérés :

Taux de réponse des unités faisant partie de l'échantillon (estimation) =
Somme des ventes pondérées des unités avec situation de réponse i / Somme des ventes pondérées des unités faisant partie de l'échantillon

i = unités pour lesquelles il existe des données déclarées qui seront utilisées dans l'estimation ou qui sont des refus convertis, ou pour lesquelles il existe des données déclarées qui n'ont pas encore été évaluées pour l'estimation.

Taux de réponse des unités modélisées à partir de données administratives (estimation) = Somme des ventes pondérées des unités avec situation de réponse ii / Somme des ventes pondérées des unités modélisées à partir de données administratives

ii = unités pour lesquelles il existe des données extraites des fichiers administratifs et qui sont utilisables pour l'estimation.

Taux de réponse total (estimation) =
Somme des ventes pondérées des unités avec situation de réponse i ou situation de réponse ii / Somme de toutes les ventes pondérées

Taux non pondérés :

Taux de réponse des unités faisant partie de l'échantillon (collecte) =
Nombre de questionnaires avec situation de réponse iii / Nombre de questionnaires avec situation de réponse iv

iii = unités pour lesquelles il existe des données déclarées (dont le cas n'est pas résolu, utilisées ou non utilisées pour l'estimation) ou qui sont des refus convertis;

iv = toutes les unités susmentionnées, ainsi que les unités qui ont refusé de répondre, les unités avec lesquelles on n'a pas pris contact et d'autres types d'unités non répondantes.

Taux de réponse des unités modélisées à partir de données administratives (extraction) =
Nombre de questionnaires avec situation de réponse vi / Nombre de questionnaires avec situation de réponse vii

vi = unités dans le champ d'observation pour lesquelles il existe des données (utilisables ou non utilisables) extraites des fichiers administratifs;

vii = toutes les unités susmentionnées, ainsi que les unités qui ont refusé de déclarer la source de données administratives, les unités avec lesquelles on n'a pas pris contact et d'autres types d'unités non répondantes.

(% de questionnaires recueillis par rapport à l'ensemble des questionnaires dans le champ d'observation)

Taux de résultat de la collecte =
Nombre de questionnaires avec situation de réponse iii / Nombre de questionnaires avec situation de réponse viii

iii = même que iii défini plus haut;

viii = même que iv, à part l'exclusion des unités avec lesquelles on a pris contact, parce que leur réponse n'est pas disponible pour un mois particulier, puisqu'il s'agit de déclarants non mensuels.

Taux de résultat de l'extraction =
Nombre de questionnaires avec situation de réponse ix / Nombre de questionnaires avec situation de réponse vii

ix = même que vi, avec l'ajout des unités extraites qui ont été imputées ou qui étaient hors du champ de l'enquête;

où vii = même que vii défini plus haut.

(% de questionnaires recueillis par rapport à l'ensemble des questionnaires dans le champ d'observation que nous avons tenté de recueillir)

Tous les taux pondérés et non pondérés susmentionnés sont calculés au niveau du groupe industriel, de la région et du groupe de taille, ainsi que pour toute combinaison de ces niveaux.

Utilisation des données administratives

Réduire le fardeau de réponse est un défi à long terme pour Statistique Canada. Afin d’alléger le fardeau de réponse et de réduire les coûts reliés à l’enquête, notamment en ce qui a trait aux petites entreprises, l’EMCD a réduit le nombre d’établissements simples de l’échantillon qui sont enquêtés directement et dérive plutôt les chiffres de vente pour ces établissements à partir des fichiers de la TPS en utilisant un modèle statistique. Le modèle explique les différences entre les ventes et les recettes déclarées aux fins de la TPS, ainsi que le décalage entre la période de référence de l’enquête et celle de la TPS.

Pour en savoir plus sur la méthode utilisée lors de la modélisation des ventes tirées de fichiers administratifs, veuillez consulter le document intitulé Enquête mensuelle sur le commerce de détail : Utilisation de données administratives sous la rubrique ‘Documentation’ du BMDI.

Le tableau 1 contient les fractions de réponses pondérées pour tous les groupes industriels ainsi que pour toutes les provinces et territoires. Pour des fractions de réponses pondérées plus détaillées, veuillez contacter la section du marketing et de la diffusion au (613) 951-3549, sans frais: 1-877-421-3067 or par courriel à retailinfo@statcan.

6.2. Méthodes utilisées pour réduire la non-réponse durant la collecte

Beaucoup d’efforts sont déployés en vue de réduire au minimum la non-réponse durant la collecte. Les méthodes utilisées incluent des techniques d'interview, comme l'utilisation de questions d'approfondissement et des techniques de persuasion, la replanification répétée des appels téléphoniques pour obtenir l'information et la mise en place de procédures indiquant aux intervieweurs comment s'y prendre avec les répondants qui refusent de participer à l'enquête.

Si les données demandées ne sont pas disponibles au moment de la collecte, la meilleure estimation fournie par le répondant est acceptée et est révisée par la suite, quand les données réelles sont disponibles.

Pour réduire au minimum la non-réponse totale pour toutes les variables, des réponses partielles sont acceptées. En outre, les questionnaires sont personnalisés pour la collecte de certaines variables, comme les stocks, de sorte que la collecte ait lieu durant les mois où les données sont disponibles.

Enfin, pour établir un climat de confiance entre les intervieweurs et les répondants, les cas sont généralement affectés au même intervieweur chaque mois. Ce dernier peut ainsi établir une relation personnelle avec le répondant et renforcer sa confiance.

7. Opérations de collecte et de saisie des données

La collecte des données est réalisée par les bureaux régionaux de Statistique Canada.

Tableau 1: Fractions de réponse pondérées par SCIAN et pour les provinces et territoires, mai 2016 :
Sommaire du tableau
Le tableau montre les résultats de Tableau 1: Fractions de réponse pondérées par SCIAN et pour les provinces et territoires Fractions de réponse pondérées, calculées selon Total, Enquêté et Administrative unités de mesure (figurant comme en-tête de colonne).
  Fractions de réponse pondérées
Total Enquêté Administrative
SCIAN - Canada  
Concessionnaires de véhicules et de pièces automobiles 90,4 91,1 66,7
Concessionnaires d'automobiles 91,9 92,2 69,0
Concessionnaires d'automobiles neuves 93,3 93,3 Note ...: n'ayant pas lieu de figurer
Concessionnaires d'automobiles d'occasion 69,7 69,9 69,0
Autres concessionnaires de véhicules automobiles 76,7 78,7 65,7
Magasins de pièces, de pneus et d' accessoires pour véhicules automobiles 84,1 86,6 64,7
Magasins de meubles et d'accessoires de maison 87,8 90,8 59,7
Magasins de meubles 91,4 92,3 75,0
Magasins d'accessoires de maison 81,2 87,7 52,9
Magasin d'appareils électroniques et ménagers 82,9 83,3 65,6
Marchands de matériaux de construction et de matériel et fournitures de jardinage 87,5 90,0 48,6
Magasins d'alimentation 83,8 86,1 51,4
Épiceries 88,2 90,8 54,3
Supermarchés et autres épiceries (sauf les dépanneurs) 91,1 93,6 57,7
Dépanneurs 48,4 51,2 29,4
Magasins d'alimentation spécialisés 59,0 63,1 38,0
Magasins de bière, de vin et de spiritueux 73,8 74,5 38,6
Magasins de produits de santé et de soins personnels 88,4 88,4 87,1
Stations-service 76,9 78,6 52,7
Magasins de vêtements et d'accessoires vestimentaires 88,1 89,3 42,8
Magasins de vêtements 88,9 89,9 46,2
Magasins de chaussures 88,2 89,3 13,6
Bijouteries et magasins de bagages et de maroquinerie 80,7 83,2 42,0
Magasins d'articles de sport, d'articles de passe-temps, d'articles de musique et de livres 87,9 92,6 31,1
Magasins de marchandises diverses 99,3 99,4 90,2
Grands magasins 100,0 100,0 Note ...: n'ayant pas lieu de figurer
Autres magasins de marchandises diverses 98,9 99,0 90,2
Magasins de détail divers 77,9 82,9 28,5
Total 88,0 89,4 56,5
Régions  
Terre-Neuve-et-Labrador 82,0 82,9 48,2
Île-du-Prince-Édouard 82,3 83,3 7,0
Nouvelle Écosse 92,7 93,8 54,9
Nouveau-Brunswick 84,3 85,5 52,8
Québec 89,7 91,5 57,7
Ontario 89,2 91,0 54,3
Manitoba 81,8 82,1 64,1
Saskatchewan 88,6 89,6 65,2
Alberta 86,9 88,1 64,4
Colombie-Britannique 85,1 86,4 48,9
Territoire du Yukon 78,4 78,4 Note ...: n'ayant pas lieu de figurer
Territoires du Nord-Ouest 82,5 82,5 Note ...: n'ayant pas lieu de figurer
Nunavut 94,0 94,0 Note ...: n'ayant pas lieu de figurer

Fractions de réponse pondérées

Ces derniers envoient un questionnaire aux répondants ou communiquent avec ceux-ci par téléphone afin d'obtenir les valeurs de leurs ventes et de leurs stocks, et de confirmer l'ouverture ou la fermeture des emplacements d'affaires. Ils effectuent aussi un suivi auprès des non-répondants. La collecte des données débute environ sept jours ouvrables après la fin du mois de référence et se poursuit pendant tout le mois en question.

Les entités qui participent à l'enquête pour la première fois reçoivent une lettre d'introduction en vue d’informer le répondant qu'un représentant de Statistique Canada l'appellera. Cet appel a pour but de présenter l'enquête, de confirmer l'activité de l'entreprise, d'établir et de commencer la collecte des données, et de répondre à toutes questions que le répondant pourrait avoir.

8. Vérification

La vérification des données est l'application de contrôles pour déceler les entrées manquantes, invalides ou incohérentes, ou pour repérer les enregistrements de données susceptibles d'être erronés. Durant le processus d'enquête de l'EMCD, les données sont vérifiées à deux moments distincts.

Premièrement, une vérification est faite durant la collecte des données. Après leur collecte par téléphone ou au moyen du questionnaire à renvoyer par la poste, les données sont saisies à l'aide d'applications informatiques personnalisées. Toutes sont soumises à une vérification. Les contrôles réalisés durant la collecte des données, appelés contrôles sur le terrain, comprennent généralement des contrôles de validité et certains contrôles de cohérence simples. Ils servent aussi à déceler les erreurs commises durant l'interview par le répondant ou par l'intervieweur et de repérer l'information manquante à l'étape de la collecte en vue de réduire le besoin d'un suivi ultérieur. Les contrôles sur le terrain ont également pour but d'épurer les réponses. Dans le cas de l'EMCD, les réponses du mois courant sont comparées aux réponses fournies par le répondant le mois précédent et (ou) l'année précédente pour le mois courant. Les contrôles sur le terrain permettent de repérer les problèmes que posent les procédures de collecte des données et la conception des questionnaires, et de déterminer s'il faut offrir une formation supplémentaire aux intervieweurs.

Tout enregistrement de données rejeté lors des contrôles préliminaires fait l'objet d'un suivi auprès du répondant afin de valider les données soupçonnées d'être incorrectes. Une fois validé, les données recueillies sont transmises de façon régulière au Bureau central à Ottawa.

Deuxièmement, après la collecte, les données sont soumises à une vérification statistique dont la nature est plus empirique. On exécute la vérification statistique avant l'imputation, afin de repérer les données qui serviront de base pour l'imputation de valeurs pour les non-répondants. Les valeurs très extrêmes risquant de perturber une tendance mensuelle sont exclues des calculs de tendance lors de la vérification statistique. Il convient de souligner qu'aucun ajustement n'est fait à cette étape pour corriger les valeurs extrêmes déclarées.

La première étape de la vérification statistique consiste à repérer les réponses qui seront soumises aux règles de vérification statistique. Les données déclarées pour le mois de référence courant sont soumises à divers contrôles.

Le premier ensemble de contrôles est fondé sur la méthode d'Hidiroglou-Berthelot qui consiste à examiner le rapport des données du mois courant fournies par un répondant à des données historiques (c.-à-d. dernier mois ou même mois l'année précédente) ou administratives. Si le rapport calculé pour le répondant diffère significativement de ceux obtenus pour des répondants dont les caractéristiques sont comparables en ce qui concerne le groupe industriel et/ou la région géographique, la réponse est considérée comme une valeur extrême.

Le deuxième ensemble de contrôles est basé sur la vérification de la part de marché. Cette méthode, qui s'appuie sur les données du mois courant uniquement, permet de vérifier les données fournies par tous les répondants, mêmes ceux pour lesquels on ne dispose pas de données historiques ou de données auxiliaires. Par conséquent, parmi un groupe de répondants présentant des caractéristiques similaires en ce qui concerne le groupe industriel et (ou) la région géographique, toute valeur dont la contribution pondérée au total du groupe est trop importante sera considérée comme une valeur extrême.

Pour les contrôles fondés sur la méthode d'Hidiroglou-Berthelot, les données jugées extrêmes ne sont pas incluses dans les modèles d'imputation (ceux fondés sur les ratios). En outre, les données considérées comme des valeurs extrêmes lors de la vérification de la part de marché ne sont pas incluses dans les modèles d'imputation où les moyennes et les médianes sont calculées pour imputer des valeurs pour les réponses pour lesquelles il n'existe pas de données historiques.

Conjointement avec les vérifications statistiques effectuées après la collecte de données, on procède à la détection d’erreurs des données extraites des fichiers administratifs. Les données modélisées de la TPS sont également assujetties à une phase de vérification approfondie. Chaque fichier sur lequel les données modélisées sont fondées est vérifié de même que les valeurs modélisées. Les vérifications sont effectuées au niveau agrégé (industrie, géographie) afin de détecter les fichiers qui dévient de la norme (soit en exhibant des différences d’un mois à l’autre trop importantes ou qui diffèrent considérablement des autres unités. Toutes les données qui faillissent ces étapes de contrôle sont sujettes à une vérification manuelle, et si nécessaire, à une action corrective.

9. Imputation

Le processus d’imputation de l'EMCD a pour but de remplacer les données manquantes par des valeurs imputées. Des valeurs sont attribuées aux enregistrements pour lesquels la vérification a révélé des valeurs manquantes afin de s'assurer que les estimations soient de haute qualité et d'établir une cohérence interne plausible. Pour des raisons de fardeau de réponse, de coût et d'actualité des données, il est généralement impossible de réaliser auprès des répondants tous les suivis nécessaires pour résoudre les problèmes de réponses manquantes. Puisqu'il est souhaitable de produire un fichier de microdonnées complet et cohérent, on recourt à l'imputation pour traiter les cas persistants de données manquantes.

Dans le cas de l'EMCD, on peut fonder l'imputation des valeurs manquantes sur des données historiques ou sur des données administratives. Le choix de la méthode appropriée est fondé sur une stratégie qui dépend de l'existence de données historiques ou de données administratives et (ou) du mois de référence en question.

Il existe trois types de méthode d'imputation d'après des données historiques. Le premier est l’application d’une tendance générale qui s'appuie sur une source unique de données historiques (mois précédent, données recueillies pour le mois suivant ou données recueillies pour le même mois l'année précédente). Le deuxième est un modèle de régression dans lequel sont utilisées simultanément les données provenant du mois précédent et celles provenant du même mois l'année précédente. La troisième méthode consiste à remplacer directement les valeurs manquantes par des données historiques.

Selon le mois de référence, il existe, pour le choix de la méthode, un ordre de préférence en vue d'assurer une imputation de haute qualité. Le troisième type de méthode d'imputation historique est toujours la dernière option considérée pour chaque mois de référence.

La méthode d’imputation fondée sur des données administratives est sélectionnée automatiquement lorsqu'on ne dispose pas de données historiques pour un non-répondant.  Des tendances sont alors appliquées à la source de données administratives (mesure de taille mensuelle) selon que la structure est simple (entreprises ne comptant qu’un seul établissement) ou complexe.

10. Estimation

L'estimation est un processus qui consiste à calculer une valeur approximative des paramètres de population inconnus en utilisant uniquement la partie de la population qui est incluse dans un échantillon. Des inférences sont ensuite faites au sujet des paramètres inconnus en utilisant les données d'échantillon et les renseignements connexes sur le plan de sondage. Cette étape fait usage du Système généralisé d'estimation (SGE) de Statistique Canada.

Pour les ventes des détaillants, la population est divisée en une partie observée (strates à tirage complet et à tirage partiel) et une partie non observée (strate à tirage nul). D'après l'échantillon tiré à partir de la partie observée, on calcule une estimation pour la population au moyen d'un estimateur d'Horvitz-Thompson où les réponses concernant les ventes sont pondérées par l'inverse des probabilités d'inclusion des unités échantillonnées. Ces poids (appelés poids d'échantillonnage) peuvent être interprétés comme étant le nombre de fois que chaque unité échantillonnée devrait être répétée pour représenter la population complète. Les valeurs pondérées des ventes ainsi calculées sont totalisées par domaine, pour produire une estimation du total des ventes pour chaque combinaison des groupes industriels/région géographique. Un domaine est défini comme correspondant aux valeurs de classification les plus récentes disponibles dans le RE pour l'unité et la période de référence de l'enquête. Les domaines peuvent différer des strates d'échantillonnage originales, parce que les unités peuvent avoir changé de taille, d'industrie ou d'emplacement. Les changements de classification sont reflétés immédiatement dans les estimations et ne sont pas cumulés au cours du temps. Pour la partie non observée de la population, les ventes sont estimées à l’aide de modèles statistiques exploitant les ventes assujetties à la TPS exprimées sous forme mensuelle.

Pour en savoir plus sur la méthode utilisée lors de la modélisation des ventes tirées de fichiers administratifs, veuillez consulter le document intitulé Enquête mensuelle sur le commerce de détail : Utilisation de données administratives sous la rubrique ‘Documentation’ du BMDI.

La variance est la mesure de précision utilisée dans le cas de l'EMCD pour évaluer la qualité de l'estimation des paramètres de population et pour obtenir des inférences valides. Pour la partie observée de la population, la variance est calculée directement à partir d'un échantillon aléatoire simple stratifié sans remise.

Les estimations d'échantillon peuvent différer de la valeur prévue des estimations. Cependant, puisque l'estimation est fondée sur un échantillon probabiliste, il est possible d'évaluer la variabilité de l'estimation d'échantillon par rapport à la valeur prévue. La variance d'une estimation est une mesure de la précision de l'estimation d'échantillon qui est définie comme étant la moyenne, sur tous les échantillons possibles, de l'écart quadratique de l'estimation par rapport à sa valeur prévue.

11. Révisions et désaisonnalisation

Les données brutes sont révisées, sur une base mensuelle, pour le mois précédant immédiatement le mois de référence en cours qui fait l'objet de la publication. C'est donc dire que lorsque les données pour décembre sont publiées pour la première fois, on procédera aussi à des révisions, au besoin, à l'égard des données brutes pour novembre. En outre, des révisions sont aussi effectuées une fois par année, au moment de la première publication des données de février, pour tous les mois de l'année précédente. On vise ainsi à corriger tout problème important que l'on ait décelé et qui s'applique pour une période prolongée. La période de révision proprement dite dépend de la nature du problème décelé, mais elle ne dépasse rarement trois ans. Toutefois, la période de révision peut être plus longue lors de révisions historiques ou de restratification.

Depuis avril 2008, les données de l'Enquête mensuelle sur le commerce de détail sont désaisonnalisées en utilisant la méthode X12-ARIMA. Cette technique consiste essentiellement, dans un premier temps, à extrapoler une année de données brutes avec des modèles ARIMA (modèles autorégressifs à moyennes mobiles intégrées); et dans un deuxième temps, à désaisonnaliser la série brute prolongée par la méthode X-11. Ensuite, les données désaisonnalisées sont ajustées aux totaux annuels des données brutes.

Les données désaisonnalisées doivent aussi être révisées. Elles doivent notamment rendre compte des révisions déterminées pour les données brutes. Par ailleurs, les estimations désaisonnalisées sont calculées à partir de X-12-ARIMA, et la tendance est sensible aux valeurs les plus récentes déclarées dans les données brutes. C'est pourquoi, au moment de la diffusion de nouvelles données pour chaque mois, les valeurs désaisonnalisées pour les trois mois précédents sont révisées. Les séries de données désaisonnalisées sont des données chronologiques qui ont été modifiées pour éliminer l’effet des influences saisonnières et du calendrier.  Pour cette raison, la désaisonnalisation des données permet des comparaisons plus significatives des conditions économiques d’un mois à l’autre.

Une fois par année, les options de désaisonnalisation sont révisées afin d'intégrer les données les plus récentes. Des estimations désaisonnalisées révisées pour chacun des mois des années civiles précédentes sont diffusées en même temps que la révision annuelle des données brutes. La période exacte de révision dépend de la période de révision des données brutes.

12. Évaluation de la qualité des données

La méthodologie de l'enquête a pour objectif de contrôler les erreurs et de réduire leurs effets éventuels sur les estimations. Les résultats de l'enquête peuvent néanmoins contenir des erreurs dont l'erreur d'échantillonnage n'est que l'une des composantes. L'erreur d'échantillonnage survient lorsque les observations sont faites uniquement sur un échantillon et non sur l'ensemble de la population. Toutes les autres erreurs commises aux diverses phases de l'enquête sont appelées erreurs non dues à l'échantillonnage. Des erreurs de ce type peuvent survenir, par exemple, quand un répondant fournit des renseignements erronés ou qu'il ne répond pas à certaines questions; quand une unité du champ de l'enquête y est incluse erronément ou que des erreurs sont commises lors du traitement des données, comme des erreurs de codage ou de saisie.

Avant la publication, on analyse les résultats combinés de l'enquête afin d'en évaluer la comparabilité; il s'agit généralement d'un examen détaillé des réponses individuelles (particulièrement celles des grandes entreprises), de la conjoncture économique générale et des tendances historiques.

Une mesure habituelle de la qualité des données des enquêtes est le coefficient de variation (CV). Le coefficient de variation, défini comme étant l'erreur-type divisée par l'estimation d'échantillon, est une mesure de la précision relative. Puisque le coefficient de variation est calculé d'après les réponses des unités individuelles, il mesure aussi certaines erreurs non dues à l'échantillonnage.

La formule utilisée pour calculer le coefficient de variation (CV) en pourcentage est :

CV (X) = S(X) * 100% / X
où X représente l'estimation et S(X) représente l'erreur-type de X.

On peut construire les intervalles de confiance autour des estimations en utilisant l'estimation et le CV. Donc, pour notre échantillon, il est possible de déclarer avec un niveau donné de confiance que la valeur prévue sera comprise dans l'intervalle de confiance construit autour de l'estimation. Par exemple, si une estimation de 12 millions de dollars à un CV de 2 %, l'erreur-type sera de 240 000 $ (l'estimation multipliée par le CV). On peut déclarer avec 68 % de confiance que les valeurs prévues seront comprises dans l'intervalle dont la longueur est égale à un écart type de part et d'autre de l'estimation, c'est-à-dire entre 11 760 000 $ et 12 240 000 $. Ou bien, nous pouvons déclarer avec 95 % de confiance que la valeur prévue sera comprise dans l'intervalle dont la longueur est égale à deux écarts types de part et d'autre de l'estimation, c'est-à-dire entre 11 520 000 $ et 12 480 000 $.

Enfin, étant donné la faible contribution de la partie non observée de la population aux estimations totales, le biais dans la partie non observée a un effet négligeable sur les CV. Par conséquent, on utilise le CV provenant de la partie observée pour l'estimation totale qui est égale à la somme des estimations pour les parties observée et non observée de la population.

13. Contrôle de la divulgation

La loi interdit à Statistique Canada de rendre publique toute donnée susceptible de révéler l'information recueillie en vertu de la Loi sur la statistique et se rapportant à toute personne, entreprise ou organisation reconnaissable, sans que cette personne, entreprise ou organisation le sache ou y consente par écrit. Diverses règles de confidentialité s'appliquent à toutes les données diffusées ou publiées afin d'empêcher la publication ou la divulgation de toute information jugée confidentielle. Au besoin, des données sont supprimées pour empêcher la divulgation directe ou par recoupement de données reconnaissables.

L'analyse de la confidentialité des données inclut la détection de la « divulgation directe » éventuelle, qui survient lorsque la valeur figurant dans une cellule d'un tableau ne correspond qu'à quelques répondants ou que la cellule est dominée par un petit nombre d'entreprises.

Enquête mensuelle sur le commerce de détail (EMCD) – Énoncé de la qualité des données

Objectifs, utilisation et utilisateurs
Concepts, variables et classifications
Couverture et bases de sondage
Échantillonnage
Conception du questionnaire
Réponse et non-réponse
Opérations de collecte et de saisie des données
Vérification
Imputation
Estimation
Révisions et désaisonnalisation
Évaluation de la qualité des données
Contrôle de la divulgation

1. Objectifs, utilisation et utilisateurs

1.1. Objectifs

L’Enquête mensuelle sur le commerce de détail (EMCD) fournit des renseignements sur la performance du secteur du commerce de détail et, quand les données sont combinées à d’autres statistiques, représente un important indicateur de l'état de l’économie canadienne.

1.2. Utilisation

Les estimations fournissent une mesure de la santé et de la performance du secteur du commerce de détail. L'information recueillie est utilisée pour estimer le niveau et la tendance mensuelle des ventes ainsi que le nombre d’emplacements. À la fin de chaque année, les estimations donnent un premier aperçu de la valeur annuelle des ventes au détail et de la performance du secteur.

1.3. Utilisateurs

Divers organismes, associations sectorielles et gouvernements utilisent l'information. Les détaillants utilisent les résultats de l'enquête pour comparer leurs résultats à ceux d'entreprises similaires, ainsi qu'à des fins de marketing. Les associations de détaillants peuvent surveiller la performance de leur industrie et promouvoir les industries du commerce de détail. Les investisseurs peuvent surveiller la croissance de l'industrie, ce qui peut donner aux détaillants un meilleur accès au capital d'investissement. Les données de l'enquête aident les administrations à comprendre le rôle des détaillants dans l'économie, ce qui facilite l'élaboration des politiques et des encouragements fiscaux. Le commerce de détail étant un important secteur de l'économie canadienne, les données permettent aux administrations de déterminer plus exactement la santé globale de l'économie grâce à l'utilisation des estimations dans le calcul du produit intérieur brut (PIB) national.

2. Concepts, variables et classifications

2.1. Concepts

Le secteur du commerce de détail comprend les établissements dont l’activité principale consiste à vendre des marchandises au détail, généralement sans transformation, et à fournir des services connexes.

Le commerce de détail représente le dernier maillon de la chaîne de distribution; les détaillants sont donc organisés pour vendre des marchandises en petites quantités au grand public. Ce secteur comprend deux grands types d’établissements : les détaillants en magasin et les détaillants hors magasin. L’EMCD couvre uniquement les détaillants en magasin. Leurs principales caractéristiques sont décrites ci-après.

Les détaillants en magasin exploitent des points de vente fixes, situés et conçus de manière à attirer un grand nombre de passants. De façon générale, les magasins de détail ont de grands étalages et font de la publicité dans les médias. Ils vendent surtout des biens de consommation qui intéressent les particuliers ou les ménages, mais certains servent aussi les entreprises et une clientèle institutionnelle. Parmi ces établissements, on compte les magasins de fournitures de bureau, les magasins d’ordinateurs et de logiciels, les stations-service, les vendeurs de matériaux de construction, les magasins de fournitures de plomberie et de fournitures électriques.

En plus de vendre des marchandises, certains types de détaillants fournissent des services après-vente, comme des services de réparation et d’installation. Ainsi, les concessionnaires d’automobiles neuves, les magasins d’électronique et d’appareils ménagers, et les magasins d’instruments et de fournitures de musique assurent fréquemment un service de réparation, alors que les magasins de revêtements de sol et les magasins de garnitures de fenêtres fournissent souvent des services d’installation. En règle générale, les établissements qui vendent des marchandises au détail et qui ont un service après-vente sont classés dans ce secteur.

Les salles d’exposition des sociétés de vente sur catalogue, les stations-service et les marchands de maisons mobiles sont assimilés à des détaillants en magasin.

2.2. Variables

Les ventes sont définies comme étant les ventes de toutes les marchandises achetées pour la revente, nettes des rendus et des escomptes. Sont inclus les honoraires et les commissions résultant de la vente de biens et de services pour le compte de tiers, comme la vente de billets de loterie, de billets d’autobus et de cartes de téléphone. Sont également inclus les recettes provenant des pièces et de la main-d’oeuvre utilisées pour les services d'entretien et de réparation, les revenus de location et de location à bail de biens et de matériel, les revenus provenant de services, y compris les services de restauration, les ventes de biens fabriqués en tant qu’activité secondaire et la valeur des marchandises prélevées par le propriétaire pour son usage personnel. Sont exclus les autres revenus de location de biens immobiliers, les frais de placement, les subventions d’exploitation et autres, les redevances et les droits de franchise.

L’emplacement d’affaires comprend le ou les emplacements physiques où a lieu l’activité commerciale dans chaque province et territoire et dont les ventes sont créditées ou comptabilisées dans les états financiers de l’entreprise. Pour les détaillants, il s’agit normalement d’un magasin.

Dollars constants : La valeur du commerce de détail est mesurée de deux façons : par la prise en compte des effets de la variation des prix sur la valeur des ventes et par l’élimination des effets de la variation des prix. La première mesure est la valeur des ventes au détail en dollars courants et la seconde, la valeur des ventes au détail en dollars constants. Pour calculer l’estimation en dollars courants, on agrège la valeur des ventes pondérées de tous les points de vente au détail. Pour calculer l’estimation en dollars constants, il faut d’abord rajuster la valeur des ventes par rapport à une année de base en utilisant l’Indice des prix à la consommation, puis additionner les valeurs résultantes.

2.3. Classification

L’Enquête mensuelle sur le commerce de détail est fondée sur la définition du commerce de détail adoptée dans le SCIAN (Système de classification des industries de l’Amérique du Nord). Le SCIAN est le cadre commun reconnu pour la production de statistiques comparables par les organismes statistiques du Canada, du Mexique et des États-Unis. L’accord définit les limites de 20 secteurs. Le SCIAN est fondé sur un cadre conceptuel axé sur la production, ou l’offre, en ce sens que les établissements sont regroupés en classes ou branches d’activité d’après la similarité des processus utilisés pour produire les biens et les services.

Les estimations sont calculées pour 21 groupes fondés sur des agrégations spéciales du Système de classification des industries de l’Amérique du Nord (SCIAN) de 2012. Les 21 groupes sont en outre agrégés en onze sous-secteurs.

Du point de vue géographique, les estimations des ventes sont produites pour le Canada et pour chaque province et territoire.

3. Couverture et bases de sondage

La base de sondage de l'Enquête mensuelle sur le commerce de détail (EMCD) est le Registre des entreprises (RE) de Statistique Canada. Ce dernier est une liste structurée d'entreprises productrices de biens et de services au Canada. Cette base de données tenue à jour centralement contient des renseignements détaillés sur la plupart des entités commerciales exploitées au Canada. Le RE couvre toutes les entreprises constituées en société, avec ou sans employés. Pour les entreprises non constituées en société, le RE comprend toutes les entreprises ayant des employés, ainsi que les entreprises sans employés ayant des ventes annualisées provenant d'un compte de la taxe sur les produits et services (TPS) ou un revenu annuel provenant de la déclaration d'impôt individuelle.

Dans le RE, les entreprises sont représentées selon une structure hiérarchique à quatre niveaux ayant pour sommet l'entreprise statistique suivie, par ordre décroissant, par la compagnie statistique, l'établissement statistique et l'emplacement statistique. Une entreprise peut être reliée à une ou à plusieurs compagnies statistiques, une compagnie statistique à un ou à plusieurs établissements statistiques et un établissement statistique à un ou à plusieurs emplacements statistiques.

La population cible de l'EMCD comprend tous les établissements statistiques figurant dans le RE, excluant les entreprises non constituées en société n'ayant pas d'employés dont les ventes annuelles sont inférieures à 30 000 $, qui sont classés dans le secteur du commerce de détail d'après le Système de classification des industries de l'Amérique du Nord (SCIAN) (environ 200 000 établissements). La fourchette de codes du SCIAN pour le secteur du commerce de détail varie de 441100 à 453999. Un établissement statistique est l'entité de production ou le plus petit groupe d'entités de production qui produit un ensemble de biens ou de services homogènes, dont les activités ne débordent pas les frontières provinciales/territoriales, et qui est en mesure de fournir des données sur la valeur de la production, ainsi que sur le coût des matières utilisées et le coût et l'importance de la main-d'oeuvre affectée à la production. L'entité de production est l'unité physique où se déroulent les activités de l'entreprise. Elle doit avoir une adresse de voirie et une main-d'oeuvre directement affectée au processus de production.

Sont exclus de la population cible les établissements auxiliaires (producteurs de services de soutien de l'activité de production de biens et services destinés au marché de plus d'un établissement au sein de l'entreprise, et qui sont considérés comme un centre de coûts ou un centre de dépenses discrétionnaires pour lequel les données sur tous les coûts, y compris la main-d'oeuvre et l'amortissement, peuvent être déclarées par l'entreprise), les futurs établissements, les établissements pour lesquels les signaux économiques indiquent un revenu manquant ou nul, et les établissements appartenant aux catégories du SCIAN non couvertes qui suivent :

  • 4541 (entreprises de télémagasinage et de vente par correspondance)
  • 4542 (exploitants de distributeurs automatiques)
  • 45431 (marchands de combustible)
  • 45439 (autres établissements de vente directe)

4. Échantillonnage

L'échantillon de l'EMCD est formé de 10 000 groupes d'établissements (grappes) classés dans le secteur du commerce de détail et sélectionnés à partir du Registre des entreprises de Statistique Canada. Par définition, une grappe d'établissements comprend tous les établissements appartenant à une entreprise statistique qui font partie d'un même groupe industriel et d'une même région géographique. L’EMCD est fondée sur un plan d'échantillonnage stratifié avec sélection d'un échantillon aléatoire simple dans chaque strate. La stratification est faite selon des groupes industriels (majoritairement mais non exclusivement des SCIAN à quatre chiffres) et selon la région géographique, c'est-à-dire selon la province ou le territoire. Ensuite, la population est stratifiée selon la taille de l'établissement. La mesure de taille est créée en combinant des données provenant d'enquêtes indépendantes et trois variables administratives, à savoir le revenu annuel profilé, les ventes assujetties à la TPS exprimées sur une base annuelle et le revenu de la déclaration d’impôt (T1 ou T2).

Les strates de taille comptent une strate à tirage complet (recensement), au moins deux strates à tirage partiel (échantillonnées partiellement) et une strate à tirage nul (non échantillonnée). La strate à tirage nul est destinée à réduire le fardeau de réponse en excluant les entreprises les plus petites de la population observée. Ces entreprises représentent, en principe, au plus 10 % du total des ventes. Au lieu d'envoyer un questionnaire à ces entreprises, on produit les estimations d'après des données administratives.

L'échantillon est réparti de façon optimale afin d'atteindre les coefficients de variation cibles au niveau du Canada dans son ensemble, de la province ou du territoire, de l’industrie et des groupes industriels selon la province ou le territoire. On procède aussi à un suréchantillonnage pour tenir compte des unités disparues, non répondantes ou classées incorrectement.

L'EMCD est une enquête répétée avec maximisation du chevauchement des échantillons mensuels. On retient l'échantillon d’un mois à l’autre et, chaque mois, on y ajoute de nouvelles unités (naissances). Pour découvrir les nouvelles unités visées par l'EMCD, c'est-à-dire les nouvelles grappes d'établissement(s), on examine chaque mois l'univers le plus récent du RE. On stratifie ces nouvelles unités conformément aux mêmes critères que ceux appliqués à la population initiale, puis on les échantillonne conformément à la fraction d'échantillonnage de la strate à laquelle elles appartiennent et on les ajoute à l'échantillon mensuel. Des disparitions d'entité surviennent également chaque mois. Une entité disparue peut être une grappe d'établissements qui ont cessé leurs activités (fermeture) ou dont les activités principales ne se rattachent plus au commerce de détail (hors du champ). La situation de ces entreprises est mise à jour dans le RE d'après des renseignements de source administrative et les commentaires reçus lors des enquêtes, y compris ceux des entreprises prenant part à l'EMCD. Les méthodes suivies pour traiter les unités disparues et les unités classées incorrectement font partie des procédures d'échantillonnage et de mise à jour de la population.

5. Conception du questionnaire

L’Enquête mensuelle sur le commerce de détail englobe les sous-enquêtes suivantes :

Enquête mensuelle sur le commerce de détail – R8

Enquête mensuelle sur le commerce de détail (avec les stocks) – R8

Enquête sur les ventes et stocks de boissons alcooliques

Le questionnaire est conçu pour recueillir mensuellement auprès d'un échantillon de détaillants des données sur les ventes au détail, sur le nombre d'emplacements commerciaux par province ou territoire et sur les stocks de biens possédés et destinés à la revente. Lors du remaniement de 2004, la plupart des questionnaires n'ont subi que des changements de présentation. Le questionnaire sur les ventes et les stocks de boissons alcooliques a subi des modifications plus importantes. Les modifications ont été discutées avec les intervenants et les répondants ont eu l'occasion de faire des commentaires avant que le nouveau questionnaire ne soit finalisé. Si d'autres modifications devaient être apportées à l'un des questionnaires, les changements proposés seraient soumis à un comité d'examen et ferait l'objet d'un essai sur le terrain auprès de répondants et d'utilisateurs de données pour s'assurer de leur pertinence.

6. Réponse et non-réponse

6.1. Réponse et non-réponse

Bien que les gestionnaires d'enquête et les employés des opérations fassent tout leur possible pour maximiser la réponse à l'EMCD, un certain degré de non-réponse a lieu. Pour qu'un établissement statistique soit considéré comme répondant, il faut que le degré de réponse partielle (situation où une réponse exacte n'est obtenue que pour certaines questions posées au répondant) atteigne un seuil minimal au-dessous duquel la déclaration fournie par l'établissement serait rejetée et l'établissement, considéré comme une unité non répondante. Le cas échéant, on considère que l'entreprise n'a pas répondu du tout.

La non-réponse a deux effets sur les données : premièrement, elle introduit un biais dans les estimations si les non-répondants diffèrent des répondants en ce qui concerne les caractéristiques mesurées et, deuxièmement, elle fait augmenter la variance d'échantillonnage des estimations, parce que la taille effective de l'échantillon est réduite comparativement à celle considérée au départ.

L'ampleur des efforts déployés pour obtenir une réponse auprès d'un non-répondant dépend des contraintes budgétaires et de temps, de l'effet de la non-réponse sur la qualité globale et du risque de biais dû à la non-réponse.

La méthode principalement utilisée pour réduire l'effet de la non-réponse à l'étape de l'échantillonnage consiste à augmenter la taille de l'échantillon en appliquant un taux de suréchantillonnage déterminé d'après les résultats d'enquêtes similaires.

Les cas de non-réponse qui surviennent malgré les méthodes appliquées aux étapes de l'échantillonnage et de la collecte pour réduire l'effet de la non-réponse sont traités par imputation.

Afin de déterminer l'importance de la non-réponse qui a lieu chaque mois, on calcule divers taux de réponse. Pour un mois de référence donné, on produit les estimations au moins deux fois (estimations provisoires et estimations révisées). Entre les deux exécutions, certaines données fournies par les répondants peuvent être jugées inutilisables et des valeurs imputées peuvent être corrigées au moyen de données fournies par les répondants. Par conséquent, les taux de réponse sont calculés après chaque exécution du processus d'estimation.

Pour l'EMCD, deux types de taux sont calculés (non pondérés et pondérés). Afin d'évaluer l'efficacité du processus de collecte, on calcule les taux de réponse non pondérés. Les taux pondérés, fondés sur le poids d'estimation et la valeur de la variable d'intérêt, évaluent la qualité de l'estimation. À l'intérieur de chacun de ces types de taux, il existe des taux distincts pour les unités faisant partie de l'échantillon et pour les unités qui sont uniquement modélisées à partir de données administratives qui ont été extraites des fichiers de TPS.

Afin d’obtenir une meilleure idée du succès du processus de collecte de données, on calcule deux taux non pondérés appelés « taux de résultat de la collecte » et « taux de résultat de l'extraction ». On calcule ces taux en divisant le nombre de répondants par le nombre d'unités avec lesquelles on a essayé de prendre contact ou pour lesquelles on a essayé de recevoir des données extraites. Les déclarants non mensuels (répondants bénéficiant de modalités de déclaration spéciales leur permettant de ne pas produire de déclaration chaque mois, mais pour lesquels des données réelles sont disponibles lors des révisions subséquentes) sont exclus du numérateur ainsi que du dénominateur pour les mois où aucun contact n'est pris avec eux. Brièvement, les divers taux de réponse se calculent comme suit :

Taux pondérés :

Taux de réponse des unités faisant partie de l'échantillon (estimation) =
Somme des ventes pondérées des unités avec situation de réponse i / Somme des ventes pondérées des unités faisant partie de l'échantillon

i = unités pour lesquelles il existe des données déclarées qui seront utilisées dans l'estimation ou qui sont des refus convertis, ou pour lesquelles il existe des données déclarées qui n'ont pas encore été évaluées pour l'estimation.

Taux de réponse des unités modélisées à partir de données administratives (estimation) = Somme des ventes pondérées des unités avec situation de réponse ii / Somme des ventes pondérées des unités modélisées à partir de données administratives

ii = unités pour lesquelles il existe des données extraites des fichiers administratifs et qui sont utilisables pour l'estimation.

Taux de réponse total (estimation) =
Somme des ventes pondérées des unités avec situation de réponse i ou situation de réponse ii / Somme de toutes les ventes pondérées

Taux non pondérés :

Taux de réponse des unités faisant partie de l'échantillon (collecte) =
Nombre de questionnaires avec situation de réponse iii / Nombre de questionnaires avec situation de réponse iv

iii = unités pour lesquelles il existe des données déclarées (dont le cas n'est pas résolu, utilisées ou non utilisées pour l'estimation) ou qui sont des refus convertis;

iv = toutes les unités susmentionnées, ainsi que les unités qui ont refusé de répondre, les unités avec lesquelles on n'a pas pris contact et d'autres types d'unités non répondantes.

Taux de réponse des unités modélisées à partir de données administratives (extraction) =
Nombre de questionnaires avec situation de réponse vi / Nombre de questionnaires avec situation de réponse vii

vi = unités dans le champ d'observation pour lesquelles il existe des données (utilisables ou non utilisables) extraites des fichiers administratifs;

vii = toutes les unités susmentionnées, ainsi que les unités qui ont refusé de déclarer la source de données administratives, les unités avec lesquelles on n'a pas pris contact et d'autres types d'unités non répondantes.

(% de questionnaires recueillis par rapport à l'ensemble des questionnaires dans le champ d'observation)

Taux de résultat de la collecte =
Nombre de questionnaires avec situation de réponse iii / Nombre de questionnaires avec situation de réponse viii

iii = même que iii défini plus haut;

viii = même que iv, à part l'exclusion des unités avec lesquelles on a pris contact, parce que leur réponse n'est pas disponible pour un mois particulier, puisqu'il s'agit de déclarants non mensuels.

Taux de résultat de l'extraction =
Nombre de questionnaires avec situation de réponse ix / Nombre de questionnaires avec situation de réponse vii

ix = même que vi, avec l'ajout des unités extraites qui ont été imputées ou qui étaient hors du champ de l'enquête;

où vii = même que vii défini plus haut.

(% de questionnaires recueillis par rapport à l'ensemble des questionnaires dans le champ d'observation que nous avons tenté de recueillir)

Tous les taux pondérés et non pondérés susmentionnés sont calculés au niveau du groupe industriel, de la région et du groupe de taille, ainsi que pour toute combinaison de ces niveaux.

Utilisation des données administratives

Réduire le fardeau de réponse est un défi à long terme pour Statistique Canada. Afin d’alléger le fardeau de réponse et de réduire les coûts reliés à l’enquête, notamment en ce qui a trait aux petites entreprises, l’EMCD a réduit le nombre d’établissements simples de l’échantillon qui sont enquêtés directement et dérive plutôt les chiffres de vente pour ces établissements à partir des fichiers de la TPS en utilisant un modèle statistique. Le modèle explique les différences entre les ventes et les recettes déclarées aux fins de la TPS, ainsi que le décalage entre la période de référence de l’enquête et celle de la TPS.

Pour en savoir plus sur la méthode utilisée lors de la modélisation des ventes tirées de fichiers administratifs, veuillez consulter le document intitulé Enquête mensuelle sur le commerce de détail : Utilisation de données administratives sous la rubrique ‘Documentation’ du BMDI.

Le tableau 1 contient les fractions de réponses pondérées pour tous les groupes industriels ainsi que pour toutes les provinces et territoires. Pour des fractions de réponses pondérées plus détaillées, veuillez contacter la section du marketing et de la diffusion au (613) 951-3549, sans frais: 1-877-421-3067 or par courriel à retailinfo@statcan.

6.2. Méthodes utilisées pour réduire la non-réponse durant la collecte

Beaucoup d’efforts sont déployés en vue de réduire au minimum la non-réponse durant la collecte. Les méthodes utilisées incluent des techniques d'interview, comme l'utilisation de questions d'approfondissement et des techniques de persuasion, la replanification répétée des appels téléphoniques pour obtenir l'information et la mise en place de procédures indiquant aux intervieweurs comment s'y prendre avec les répondants qui refusent de participer à l'enquête.

Si les données demandées ne sont pas disponibles au moment de la collecte, la meilleure estimation fournie par le répondant est acceptée et est révisée par la suite, quand les données réelles sont disponibles.

Pour réduire au minimum la non-réponse totale pour toutes les variables, des réponses partielles sont acceptées. En outre, les questionnaires sont personnalisés pour la collecte de certaines variables, comme les stocks, de sorte que la collecte ait lieu durant les mois où les données sont disponibles.

Enfin, pour établir un climat de confiance entre les intervieweurs et les répondants, les cas sont généralement affectés au même intervieweur chaque mois. Ce dernier peut ainsi établir une relation personnelle avec le répondant et renforcer sa confiance.

7. Opérations de collecte et de saisie des données

La collecte des données est réalisée par les bureaux régionaux de Statistique Canada.

Tableau 1: Fractions de réponse pondérées par SCIAN et pour les provinces et territoires, avril 2016 :
Sommaire du tableau
Le tableau montre les résultats de Tableau 1: Fractions de réponse pondérées par SCIAN et pour les provinces et territoires Fractions de réponse pondérées, calculées selon Total, Enquêté et Administrative unités de mesure (figurant comme en-tête de colonne).
  Fractions de réponse pondérées
Total Enquêté Administrative
SCIAN - Canada  
Concessionnaires de véhicules et de pièces automobiles 91,1 91,5 62,9
Concessionnaires d'automobiles 92,9 92,9 90,6
Concessionnaires d'automobiles neuves 94,5 94,5 Note ...: n'ayant pas lieu de figurer
Concessionnaires d'automobiles d'occasion 67,4 64,6 90,6
Autres concessionnaires de véhicules automobiles 70,4 73,0 37,3
Magasins de pièces, de pneus et d' accessoires pour véhicules automobiles 81,9 85,6 53,7
Magasins de meubles et d'accessoires de maison 81,0 83,4 56,7
Magasins de meubles 80,0 80,6 67,9
Magasins d'accessoires de maison 82,9 89,4 50,2
Magasin d'appareils électroniques et ménagers 81,4 82,7 5,1
Marchands de matériaux de construction et de matériel et fournitures de jardinage 90,2 90,4 86,3
Magasins d'alimentation 84,2 86,1 57,9
Épiceries 89,7 92,0 58,9
Supermarchés et autres épiceries (sauf les dépanneurs) 90,9 93,2 58,8
Dépanneurs 73,1 75,1 59,5
Magasins d'alimentation spécialisés 58,7 61,1 44,9
Magasins de bière, de vin et de spiritueux 69,4 69,4 67,2
Magasins de produits de santé et de soins personnels 86,7 87,4 77,2
Stations-service 77,2 77,8 68,7
Magasins de vêtements et d'accessoires vestimentaires 87,1 88,2 36,6
Magasins de vêtements 88,0 89,1 27,5
Magasins de chaussures 82,4 82,4 80,3
Bijouteries et magasins de bagages et de maroquinerie 86,3 88,7 47,0
Magasins d'articles de sport, d'articles de passe-temps, d'articles de musique et de livres 86,4 91,9 25,0
Magasins de marchandises diverses 98,2 98,3 89,5
Grands magasins 100,0 100,0 Note ...: n'ayant pas lieu de figurer
Autres magasins de marchandises diverses 97,1 97,2 89,5
Magasins de détail divers 76,8 79,6 52,9
Total 87,9 89,0 62,7
Régions  
Terre-Neuve-et-Labrador 81,9 82,1 74,8
Île-du-Prince-Édouard 81,9 82,7 23,4
Nouvelle Écosse 91,8 92,2 79,2
Nouveau-Brunswick 89,4 90,6 62,4
Québec 89,1 90,5 64,6
Ontario 89,2 90,7 53,9
Manitoba 79,8 80,2 57,4
Saskatchewan 86,7 86,9 82,1
Alberta 86,8 87,6 68,8
Colombie-Britannique 86,8 87,4 71,4
Territoire du Yukon 72,8 72,8 Note ...: n'ayant pas lieu de figurer
Territoires du Nord-Ouest 52,2 52,2 Note ...: n'ayant pas lieu de figurer
Nunavut 35,2 35,2 Note ...: n'ayant pas lieu de figurer

Fractions de réponse pondérées

Ces derniers envoient un questionnaire aux répondants ou communiquent avec ceux-ci par téléphone afin d'obtenir les valeurs de leurs ventes et de leurs stocks, et de confirmer l'ouverture ou la fermeture des emplacements d'affaires. Ils effectuent aussi un suivi auprès des non-répondants. La collecte des données débute environ sept jours ouvrables après la fin du mois de référence et se poursuit pendant tout le mois en question.

Les entités qui participent à l'enquête pour la première fois reçoivent une lettre d'introduction en vue d’informer le répondant qu'un représentant de Statistique Canada l'appellera. Cet appel a pour but de présenter l'enquête, de confirmer l'activité de l'entreprise, d'établir et de commencer la collecte des données, et de répondre à toutes questions que le répondant pourrait avoir.

8. Vérification

La vérification des données est l'application de contrôles pour déceler les entrées manquantes, invalides ou incohérentes, ou pour repérer les enregistrements de données susceptibles d'être erronés. Durant le processus d'enquête de l'EMCD, les données sont vérifiées à deux moments distincts.

Premièrement, une vérification est faite durant la collecte des données. Après leur collecte par téléphone ou au moyen du questionnaire à renvoyer par la poste, les données sont saisies à l'aide d'applications informatiques personnalisées. Toutes sont soumises à une vérification. Les contrôles réalisés durant la collecte des données, appelés contrôles sur le terrain, comprennent généralement des contrôles de validité et certains contrôles de cohérence simples. Ils servent aussi à déceler les erreurs commises durant l'interview par le répondant ou par l'intervieweur et de repérer l'information manquante à l'étape de la collecte en vue de réduire le besoin d'un suivi ultérieur. Les contrôles sur le terrain ont également pour but d'épurer les réponses. Dans le cas de l'EMCD, les réponses du mois courant sont comparées aux réponses fournies par le répondant le mois précédent et (ou) l'année précédente pour le mois courant. Les contrôles sur le terrain permettent de repérer les problèmes que posent les procédures de collecte des données et la conception des questionnaires, et de déterminer s'il faut offrir une formation supplémentaire aux intervieweurs.

Tout enregistrement de données rejeté lors des contrôles préliminaires fait l'objet d'un suivi auprès du répondant afin de valider les données soupçonnées d'être incorrectes. Une fois validé, les données recueillies sont transmises de façon régulière au Bureau central à Ottawa.

Deuxièmement, après la collecte, les données sont soumises à une vérification statistique dont la nature est plus empirique. On exécute la vérification statistique avant l'imputation, afin de repérer les données qui serviront de base pour l'imputation de valeurs pour les non-répondants. Les valeurs très extrêmes risquant de perturber une tendance mensuelle sont exclues des calculs de tendance lors de la vérification statistique. Il convient de souligner qu'aucun ajustement n'est fait à cette étape pour corriger les valeurs extrêmes déclarées.

La première étape de la vérification statistique consiste à repérer les réponses qui seront soumises aux règles de vérification statistique. Les données déclarées pour le mois de référence courant sont soumises à divers contrôles.

Le premier ensemble de contrôles est fondé sur la méthode d'Hidiroglou-Berthelot qui consiste à examiner le rapport des données du mois courant fournies par un répondant à des données historiques (c.-à-d. dernier mois ou même mois l'année précédente) ou administratives. Si le rapport calculé pour le répondant diffère significativement de ceux obtenus pour des répondants dont les caractéristiques sont comparables en ce qui concerne le groupe industriel et/ou la région géographique, la réponse est considérée comme une valeur extrême.

Le deuxième ensemble de contrôles est basé sur la vérification de la part de marché. Cette méthode, qui s'appuie sur les données du mois courant uniquement, permet de vérifier les données fournies par tous les répondants, mêmes ceux pour lesquels on ne dispose pas de données historiques ou de données auxiliaires. Par conséquent, parmi un groupe de répondants présentant des caractéristiques similaires en ce qui concerne le groupe industriel et (ou) la région géographique, toute valeur dont la contribution pondérée au total du groupe est trop importante sera considérée comme une valeur extrême.

Pour les contrôles fondés sur la méthode d'Hidiroglou-Berthelot, les données jugées extrêmes ne sont pas incluses dans les modèles d'imputation (ceux fondés sur les ratios). En outre, les données considérées comme des valeurs extrêmes lors de la vérification de la part de marché ne sont pas incluses dans les modèles d'imputation où les moyennes et les médianes sont calculées pour imputer des valeurs pour les réponses pour lesquelles il n'existe pas de données historiques.

Conjointement avec les vérifications statistiques effectuées après la collecte de données, on procède à la détection d’erreurs des données extraites des fichiers administratifs. Les données modélisées de la TPS sont également assujetties à une phase de vérification approfondie. Chaque fichier sur lequel les données modélisées sont fondées est vérifié de même que les valeurs modélisées. Les vérifications sont effectuées au niveau agrégé (industrie, géographie) afin de détecter les fichiers qui dévient de la norme (soit en exhibant des différences d’un mois à l’autre trop importantes ou qui diffèrent considérablement des autres unités. Toutes les données qui faillissent ces étapes de contrôle sont sujettes à une vérification manuelle, et si nécessaire, à une action corrective.

9. Imputation

Le processus d’imputation de l'EMCD a pour but de remplacer les données manquantes par des valeurs imputées. Des valeurs sont attribuées aux enregistrements pour lesquels la vérification a révélé des valeurs manquantes afin de s'assurer que les estimations soient de haute qualité et d'établir une cohérence interne plausible. Pour des raisons de fardeau de réponse, de coût et d'actualité des données, il est généralement impossible de réaliser auprès des répondants tous les suivis nécessaires pour résoudre les problèmes de réponses manquantes. Puisqu'il est souhaitable de produire un fichier de microdonnées complet et cohérent, on recourt à l'imputation pour traiter les cas persistants de données manquantes.

Dans le cas de l'EMCD, on peut fonder l'imputation des valeurs manquantes sur des données historiques ou sur des données administratives. Le choix de la méthode appropriée est fondé sur une stratégie qui dépend de l'existence de données historiques ou de données administratives et (ou) du mois de référence en question.

Il existe trois types de méthode d'imputation d'après des données historiques. Le premier est l’application d’une tendance générale qui s'appuie sur une source unique de données historiques (mois précédent, données recueillies pour le mois suivant ou données recueillies pour le même mois l'année précédente). Le deuxième est un modèle de régression dans lequel sont utilisées simultanément les données provenant du mois précédent et celles provenant du même mois l'année précédente. La troisième méthode consiste à remplacer directement les valeurs manquantes par des données historiques.

Selon le mois de référence, il existe, pour le choix de la méthode, un ordre de préférence en vue d'assurer une imputation de haute qualité. Le troisième type de méthode d'imputation historique est toujours la dernière option considérée pour chaque mois de référence.

La méthode d’imputation fondée sur des données administratives est sélectionnée automatiquement lorsqu'on ne dispose pas de données historiques pour un non-répondant.  Des tendances sont alors appliquées à la source de données administratives (mesure de taille mensuelle) selon que la structure est simple (entreprises ne comptant qu’un seul établissement) ou complexe.

10. Estimation

L'estimation est un processus qui consiste à calculer une valeur approximative des paramètres de population inconnus en utilisant uniquement la partie de la population qui est incluse dans un échantillon. Des inférences sont ensuite faites au sujet des paramètres inconnus en utilisant les données d'échantillon et les renseignements connexes sur le plan de sondage. Cette étape fait usage du Système généralisé d'estimation (SGE) de Statistique Canada.

Pour les ventes des détaillants, la population est divisée en une partie observée (strates à tirage complet et à tirage partiel) et une partie non observée (strate à tirage nul). D'après l'échantillon tiré à partir de la partie observée, on calcule une estimation pour la population au moyen d'un estimateur d'Horvitz-Thompson où les réponses concernant les ventes sont pondérées par l'inverse des probabilités d'inclusion des unités échantillonnées. Ces poids (appelés poids d'échantillonnage) peuvent être interprétés comme étant le nombre de fois que chaque unité échantillonnée devrait être répétée pour représenter la population complète. Les valeurs pondérées des ventes ainsi calculées sont totalisées par domaine, pour produire une estimation du total des ventes pour chaque combinaison des groupes industriels/région géographique. Un domaine est défini comme correspondant aux valeurs de classification les plus récentes disponibles dans le RE pour l'unité et la période de référence de l'enquête. Les domaines peuvent différer des strates d'échantillonnage originales, parce que les unités peuvent avoir changé de taille, d'industrie ou d'emplacement. Les changements de classification sont reflétés immédiatement dans les estimations et ne sont pas cumulés au cours du temps. Pour la partie non observée de la population, les ventes sont estimées à l’aide de modèles statistiques exploitant les ventes assujetties à la TPS exprimées sous forme mensuelle.

Pour en savoir plus sur la méthode utilisée lors de la modélisation des ventes tirées de fichiers administratifs, veuillez consulter le document intitulé Enquête mensuelle sur le commerce de détail : Utilisation de données administratives sous la rubrique ‘Documentation’ du BMDI.

La variance est la mesure de précision utilisée dans le cas de l'EMCD pour évaluer la qualité de l'estimation des paramètres de population et pour obtenir des inférences valides. Pour la partie observée de la population, la variance est calculée directement à partir d'un échantillon aléatoire simple stratifié sans remise.

Les estimations d'échantillon peuvent différer de la valeur prévue des estimations. Cependant, puisque l'estimation est fondée sur un échantillon probabiliste, il est possible d'évaluer la variabilité de l'estimation d'échantillon par rapport à la valeur prévue. La variance d'une estimation est une mesure de la précision de l'estimation d'échantillon qui est définie comme étant la moyenne, sur tous les échantillons possibles, de l'écart quadratique de l'estimation par rapport à sa valeur prévue.

11. Révisions et désaisonnalisation

Les données brutes sont révisées, sur une base mensuelle, pour le mois précédant immédiatement le mois de référence en cours qui fait l'objet de la publication. C'est donc dire que lorsque les données pour décembre sont publiées pour la première fois, on procédera aussi à des révisions, au besoin, à l'égard des données brutes pour novembre. En outre, des révisions sont aussi effectuées une fois par année, au moment de la première publication des données de février, pour tous les mois de l'année précédente. On vise ainsi à corriger tout problème important que l'on ait décelé et qui s'applique pour une période prolongée. La période de révision proprement dite dépend de la nature du problème décelé, mais elle ne dépasse rarement trois ans. Toutefois, la période de révision peut être plus longue lors de révisions historiques ou de restratification.

Depuis avril 2008, les données de l'Enquête mensuelle sur le commerce de détail sont désaisonnalisées en utilisant la méthode X12-ARIMA. Cette technique consiste essentiellement, dans un premier temps, à extrapoler une année de données brutes avec des modèles ARIMA (modèles autorégressifs à moyennes mobiles intégrées); et dans un deuxième temps, à désaisonnaliser la série brute prolongée par la méthode X-11. Ensuite, les données désaisonnalisées sont ajustées aux totaux annuels des données brutes.

Les données désaisonnalisées doivent aussi être révisées. Elles doivent notamment rendre compte des révisions déterminées pour les données brutes. Par ailleurs, les estimations désaisonnalisées sont calculées à partir de X-12-ARIMA, et la tendance est sensible aux valeurs les plus récentes déclarées dans les données brutes. C'est pourquoi, au moment de la diffusion de nouvelles données pour chaque mois, les valeurs désaisonnalisées pour les trois mois précédents sont révisées. Les séries de données désaisonnalisées sont des données chronologiques qui ont été modifiées pour éliminer l’effet des influences saisonnières et du calendrier.  Pour cette raison, la désaisonnalisation des données permet des comparaisons plus significatives des conditions économiques d’un mois à l’autre.

Une fois par année, les options de désaisonnalisation sont révisées afin d'intégrer les données les plus récentes. Des estimations désaisonnalisées révisées pour chacun des mois des années civiles précédentes sont diffusées en même temps que la révision annuelle des données brutes. La période exacte de révision dépend de la période de révision des données brutes.

12. Évaluation de la qualité des données

La méthodologie de l'enquête a pour objectif de contrôler les erreurs et de réduire leurs effets éventuels sur les estimations. Les résultats de l'enquête peuvent néanmoins contenir des erreurs dont l'erreur d'échantillonnage n'est que l'une des composantes. L'erreur d'échantillonnage survient lorsque les observations sont faites uniquement sur un échantillon et non sur l'ensemble de la population. Toutes les autres erreurs commises aux diverses phases de l'enquête sont appelées erreurs non dues à l'échantillonnage. Des erreurs de ce type peuvent survenir, par exemple, quand un répondant fournit des renseignements erronés ou qu'il ne répond pas à certaines questions; quand une unité du champ de l'enquête y est incluse erronément ou que des erreurs sont commises lors du traitement des données, comme des erreurs de codage ou de saisie.

Avant la publication, on analyse les résultats combinés de l'enquête afin d'en évaluer la comparabilité; il s'agit généralement d'un examen détaillé des réponses individuelles (particulièrement celles des grandes entreprises), de la conjoncture économique générale et des tendances historiques.

Une mesure habituelle de la qualité des données des enquêtes est le coefficient de variation (CV). Le coefficient de variation, défini comme étant l'erreur-type divisée par l'estimation d'échantillon, est une mesure de la précision relative. Puisque le coefficient de variation est calculé d'après les réponses des unités individuelles, il mesure aussi certaines erreurs non dues à l'échantillonnage.

La formule utilisée pour calculer le coefficient de variation (CV) en pourcentage est :

CV (X) = S(X) * 100% / X
où X représente l'estimation et S(X) représente l'erreur-type de X.

On peut construire les intervalles de confiance autour des estimations en utilisant l'estimation et le CV. Donc, pour notre échantillon, il est possible de déclarer avec un niveau donné de confiance que la valeur prévue sera comprise dans l'intervalle de confiance construit autour de l'estimation. Par exemple, si une estimation de 12 millions de dollars à un CV de 2 %, l'erreur-type sera de 240 000 $ (l'estimation multipliée par le CV). On peut déclarer avec 68 % de confiance que les valeurs prévues seront comprises dans l'intervalle dont la longueur est égale à un écart type de part et d'autre de l'estimation, c'est-à-dire entre 11 760 000 $ et 12 240 000 $. Ou bien, nous pouvons déclarer avec 95 % de confiance que la valeur prévue sera comprise dans l'intervalle dont la longueur est égale à deux écarts types de part et d'autre de l'estimation, c'est-à-dire entre 11 520 000 $ et 12 480 000 $.

Enfin, étant donné la faible contribution de la partie non observée de la population aux estimations totales, le biais dans la partie non observée a un effet négligeable sur les CV. Par conséquent, on utilise le CV provenant de la partie observée pour l'estimation totale qui est égale à la somme des estimations pour les parties observée et non observée de la population.

13. Contrôle de la divulgation

La loi interdit à Statistique Canada de rendre publique toute donnée susceptible de révéler l'information recueillie en vertu de la Loi sur la statistique et se rapportant à toute personne, entreprise ou organisation reconnaissable, sans que cette personne, entreprise ou organisation le sache ou y consente par écrit. Diverses règles de confidentialité s'appliquent à toutes les données diffusées ou publiées afin d'empêcher la publication ou la divulgation de toute information jugée confidentielle. Au besoin, des données sont supprimées pour empêcher la divulgation directe ou par recoupement de données reconnaissables.

L'analyse de la confidentialité des données inclut la détection de la « divulgation directe » éventuelle, qui survient lorsque la valeur figurant dans une cellule d'un tableau ne correspond qu'à quelques répondants ou que la cellule est dominée par un petit nombre d'entreprises.

Enquête mensuelle sur le commerce de détail (EMCD) – Énoncé de la qualité des données

Objectifs, utilisation et utilisateurs
Concepts, variables et classifications
Couverture et bases de sondage
Échantillonnage
Conception du questionnaire
Réponse et non-réponse
Opérations de collecte et de saisie des données
Vérification
Imputation
Estimation
Révisions et désaisonnalisation
Évaluation de la qualité des données
Contrôle de la divulgation

1. Objectifs, utilisation et utilisateurs

1.1. Objectifs

L’Enquête mensuelle sur le commerce de détail (EMCD) fournit des renseignements sur la performance du secteur du commerce de détail et, quand les données sont combinées à d’autres statistiques, représente un important indicateur de l'état de l’économie canadienne.

1.2. Utilisation

Les estimations fournissent une mesure de la santé et de la performance du secteur du commerce de détail. L'information recueillie est utilisée pour estimer le niveau et la tendance mensuelle des ventes ainsi que le nombre d’emplacements. À la fin de chaque année, les estimations donnent un premier aperçu de la valeur annuelle des ventes au détail et de la performance du secteur.

1.3. Utilisateurs

Divers organismes, associations sectorielles et gouvernements utilisent l'information. Les détaillants utilisent les résultats de l'enquête pour comparer leurs résultats à ceux d'entreprises similaires, ainsi qu'à des fins de marketing. Les associations de détaillants peuvent surveiller la performance de leur industrie et promouvoir les industries du commerce de détail. Les investisseurs peuvent surveiller la croissance de l'industrie, ce qui peut donner aux détaillants un meilleur accès au capital d'investissement. Les données de l'enquête aident les administrations à comprendre le rôle des détaillants dans l'économie, ce qui facilite l'élaboration des politiques et des encouragements fiscaux. Le commerce de détail étant un important secteur de l'économie canadienne, les données permettent aux administrations de déterminer plus exactement la santé globale de l'économie grâce à l'utilisation des estimations dans le calcul du produit intérieur brut (PIB) national.

2. Concepts, variables et classifications

2.1. Concepts

Le secteur du commerce de détail comprend les établissements dont l’activité principale consiste à vendre des marchandises au détail, généralement sans transformation, et à fournir des services connexes.

Le commerce de détail représente le dernier maillon de la chaîne de distribution; les détaillants sont donc organisés pour vendre des marchandises en petites quantités au grand public. Ce secteur comprend deux grands types d’établissements : les détaillants en magasin et les détaillants hors magasin. L’EMCD couvre uniquement les détaillants en magasin. Leurs principales caractéristiques sont décrites ci-après.

Les détaillants en magasin exploitent des points de vente fixes, situés et conçus de manière à attirer un grand nombre de passants. De façon générale, les magasins de détail ont de grands étalages et font de la publicité dans les médias. Ils vendent surtout des biens de consommation qui intéressent les particuliers ou les ménages, mais certains servent aussi les entreprises et une clientèle institutionnelle. Parmi ces établissements, on compte les magasins de fournitures de bureau, les magasins d’ordinateurs et de logiciels, les stations-service, les vendeurs de matériaux de construction, les magasins de fournitures de plomberie et de fournitures électriques.

En plus de vendre des marchandises, certains types de détaillants fournissent des services après-vente, comme des services de réparation et d’installation. Ainsi, les concessionnaires d’automobiles neuves, les magasins d’électronique et d’appareils ménagers, et les magasins d’instruments et de fournitures de musique assurent fréquemment un service de réparation, alors que les magasins de revêtements de sol et les magasins de garnitures de fenêtres fournissent souvent des services d’installation. En règle générale, les établissements qui vendent des marchandises au détail et qui ont un service après-vente sont classés dans ce secteur.

Les salles d’exposition des sociétés de vente sur catalogue, les stations-service et les marchands de maisons mobiles sont assimilés à des détaillants en magasin.

2.2. Variables

Les ventes sont définies comme étant les ventes de toutes les marchandises achetées pour la revente, nettes des rendus et des escomptes. Sont inclus les honoraires et les commissions résultant de la vente de biens et de services pour le compte de tiers, comme la vente de billets de loterie, de billets d’autobus et de cartes de téléphone. Sont également inclus les recettes provenant des pièces et de la main-d’oeuvre utilisées pour les services d'entretien et de réparation, les revenus de location et de location à bail de biens et de matériel, les revenus provenant de services, y compris les services de restauration, les ventes de biens fabriqués en tant qu’activité secondaire et la valeur des marchandises prélevées par le propriétaire pour son usage personnel. Sont exclus les autres revenus de location de biens immobiliers, les frais de placement, les subventions d’exploitation et autres, les redevances et les droits de franchise.

L’emplacement d’affaires comprend le ou les emplacements physiques où a lieu l’activité commerciale dans chaque province et territoire et dont les ventes sont créditées ou comptabilisées dans les états financiers de l’entreprise. Pour les détaillants, il s’agit normalement d’un magasin.

Dollars constants : La valeur du commerce de détail est mesurée de deux façons : par la prise en compte des effets de la variation des prix sur la valeur des ventes et par l’élimination des effets de la variation des prix. La première mesure est la valeur des ventes au détail en dollars courants et la seconde, la valeur des ventes au détail en dollars constants. Pour calculer l’estimation en dollars courants, on agrège la valeur des ventes pondérées de tous les points de vente au détail. Pour calculer l’estimation en dollars constants, il faut d’abord rajuster la valeur des ventes par rapport à une année de base en utilisant l’Indice des prix à la consommation, puis additionner les valeurs résultantes.

2.3. Classification

L’Enquête mensuelle sur le commerce de détail est fondée sur la définition du commerce de détail adoptée dans le SCIAN (Système de classification des industries de l’Amérique du Nord). Le SCIAN est le cadre commun reconnu pour la production de statistiques comparables par les organismes statistiques du Canada, du Mexique et des États-Unis. L’accord définit les limites de 20 secteurs. Le SCIAN est fondé sur un cadre conceptuel axé sur la production, ou l’offre, en ce sens que les établissements sont regroupés en classes ou branches d’activité d’après la similarité des processus utilisés pour produire les biens et les services.

Les estimations sont calculées pour 21 groupes fondés sur des agrégations spéciales du Système de classification des industries de l’Amérique du Nord (SCIAN) de 2012. Les 21 groupes sont en outre agrégés en onze sous-secteurs.

Du point de vue géographique, les estimations des ventes sont produites pour le Canada et pour chaque province et territoire.

3. Couverture et bases de sondage

La base de sondage de l'Enquête mensuelle sur le commerce de détail (EMCD) est le Registre des entreprises (RE) de Statistique Canada. Ce dernier est une liste structurée d'entreprises productrices de biens et de services au Canada. Cette base de données tenue à jour centralement contient des renseignements détaillés sur la plupart des entités commerciales exploitées au Canada. Le RE couvre toutes les entreprises constituées en société, avec ou sans employés. Pour les entreprises non constituées en société, le RE comprend toutes les entreprises ayant des employés, ainsi que les entreprises sans employés ayant des ventes annualisées provenant d'un compte de la taxe sur les produits et services (TPS) ou un revenu annuel provenant de la déclaration d'impôt individuelle.

Dans le RE, les entreprises sont représentées selon une structure hiérarchique à quatre niveaux ayant pour sommet l'entreprise statistique suivie, par ordre décroissant, par la compagnie statistique, l'établissement statistique et l'emplacement statistique. Une entreprise peut être reliée à une ou à plusieurs compagnies statistiques, une compagnie statistique à un ou à plusieurs établissements statistiques et un établissement statistique à un ou à plusieurs emplacements statistiques.

La population cible de l'EMCD comprend tous les établissements statistiques figurant dans le RE, excluant les entreprises non constituées en société n'ayant pas d'employés dont les ventes annuelles sont inférieures à 30 000 $, qui sont classés dans le secteur du commerce de détail d'après le Système de classification des industries de l'Amérique du Nord (SCIAN) (environ 200 000 établissements). La fourchette de codes du SCIAN pour le secteur du commerce de détail varie de 441100 à 453999. Un établissement statistique est l'entité de production ou le plus petit groupe d'entités de production qui produit un ensemble de biens ou de services homogènes, dont les activités ne débordent pas les frontières provinciales/territoriales, et qui est en mesure de fournir des données sur la valeur de la production, ainsi que sur le coût des matières utilisées et le coût et l'importance de la main-d'oeuvre affectée à la production. L'entité de production est l'unité physique où se déroulent les activités de l'entreprise. Elle doit avoir une adresse de voirie et une main-d'oeuvre directement affectée au processus de production.

Sont exclus de la population cible les établissements auxiliaires (producteurs de services de soutien de l'activité de production de biens et services destinés au marché de plus d'un établissement au sein de l'entreprise, et qui sont considérés comme un centre de coûts ou un centre de dépenses discrétionnaires pour lequel les données sur tous les coûts, y compris la main-d'oeuvre et l'amortissement, peuvent être déclarées par l'entreprise), les futurs établissements, les établissements pour lesquels les signaux économiques indiquent un revenu manquant ou nul, et les établissements appartenant aux catégories du SCIAN non couvertes qui suivent :

  • 4541 (entreprises de télémagasinage et de vente par correspondance)
  • 4542 (exploitants de distributeurs automatiques)
  • 45431 (marchands de combustible)
  • 45439 (autres établissements de vente directe)

4. Échantillonnage

L'échantillon de l'EMCD est formé de 10 000 groupes d'établissements (grappes) classés dans le secteur du commerce de détail et sélectionnés à partir du Registre des entreprises de Statistique Canada. Par définition, une grappe d'établissements comprend tous les établissements appartenant à une entreprise statistique qui font partie d'un même groupe industriel et d'une même région géographique. L’EMCD est fondée sur un plan d'échantillonnage stratifié avec sélection d'un échantillon aléatoire simple dans chaque strate. La stratification est faite selon des groupes industriels (majoritairement mais non exclusivement des SCIAN à quatre chiffres) et selon la région géographique, c'est-à-dire selon la province ou le territoire. Ensuite, la population est stratifiée selon la taille de l'établissement. La mesure de taille est créée en combinant des données provenant d'enquêtes indépendantes et trois variables administratives, à savoir le revenu annuel profilé, les ventes assujetties à la TPS exprimées sur une base annuelle et le revenu de la déclaration d’impôt (T1 ou T2).

Les strates de taille comptent une strate à tirage complet (recensement), au moins deux strates à tirage partiel (échantillonnées partiellement) et une strate à tirage nul (non échantillonnée). La strate à tirage nul est destinée à réduire le fardeau de réponse en excluant les entreprises les plus petites de la population observée. Ces entreprises représentent, en principe, au plus 10 % du total des ventes. Au lieu d'envoyer un questionnaire à ces entreprises, on produit les estimations d'après des données administratives.

L'échantillon est réparti de façon optimale afin d'atteindre les coefficients de variation cibles au niveau du Canada dans son ensemble, de la province ou du territoire, de l’industrie et des groupes industriels selon la province ou le territoire. On procède aussi à un suréchantillonnage pour tenir compte des unités disparues, non répondantes ou classées incorrectement.

L'EMCD est une enquête répétée avec maximisation du chevauchement des échantillons mensuels. On retient l'échantillon d’un mois à l’autre et, chaque mois, on y ajoute de nouvelles unités (naissances). Pour découvrir les nouvelles unités visées par l'EMCD, c'est-à-dire les nouvelles grappes d'établissement(s), on examine chaque mois l'univers le plus récent du RE. On stratifie ces nouvelles unités conformément aux mêmes critères que ceux appliqués à la population initiale, puis on les échantillonne conformément à la fraction d'échantillonnage de la strate à laquelle elles appartiennent et on les ajoute à l'échantillon mensuel. Des disparitions d'entité surviennent également chaque mois. Une entité disparue peut être une grappe d'établissements qui ont cessé leurs activités (fermeture) ou dont les activités principales ne se rattachent plus au commerce de détail (hors du champ). La situation de ces entreprises est mise à jour dans le RE d'après des renseignements de source administrative et les commentaires reçus lors des enquêtes, y compris ceux des entreprises prenant part à l'EMCD. Les méthodes suivies pour traiter les unités disparues et les unités classées incorrectement font partie des procédures d'échantillonnage et de mise à jour de la population.

5. Conception du questionnaire

L’Enquête mensuelle sur le commerce de détail englobe les sous-enquêtes suivantes :

Enquête mensuelle sur le commerce de détail – R8

Enquête mensuelle sur le commerce de détail (avec les stocks) – R8

Enquête sur les ventes et stocks de boissons alcooliques

Le questionnaire est conçu pour recueillir mensuellement auprès d'un échantillon de détaillants des données sur les ventes au détail, sur le nombre d'emplacements commerciaux par province ou territoire et sur les stocks de biens possédés et destinés à la revente. Lors du remaniement de 2004, la plupart des questionnaires n'ont subi que des changements de présentation. Le questionnaire sur les ventes et les stocks de boissons alcooliques a subi des modifications plus importantes. Les modifications ont été discutées avec les intervenants et les répondants ont eu l'occasion de faire des commentaires avant que le nouveau questionnaire ne soit finalisé. Si d'autres modifications devaient être apportées à l'un des questionnaires, les changements proposés seraient soumis à un comité d'examen et ferait l'objet d'un essai sur le terrain auprès de répondants et d'utilisateurs de données pour s'assurer de leur pertinence.

6. Réponse et non-réponse

6.1. Réponse et non-réponse

Bien que les gestionnaires d'enquête et les employés des opérations fassent tout leur possible pour maximiser la réponse à l'EMCD, un certain degré de non-réponse a lieu. Pour qu'un établissement statistique soit considéré comme répondant, il faut que le degré de réponse partielle (situation où une réponse exacte n'est obtenue que pour certaines questions posées au répondant) atteigne un seuil minimal au-dessous duquel la déclaration fournie par l'établissement serait rejetée et l'établissement, considéré comme une unité non répondante. Le cas échéant, on considère que l'entreprise n'a pas répondu du tout.

La non-réponse a deux effets sur les données : premièrement, elle introduit un biais dans les estimations si les non-répondants diffèrent des répondants en ce qui concerne les caractéristiques mesurées et, deuxièmement, elle fait augmenter la variance d'échantillonnage des estimations, parce que la taille effective de l'échantillon est réduite comparativement à celle considérée au départ.

L'ampleur des efforts déployés pour obtenir une réponse auprès d'un non-répondant dépend des contraintes budgétaires et de temps, de l'effet de la non-réponse sur la qualité globale et du risque de biais dû à la non-réponse.

La méthode principalement utilisée pour réduire l'effet de la non-réponse à l'étape de l'échantillonnage consiste à augmenter la taille de l'échantillon en appliquant un taux de suréchantillonnage déterminé d'après les résultats d'enquêtes similaires.

Les cas de non-réponse qui surviennent malgré les méthodes appliquées aux étapes de l'échantillonnage et de la collecte pour réduire l'effet de la non-réponse sont traités par imputation.

Afin de déterminer l'importance de la non-réponse qui a lieu chaque mois, on calcule divers taux de réponse. Pour un mois de référence donné, on produit les estimations au moins deux fois (estimations provisoires et estimations révisées). Entre les deux exécutions, certaines données fournies par les répondants peuvent être jugées inutilisables et des valeurs imputées peuvent être corrigées au moyen de données fournies par les répondants. Par conséquent, les taux de réponse sont calculés après chaque exécution du processus d'estimation.

Pour l'EMCD, deux types de taux sont calculés (non pondérés et pondérés). Afin d'évaluer l'efficacité du processus de collecte, on calcule les taux de réponse non pondérés. Les taux pondérés, fondés sur le poids d'estimation et la valeur de la variable d'intérêt, évaluent la qualité de l'estimation. À l'intérieur de chacun de ces types de taux, il existe des taux distincts pour les unités faisant partie de l'échantillon et pour les unités qui sont uniquement modélisées à partir de données administratives qui ont été extraites des fichiers de TPS.

Afin d’obtenir une meilleure idée du succès du processus de collecte de données, on calcule deux taux non pondérés appelés « taux de résultat de la collecte » et « taux de résultat de l'extraction ». On calcule ces taux en divisant le nombre de répondants par le nombre d'unités avec lesquelles on a essayé de prendre contact ou pour lesquelles on a essayé de recevoir des données extraites. Les déclarants non mensuels (répondants bénéficiant de modalités de déclaration spéciales leur permettant de ne pas produire de déclaration chaque mois, mais pour lesquels des données réelles sont disponibles lors des révisions subséquentes) sont exclus du numérateur ainsi que du dénominateur pour les mois où aucun contact n'est pris avec eux. Brièvement, les divers taux de réponse se calculent comme suit :

Taux pondérés :

Taux de réponse des unités faisant partie de l'échantillon (estimation) =
Somme des ventes pondérées des unités avec situation de réponse i / Somme des ventes pondérées des unités faisant partie de l'échantillon

i = unités pour lesquelles il existe des données déclarées qui seront utilisées dans l'estimation ou qui sont des refus convertis, ou pour lesquelles il existe des données déclarées qui n'ont pas encore été évaluées pour l'estimation.

Taux de réponse des unités modélisées à partir de données administratives (estimation) = Somme des ventes pondérées des unités avec situation de réponse ii / Somme des ventes pondérées des unités modélisées à partir de données administratives

ii = unités pour lesquelles il existe des données extraites des fichiers administratifs et qui sont utilisables pour l'estimation.

Taux de réponse total (estimation) =
Somme des ventes pondérées des unités avec situation de réponse i ou situation de réponse ii / Somme de toutes les ventes pondérées

Taux non pondérés :

Taux de réponse des unités faisant partie de l'échantillon (collecte) =
Nombre de questionnaires avec situation de réponse iii / Nombre de questionnaires avec situation de réponse iv

iii = unités pour lesquelles il existe des données déclarées (dont le cas n'est pas résolu, utilisées ou non utilisées pour l'estimation) ou qui sont des refus convertis;

iv = toutes les unités susmentionnées, ainsi que les unités qui ont refusé de répondre, les unités avec lesquelles on n'a pas pris contact et d'autres types d'unités non répondantes.

Taux de réponse des unités modélisées à partir de données administratives (extraction) =
Nombre de questionnaires avec situation de réponse vi / Nombre de questionnaires avec situation de réponse vii

vi = unités dans le champ d'observation pour lesquelles il existe des données (utilisables ou non utilisables) extraites des fichiers administratifs;

vii = toutes les unités susmentionnées, ainsi que les unités qui ont refusé de déclarer la source de données administratives, les unités avec lesquelles on n'a pas pris contact et d'autres types d'unités non répondantes.

(% de questionnaires recueillis par rapport à l'ensemble des questionnaires dans le champ d'observation)

Taux de résultat de la collecte =
Nombre de questionnaires avec situation de réponse iii / Nombre de questionnaires avec situation de réponse viii

iii = même que iii défini plus haut;

viii = même que iv, à part l'exclusion des unités avec lesquelles on a pris contact, parce que leur réponse n'est pas disponible pour un mois particulier, puisqu'il s'agit de déclarants non mensuels.

Taux de résultat de l'extraction =
Nombre de questionnaires avec situation de réponse ix / Nombre de questionnaires avec situation de réponse vii

ix = même que vi, avec l'ajout des unités extraites qui ont été imputées ou qui étaient hors du champ de l'enquête;

où vii = même que vii défini plus haut.

(% de questionnaires recueillis par rapport à l'ensemble des questionnaires dans le champ d'observation que nous avons tenté de recueillir)

Tous les taux pondérés et non pondérés susmentionnés sont calculés au niveau du groupe industriel, de la région et du groupe de taille, ainsi que pour toute combinaison de ces niveaux.

Utilisation des données administratives

Réduire le fardeau de réponse est un défi à long terme pour Statistique Canada. Afin d’alléger le fardeau de réponse et de réduire les coûts reliés à l’enquête, notamment en ce qui a trait aux petites entreprises, l’EMCD a réduit le nombre d’établissements simples de l’échantillon qui sont enquêtés directement et dérive plutôt les chiffres de vente pour ces établissements à partir des fichiers de la TPS en utilisant un modèle statistique. Le modèle explique les différences entre les ventes et les recettes déclarées aux fins de la TPS, ainsi que le décalage entre la période de référence de l’enquête et celle de la TPS.

Pour en savoir plus sur la méthode utilisée lors de la modélisation des ventes tirées de fichiers administratifs, veuillez consulter le document intitulé Enquête mensuelle sur le commerce de détail : Utilisation de données administratives sous la rubrique ‘Documentation’ du BMDI.

Le tableau 1 contient les fractions de réponses pondérées pour tous les groupes industriels ainsi que pour toutes les provinces et territoires. Pour des fractions de réponses pondérées plus détaillées, veuillez contacter la section du marketing et de la diffusion au (613) 951-3549, sans frais: 1-877-421-3067 or par courriel à retailinfo@statcan.

6.2. Méthodes utilisées pour réduire la non-réponse durant la collecte

Beaucoup d’efforts sont déployés en vue de réduire au minimum la non-réponse durant la collecte. Les méthodes utilisées incluent des techniques d'interview, comme l'utilisation de questions d'approfondissement et des techniques de persuasion, la replanification répétée des appels téléphoniques pour obtenir l'information et la mise en place de procédures indiquant aux intervieweurs comment s'y prendre avec les répondants qui refusent de participer à l'enquête.

Si les données demandées ne sont pas disponibles au moment de la collecte, la meilleure estimation fournie par le répondant est acceptée et est révisée par la suite, quand les données réelles sont disponibles.

Pour réduire au minimum la non-réponse totale pour toutes les variables, des réponses partielles sont acceptées. En outre, les questionnaires sont personnalisés pour la collecte de certaines variables, comme les stocks, de sorte que la collecte ait lieu durant les mois où les données sont disponibles.

Enfin, pour établir un climat de confiance entre les intervieweurs et les répondants, les cas sont généralement affectés au même intervieweur chaque mois. Ce dernier peut ainsi établir une relation personnelle avec le répondant et renforcer sa confiance.

7. Opérations de collecte et de saisie des données

La collecte des données est réalisée par les bureaux régionaux de Statistique Canada.

Tableau 1: Fractions de réponse pondérées par SCIAN et pour les provinces et territoires, mars 2016 : Sommaire du tableau
Le tableau montre les résultats de Tableau 1: Fractions de réponse pondérées par SCIAN et pour les provinces et territoires Fractions de réponse pondérées, calculées selon Total, Enquêté et Administrative unités de mesure (figurant comme en-tête de colonne).
  Fractions de réponse pondérées
  Total Enquêté Administrative
SCIAN - Canada  
Concessionnaires de véhicules et de pièces automobiles 92,3 93,0 52,4
Concessionnaires d'automobiles 93,6 93,9 49,6
Concessionnaires d'automobiles neuves 95,1 95,1 Note ...: n'ayant pas lieu de figurer
Concessionnaires d'automobiles d'occasion 71,0 74,0 49,6
Autres concessionnaires de véhicules automobiles 73,5 74,1 67,4
Magasins de pièces, de pneus et d' accessoires pour véhicules automobiles 85,8 91,6 43,5
Magasins de meubles et d'accessoires de maison 87,1 91,6 40,3
Magasins de meubles 92,4 93,7 64,3
Magasins d'accessoires de maison 77,9 87,3 29,3
Magasin d'appareils électroniques et ménagers 88,4 89,1 51,3
Marchands de matériaux de construction et de matériel et fournitures de jardinage 86,2 89,6 42,5
Magasins d'alimentation 85,0 87,6 48,8
Épiceries 89,5 92,4 52,4
Supermarchés et autres épiceries (sauf les dépanneurs) 91,8 94,5 55,8
Dépanneurs 55,3 59,6 26,2
Magasins d'alimentation spécialisés 62,7 67,9 35,7
Magasins de bière, de vin et de spiritueux 73,0 74,1 31,5
Magasins de produits de santé et de soins personnels 90,9 91,4 84,1
Stations-service 81,5 83,2 57,2
Magasins de vêtements et d'accessoires vestimentaires 84,3 85,0 55,8
Magasins de vêtements 84,8 85,5 55,4
Magasins de chaussures 80,8 81,6 20,7
Bijouteries et magasins de bagages et de maroquinerie 84,2 85,3 68,2
Magasins d'articles de sport, d'articles de passe-temps, d'articles de musique et de livres 89,2 92,5 50,0
Magasins de marchandises diverses 98,8 99,4 34,9
Grands magasins 100,0 100,0 Note ...: n'ayant pas lieu de figurer
Autres magasins de marchandises diverses 97,9 98,9 34,9
Magasins de détail divers 73,7 77,6 37,2
Total 89,0 90,6 52,3
Régions  
Terre-Neuve-et-Labrador 89,2 90,9 30,2
Île-du-Prince-Édouard 83,8 84,5 32,8
Nouvelle Écosse 87,9 89,1 47,0
Nouveau-Brunswick 86,7 88,7 45,0
Québec 90,9 92,9 57,0
Ontario 89,7 91,6 47,0
Manitoba 82,8 83,0 65,1
Saskatchewan 90,7 92,6 47,0
Alberta 89,4 90,9 57,4
Colombie-Britannique 86,0 87,2 54,9
Territoire du Yukon 79,5 79,5 Note ...: n'ayant pas lieu de figurer
Territoires du Nord-Ouest 75,0 75,0 Note ...: n'ayant pas lieu de figurer
Nunavut 87,8 87,8 Note ...: n'ayant pas lieu de figurer

Fractions de réponse pondérées

Ces derniers envoient un questionnaire aux répondants ou communiquent avec ceux-ci par téléphone afin d'obtenir les valeurs de leurs ventes et de leurs stocks, et de confirmer l'ouverture ou la fermeture des emplacements d'affaires. Ils effectuent aussi un suivi auprès des non-répondants. La collecte des données débute environ sept jours ouvrables après la fin du mois de référence et se poursuit pendant tout le mois en question.

Les entités qui participent à l'enquête pour la première fois reçoivent une lettre d'introduction en vue d’informer le répondant qu'un représentant de Statistique Canada l'appellera. Cet appel a pour but de présenter l'enquête, de confirmer l'activité de l'entreprise, d'établir et de commencer la collecte des données, et de répondre à toutes questions que le répondant pourrait avoir.

8. Vérification

La vérification des données est l'application de contrôles pour déceler les entrées manquantes, invalides ou incohérentes, ou pour repérer les enregistrements de données susceptibles d'être erronés. Durant le processus d'enquête de l'EMCD, les données sont vérifiées à deux moments distincts.

Premièrement, une vérification est faite durant la collecte des données. Après leur collecte par téléphone ou au moyen du questionnaire à renvoyer par la poste, les données sont saisies à l'aide d'applications informatiques personnalisées. Toutes sont soumises à une vérification. Les contrôles réalisés durant la collecte des données, appelés contrôles sur le terrain, comprennent généralement des contrôles de validité et certains contrôles de cohérence simples. Ils servent aussi à déceler les erreurs commises durant l'interview par le répondant ou par l'intervieweur et de repérer l'information manquante à l'étape de la collecte en vue de réduire le besoin d'un suivi ultérieur. Les contrôles sur le terrain ont également pour but d'épurer les réponses. Dans le cas de l'EMCD, les réponses du mois courant sont comparées aux réponses fournies par le répondant le mois précédent et (ou) l'année précédente pour le mois courant. Les contrôles sur le terrain permettent de repérer les problèmes que posent les procédures de collecte des données et la conception des questionnaires, et de déterminer s'il faut offrir une formation supplémentaire aux intervieweurs.

Tout enregistrement de données rejeté lors des contrôles préliminaires fait l'objet d'un suivi auprès du répondant afin de valider les données soupçonnées d'être incorrectes. Une fois validé, les données recueillies sont transmises de façon régulière au Bureau central à Ottawa.

Deuxièmement, après la collecte, les données sont soumises à une vérification statistique dont la nature est plus empirique. On exécute la vérification statistique avant l'imputation, afin de repérer les données qui serviront de base pour l'imputation de valeurs pour les non-répondants. Les valeurs très extrêmes risquant de perturber une tendance mensuelle sont exclues des calculs de tendance lors de la vérification statistique. Il convient de souligner qu'aucun ajustement n'est fait à cette étape pour corriger les valeurs extrêmes déclarées.

La première étape de la vérification statistique consiste à repérer les réponses qui seront soumises aux règles de vérification statistique. Les données déclarées pour le mois de référence courant sont soumises à divers contrôles.

Le premier ensemble de contrôles est fondé sur la méthode d'Hidiroglou-Berthelot qui consiste à examiner le rapport des données du mois courant fournies par un répondant à des données historiques (c.-à-d. dernier mois ou même mois l'année précédente) ou administratives. Si le rapport calculé pour le répondant diffère significativement de ceux obtenus pour des répondants dont les caractéristiques sont comparables en ce qui concerne le groupe industriel et/ou la région géographique, la réponse est considérée comme une valeur extrême.

Le deuxième ensemble de contrôles est basé sur la vérification de la part de marché. Cette méthode, qui s'appuie sur les données du mois courant uniquement, permet de vérifier les données fournies par tous les répondants, mêmes ceux pour lesquels on ne dispose pas de données historiques ou de données auxiliaires. Par conséquent, parmi un groupe de répondants présentant des caractéristiques similaires en ce qui concerne le groupe industriel et (ou) la région géographique, toute valeur dont la contribution pondérée au total du groupe est trop importante sera considérée comme une valeur extrême.

Pour les contrôles fondés sur la méthode d'Hidiroglou-Berthelot, les données jugées extrêmes ne sont pas incluses dans les modèles d'imputation (ceux fondés sur les ratios). En outre, les données considérées comme des valeurs extrêmes lors de la vérification de la part de marché ne sont pas incluses dans les modèles d'imputation où les moyennes et les médianes sont calculées pour imputer des valeurs pour les réponses pour lesquelles il n'existe pas de données historiques.

Conjointement avec les vérifications statistiques effectuées après la collecte de données, on procède à la détection d’erreurs des données extraites des fichiers administratifs. Les données modélisées de la TPS sont également assujetties à une phase de vérification approfondie. Chaque fichier sur lequel les données modélisées sont fondées est vérifié de même que les valeurs modélisées. Les vérifications sont effectuées au niveau agrégé (industrie, géographie) afin de détecter les fichiers qui dévient de la norme (soit en exhibant des différences d’un mois à l’autre trop importantes ou qui diffèrent considérablement des autres unités. Toutes les données qui faillissent ces étapes de contrôle sont sujettes à une vérification manuelle, et si nécessaire, à une action corrective.

9. Imputation

Le processus d’imputation de l'EMCD a pour but de remplacer les données manquantes par des valeurs imputées. Des valeurs sont attribuées aux enregistrements pour lesquels la vérification a révélé des valeurs manquantes afin de s'assurer que les estimations soient de haute qualité et d'établir une cohérence interne plausible. Pour des raisons de fardeau de réponse, de coût et d'actualité des données, il est généralement impossible de réaliser auprès des répondants tous les suivis nécessaires pour résoudre les problèmes de réponses manquantes. Puisqu'il est souhaitable de produire un fichier de microdonnées complet et cohérent, on recourt à l'imputation pour traiter les cas persistants de données manquantes.

Dans le cas de l'EMCD, on peut fonder l'imputation des valeurs manquantes sur des données historiques ou sur des données administratives. Le choix de la méthode appropriée est fondé sur une stratégie qui dépend de l'existence de données historiques ou de données administratives et (ou) du mois de référence en question.

Il existe trois types de méthode d'imputation d'après des données historiques. Le premier est l’application d’une tendance générale qui s'appuie sur une source unique de données historiques (mois précédent, données recueillies pour le mois suivant ou données recueillies pour le même mois l'année précédente). Le deuxième est un modèle de régression dans lequel sont utilisées simultanément les données provenant du mois précédent et celles provenant du même mois l'année précédente. La troisième méthode consiste à remplacer directement les valeurs manquantes par des données historiques.

Selon le mois de référence, il existe, pour le choix de la méthode, un ordre de préférence en vue d'assurer une imputation de haute qualité. Le troisième type de méthode d'imputation historique est toujours la dernière option considérée pour chaque mois de référence.

La méthode d’imputation fondée sur des données administratives est sélectionnée automatiquement lorsqu'on ne dispose pas de données historiques pour un non-répondant.  Des tendances sont alors appliquées à la source de données administratives (mesure de taille mensuelle) selon que la structure est simple (entreprises ne comptant qu’un seul établissement) ou complexe.

10. Estimation

L'estimation est un processus qui consiste à calculer une valeur approximative des paramètres de population inconnus en utilisant uniquement la partie de la population qui est incluse dans un échantillon. Des inférences sont ensuite faites au sujet des paramètres inconnus en utilisant les données d'échantillon et les renseignements connexes sur le plan de sondage. Cette étape fait usage du Système généralisé d'estimation (SGE) de Statistique Canada.

Pour les ventes des détaillants, la population est divisée en une partie observée (strates à tirage complet et à tirage partiel) et une partie non observée (strate à tirage nul). D'après l'échantillon tiré à partir de la partie observée, on calcule une estimation pour la population au moyen d'un estimateur d'Horvitz-Thompson où les réponses concernant les ventes sont pondérées par l'inverse des probabilités d'inclusion des unités échantillonnées. Ces poids (appelés poids d'échantillonnage) peuvent être interprétés comme étant le nombre de fois que chaque unité échantillonnée devrait être répétée pour représenter la population complète. Les valeurs pondérées des ventes ainsi calculées sont totalisées par domaine, pour produire une estimation du total des ventes pour chaque combinaison des groupes industriels/région géographique. Un domaine est défini comme correspondant aux valeurs de classification les plus récentes disponibles dans le RE pour l'unité et la période de référence de l'enquête. Les domaines peuvent différer des strates d'échantillonnage originales, parce que les unités peuvent avoir changé de taille, d'industrie ou d'emplacement. Les changements de classification sont reflétés immédiatement dans les estimations et ne sont pas cumulés au cours du temps. Pour la partie non observée de la population, les ventes sont estimées à l’aide de modèles statistiques exploitant les ventes assujetties à la TPS exprimées sous forme mensuelle.

Pour en savoir plus sur la méthode utilisée lors de la modélisation des ventes tirées de fichiers administratifs, veuillez consulter le document intitulé Enquête mensuelle sur le commerce de détail : Utilisation de données administratives sous la rubrique ‘Documentation’ du BMDI.

La variance est la mesure de précision utilisée dans le cas de l'EMCD pour évaluer la qualité de l'estimation des paramètres de population et pour obtenir des inférences valides. Pour la partie observée de la population, la variance est calculée directement à partir d'un échantillon aléatoire simple stratifié sans remise.

Les estimations d'échantillon peuvent différer de la valeur prévue des estimations. Cependant, puisque l'estimation est fondée sur un échantillon probabiliste, il est possible d'évaluer la variabilité de l'estimation d'échantillon par rapport à la valeur prévue. La variance d'une estimation est une mesure de la précision de l'estimation d'échantillon qui est définie comme étant la moyenne, sur tous les échantillons possibles, de l'écart quadratique de l'estimation par rapport à sa valeur prévue.

11. Révisions et désaisonnalisation

Les données brutes sont révisées, sur une base mensuelle, pour le mois précédant immédiatement le mois de référence en cours qui fait l'objet de la publication. C'est donc dire que lorsque les données pour décembre sont publiées pour la première fois, on procédera aussi à des révisions, au besoin, à l'égard des données brutes pour novembre. En outre, des révisions sont aussi effectuées une fois par année, au moment de la première publication des données de février, pour tous les mois de l'année précédente. On vise ainsi à corriger tout problème important que l'on ait décelé et qui s'applique pour une période prolongée. La période de révision proprement dite dépend de la nature du problème décelé, mais elle ne dépasse rarement trois ans. Toutefois, la période de révision peut être plus longue lors de révisions historiques ou de restratification.

Depuis avril 2008, les données de l'Enquête mensuelle sur le commerce de détail sont désaisonnalisées en utilisant la méthode X12-ARIMA. Cette technique consiste essentiellement, dans un premier temps, à extrapoler une année de données brutes avec des modèles ARIMA (modèles autorégressifs à moyennes mobiles intégrées); et dans un deuxième temps, à désaisonnaliser la série brute prolongée par la méthode X-11. Ensuite, les données désaisonnalisées sont ajustées aux totaux annuels des données brutes.

Les données désaisonnalisées doivent aussi être révisées. Elles doivent notamment rendre compte des révisions déterminées pour les données brutes. Par ailleurs, les estimations désaisonnalisées sont calculées à partir de X-12-ARIMA, et la tendance est sensible aux valeurs les plus récentes déclarées dans les données brutes. C'est pourquoi, au moment de la diffusion de nouvelles données pour chaque mois, les valeurs désaisonnalisées pour les trois mois précédents sont révisées. Les séries de données désaisonnalisées sont des données chronologiques qui ont été modifiées pour éliminer l’effet des influences saisonnières et du calendrier.  Pour cette raison, la désaisonnalisation des données permet des comparaisons plus significatives des conditions économiques d’un mois à l’autre.

Une fois par année, les options de désaisonnalisation sont révisées afin d'intégrer les données les plus récentes. Des estimations désaisonnalisées révisées pour chacun des mois des années civiles précédentes sont diffusées en même temps que la révision annuelle des données brutes. La période exacte de révision dépend de la période de révision des données brutes.

12. Évaluation de la qualité des données

La méthodologie de l'enquête a pour objectif de contrôler les erreurs et de réduire leurs effets éventuels sur les estimations. Les résultats de l'enquête peuvent néanmoins contenir des erreurs dont l'erreur d'échantillonnage n'est que l'une des composantes. L'erreur d'échantillonnage survient lorsque les observations sont faites uniquement sur un échantillon et non sur l'ensemble de la population. Toutes les autres erreurs commises aux diverses phases de l'enquête sont appelées erreurs non dues à l'échantillonnage. Des erreurs de ce type peuvent survenir, par exemple, quand un répondant fournit des renseignements erronés ou qu'il ne répond pas à certaines questions; quand une unité du champ de l'enquête y est incluse erronément ou que des erreurs sont commises lors du traitement des données, comme des erreurs de codage ou de saisie.

Avant la publication, on analyse les résultats combinés de l'enquête afin d'en évaluer la comparabilité; il s'agit généralement d'un examen détaillé des réponses individuelles (particulièrement celles des grandes entreprises), de la conjoncture économique générale et des tendances historiques.

Une mesure habituelle de la qualité des données des enquêtes est le coefficient de variation (CV). Le coefficient de variation, défini comme étant l'erreur-type divisée par l'estimation d'échantillon, est une mesure de la précision relative. Puisque le coefficient de variation est calculé d'après les réponses des unités individuelles, il mesure aussi certaines erreurs non dues à l'échantillonnage.

La formule utilisée pour calculer le coefficient de variation (CV) en pourcentage est :

CV (X) = S(X) * 100% / X
où X représente l'estimation et S(X) représente l'erreur-type de X.

On peut construire les intervalles de confiance autour des estimations en utilisant l'estimation et le CV. Donc, pour notre échantillon, il est possible de déclarer avec un niveau donné de confiance que la valeur prévue sera comprise dans l'intervalle de confiance construit autour de l'estimation. Par exemple, si une estimation de 12 millions de dollars à un CV de 2 %, l'erreur-type sera de 240 000 $ (l'estimation multipliée par le CV). On peut déclarer avec 68 % de confiance que les valeurs prévues seront comprises dans l'intervalle dont la longueur est égale à un écart type de part et d'autre de l'estimation, c'est-à-dire entre 11 760 000 $ et 12 240 000 $. Ou bien, nous pouvons déclarer avec 95 % de confiance que la valeur prévue sera comprise dans l'intervalle dont la longueur est égale à deux écarts types de part et d'autre de l'estimation, c'est-à-dire entre 11 520 000 $ et 12 480 000 $.

Enfin, étant donné la faible contribution de la partie non observée de la population aux estimations totales, le biais dans la partie non observée a un effet négligeable sur les CV. Par conséquent, on utilise le CV provenant de la partie observée pour l'estimation totale qui est égale à la somme des estimations pour les parties observée et non observée de la population.

13. Contrôle de la divulgation

La loi interdit à Statistique Canada de rendre publique toute donnée susceptible de révéler l'information recueillie en vertu de la Loi sur la statistique et se rapportant à toute personne, entreprise ou organisation reconnaissable, sans que cette personne, entreprise ou organisation le sache ou y consente par écrit. Diverses règles de confidentialité s'appliquent à toutes les données diffusées ou publiées afin d'empêcher la publication ou la divulgation de toute information jugée confidentielle. Au besoin, des données sont supprimées pour empêcher la divulgation directe ou par recoupement de données reconnaissables.

L'analyse de la confidentialité des données inclut la détection de la « divulgation directe » éventuelle, qui survient lorsque la valeur figurant dans une cellule d'un tableau ne correspond qu'à quelques répondants ou que la cellule est dominée par un petit nombre d'entreprises.

Enquête mensuelle sur le commerce de détail (EMCD) – Énoncé de la qualité des données

Objectifs, utilisation et utilisateurs
Concepts, variables et classifications
Couverture et bases de sondage
Échantillonnage
Conception du questionnaire
Réponse et non-réponse
Opérations de collecte et de saisie des données
Vérification
Imputation
Estimation
Révisions et désaisonnalisation
Évaluation de la qualité des données
Contrôle de la divulgation

1. Objectifs, utilisation et utilisateurs

1.1. Objectifs

L’Enquête mensuelle sur le commerce de détail (EMCD) fournit des renseignements sur la performance du secteur du commerce de détail et, quand les données sont combinées à d’autres statistiques, représente un important indicateur de l'état de l’économie canadienne.

1.2. Utilisation

Les estimations fournissent une mesure de la santé et de la performance du secteur du commerce de détail. L'information recueillie est utilisée pour estimer le niveau et la tendance mensuelle des ventes ainsi que le nombre d’emplacements. À la fin de chaque année, les estimations donnent un premier aperçu de la valeur annuelle des ventes au détail et de la performance du secteur.

1.3. Utilisateurs

Divers organismes, associations sectorielles et gouvernements utilisent l'information. Les détaillants utilisent les résultats de l'enquête pour comparer leurs résultats à ceux d'entreprises similaires, ainsi qu'à des fins de marketing. Les associations de détaillants peuvent surveiller la performance de leur industrie et promouvoir les industries du commerce de détail. Les investisseurs peuvent surveiller la croissance de l'industrie, ce qui peut donner aux détaillants un meilleur accès au capital d'investissement. Les données de l'enquête aident les administrations à comprendre le rôle des détaillants dans l'économie, ce qui facilite l'élaboration des politiques et des encouragements fiscaux. Le commerce de détail étant un important secteur de l'économie canadienne, les données permettent aux administrations de déterminer plus exactement la santé globale de l'économie grâce à l'utilisation des estimations dans le calcul du produit intérieur brut (PIB) national.

2. Concepts, variables et classifications

2.1. Concepts

Le secteur du commerce de détail comprend les établissements dont l’activité principale consiste à vendre des marchandises au détail, généralement sans transformation, et à fournir des services connexes.

Le commerce de détail représente le dernier maillon de la chaîne de distribution; les détaillants sont donc organisés pour vendre des marchandises en petites quantités au grand public. Ce secteur comprend deux grands types d’établissements : les détaillants en magasin et les détaillants hors magasin. L’EMCD couvre uniquement les détaillants en magasin. Leurs principales caractéristiques sont décrites ci-après.

Les détaillants en magasin exploitent des points de vente fixes, situés et conçus de manière à attirer un grand nombre de passants. De façon générale, les magasins de détail ont de grands étalages et font de la publicité dans les médias. Ils vendent surtout des biens de consommation qui intéressent les particuliers ou les ménages, mais certains servent aussi les entreprises et une clientèle institutionnelle. Parmi ces établissements, on compte les magasins de fournitures de bureau, les magasins d’ordinateurs et de logiciels, les stations-service, les vendeurs de matériaux de construction, les magasins de fournitures de plomberie et de fournitures électriques.

En plus de vendre des marchandises, certains types de détaillants fournissent des services après-vente, comme des services de réparation et d’installation. Ainsi, les concessionnaires d’automobiles neuves, les magasins d’électronique et d’appareils ménagers, et les magasins d’instruments et de fournitures de musique assurent fréquemment un service de réparation, alors que les magasins de revêtements de sol et les magasins de garnitures de fenêtres fournissent souvent des services d’installation. En règle générale, les établissements qui vendent des marchandises au détail et qui ont un service après-vente sont classés dans ce secteur.

Les salles d’exposition des sociétés de vente sur catalogue, les stations-service et les marchands de maisons mobiles sont assimilés à des détaillants en magasin.

2.2. Variables

Les ventes sont définies comme étant les ventes de toutes les marchandises achetées pour la revente, nettes des rendus et des escomptes. Sont inclus les honoraires et les commissions résultant de la vente de biens et de services pour le compte de tiers, comme la vente de billets de loterie, de billets d’autobus et de cartes de téléphone. Sont également inclus les recettes provenant des pièces et de la main-d’oeuvre utilisées pour les services d'entretien et de réparation, les revenus de location et de location à bail de biens et de matériel, les revenus provenant de services, y compris les services de restauration, les ventes de biens fabriqués en tant qu’activité secondaire et la valeur des marchandises prélevées par le propriétaire pour son usage personnel. Sont exclus les autres revenus de location de biens immobiliers, les frais de placement, les subventions d’exploitation et autres, les redevances et les droits de franchise.

L’emplacement d’affaires comprend le ou les emplacements physiques où a lieu l’activité commerciale dans chaque province et territoire et dont les ventes sont créditées ou comptabilisées dans les états financiers de l’entreprise. Pour les détaillants, il s’agit normalement d’un magasin.

Dollars constants : La valeur du commerce de détail est mesurée de deux façons : par la prise en compte des effets de la variation des prix sur la valeur des ventes et par l’élimination des effets de la variation des prix. La première mesure est la valeur des ventes au détail en dollars courants et la seconde, la valeur des ventes au détail en dollars constants. Pour calculer l’estimation en dollars courants, on agrège la valeur des ventes pondérées de tous les points de vente au détail. Pour calculer l’estimation en dollars constants, il faut d’abord rajuster la valeur des ventes par rapport à une année de base en utilisant l’Indice des prix à la consommation, puis additionner les valeurs résultantes.

2.3. Classification

L’Enquête mensuelle sur le commerce de détail est fondée sur la définition du commerce de détail adoptée dans le SCIAN (Système de classification des industries de l’Amérique du Nord). Le SCIAN est le cadre commun reconnu pour la production de statistiques comparables par les organismes statistiques du Canada, du Mexique et des États-Unis. L’accord définit les limites de 20 secteurs. Le SCIAN est fondé sur un cadre conceptuel axé sur la production, ou l’offre, en ce sens que les établissements sont regroupés en classes ou branches d’activité d’après la similarité des processus utilisés pour produire les biens et les services.

Les estimations sont calculées pour 21 groupes fondés sur des agrégations spéciales du Système de classification des industries de l’Amérique du Nord (SCIAN) de 2012. Les 21 groupes sont en outre agrégés en onze sous-secteurs.

Du point de vue géographique, les estimations des ventes sont produites pour le Canada et pour chaque province et territoire.

3. Couverture et bases de sondage

La base de sondage de l'Enquête mensuelle sur le commerce de détail (EMCD) est le Registre des entreprises (RE) de Statistique Canada. Ce dernier est une liste structurée d'entreprises productrices de biens et de services au Canada. Cette base de données tenue à jour centralement contient des renseignements détaillés sur la plupart des entités commerciales exploitées au Canada. Le RE couvre toutes les entreprises constituées en société, avec ou sans employés. Pour les entreprises non constituées en société, le RE comprend toutes les entreprises ayant des employés, ainsi que les entreprises sans employés ayant des ventes annualisées provenant d'un compte de la taxe sur les produits et services (TPS) ou un revenu annuel provenant de la déclaration d'impôt individuelle.

Dans le RE, les entreprises sont représentées selon une structure hiérarchique à quatre niveaux ayant pour sommet l'entreprise statistique suivie, par ordre décroissant, par la compagnie statistique, l'établissement statistique et l'emplacement statistique. Une entreprise peut être reliée à une ou à plusieurs compagnies statistiques, une compagnie statistique à un ou à plusieurs établissements statistiques et un établissement statistique à un ou à plusieurs emplacements statistiques.

La population cible de l'EMCD comprend tous les établissements statistiques figurant dans le RE, excluant les entreprises non constituées en société n'ayant pas d'employés dont les ventes annuelles sont inférieures à 30 000 $, qui sont classés dans le secteur du commerce de détail d'après le Système de classification des industries de l'Amérique du Nord (SCIAN) (environ 200 000 établissements). La fourchette de codes du SCIAN pour le secteur du commerce de détail varie de 441100 à 453999. Un établissement statistique est l'entité de production ou le plus petit groupe d'entités de production qui produit un ensemble de biens ou de services homogènes, dont les activités ne débordent pas les frontières provinciales/territoriales, et qui est en mesure de fournir des données sur la valeur de la production, ainsi que sur le coût des matières utilisées et le coût et l'importance de la main-d'oeuvre affectée à la production. L'entité de production est l'unité physique où se déroulent les activités de l'entreprise. Elle doit avoir une adresse de voirie et une main-d'oeuvre directement affectée au processus de production.

Sont exclus de la population cible les établissements auxiliaires (producteurs de services de soutien de l'activité de production de biens et services destinés au marché de plus d'un établissement au sein de l'entreprise, et qui sont considérés comme un centre de coûts ou un centre de dépenses discrétionnaires pour lequel les données sur tous les coûts, y compris la main-d'oeuvre et l'amortissement, peuvent être déclarées par l'entreprise), les futurs établissements, les établissements pour lesquels les signaux économiques indiquent un revenu manquant ou nul, et les établissements appartenant aux catégories du SCIAN non couvertes qui suivent :

  • 4541 (entreprises de télémagasinage et de vente par correspondance)
  • 4542 (exploitants de distributeurs automatiques)
  • 45431 (marchands de combustible)
  • 45439 (autres établissements de vente directe)

4. Échantillonnage

L'échantillon de l'EMCD est formé de 10 000 groupes d'établissements (grappes) classés dans le secteur du commerce de détail et sélectionnés à partir du Registre des entreprises de Statistique Canada. Par définition, une grappe d'établissements comprend tous les établissements appartenant à une entreprise statistique qui font partie d'un même groupe industriel et d'une même région géographique. L’EMCD est fondée sur un plan d'échantillonnage stratifié avec sélection d'un échantillon aléatoire simple dans chaque strate. La stratification est faite selon des groupes industriels (majoritairement mais non exclusivement des SCIAN à quatre chiffres) et selon la région géographique, c'est-à-dire selon la province ou le territoire. Ensuite, la population est stratifiée selon la taille de l'établissement. La mesure de taille est créée en combinant des données provenant d'enquêtes indépendantes et trois variables administratives, à savoir le revenu annuel profilé, les ventes assujetties à la TPS exprimées sur une base annuelle et le revenu de la déclaration d’impôt (T1 ou T2).

Les strates de taille comptent une strate à tirage complet (recensement), au moins deux strates à tirage partiel (échantillonnées partiellement) et une strate à tirage nul (non échantillonnée). La strate à tirage nul est destinée à réduire le fardeau de réponse en excluant les entreprises les plus petites de la population observée. Ces entreprises représentent, en principe, au plus 10 % du total des ventes. Au lieu d'envoyer un questionnaire à ces entreprises, on produit les estimations d'après des données administratives.

L'échantillon est réparti de façon optimale afin d'atteindre les coefficients de variation cibles au niveau du Canada dans son ensemble, de la province ou du territoire, de l’industrie et des groupes industriels selon la province ou le territoire. On procède aussi à un suréchantillonnage pour tenir compte des unités disparues, non répondantes ou classées incorrectement.

L'EMCD est une enquête répétée avec maximisation du chevauchement des échantillons mensuels. On retient l'échantillon d’un mois à l’autre et, chaque mois, on y ajoute de nouvelles unités (naissances). Pour découvrir les nouvelles unités visées par l'EMCD, c'est-à-dire les nouvelles grappes d'établissement(s), on examine chaque mois l'univers le plus récent du RE. On stratifie ces nouvelles unités conformément aux mêmes critères que ceux appliqués à la population initiale, puis on les échantillonne conformément à la fraction d'échantillonnage de la strate à laquelle elles appartiennent et on les ajoute à l'échantillon mensuel. Des disparitions d'entité surviennent également chaque mois. Une entité disparue peut être une grappe d'établissements qui ont cessé leurs activités (fermeture) ou dont les activités principales ne se rattachent plus au commerce de détail (hors du champ). La situation de ces entreprises est mise à jour dans le RE d'après des renseignements de source administrative et les commentaires reçus lors des enquêtes, y compris ceux des entreprises prenant part à l'EMCD. Les méthodes suivies pour traiter les unités disparues et les unités classées incorrectement font partie des procédures d'échantillonnage et de mise à jour de la population.

5. Conception du questionnaire

L’Enquête mensuelle sur le commerce de détail englobe les sous-enquêtes suivantes :

Enquête mensuelle sur le commerce de détail – R8

Enquête mensuelle sur le commerce de détail (avec les stocks) – R8

Enquête sur les ventes et stocks de boissons alcooliques

Le questionnaire est conçu pour recueillir mensuellement auprès d'un échantillon de détaillants des données sur les ventes au détail, sur le nombre d'emplacements commerciaux par province ou territoire et sur les stocks de biens possédés et destinés à la revente. Lors du remaniement de 2004, la plupart des questionnaires n'ont subi que des changements de présentation. Le questionnaire sur les ventes et les stocks de boissons alcooliques a subi des modifications plus importantes. Les modifications ont été discutées avec les intervenants et les répondants ont eu l'occasion de faire des commentaires avant que le nouveau questionnaire ne soit finalisé. Si d'autres modifications devaient être apportées à l'un des questionnaires, les changements proposés seraient soumis à un comité d'examen et ferait l'objet d'un essai sur le terrain auprès de répondants et d'utilisateurs de données pour s'assurer de leur pertinence.

6. Réponse et non-réponse

6.1. Réponse et non-réponse

Bien que les gestionnaires d'enquête et les employés des opérations fassent tout leur possible pour maximiser la réponse à l'EMCD, un certain degré de non-réponse a lieu. Pour qu'un établissement statistique soit considéré comme répondant, il faut que le degré de réponse partielle (situation où une réponse exacte n'est obtenue que pour certaines questions posées au répondant) atteigne un seuil minimal au-dessous duquel la déclaration fournie par l'établissement serait rejetée et l'établissement, considéré comme une unité non répondante. Le cas échéant, on considère que l'entreprise n'a pas répondu du tout.

La non-réponse a deux effets sur les données : premièrement, elle introduit un biais dans les estimations si les non-répondants diffèrent des répondants en ce qui concerne les caractéristiques mesurées et, deuxièmement, elle fait augmenter la variance d'échantillonnage des estimations, parce que la taille effective de l'échantillon est réduite comparativement à celle considérée au départ.

L'ampleur des efforts déployés pour obtenir une réponse auprès d'un non-répondant dépend des contraintes budgétaires et de temps, de l'effet de la non-réponse sur la qualité globale et du risque de biais dû à la non-réponse.

La méthode principalement utilisée pour réduire l'effet de la non-réponse à l'étape de l'échantillonnage consiste à augmenter la taille de l'échantillon en appliquant un taux de suréchantillonnage déterminé d'après les résultats d'enquêtes similaires.

Les cas de non-réponse qui surviennent malgré les méthodes appliquées aux étapes de l'échantillonnage et de la collecte pour réduire l'effet de la non-réponse sont traités par imputation.

Afin de déterminer l'importance de la non-réponse qui a lieu chaque mois, on calcule divers taux de réponse. Pour un mois de référence donné, on produit les estimations au moins deux fois (estimations provisoires et estimations révisées). Entre les deux exécutions, certaines données fournies par les répondants peuvent être jugées inutilisables et des valeurs imputées peuvent être corrigées au moyen de données fournies par les répondants. Par conséquent, les taux de réponse sont calculés après chaque exécution du processus d'estimation.

Pour l'EMCD, deux types de taux sont calculés (non pondérés et pondérés). Afin d'évaluer l'efficacité du processus de collecte, on calcule les taux de réponse non pondérés. Les taux pondérés, fondés sur le poids d'estimation et la valeur de la variable d'intérêt, évaluent la qualité de l'estimation. À l'intérieur de chacun de ces types de taux, il existe des taux distincts pour les unités faisant partie de l'échantillon et pour les unités qui sont uniquement modélisées à partir de données administratives qui ont été extraites des fichiers de TPS.

Afin d’obtenir une meilleure idée du succès du processus de collecte de données, on calcule deux taux non pondérés appelés « taux de résultat de la collecte » et « taux de résultat de l'extraction ». On calcule ces taux en divisant le nombre de répondants par le nombre d'unités avec lesquelles on a essayé de prendre contact ou pour lesquelles on a essayé de recevoir des données extraites. Les déclarants non mensuels (répondants bénéficiant de modalités de déclaration spéciales leur permettant de ne pas produire de déclaration chaque mois, mais pour lesquels des données réelles sont disponibles lors des révisions subséquentes) sont exclus du numérateur ainsi que du dénominateur pour les mois où aucun contact n'est pris avec eux. Brièvement, les divers taux de réponse se calculent comme suit :

Taux pondérés :

Taux de réponse des unités faisant partie de l'échantillon (estimation) =
Somme des ventes pondérées des unités avec situation de réponse i / Somme des ventes pondérées des unités faisant partie de l'échantillon

i = unités pour lesquelles il existe des données déclarées qui seront utilisées dans l'estimation ou qui sont des refus convertis, ou pour lesquelles il existe des données déclarées qui n'ont pas encore été évaluées pour l'estimation.

Taux de réponse des unités modélisées à partir de données administratives (estimation) = Somme des ventes pondérées des unités avec situation de réponse ii / Somme des ventes pondérées des unités modélisées à partir de données administratives

ii = unités pour lesquelles il existe des données extraites des fichiers administratifs et qui sont utilisables pour l'estimation.

Taux de réponse total (estimation) =
Somme des ventes pondérées des unités avec situation de réponse i ou situation de réponse ii / Somme de toutes les ventes pondérées

Taux non pondérés :

Taux de réponse des unités faisant partie de l'échantillon (collecte) =
Nombre de questionnaires avec situation de réponse iii / Nombre de questionnaires avec situation de réponse iv

iii = unités pour lesquelles il existe des données déclarées (dont le cas n'est pas résolu, utilisées ou non utilisées pour l'estimation) ou qui sont des refus convertis;

iv = toutes les unités susmentionnées, ainsi que les unités qui ont refusé de répondre, les unités avec lesquelles on n'a pas pris contact et d'autres types d'unités non répondantes.

Taux de réponse des unités modélisées à partir de données administratives (extraction) =
Nombre de questionnaires avec situation de réponse vi / Nombre de questionnaires avec situation de réponse vii

vi = unités dans le champ d'observation pour lesquelles il existe des données (utilisables ou non utilisables) extraites des fichiers administratifs;

vii = toutes les unités susmentionnées, ainsi que les unités qui ont refusé de déclarer la source de données administratives, les unités avec lesquelles on n'a pas pris contact et d'autres types d'unités non répondantes.

(% de questionnaires recueillis par rapport à l'ensemble des questionnaires dans le champ d'observation)

Taux de résultat de la collecte =
Nombre de questionnaires avec situation de réponse iii / Nombre de questionnaires avec situation de réponse viii

iii = même que iii défini plus haut;

viii = même que iv, à part l'exclusion des unités avec lesquelles on a pris contact, parce que leur réponse n'est pas disponible pour un mois particulier, puisqu'il s'agit de déclarants non mensuels.

Taux de résultat de l'extraction =
Nombre de questionnaires avec situation de réponse ix / Nombre de questionnaires avec situation de réponse vii

ix = même que vi, avec l'ajout des unités extraites qui ont été imputées ou qui étaient hors du champ de l'enquête;

où vii = même que vii défini plus haut.

(% de questionnaires recueillis par rapport à l'ensemble des questionnaires dans le champ d'observation que nous avons tenté de recueillir)

Tous les taux pondérés et non pondérés susmentionnés sont calculés au niveau du groupe industriel, de la région et du groupe de taille, ainsi que pour toute combinaison de ces niveaux.

Utilisation des données administratives

Réduire le fardeau de réponse est un défi à long terme pour Statistique Canada. Afin d’alléger le fardeau de réponse et de réduire les coûts reliés à l’enquête, notamment en ce qui a trait aux petites entreprises, l’EMCD a réduit le nombre d’établissements simples de l’échantillon qui sont enquêtés directement et dérive plutôt les chiffres de vente pour ces établissements à partir des fichiers de la TPS en utilisant un modèle statistique. Le modèle explique les différences entre les ventes et les recettes déclarées aux fins de la TPS, ainsi que le décalage entre la période de référence de l’enquête et celle de la TPS.

Pour en savoir plus sur la méthode utilisée lors de la modélisation des ventes tirées de fichiers administratifs, veuillez consulter le document intitulé Enquête mensuelle sur le commerce de détail : Utilisation de données administratives sous la rubrique ‘Documentation’ du BMDI.

Le tableau 1 contient les fractions de réponses pondérées pour tous les groupes industriels ainsi que pour toutes les provinces et territoires. Pour des fractions de réponses pondérées plus détaillées, veuillez contacter la section du marketing et de la diffusion au (613) 951-3549, sans frais: 1-877-421-3067 or par courriel à retailinfo@statcan.

6.2. Méthodes utilisées pour réduire la non-réponse durant la collecte

Beaucoup d’efforts sont déployés en vue de réduire au minimum la non-réponse durant la collecte. Les méthodes utilisées incluent des techniques d'interview, comme l'utilisation de questions d'approfondissement et des techniques de persuasion, la replanification répétée des appels téléphoniques pour obtenir l'information et la mise en place de procédures indiquant aux intervieweurs comment s'y prendre avec les répondants qui refusent de participer à l'enquête.

Si les données demandées ne sont pas disponibles au moment de la collecte, la meilleure estimation fournie par le répondant est acceptée et est révisée par la suite, quand les données réelles sont disponibles.

Pour réduire au minimum la non-réponse totale pour toutes les variables, des réponses partielles sont acceptées. En outre, les questionnaires sont personnalisés pour la collecte de certaines variables, comme les stocks, de sorte que la collecte ait lieu durant les mois où les données sont disponibles.

Enfin, pour établir un climat de confiance entre les intervieweurs et les répondants, les cas sont généralement affectés au même intervieweur chaque mois. Ce dernier peut ainsi établir une relation personnelle avec le répondant et renforcer sa confiance.

7. Opérations de collecte et de saisie des données

La collecte des données est réalisée par les bureaux régionaux de Statistique Canada.

Tableau 1
Fractions de réponse pondérées par SCIAN et pour les provinces et territoires, février 2016 Sommaire du tableau
Le tableau montre les résultats de Fractions de réponse pondérées par SCIAN et pour les provinces et territoires Fractions de réponse pondérées, calculées selon Total, Enquêté et Administrative unités de mesure (figurant comme en-tête de colonne).
  Fractions de réponse pondérées
Total Enquêté Administrative
SCIAN - Canada  
Concessionnaires de véhicules et de pièces automobiles 90,9 91,4 63,5
Concessionnaires d'automobiles 92,3 92,4 70,0
Concessionnaires d'automobiles neuves 93,9 93,9 Note ...: n'ayant pas lieu de figurer
Concessionnaires d'automobiles d'occasion 68,4 68,1 70,0
Autres concessionnaires de véhicules automobiles 72,6 73,4 64,0
Magasins de pièces, de pneus et d' accessoires pour véhicules automobiles 84,1 87,4 52,8
Magasins de meubles et d'accessoires de maison 78,8 81,9 50,3
Magasins de meubles 78,4 79,1 63,9
Magasins d'accessoires de maison 79,4 87,5 45,5
Magasin d'appareils électroniques et ménagers 83,9 85,8 4,1
Marchands de matériaux de construction et de matériel et fournitures de jardinage 85,9 88,6 51,9
Magasins d'alimentation 84,3 88,2 30,9
Épiceries 86,6 91,4 27,7
Supermarchés et autres épiceries (sauf les dépanneurs) 89,1 93,6 29,3
Dépanneurs 49,4 54,9 16,6
Magasins d'alimentation spécialisés 67,7 70,0 53,7
Magasins de bière, de vin et de spiritueux 79,2 80,0 38,8
Magasins de produits de santé et de soins personnels 84,9 85,4 77,7
Stations-service 79,1 80,5 58,1
Magasins de vêtements et d'accessoires vestimentaires 82,3 83,1 35,3
Magasins de vêtements 81,9 82,8 36,7
Magasins de chaussures 88,8 89,7 16,4
Bijouteries et magasins de bagages et de maroquinerie 78,4 79,1 37,2
Magasins d'articles de sport, d'articles de passe-temps, d'articles de musique et de livres 88,3 90,4 58,7
Magasins de marchandises diverses 98,9 99,4 35,7
Grands magasins 100,0 100,0 Note ...: n'ayant pas lieu de figurer
Autres magasins de marchandises diverses 98,1 99,0 35,7
Magasins de détail divers 76,3 81,0 25,1
Total 87,2 89,1 46,7
Régions  
Terre-Neuve-et-Labrador 83,9 85,8 26,7
Île-du-Prince-Édouard 81,3 82,4 Note ...: n'ayant pas lieu de figurer
Nouvelle Écosse 92,0 93,2 51,5
Nouveau-Brunswick 88,5 90,3 50,0
Québec 87,9 91,1 34,7
Ontario 87,9 89,8 47,6
Manitoba 84,6 84,9 56,2
Saskatchewan 87,4 89,6 37,2
Alberta 86,9 87,8 67,7
Colombie-Britannique 85,4 86,8 49,3
Territoire du Yukon 79,4 79,4 Note ...: n'ayant pas lieu de figurer
Territoires du Nord-Ouest 70,4 70,4 Note ...: n'ayant pas lieu de figurer
Nunavut 69,7 69,7 Note ...: n'ayant pas lieu de figurer

Fractions de réponse pondérées

Ces derniers envoient un questionnaire aux répondants ou communiquent avec ceux-ci par téléphone afin d'obtenir les valeurs de leurs ventes et de leurs stocks, et de confirmer l'ouverture ou la fermeture des emplacements d'affaires. Ils effectuent aussi un suivi auprès des non-répondants. La collecte des données débute environ sept jours ouvrables après la fin du mois de référence et se poursuit pendant tout le mois en question.

Les entités qui participent à l'enquête pour la première fois reçoivent une lettre d'introduction en vue d’informer le répondant qu'un représentant de Statistique Canada l'appellera. Cet appel a pour but de présenter l'enquête, de confirmer l'activité de l'entreprise, d'établir et de commencer la collecte des données, et de répondre à toutes questions que le répondant pourrait avoir.

8. Vérification

La vérification des données est l'application de contrôles pour déceler les entrées manquantes, invalides ou incohérentes, ou pour repérer les enregistrements de données susceptibles d'être erronés. Durant le processus d'enquête de l'EMCD, les données sont vérifiées à deux moments distincts.

Premièrement, une vérification est faite durant la collecte des données. Après leur collecte par téléphone ou au moyen du questionnaire à renvoyer par la poste, les données sont saisies à l'aide d'applications informatiques personnalisées. Toutes sont soumises à une vérification. Les contrôles réalisés durant la collecte des données, appelés contrôles sur le terrain, comprennent généralement des contrôles de validité et certains contrôles de cohérence simples. Ils servent aussi à déceler les erreurs commises durant l'interview par le répondant ou par l'intervieweur et de repérer l'information manquante à l'étape de la collecte en vue de réduire le besoin d'un suivi ultérieur. Les contrôles sur le terrain ont également pour but d'épurer les réponses. Dans le cas de l'EMCD, les réponses du mois courant sont comparées aux réponses fournies par le répondant le mois précédent et (ou) l'année précédente pour le mois courant. Les contrôles sur le terrain permettent de repérer les problèmes que posent les procédures de collecte des données et la conception des questionnaires, et de déterminer s'il faut offrir une formation supplémentaire aux intervieweurs.

Tout enregistrement de données rejeté lors des contrôles préliminaires fait l'objet d'un suivi auprès du répondant afin de valider les données soupçonnées d'être incorrectes. Une fois validé, les données recueillies sont transmises de façon régulière au Bureau central à Ottawa.

Deuxièmement, après la collecte, les données sont soumises à une vérification statistique dont la nature est plus empirique. On exécute la vérification statistique avant l'imputation, afin de repérer les données qui serviront de base pour l'imputation de valeurs pour les non-répondants. Les valeurs très extrêmes risquant de perturber une tendance mensuelle sont exclues des calculs de tendance lors de la vérification statistique. Il convient de souligner qu'aucun ajustement n'est fait à cette étape pour corriger les valeurs extrêmes déclarées.

La première étape de la vérification statistique consiste à repérer les réponses qui seront soumises aux règles de vérification statistique. Les données déclarées pour le mois de référence courant sont soumises à divers contrôles.

Le premier ensemble de contrôles est fondé sur la méthode d'Hidiroglou-Berthelot qui consiste à examiner le rapport des données du mois courant fournies par un répondant à des données historiques (c.-à-d. dernier mois ou même mois l'année précédente) ou administratives. Si le rapport calculé pour le répondant diffère significativement de ceux obtenus pour des répondants dont les caractéristiques sont comparables en ce qui concerne le groupe industriel et/ou la région géographique, la réponse est considérée comme une valeur extrême.

Le deuxième ensemble de contrôles est basé sur la vérification de la part de marché. Cette méthode, qui s'appuie sur les données du mois courant uniquement, permet de vérifier les données fournies par tous les répondants, mêmes ceux pour lesquels on ne dispose pas de données historiques ou de données auxiliaires. Par conséquent, parmi un groupe de répondants présentant des caractéristiques similaires en ce qui concerne le groupe industriel et (ou) la région géographique, toute valeur dont la contribution pondérée au total du groupe est trop importante sera considérée comme une valeur extrême.

Pour les contrôles fondés sur la méthode d'Hidiroglou-Berthelot, les données jugées extrêmes ne sont pas incluses dans les modèles d'imputation (ceux fondés sur les ratios). En outre, les données considérées comme des valeurs extrêmes lors de la vérification de la part de marché ne sont pas incluses dans les modèles d'imputation où les moyennes et les médianes sont calculées pour imputer des valeurs pour les réponses pour lesquelles il n'existe pas de données historiques.

Conjointement avec les vérifications statistiques effectuées après la collecte de données, on procède à la détection d’erreurs des données extraites des fichiers administratifs. Les données modélisées de la TPS sont également assujetties à une phase de vérification approfondie. Chaque fichier sur lequel les données modélisées sont fondées est vérifié de même que les valeurs modélisées. Les vérifications sont effectuées au niveau agrégé (industrie, géographie) afin de détecter les fichiers qui dévient de la norme (soit en exhibant des différences d’un mois à l’autre trop importantes ou qui diffèrent considérablement des autres unités. Toutes les données qui faillissent ces étapes de contrôle sont sujettes à une vérification manuelle, et si nécessaire, à une action corrective.

9. Imputation

Le processus d’imputation de l'EMCD a pour but de remplacer les données manquantes par des valeurs imputées. Des valeurs sont attribuées aux enregistrements pour lesquels la vérification a révélé des valeurs manquantes afin de s'assurer que les estimations soient de haute qualité et d'établir une cohérence interne plausible. Pour des raisons de fardeau de réponse, de coût et d'actualité des données, il est généralement impossible de réaliser auprès des répondants tous les suivis nécessaires pour résoudre les problèmes de réponses manquantes. Puisqu'il est souhaitable de produire un fichier de microdonnées complet et cohérent, on recourt à l'imputation pour traiter les cas persistants de données manquantes.

Dans le cas de l'EMCD, on peut fonder l'imputation des valeurs manquantes sur des données historiques ou sur des données administratives. Le choix de la méthode appropriée est fondé sur une stratégie qui dépend de l'existence de données historiques ou de données administratives et (ou) du mois de référence en question.

Il existe trois types de méthode d'imputation d'après des données historiques. Le premier est l’application d’une tendance générale qui s'appuie sur une source unique de données historiques (mois précédent, données recueillies pour le mois suivant ou données recueillies pour le même mois l'année précédente). Le deuxième est un modèle de régression dans lequel sont utilisées simultanément les données provenant du mois précédent et celles provenant du même mois l'année précédente. La troisième méthode consiste à remplacer directement les valeurs manquantes par des données historiques.

Selon le mois de référence, il existe, pour le choix de la méthode, un ordre de préférence en vue d'assurer une imputation de haute qualité. Le troisième type de méthode d'imputation historique est toujours la dernière option considérée pour chaque mois de référence.

La méthode d’imputation fondée sur des données administratives est sélectionnée automatiquement lorsqu'on ne dispose pas de données historiques pour un non-répondant.  Des tendances sont alors appliquées à la source de données administratives (mesure de taille mensuelle) selon que la structure est simple (entreprises ne comptant qu’un seul établissement) ou complexe.

10. Estimation

L'estimation est un processus qui consiste à calculer une valeur approximative des paramètres de population inconnus en utilisant uniquement la partie de la population qui est incluse dans un échantillon. Des inférences sont ensuite faites au sujet des paramètres inconnus en utilisant les données d'échantillon et les renseignements connexes sur le plan de sondage. Cette étape fait usage du Système généralisé d'estimation (SGE) de Statistique Canada.

Pour les ventes des détaillants, la population est divisée en une partie observée (strates à tirage complet et à tirage partiel) et une partie non observée (strate à tirage nul). D'après l'échantillon tiré à partir de la partie observée, on calcule une estimation pour la population au moyen d'un estimateur d'Horvitz-Thompson où les réponses concernant les ventes sont pondérées par l'inverse des probabilités d'inclusion des unités échantillonnées. Ces poids (appelés poids d'échantillonnage) peuvent être interprétés comme étant le nombre de fois que chaque unité échantillonnée devrait être répétée pour représenter la population complète. Les valeurs pondérées des ventes ainsi calculées sont totalisées par domaine, pour produire une estimation du total des ventes pour chaque combinaison des groupes industriels/région géographique. Un domaine est défini comme correspondant aux valeurs de classification les plus récentes disponibles dans le RE pour l'unité et la période de référence de l'enquête. Les domaines peuvent différer des strates d'échantillonnage originales, parce que les unités peuvent avoir changé de taille, d'industrie ou d'emplacement. Les changements de classification sont reflétés immédiatement dans les estimations et ne sont pas cumulés au cours du temps. Pour la partie non observée de la population, les ventes sont estimées à l’aide de modèles statistiques exploitant les ventes assujetties à la TPS exprimées sous forme mensuelle.

Pour en savoir plus sur la méthode utilisée lors de la modélisation des ventes tirées de fichiers administratifs, veuillez consulter le document intitulé Enquête mensuelle sur le commerce de détail : Utilisation de données administratives sous la rubrique ‘Documentation’ du BMDI.

La variance est la mesure de précision utilisée dans le cas de l'EMCD pour évaluer la qualité de l'estimation des paramètres de population et pour obtenir des inférences valides. Pour la partie observée de la population, la variance est calculée directement à partir d'un échantillon aléatoire simple stratifié sans remise.

Les estimations d'échantillon peuvent différer de la valeur prévue des estimations. Cependant, puisque l'estimation est fondée sur un échantillon probabiliste, il est possible d'évaluer la variabilité de l'estimation d'échantillon par rapport à la valeur prévue. La variance d'une estimation est une mesure de la précision de l'estimation d'échantillon qui est définie comme étant la moyenne, sur tous les échantillons possibles, de l'écart quadratique de l'estimation par rapport à sa valeur prévue.

11. Révisions et désaisonnalisation

Les données brutes sont révisées, sur une base mensuelle, pour le mois précédant immédiatement le mois de référence en cours qui fait l'objet de la publication. C'est donc dire que lorsque les données pour décembre sont publiées pour la première fois, on procédera aussi à des révisions, au besoin, à l'égard des données brutes pour novembre. En outre, des révisions sont aussi effectuées une fois par année, au moment de la première publication des données de février, pour tous les mois de l'année précédente. On vise ainsi à corriger tout problème important que l'on ait décelé et qui s'applique pour une période prolongée. La période de révision proprement dite dépend de la nature du problème décelé, mais elle ne dépasse rarement trois ans. Toutefois, la période de révision peut être plus longue lors de révisions historiques ou de restratification.

Depuis avril 2008, les données de l'Enquête mensuelle sur le commerce de détail sont désaisonnalisées en utilisant la méthode X12-ARIMA. Cette technique consiste essentiellement, dans un premier temps, à extrapoler une année de données brutes avec des modèles ARIMA (modèles autorégressifs à moyennes mobiles intégrées); et dans un deuxième temps, à désaisonnaliser la série brute prolongée par la méthode X-11. Ensuite, les données désaisonnalisées sont ajustées aux totaux annuels des données brutes.

Les données désaisonnalisées doivent aussi être révisées. Elles doivent notamment rendre compte des révisions déterminées pour les données brutes. Par ailleurs, les estimations désaisonnalisées sont calculées à partir de X-12-ARIMA, et la tendance est sensible aux valeurs les plus récentes déclarées dans les données brutes. C'est pourquoi, au moment de la diffusion de nouvelles données pour chaque mois, les valeurs désaisonnalisées pour les trois mois précédents sont révisées. Les séries de données désaisonnalisées sont des données chronologiques qui ont été modifiées pour éliminer l’effet des influences saisonnières et du calendrier.  Pour cette raison, la désaisonnalisation des données permet des comparaisons plus significatives des conditions économiques d’un mois à l’autre.

Une fois par année, les options de désaisonnalisation sont révisées afin d'intégrer les données les plus récentes. Des estimations désaisonnalisées révisées pour chacun des mois des années civiles précédentes sont diffusées en même temps que la révision annuelle des données brutes. La période exacte de révision dépend de la période de révision des données brutes.

12. Évaluation de la qualité des données

La méthodologie de l'enquête a pour objectif de contrôler les erreurs et de réduire leurs effets éventuels sur les estimations. Les résultats de l'enquête peuvent néanmoins contenir des erreurs dont l'erreur d'échantillonnage n'est que l'une des composantes. L'erreur d'échantillonnage survient lorsque les observations sont faites uniquement sur un échantillon et non sur l'ensemble de la population. Toutes les autres erreurs commises aux diverses phases de l'enquête sont appelées erreurs non dues à l'échantillonnage. Des erreurs de ce type peuvent survenir, par exemple, quand un répondant fournit des renseignements erronés ou qu'il ne répond pas à certaines questions; quand une unité du champ de l'enquête y est incluse erronément ou que des erreurs sont commises lors du traitement des données, comme des erreurs de codage ou de saisie.

Avant la publication, on analyse les résultats combinés de l'enquête afin d'en évaluer la comparabilité; il s'agit généralement d'un examen détaillé des réponses individuelles (particulièrement celles des grandes entreprises), de la conjoncture économique générale et des tendances historiques.

Une mesure habituelle de la qualité des données des enquêtes est le coefficient de variation (CV). Le coefficient de variation, défini comme étant l'erreur-type divisée par l'estimation d'échantillon, est une mesure de la précision relative. Puisque le coefficient de variation est calculé d'après les réponses des unités individuelles, il mesure aussi certaines erreurs non dues à l'échantillonnage.

La formule utilisée pour calculer le coefficient de variation (CV) en pourcentage est :

CV (X) = S(X) * 100% / X
où X représente l'estimation et S(X) représente l'erreur-type de X.

On peut construire les intervalles de confiance autour des estimations en utilisant l'estimation et le CV. Donc, pour notre échantillon, il est possible de déclarer avec un niveau donné de confiance que la valeur prévue sera comprise dans l'intervalle de confiance construit autour de l'estimation. Par exemple, si une estimation de 12 millions de dollars à un CV de 2 %, l'erreur-type sera de 240 000 $ (l'estimation multipliée par le CV). On peut déclarer avec 68 % de confiance que les valeurs prévues seront comprises dans l'intervalle dont la longueur est égale à un écart type de part et d'autre de l'estimation, c'est-à-dire entre 11 760 000 $ et 12 240 000 $. Ou bien, nous pouvons déclarer avec 95 % de confiance que la valeur prévue sera comprise dans l'intervalle dont la longueur est égale à deux écarts types de part et d'autre de l'estimation, c'est-à-dire entre 11 520 000 $ et 12 480 000 $.

Enfin, étant donné la faible contribution de la partie non observée de la population aux estimations totales, le biais dans la partie non observée a un effet négligeable sur les CV. Par conséquent, on utilise le CV provenant de la partie observée pour l'estimation totale qui est égale à la somme des estimations pour les parties observée et non observée de la population.

13. Contrôle de la divulgation

La loi interdit à Statistique Canada de rendre publique toute donnée susceptible de révéler l'information recueillie en vertu de la Loi sur la statistique et se rapportant à toute personne, entreprise ou organisation reconnaissable, sans que cette personne, entreprise ou organisation le sache ou y consente par écrit. Diverses règles de confidentialité s'appliquent à toutes les données diffusées ou publiées afin d'empêcher la publication ou la divulgation de toute information jugée confidentielle. Au besoin, des données sont supprimées pour empêcher la divulgation directe ou par recoupement de données reconnaissables.

L'analyse de la confidentialité des données inclut la détection de la « divulgation directe » éventuelle, qui survient lorsque la valeur figurant dans une cellule d'un tableau ne correspond qu'à quelques répondants ou que la cellule est dominée par un petit nombre d'entreprises.

Enquête mensuelle sur le commerce de détail (EMCD) – Énoncé de la qualité des données

Objectifs, utilisation et utilisateurs
Concepts, variables et classifications
Couverture et bases de sondage
Échantillonnage
Conception du questionnaire
Réponse et non-réponse
Opérations de collecte et de saisie des données
Vérification
Imputation
Estimation
Révisions et désaisonnalisation
Évaluation de la qualité des données
Contrôle de la divulgation

1. Objectifs, utilisation et utilisateurs

1.1. Objectifs

L’Enquête mensuelle sur le commerce de détail (EMCD) fournit des renseignements sur la performance du secteur du commerce de détail et, quand les données sont combinées à d’autres statistiques, représente un important indicateur de l'état de l’économie canadienne.

1.2. Utilisation

Les estimations fournissent une mesure de la santé et de la performance du secteur du commerce de détail. L'information recueillie est utilisée pour estimer le niveau et la tendance mensuelle des ventes ainsi que le nombre d’emplacements. À la fin de chaque année, les estimations donnent un premier aperçu de la valeur annuelle des ventes au détail et de la performance du secteur.

1.3. Utilisateurs

Divers organismes, associations sectorielles et gouvernements utilisent l'information. Les détaillants utilisent les résultats de l'enquête pour comparer leurs résultats à ceux d'entreprises similaires, ainsi qu'à des fins de marketing. Les associations de détaillants peuvent surveiller la performance de leur industrie et promouvoir les industries du commerce de détail. Les investisseurs peuvent surveiller la croissance de l'industrie, ce qui peut donner aux détaillants un meilleur accès au capital d'investissement. Les données de l'enquête aident les administrations à comprendre le rôle des détaillants dans l'économie, ce qui facilite l'élaboration des politiques et des encouragements fiscaux. Le commerce de détail étant un important secteur de l'économie canadienne, les données permettent aux administrations de déterminer plus exactement la santé globale de l'économie grâce à l'utilisation des estimations dans le calcul du produit intérieur brut (PIB) national.

2. Concepts, variables et classifications

2.1. Concepts

Le secteur du commerce de détail comprend les établissements dont l’activité principale consiste à vendre des marchandises au détail, généralement sans transformation, et à fournir des services connexes.

Le commerce de détail représente le dernier maillon de la chaîne de distribution; les détaillants sont donc organisés pour vendre des marchandises en petites quantités au grand public. Ce secteur comprend deux grands types d’établissements : les détaillants en magasin et les détaillants hors magasin. L’EMCD couvre uniquement les détaillants en magasin. Leurs principales caractéristiques sont décrites ci-après.

Les détaillants en magasin exploitent des points de vente fixes, situés et conçus de manière à attirer un grand nombre de passants. De façon générale, les magasins de détail ont de grands étalages et font de la publicité dans les médias. Ils vendent surtout des biens de consommation qui intéressent les particuliers ou les ménages, mais certains servent aussi les entreprises et une clientèle institutionnelle. Parmi ces établissements, on compte les magasins de fournitures de bureau, les magasins d’ordinateurs et de logiciels, les stations-service, les vendeurs de matériaux de construction, les magasins de fournitures de plomberie et de fournitures électriques.

En plus de vendre des marchandises, certains types de détaillants fournissent des services après-vente, comme des services de réparation et d’installation. Ainsi, les concessionnaires d’automobiles neuves, les magasins d’électronique et d’appareils ménagers, et les magasins d’instruments et de fournitures de musique assurent fréquemment un service de réparation, alors que les magasins de revêtements de sol et les magasins de garnitures de fenêtres fournissent souvent des services d’installation. En règle générale, les établissements qui vendent des marchandises au détail et qui ont un service après-vente sont classés dans ce secteur.

Les salles d’exposition des sociétés de vente sur catalogue, les stations-service et les marchands de maisons mobiles sont assimilés à des détaillants en magasin.

2.2. Variables

Les ventes sont définies comme étant les ventes de toutes les marchandises achetées pour la revente, nettes des rendus et des escomptes. Sont inclus les honoraires et les commissions résultant de la vente de biens et de services pour le compte de tiers, comme la vente de billets de loterie, de billets d’autobus et de cartes de téléphone. Sont également inclus les recettes provenant des pièces et de la main-d’oeuvre utilisées pour les services d'entretien et de réparation, les revenus de location et de location à bail de biens et de matériel, les revenus provenant de services, y compris les services de restauration, les ventes de biens fabriqués en tant qu’activité secondaire et la valeur des marchandises prélevées par le propriétaire pour son usage personnel. Sont exclus les autres revenus de location de biens immobiliers, les frais de placement, les subventions d’exploitation et autres, les redevances et les droits de franchise.

L’emplacement d’affaires comprend le ou les emplacements physiques où a lieu l’activité commerciale dans chaque province et territoire et dont les ventes sont créditées ou comptabilisées dans les états financiers de l’entreprise. Pour les détaillants, il s’agit normalement d’un magasin.

Dollars constants : La valeur du commerce de détail est mesurée de deux façons : par la prise en compte des effets de la variation des prix sur la valeur des ventes et par l’élimination des effets de la variation des prix. La première mesure est la valeur des ventes au détail en dollars courants et la seconde, la valeur des ventes au détail en dollars constants. Pour calculer l’estimation en dollars courants, on agrège la valeur des ventes pondérées de tous les points de vente au détail. Pour calculer l’estimation en dollars constants, il faut d’abord rajuster la valeur des ventes par rapport à une année de base en utilisant l’Indice des prix à la consommation, puis additionner les valeurs résultantes.

2.3. Classification

L’Enquête mensuelle sur le commerce de détail est fondée sur la définition du commerce de détail adoptée dans le SCIAN (Système de classification des industries de l’Amérique du Nord). Le SCIAN est le cadre commun reconnu pour la production de statistiques comparables par les organismes statistiques du Canada, du Mexique et des États-Unis. L’accord définit les limites de 20 secteurs. Le SCIAN est fondé sur un cadre conceptuel axé sur la production, ou l’offre, en ce sens que les établissements sont regroupés en classes ou branches d’activité d’après la similarité des processus utilisés pour produire les biens et les services.

Les estimations sont calculées pour 21 groupes fondés sur des agrégations spéciales du Système de classification des industries de l’Amérique du Nord (SCIAN) de 2012. Les 21 groupes sont en outre agrégés en onze sous-secteurs.

Du point de vue géographique, les estimations des ventes sont produites pour le Canada et pour chaque province et territoire.

3. Couverture et bases de sondage

La base de sondage de l'Enquête mensuelle sur le commerce de détail (EMCD) est le Registre des entreprises (RE) de Statistique Canada. Ce dernier est une liste structurée d'entreprises productrices de biens et de services au Canada. Cette base de données tenue à jour centralement contient des renseignements détaillés sur la plupart des entités commerciales exploitées au Canada. Le RE couvre toutes les entreprises constituées en société, avec ou sans employés. Pour les entreprises non constituées en société, le RE comprend toutes les entreprises ayant des employés, ainsi que les entreprises sans employés ayant des ventes annualisées provenant d'un compte de la taxe sur les produits et services (TPS) ou un revenu annuel provenant de la déclaration d'impôt individuelle.

Dans le RE, les entreprises sont représentées selon une structure hiérarchique à quatre niveaux ayant pour sommet l'entreprise statistique suivie, par ordre décroissant, par la compagnie statistique, l'établissement statistique et l'emplacement statistique. Une entreprise peut être reliée à une ou à plusieurs compagnies statistiques, une compagnie statistique à un ou à plusieurs établissements statistiques et un établissement statistique à un ou à plusieurs emplacements statistiques.

La population cible de l'EMCD comprend tous les établissements statistiques figurant dans le RE, excluant les entreprises non constituées en société n'ayant pas d'employés dont les ventes annuelles sont inférieures à 30 000 $, qui sont classés dans le secteur du commerce de détail d'après le Système de classification des industries de l'Amérique du Nord (SCIAN) (environ 200 000 établissements). La fourchette de codes du SCIAN pour le secteur du commerce de détail varie de 441100 à 453999. Un établissement statistique est l'entité de production ou le plus petit groupe d'entités de production qui produit un ensemble de biens ou de services homogènes, dont les activités ne débordent pas les frontières provinciales/territoriales, et qui est en mesure de fournir des données sur la valeur de la production, ainsi que sur le coût des matières utilisées et le coût et l'importance de la main-d'oeuvre affectée à la production. L'entité de production est l'unité physique où se déroulent les activités de l'entreprise. Elle doit avoir une adresse de voirie et une main-d'oeuvre directement affectée au processus de production.

Sont exclus de la population cible les établissements auxiliaires (producteurs de services de soutien de l'activité de production de biens et services destinés au marché de plus d'un établissement au sein de l'entreprise, et qui sont considérés comme un centre de coûts ou un centre de dépenses discrétionnaires pour lequel les données sur tous les coûts, y compris la main-d'oeuvre et l'amortissement, peuvent être déclarées par l'entreprise), les futurs établissements, les établissements pour lesquels les signaux économiques indiquent un revenu manquant ou nul, et les établissements appartenant aux catégories du SCIAN non couvertes qui suivent :

  • 4541 (entreprises de télémagasinage et de vente par correspondance)
  • 4542 (exploitants de distributeurs automatiques)
  • 45431 (marchands de combustible)
  • 45439 (autres établissements de vente directe)

4. Échantillonnage

L'échantillon de l'EMCD est formé de 10 000 groupes d'établissements (grappes) classés dans le secteur du commerce de détail et sélectionnés à partir du Registre des entreprises de Statistique Canada. Par définition, une grappe d'établissements comprend tous les établissements appartenant à une entreprise statistique qui font partie d'un même groupe industriel et d'une même région géographique. L’EMCD est fondée sur un plan d'échantillonnage stratifié avec sélection d'un échantillon aléatoire simple dans chaque strate. La stratification est faite selon des groupes industriels (majoritairement mais non exclusivement des SCIAN à quatre chiffres) et selon la région géographique, c'est-à-dire selon la province ou le territoire. Ensuite, la population est stratifiée selon la taille de l'établissement. La mesure de taille est créée en combinant des données provenant d'enquêtes indépendantes et trois variables administratives, à savoir le revenu annuel profilé, les ventes assujetties à la TPS exprimées sur une base annuelle et le revenu de la déclaration d’impôt (T1 ou T2).

Les strates de taille comptent une strate à tirage complet (recensement), au moins deux strates à tirage partiel (échantillonnées partiellement) et une strate à tirage nul (non échantillonnée). La strate à tirage nul est destinée à réduire le fardeau de réponse en excluant les entreprises les plus petites de la population observée. Ces entreprises représentent, en principe, au plus 10 % du total des ventes. Au lieu d'envoyer un questionnaire à ces entreprises, on produit les estimations d'après des données administratives.

L'échantillon est réparti de façon optimale afin d'atteindre les coefficients de variation cibles au niveau du Canada dans son ensemble, de la province ou du territoire, de l’industrie et des groupes industriels selon la province ou le territoire. On procède aussi à un suréchantillonnage pour tenir compte des unités disparues, non répondantes ou classées incorrectement.

L'EMCD est une enquête répétée avec maximisation du chevauchement des échantillons mensuels. On retient l'échantillon d’un mois à l’autre et, chaque mois, on y ajoute de nouvelles unités (naissances). Pour découvrir les nouvelles unités visées par l'EMCD, c'est-à-dire les nouvelles grappes d'établissement(s), on examine chaque mois l'univers le plus récent du RE. On stratifie ces nouvelles unités conformément aux mêmes critères que ceux appliqués à la population initiale, puis on les échantillonne conformément à la fraction d'échantillonnage de la strate à laquelle elles appartiennent et on les ajoute à l'échantillon mensuel. Des disparitions d'entité surviennent également chaque mois. Une entité disparue peut être une grappe d'établissements qui ont cessé leurs activités (fermeture) ou dont les activités principales ne se rattachent plus au commerce de détail (hors du champ). La situation de ces entreprises est mise à jour dans le RE d'après des renseignements de source administrative et les commentaires reçus lors des enquêtes, y compris ceux des entreprises prenant part à l'EMCD. Les méthodes suivies pour traiter les unités disparues et les unités classées incorrectement font partie des procédures d'échantillonnage et de mise à jour de la population.

5. Conception du questionnaire

L’Enquête mensuelle sur le commerce de détail englobe les sous-enquêtes suivantes :

Enquête mensuelle sur le commerce de détail – R8

Enquête mensuelle sur le commerce de détail (avec les stocks) – R8

Enquête sur les ventes et stocks de boissons alcooliques

Le questionnaire est conçu pour recueillir mensuellement auprès d'un échantillon de détaillants des données sur les ventes au détail, sur le nombre d'emplacements commerciaux par province ou territoire et sur les stocks de biens possédés et destinés à la revente. Lors du remaniement de 2004, la plupart des questionnaires n'ont subi que des changements de présentation. Le questionnaire sur les ventes et les stocks de boissons alcooliques a subi des modifications plus importantes. Les modifications ont été discutées avec les intervenants et les répondants ont eu l'occasion de faire des commentaires avant que le nouveau questionnaire ne soit finalisé. Si d'autres modifications devaient être apportées à l'un des questionnaires, les changements proposés seraient soumis à un comité d'examen et ferait l'objet d'un essai sur le terrain auprès de répondants et d'utilisateurs de données pour s'assurer de leur pertinence.

6. Réponse et non-réponse

6.1. Réponse et non-réponse

Bien que les gestionnaires d'enquête et les employés des opérations fassent tout leur possible pour maximiser la réponse à l'EMCD, un certain degré de non-réponse a lieu. Pour qu'un établissement statistique soit considéré comme répondant, il faut que le degré de réponse partielle (situation où une réponse exacte n'est obtenue que pour certaines questions posées au répondant) atteigne un seuil minimal au-dessous duquel la déclaration fournie par l'établissement serait rejetée et l'établissement, considéré comme une unité non répondante. Le cas échéant, on considère que l'entreprise n'a pas répondu du tout.

La non-réponse a deux effets sur les données : premièrement, elle introduit un biais dans les estimations si les non-répondants diffèrent des répondants en ce qui concerne les caractéristiques mesurées et, deuxièmement, elle fait augmenter la variance d'échantillonnage des estimations, parce que la taille effective de l'échantillon est réduite comparativement à celle considérée au départ.

L'ampleur des efforts déployés pour obtenir une réponse auprès d'un non-répondant dépend des contraintes budgétaires et de temps, de l'effet de la non-réponse sur la qualité globale et du risque de biais dû à la non-réponse.

La méthode principalement utilisée pour réduire l'effet de la non-réponse à l'étape de l'échantillonnage consiste à augmenter la taille de l'échantillon en appliquant un taux de suréchantillonnage déterminé d'après les résultats d'enquêtes similaires.

Les cas de non-réponse qui surviennent malgré les méthodes appliquées aux étapes de l'échantillonnage et de la collecte pour réduire l'effet de la non-réponse sont traités par imputation.

Afin de déterminer l'importance de la non-réponse qui a lieu chaque mois, on calcule divers taux de réponse. Pour un mois de référence donné, on produit les estimations au moins deux fois (estimations provisoires et estimations révisées). Entre les deux exécutions, certaines données fournies par les répondants peuvent être jugées inutilisables et des valeurs imputées peuvent être corrigées au moyen de données fournies par les répondants. Par conséquent, les taux de réponse sont calculés après chaque exécution du processus d'estimation.

Pour l'EMCD, deux types de taux sont calculés (non pondérés et pondérés). Afin d'évaluer l'efficacité du processus de collecte, on calcule les taux de réponse non pondérés. Les taux pondérés, fondés sur le poids d'estimation et la valeur de la variable d'intérêt, évaluent la qualité de l'estimation. À l'intérieur de chacun de ces types de taux, il existe des taux distincts pour les unités faisant partie de l'échantillon et pour les unités qui sont uniquement modélisées à partir de données administratives qui ont été extraites des fichiers de TPS.

Afin d’obtenir une meilleure idée du succès du processus de collecte de données, on calcule deux taux non pondérés appelés « taux de résultat de la collecte » et « taux de résultat de l'extraction ». On calcule ces taux en divisant le nombre de répondants par le nombre d'unités avec lesquelles on a essayé de prendre contact ou pour lesquelles on a essayé de recevoir des données extraites. Les déclarants non mensuels (répondants bénéficiant de modalités de déclaration spéciales leur permettant de ne pas produire de déclaration chaque mois, mais pour lesquels des données réelles sont disponibles lors des révisions subséquentes) sont exclus du numérateur ainsi que du dénominateur pour les mois où aucun contact n'est pris avec eux. Brièvement, les divers taux de réponse se calculent comme suit :

Taux pondérés :

Taux de réponse des unités faisant partie de l'échantillon (estimation) =
Somme des ventes pondérées des unités avec situation de réponse i / Somme des ventes pondérées des unités faisant partie de l'échantillon

i = unités pour lesquelles il existe des données déclarées qui seront utilisées dans l'estimation ou qui sont des refus convertis, ou pour lesquelles il existe des données déclarées qui n'ont pas encore été évaluées pour l'estimation.

Taux de réponse des unités modélisées à partir de données administratives (estimation) = Somme des ventes pondérées des unités avec situation de réponse ii / Somme des ventes pondérées des unités modélisées à partir de données administratives

ii = unités pour lesquelles il existe des données extraites des fichiers administratifs et qui sont utilisables pour l'estimation.

Taux de réponse total (estimation) =
Somme des ventes pondérées des unités avec situation de réponse i ou situation de réponse ii / Somme de toutes les ventes pondérées

Taux non pondérés :

Taux de réponse des unités faisant partie de l'échantillon (collecte) =
Nombre de questionnaires avec situation de réponse iii / Nombre de questionnaires avec situation de réponse iv

iii = unités pour lesquelles il existe des données déclarées (dont le cas n'est pas résolu, utilisées ou non utilisées pour l'estimation) ou qui sont des refus convertis;

iv = toutes les unités susmentionnées, ainsi que les unités qui ont refusé de répondre, les unités avec lesquelles on n'a pas pris contact et d'autres types d'unités non répondantes.

Taux de réponse des unités modélisées à partir de données administratives (extraction) =
Nombre de questionnaires avec situation de réponse vi / Nombre de questionnaires avec situation de réponse vii

vi = unités dans le champ d'observation pour lesquelles il existe des données (utilisables ou non utilisables) extraites des fichiers administratifs;

vii = toutes les unités susmentionnées, ainsi que les unités qui ont refusé de déclarer la source de données administratives, les unités avec lesquelles on n'a pas pris contact et d'autres types d'unités non répondantes.

(% de questionnaires recueillis par rapport à l'ensemble des questionnaires dans le champ d'observation)

Taux de résultat de la collecte =
Nombre de questionnaires avec situation de réponse iii / Nombre de questionnaires avec situation de réponse viii

iii = même que iii défini plus haut;

viii = même que iv, à part l'exclusion des unités avec lesquelles on a pris contact, parce que leur réponse n'est pas disponible pour un mois particulier, puisqu'il s'agit de déclarants non mensuels.

Taux de résultat de l'extraction =
Nombre de questionnaires avec situation de réponse ix / Nombre de questionnaires avec situation de réponse vii

ix = même que vi, avec l'ajout des unités extraites qui ont été imputées ou qui étaient hors du champ de l'enquête;

où vii = même que vii défini plus haut.

(% de questionnaires recueillis par rapport à l'ensemble des questionnaires dans le champ d'observation que nous avons tenté de recueillir)

Tous les taux pondérés et non pondérés susmentionnés sont calculés au niveau du groupe industriel, de la région et du groupe de taille, ainsi que pour toute combinaison de ces niveaux.

Utilisation des données administratives

Réduire le fardeau de réponse est un défi à long terme pour Statistique Canada. Afin d’alléger le fardeau de réponse et de réduire les coûts reliés à l’enquête, notamment en ce qui a trait aux petites entreprises, l’EMCD a réduit le nombre d’établissements simples de l’échantillon qui sont enquêtés directement et dérive plutôt les chiffres de vente pour ces établissements à partir des fichiers de la TPS en utilisant un modèle statistique. Le modèle explique les différences entre les ventes et les recettes déclarées aux fins de la TPS, ainsi que le décalage entre la période de référence de l’enquête et celle de la TPS.

Pour en savoir plus sur la méthode utilisée lors de la modélisation des ventes tirées de fichiers administratifs, veuillez consulter le document intitulé Enquête mensuelle sur le commerce de détail : Utilisation de données administratives sous la rubrique ‘Documentation’ du BMDI.

Le tableau 1 contient les fractions de réponses pondérées pour tous les groupes industriels ainsi que pour toutes les provinces et territoires. Pour des fractions de réponses pondérées plus détaillées, veuillez contacter la section du marketing et de la diffusion au (613) 951-3549, sans frais: 1-877-421-3067 or par courriel à retailinfo@statcan.

6.2. Méthodes utilisées pour réduire la non-réponse durant la collecte

Beaucoup d’efforts sont déployés en vue de réduire au minimum la non-réponse durant la collecte. Les méthodes utilisées incluent des techniques d'interview, comme l'utilisation de questions d'approfondissement et des techniques de persuasion, la replanification répétée des appels téléphoniques pour obtenir l'information et la mise en place de procédures indiquant aux intervieweurs comment s'y prendre avec les répondants qui refusent de participer à l'enquête.

Si les données demandées ne sont pas disponibles au moment de la collecte, la meilleure estimation fournie par le répondant est acceptée et est révisée par la suite, quand les données réelles sont disponibles.

Pour réduire au minimum la non-réponse totale pour toutes les variables, des réponses partielles sont acceptées. En outre, les questionnaires sont personnalisés pour la collecte de certaines variables, comme les stocks, de sorte que la collecte ait lieu durant les mois où les données sont disponibles.

Enfin, pour établir un climat de confiance entre les intervieweurs et les répondants, les cas sont généralement affectés au même intervieweur chaque mois. Ce dernier peut ainsi établir une relation personnelle avec le répondant et renforcer sa confiance.

7. Opérations de collecte et de saisie des données

La collecte des données est réalisée par les bureaux régionaux de Statistique Canada.

Tableau 1
Fractions de réponse pondérées par SCIAN et pour les provinces et territoires, janvier 2016 Sommaire du tableau
Le tableau montre les résultats de Fractions de réponse pondérées par SCIAN et pour les provinces et territoires Fractions de réponse pondérées(figurant comme en-tête de colonne).
  Fractions de réponse pondérées
SCIAN - Canada  
Concessionnaires de véhicules et de pièces automobiles 91,7 92,1 66,6
Concessionnaires d'automobiles 93,3 93,5 70,2
Concessionnaires d'automobiles neuves 94,8 94,8 Note ...: n'ayant pas lieu de figurer
Concessionnaires d'automobiles d'occasion 72,4 72,8 70,2
Autres concessionnaires de véhicules automobiles 67,7 67,1 74,3
Magasins de pièces, de pneus et d' accessoires pour véhicules automobiles 82,1 84,8 55,5
Magasins de meubles et d'accessoires de maison 77,0 79,5 51,2
Magasins de meubles 78,5 78,9 69,0
Magasins d'accessoires de maison 74,1 80,8 42,0
Magasin d'appareils électroniques et ménagers 83,1 84,5 14,6
Marchands de matériaux de construction et de matériel et fournitures de jardinage 89,4 90,2 79,7
Magasins d'alimentation 89,2 91,7 53,6
Épiceries 89,0 91,8 53,0
Supermarchés et autres épiceries (sauf les dépanneurs) 90,9 93,7 52,7
Dépanneurs 59,9 60,7 55,3
Magasins d'alimentation spécialisés 62,8 64,8 52,3
Magasins de bière, de vin et de spiritueux 97,0 97,5 68,7
Magasins de produits de santé et de soins personnels 84,8 84,9 83,4
Stations-service 68,6 67,9 82,5
Magasins de vêtements et d'accessoires vestimentaires 84,6 85,6 31,8
Magasins de vêtements 83,5 84,7 27,6
Magasins de chaussures 90,5 90,9 59,3
Bijouteries et magasins de bagages et de maroquinerie 86,0 86,9 48,7
Magasins d'articles de sport, d'articles de passe-temps, d'articles de musique et de livres 86,9 91,1 26,7
Magasins de marchandises diverses 95,2 95,4 79,2
Grands magasins 92,0 92,0 Note ...: n'ayant pas lieu de figurer
Autres magasins de marchandises diverses 97,6 97,9 79,2
Magasins de détail divers 78,5 80,8 54,6
Total 87,0 88,1 62,4
Régions  
Terre-Neuve-et-Labrador 88,7 89,4 63,6
Île-du-Prince-Édouard 79,0 79,4 41,1
Nouvelle Écosse 91,5 91,8 83,1
Nouveau-Brunswick 88,7 89,7 69,1
Québec 85,5 88,5 39,9
Ontario 87,1 87,7 72,2
Manitoba 86,2 86,6 53,6
Saskatchewan 90,6 91,0 81,9
Alberta 85,8 86,2 73,9
Colombie-Britannique 89,4 90,2 67,5
Territoire du Yukon 75,3 75,3 Note ...: n'ayant pas lieu de figurer
Territoires du Nord-Ouest 63,0 63,0 Note ...: n'ayant pas lieu de figurer
Nunavut 15,6 15,6 Note ...: n'ayant pas lieu de figurer

Fractions de réponse pondérées

Ces derniers envoient un questionnaire aux répondants ou communiquent avec ceux-ci par téléphone afin d'obtenir les valeurs de leurs ventes et de leurs stocks, et de confirmer l'ouverture ou la fermeture des emplacements d'affaires. Ils effectuent aussi un suivi auprès des non-répondants. La collecte des données débute environ sept jours ouvrables après la fin du mois de référence et se poursuit pendant tout le mois en question.

Les entités qui participent à l'enquête pour la première fois reçoivent une lettre d'introduction en vue d’informer le répondant qu'un représentant de Statistique Canada l'appellera. Cet appel a pour but de présenter l'enquête, de confirmer l'activité de l'entreprise, d'établir et de commencer la collecte des données, et de répondre à toutes questions que le répondant pourrait avoir.

8. Vérification

La vérification des données est l'application de contrôles pour déceler les entrées manquantes, invalides ou incohérentes, ou pour repérer les enregistrements de données susceptibles d'être erronés. Durant le processus d'enquête de l'EMCD, les données sont vérifiées à deux moments distincts.

Premièrement, une vérification est faite durant la collecte des données. Après leur collecte par téléphone ou au moyen du questionnaire à renvoyer par la poste, les données sont saisies à l'aide d'applications informatiques personnalisées. Toutes sont soumises à une vérification. Les contrôles réalisés durant la collecte des données, appelés contrôles sur le terrain, comprennent généralement des contrôles de validité et certains contrôles de cohérence simples. Ils servent aussi à déceler les erreurs commises durant l'interview par le répondant ou par l'intervieweur et de repérer l'information manquante à l'étape de la collecte en vue de réduire le besoin d'un suivi ultérieur. Les contrôles sur le terrain ont également pour but d'épurer les réponses. Dans le cas de l'EMCD, les réponses du mois courant sont comparées aux réponses fournies par le répondant le mois précédent et (ou) l'année précédente pour le mois courant. Les contrôles sur le terrain permettent de repérer les problèmes que posent les procédures de collecte des données et la conception des questionnaires, et de déterminer s'il faut offrir une formation supplémentaire aux intervieweurs.

Tout enregistrement de données rejeté lors des contrôles préliminaires fait l'objet d'un suivi auprès du répondant afin de valider les données soupçonnées d'être incorrectes. Une fois validé, les données recueillies sont transmises de façon régulière au Bureau central à Ottawa.

Deuxièmement, après la collecte, les données sont soumises à une vérification statistique dont la nature est plus empirique. On exécute la vérification statistique avant l'imputation, afin de repérer les données qui serviront de base pour l'imputation de valeurs pour les non-répondants. Les valeurs très extrêmes risquant de perturber une tendance mensuelle sont exclues des calculs de tendance lors de la vérification statistique. Il convient de souligner qu'aucun ajustement n'est fait à cette étape pour corriger les valeurs extrêmes déclarées.

La première étape de la vérification statistique consiste à repérer les réponses qui seront soumises aux règles de vérification statistique. Les données déclarées pour le mois de référence courant sont soumises à divers contrôles.

Le premier ensemble de contrôles est fondé sur la méthode d'Hidiroglou-Berthelot qui consiste à examiner le rapport des données du mois courant fournies par un répondant à des données historiques (c.-à-d. dernier mois ou même mois l'année précédente) ou administratives. Si le rapport calculé pour le répondant diffère significativement de ceux obtenus pour des répondants dont les caractéristiques sont comparables en ce qui concerne le groupe industriel et/ou la région géographique, la réponse est considérée comme une valeur extrême.

Le deuxième ensemble de contrôles est basé sur la vérification de la part de marché. Cette méthode, qui s'appuie sur les données du mois courant uniquement, permet de vérifier les données fournies par tous les répondants, mêmes ceux pour lesquels on ne dispose pas de données historiques ou de données auxiliaires. Par conséquent, parmi un groupe de répondants présentant des caractéristiques similaires en ce qui concerne le groupe industriel et (ou) la région géographique, toute valeur dont la contribution pondérée au total du groupe est trop importante sera considérée comme une valeur extrême.

Pour les contrôles fondés sur la méthode d'Hidiroglou-Berthelot, les données jugées extrêmes ne sont pas incluses dans les modèles d'imputation (ceux fondés sur les ratios). En outre, les données considérées comme des valeurs extrêmes lors de la vérification de la part de marché ne sont pas incluses dans les modèles d'imputation où les moyennes et les médianes sont calculées pour imputer des valeurs pour les réponses pour lesquelles il n'existe pas de données historiques.

Conjointement avec les vérifications statistiques effectuées après la collecte de données, on procède à la détection d’erreurs des données extraites des fichiers administratifs. Les données modélisées de la TPS sont également assujetties à une phase de vérification approfondie. Chaque fichier sur lequel les données modélisées sont fondées est vérifié de même que les valeurs modélisées. Les vérifications sont effectuées au niveau agrégé (industrie, géographie) afin de détecter les fichiers qui dévient de la norme (soit en exhibant des différences d’un mois à l’autre trop importantes ou qui diffèrent considérablement des autres unités. Toutes les données qui faillissent ces étapes de contrôle sont sujettes à une vérification manuelle, et si nécessaire, à une action corrective.

9. Imputation

Le processus d’imputation de l'EMCD a pour but de remplacer les données manquantes par des valeurs imputées. Des valeurs sont attribuées aux enregistrements pour lesquels la vérification a révélé des valeurs manquantes afin de s'assurer que les estimations soient de haute qualité et d'établir une cohérence interne plausible. Pour des raisons de fardeau de réponse, de coût et d'actualité des données, il est généralement impossible de réaliser auprès des répondants tous les suivis nécessaires pour résoudre les problèmes de réponses manquantes. Puisqu'il est souhaitable de produire un fichier de microdonnées complet et cohérent, on recourt à l'imputation pour traiter les cas persistants de données manquantes.

Dans le cas de l'EMCD, on peut fonder l'imputation des valeurs manquantes sur des données historiques ou sur des données administratives. Le choix de la méthode appropriée est fondé sur une stratégie qui dépend de l'existence de données historiques ou de données administratives et (ou) du mois de référence en question.

Il existe trois types de méthode d'imputation d'après des données historiques. Le premier est l’application d’une tendance générale qui s'appuie sur une source unique de données historiques (mois précédent, données recueillies pour le mois suivant ou données recueillies pour le même mois l'année précédente). Le deuxième est un modèle de régression dans lequel sont utilisées simultanément les données provenant du mois précédent et celles provenant du même mois l'année précédente. La troisième méthode consiste à remplacer directement les valeurs manquantes par des données historiques.

Selon le mois de référence, il existe, pour le choix de la méthode, un ordre de préférence en vue d'assurer une imputation de haute qualité. Le troisième type de méthode d'imputation historique est toujours la dernière option considérée pour chaque mois de référence.

La méthode d’imputation fondée sur des données administratives est sélectionnée automatiquement lorsqu'on ne dispose pas de données historiques pour un non-répondant.  Des tendances sont alors appliquées à la source de données administratives (mesure de taille mensuelle) selon que la structure est simple (entreprises ne comptant qu’un seul établissement) ou complexe.

10. Estimation

L'estimation est un processus qui consiste à calculer une valeur approximative des paramètres de population inconnus en utilisant uniquement la partie de la population qui est incluse dans un échantillon. Des inférences sont ensuite faites au sujet des paramètres inconnus en utilisant les données d'échantillon et les renseignements connexes sur le plan de sondage. Cette étape fait usage du Système généralisé d'estimation (SGE) de Statistique Canada.

Pour les ventes des détaillants, la population est divisée en une partie observée (strates à tirage complet et à tirage partiel) et une partie non observée (strate à tirage nul). D'après l'échantillon tiré à partir de la partie observée, on calcule une estimation pour la population au moyen d'un estimateur d'Horvitz-Thompson où les réponses concernant les ventes sont pondérées par l'inverse des probabilités d'inclusion des unités échantillonnées. Ces poids (appelés poids d'échantillonnage) peuvent être interprétés comme étant le nombre de fois que chaque unité échantillonnée devrait être répétée pour représenter la population complète. Les valeurs pondérées des ventes ainsi calculées sont totalisées par domaine, pour produire une estimation du total des ventes pour chaque combinaison des groupes industriels/région géographique. Un domaine est défini comme correspondant aux valeurs de classification les plus récentes disponibles dans le RE pour l'unité et la période de référence de l'enquête. Les domaines peuvent différer des strates d'échantillonnage originales, parce que les unités peuvent avoir changé de taille, d'industrie ou d'emplacement. Les changements de classification sont reflétés immédiatement dans les estimations et ne sont pas cumulés au cours du temps. Pour la partie non observée de la population, les ventes sont estimées à l’aide de modèles statistiques exploitant les ventes assujetties à la TPS exprimées sous forme mensuelle.

Pour en savoir plus sur la méthode utilisée lors de la modélisation des ventes tirées de fichiers administratifs, veuillez consulter le document intitulé Enquête mensuelle sur le commerce de détail : Utilisation de données administratives sous la rubrique ‘Documentation’ du BMDI.

La variance est la mesure de précision utilisée dans le cas de l'EMCD pour évaluer la qualité de l'estimation des paramètres de population et pour obtenir des inférences valides. Pour la partie observée de la population, la variance est calculée directement à partir d'un échantillon aléatoire simple stratifié sans remise.

Les estimations d'échantillon peuvent différer de la valeur prévue des estimations. Cependant, puisque l'estimation est fondée sur un échantillon probabiliste, il est possible d'évaluer la variabilité de l'estimation d'échantillon par rapport à la valeur prévue. La variance d'une estimation est une mesure de la précision de l'estimation d'échantillon qui est définie comme étant la moyenne, sur tous les échantillons possibles, de l'écart quadratique de l'estimation par rapport à sa valeur prévue.

11. Révisions et désaisonnalisation

Les données brutes sont révisées, sur une base mensuelle, pour le mois précédant immédiatement le mois de référence en cours qui fait l'objet de la publication. C'est donc dire que lorsque les données pour décembre sont publiées pour la première fois, on procédera aussi à des révisions, au besoin, à l'égard des données brutes pour novembre. En outre, des révisions sont aussi effectuées une fois par année, au moment de la première publication des données de février, pour tous les mois de l'année précédente. On vise ainsi à corriger tout problème important que l'on ait décelé et qui s'applique pour une période prolongée. La période de révision proprement dite dépend de la nature du problème décelé, mais elle ne dépasse rarement trois ans. Toutefois, la période de révision peut être plus longue lors de révisions historiques ou de restratification.

Depuis avril 2008, les données de l'Enquête mensuelle sur le commerce de détail sont désaisonnalisées en utilisant la méthode X12-ARIMA. Cette technique consiste essentiellement, dans un premier temps, à extrapoler une année de données brutes avec des modèles ARIMA (modèles autorégressifs à moyennes mobiles intégrées); et dans un deuxième temps, à désaisonnaliser la série brute prolongée par la méthode X-11. Ensuite, les données désaisonnalisées sont ajustées aux totaux annuels des données brutes.

Les données désaisonnalisées doivent aussi être révisées. Elles doivent notamment rendre compte des révisions déterminées pour les données brutes. Par ailleurs, les estimations désaisonnalisées sont calculées à partir de X-12-ARIMA, et la tendance est sensible aux valeurs les plus récentes déclarées dans les données brutes. C'est pourquoi, au moment de la diffusion de nouvelles données pour chaque mois, les valeurs désaisonnalisées pour les trois mois précédents sont révisées. Les séries de données désaisonnalisées sont des données chronologiques qui ont été modifiées pour éliminer l’effet des influences saisonnières et du calendrier.  Pour cette raison, la désaisonnalisation des données permet des comparaisons plus significatives des conditions économiques d’un mois à l’autre.

Une fois par année, les options de désaisonnalisation sont révisées afin d'intégrer les données les plus récentes. Des estimations désaisonnalisées révisées pour chacun des mois des années civiles précédentes sont diffusées en même temps que la révision annuelle des données brutes. La période exacte de révision dépend de la période de révision des données brutes.

12. Évaluation de la qualité des données

La méthodologie de l'enquête a pour objectif de contrôler les erreurs et de réduire leurs effets éventuels sur les estimations. Les résultats de l'enquête peuvent néanmoins contenir des erreurs dont l'erreur d'échantillonnage n'est que l'une des composantes. L'erreur d'échantillonnage survient lorsque les observations sont faites uniquement sur un échantillon et non sur l'ensemble de la population. Toutes les autres erreurs commises aux diverses phases de l'enquête sont appelées erreurs non dues à l'échantillonnage. Des erreurs de ce type peuvent survenir, par exemple, quand un répondant fournit des renseignements erronés ou qu'il ne répond pas à certaines questions; quand une unité du champ de l'enquête y est incluse erronément ou que des erreurs sont commises lors du traitement des données, comme des erreurs de codage ou de saisie.

Avant la publication, on analyse les résultats combinés de l'enquête afin d'en évaluer la comparabilité; il s'agit généralement d'un examen détaillé des réponses individuelles (particulièrement celles des grandes entreprises), de la conjoncture économique générale et des tendances historiques.

Une mesure habituelle de la qualité des données des enquêtes est le coefficient de variation (CV). Le coefficient de variation, défini comme étant l'erreur-type divisée par l'estimation d'échantillon, est une mesure de la précision relative. Puisque le coefficient de variation est calculé d'après les réponses des unités individuelles, il mesure aussi certaines erreurs non dues à l'échantillonnage.

La formule utilisée pour calculer le coefficient de variation (CV) en pourcentage est :

CV (X) = S(X) * 100% / X
où X représente l'estimation et S(X) représente l'erreur-type de X.

On peut construire les intervalles de confiance autour des estimations en utilisant l'estimation et le CV. Donc, pour notre échantillon, il est possible de déclarer avec un niveau donné de confiance que la valeur prévue sera comprise dans l'intervalle de confiance construit autour de l'estimation. Par exemple, si une estimation de 12 millions de dollars à un CV de 2 %, l'erreur-type sera de 240 000 $ (l'estimation multipliée par le CV). On peut déclarer avec 68 % de confiance que les valeurs prévues seront comprises dans l'intervalle dont la longueur est égale à un écart type de part et d'autre de l'estimation, c'est-à-dire entre 11 760 000 $ et 12 240 000 $. Ou bien, nous pouvons déclarer avec 95 % de confiance que la valeur prévue sera comprise dans l'intervalle dont la longueur est égale à deux écarts types de part et d'autre de l'estimation, c'est-à-dire entre 11 520 000 $ et 12 480 000 $.

Enfin, étant donné la faible contribution de la partie non observée de la population aux estimations totales, le biais dans la partie non observée a un effet négligeable sur les CV. Par conséquent, on utilise le CV provenant de la partie observée pour l'estimation totale qui est égale à la somme des estimations pour les parties observée et non observée de la population.

13. Contrôle de la divulgation

La loi interdit à Statistique Canada de rendre publique toute donnée susceptible de révéler l'information recueillie en vertu de la Loi sur la statistique et se rapportant à toute personne, entreprise ou organisation reconnaissable, sans que cette personne, entreprise ou organisation le sache ou y consente par écrit. Diverses règles de confidentialité s'appliquent à toutes les données diffusées ou publiées afin d'empêcher la publication ou la divulgation de toute information jugée confidentielle. Au besoin, des données sont supprimées pour empêcher la divulgation directe ou par recoupement de données reconnaissables.

L'analyse de la confidentialité des données inclut la détection de la « divulgation directe » éventuelle, qui survient lorsque la valeur figurant dans une cellule d'un tableau ne correspond qu'à quelques répondants ou que la cellule est dominée par un petit nombre d'entreprises.

Enquête mensuelle sur le commerce de détail (EMCD) – Énoncé de la qualité des données

Objectifs, utilisation et utilisateurs
Concepts, variables et classifications
Couverture et bases de sondage
Échantillonnage
Conception du questionnaire
Réponse et non-réponse
Opérations de collecte et de saisie des données
Vérification
Imputation
Estimation
Révisions et désaisonnalisation
Évaluation de la qualité des données
Contrôle de la divulgation

1. Objectifs, utilisation et utilisateurs

1.1. Objectifs

L’Enquête mensuelle sur le commerce de détail (EMCD) fournit des renseignements sur la performance du secteur du commerce de détail et, quand les données sont combinées à d’autres statistiques, représente un important indicateur de l'état de l’économie canadienne.

1.2. Utilisation

Les estimations fournissent une mesure de la santé et de la performance du secteur du commerce de détail. L'information recueillie est utilisée pour estimer le niveau et la tendance mensuelle des ventes ainsi que le nombre d’emplacements. À la fin de chaque année, les estimations donnent un premier aperçu de la valeur annuelle des ventes au détail et de la performance du secteur.

1.3. Utilisateurs

Divers organismes, associations sectorielles et gouvernements utilisent l'information. Les détaillants utilisent les résultats de l'enquête pour comparer leurs résultats à ceux d'entreprises similaires, ainsi qu'à des fins de marketing. Les associations de détaillants peuvent surveiller la performance de leur industrie et promouvoir les industries du commerce de détail. Les investisseurs peuvent surveiller la croissance de l'industrie, ce qui peut donner aux détaillants un meilleur accès au capital d'investissement. Les données de l'enquête aident les administrations à comprendre le rôle des détaillants dans l'économie, ce qui facilite l'élaboration des politiques et des encouragements fiscaux. Le commerce de détail étant un important secteur de l'économie canadienne, les données permettent aux administrations de déterminer plus exactement la santé globale de l'économie grâce à l'utilisation des estimations dans le calcul du produit intérieur brut (PIB) national.

2. Concepts, variables et classifications

2.1. Concepts

Le secteur du commerce de détail comprend les établissements dont l’activité principale consiste à vendre des marchandises au détail, généralement sans transformation, et à fournir des services connexes.

Le commerce de détail représente le dernier maillon de la chaîne de distribution; les détaillants sont donc organisés pour vendre des marchandises en petites quantités au grand public. Ce secteur comprend deux grands types d’établissements : les détaillants en magasin et les détaillants hors magasin. L’EMCD couvre uniquement les détaillants en magasin. Leurs principales caractéristiques sont décrites ci-après.

Les détaillants en magasin exploitent des points de vente fixes, situés et conçus de manière à attirer un grand nombre de passants. De façon générale, les magasins de détail ont de grands étalages et font de la publicité dans les médias. Ils vendent surtout des biens de consommation qui intéressent les particuliers ou les ménages, mais certains servent aussi les entreprises et une clientèle institutionnelle. Parmi ces établissements, on compte les magasins de fournitures de bureau, les magasins d’ordinateurs et de logiciels, les stations-service, les vendeurs de matériaux de construction, les magasins de fournitures de plomberie et de fournitures électriques.

En plus de vendre des marchandises, certains types de détaillants fournissent des services après-vente, comme des services de réparation et d’installation. Ainsi, les concessionnaires d’automobiles neuves, les magasins d’électronique et d’appareils ménagers, et les magasins d’instruments et de fournitures de musique assurent fréquemment un service de réparation, alors que les magasins de revêtements de sol et les magasins de garnitures de fenêtres fournissent souvent des services d’installation. En règle générale, les établissements qui vendent des marchandises au détail et qui ont un service après-vente sont classés dans ce secteur.

Les salles d’exposition des sociétés de vente sur catalogue, les stations-service et les marchands de maisons mobiles sont assimilés à des détaillants en magasin.

2.2. Variables

Les ventes sont définies comme étant les ventes de toutes les marchandises achetées pour la revente, nettes des rendus et des escomptes. Sont inclus les honoraires et les commissions résultant de la vente de biens et de services pour le compte de tiers, comme la vente de billets de loterie, de billets d’autobus et de cartes de téléphone. Sont également inclus les recettes provenant des pièces et de la main-d’oeuvre utilisées pour les services d'entretien et de réparation, les revenus de location et de location à bail de biens et de matériel, les revenus provenant de services, y compris les services de restauration, les ventes de biens fabriqués en tant qu’activité secondaire et la valeur des marchandises prélevées par le propriétaire pour son usage personnel. Sont exclus les autres revenus de location de biens immobiliers, les frais de placement, les subventions d’exploitation et autres, les redevances et les droits de franchise.

L’emplacement d’affaires comprend le ou les emplacements physiques où a lieu l’activité commerciale dans chaque province et territoire et dont les ventes sont créditées ou comptabilisées dans les états financiers de l’entreprise. Pour les détaillants, il s’agit normalement d’un magasin.

Dollars constants : La valeur du commerce de détail est mesurée de deux façons : par la prise en compte des effets de la variation des prix sur la valeur des ventes et par l’élimination des effets de la variation des prix. La première mesure est la valeur des ventes au détail en dollars courants et la seconde, la valeur des ventes au détail en dollars constants. Pour calculer l’estimation en dollars courants, on agrège la valeur des ventes pondérées de tous les points de vente au détail. Pour calculer l’estimation en dollars constants, il faut d’abord rajuster la valeur des ventes par rapport à une année de base en utilisant l’Indice des prix à la consommation, puis additionner les valeurs résultantes.

2.3. Classification

L’Enquête mensuelle sur le commerce de détail est fondée sur la définition du commerce de détail adoptée dans le SCIAN (Système de classification des industries de l’Amérique du Nord). Le SCIAN est le cadre commun reconnu pour la production de statistiques comparables par les organismes statistiques du Canada, du Mexique et des États-Unis. L’accord définit les limites de 20 secteurs. Le SCIAN est fondé sur un cadre conceptuel axé sur la production, ou l’offre, en ce sens que les établissements sont regroupés en classes ou branches d’activité d’après la similarité des processus utilisés pour produire les biens et les services.

Les estimations sont calculées pour 21 groupes fondés sur des agrégations spéciales du Système de classification des industries de l’Amérique du Nord (SCIAN) de 2012. Les 21 groupes sont en outre agrégés en onze sous-secteurs.

Du point de vue géographique, les estimations des ventes sont produites pour le Canada et pour chaque province et territoire.

3. Couverture et bases de sondage

La base de sondage de l'Enquête mensuelle sur le commerce de détail (EMCD) est le Registre des entreprises (RE) de Statistique Canada. Ce dernier est une liste structurée d'entreprises productrices de biens et de services au Canada. Cette base de données tenue à jour centralement contient des renseignements détaillés sur la plupart des entités commerciales exploitées au Canada. Le RE couvre toutes les entreprises constituées en société, avec ou sans employés. Pour les entreprises non constituées en société, le RE comprend toutes les entreprises ayant des employés, ainsi que les entreprises sans employés ayant des ventes annualisées provenant d'un compte de la taxe sur les produits et services (TPS) ou un revenu annuel provenant de la déclaration d'impôt individuelle.

Dans le RE, les entreprises sont représentées selon une structure hiérarchique à quatre niveaux ayant pour sommet l'entreprise statistique suivie, par ordre décroissant, par la compagnie statistique, l'établissement statistique et l'emplacement statistique. Une entreprise peut être reliée à une ou à plusieurs compagnies statistiques, une compagnie statistique à un ou à plusieurs établissements statistiques et un établissement statistique à un ou à plusieurs emplacements statistiques.

La population cible de l'EMCD comprend tous les établissements statistiques figurant dans le RE, excluant les entreprises non constituées en société n'ayant pas d'employés dont les ventes annuelles sont inférieures à 30 000 $, qui sont classés dans le secteur du commerce de détail d'après le Système de classification des industries de l'Amérique du Nord (SCIAN) (environ 200 000 établissements). La fourchette de codes du SCIAN pour le secteur du commerce de détail varie de 441100 à 453999. Un établissement statistique est l'entité de production ou le plus petit groupe d'entités de production qui produit un ensemble de biens ou de services homogènes, dont les activités ne débordent pas les frontières provinciales/territoriales, et qui est en mesure de fournir des données sur la valeur de la production, ainsi que sur le coût des matières utilisées et le coût et l'importance de la main-d'oeuvre affectée à la production. L'entité de production est l'unité physique où se déroulent les activités de l'entreprise. Elle doit avoir une adresse de voirie et une main-d'oeuvre directement affectée au processus de production.

Sont exclus de la population cible les établissements auxiliaires (producteurs de services de soutien de l'activité de production de biens et services destinés au marché de plus d'un établissement au sein de l'entreprise, et qui sont considérés comme un centre de coûts ou un centre de dépenses discrétionnaires pour lequel les données sur tous les coûts, y compris la main-d'oeuvre et l'amortissement, peuvent être déclarées par l'entreprise), les futurs établissements, les établissements pour lesquels les signaux économiques indiquent un revenu manquant ou nul, et les établissements appartenant aux catégories du SCIAN non couvertes qui suivent :

  • 4541 (entreprises de télémagasinage et de vente par correspondance)
  • 4542 (exploitants de distributeurs automatiques)
  • 45431 (marchands de combustible)
  • 45439 (autres établissements de vente directe)

4. Échantillonnage

L'échantillon de l'EMCD est formé de 10 000 groupes d'établissements (grappes) classés dans le secteur du commerce de détail et sélectionnés à partir du Registre des entreprises de Statistique Canada. Par définition, une grappe d'établissements comprend tous les établissements appartenant à une entreprise statistique qui font partie d'un même groupe industriel et d'une même région géographique. L’EMCD est fondée sur un plan d'échantillonnage stratifié avec sélection d'un échantillon aléatoire simple dans chaque strate. La stratification est faite selon des groupes industriels (majoritairement mais non exclusivement des SCIAN à quatre chiffres) et selon la région géographique, c'est-à-dire selon la province ou le territoire. Ensuite, la population est stratifiée selon la taille de l'établissement. La mesure de taille est créée en combinant des données provenant d'enquêtes indépendantes et trois variables administratives, à savoir le revenu annuel profilé, les ventes assujetties à la TPS exprimées sur une base annuelle et le revenu de la déclaration d’impôt (T1 ou T2).

Les strates de taille comptent une strate à tirage complet (recensement), au moins deux strates à tirage partiel (échantillonnées partiellement) et une strate à tirage nul (non échantillonnée). La strate à tirage nul est destinée à réduire le fardeau de réponse en excluant les entreprises les plus petites de la population observée. Ces entreprises représentent, en principe, au plus 10 % du total des ventes. Au lieu d'envoyer un questionnaire à ces entreprises, on produit les estimations d'après des données administratives.

L'échantillon est réparti de façon optimale afin d'atteindre les coefficients de variation cibles au niveau du Canada dans son ensemble, de la province ou du territoire, de l’industrie et des groupes industriels selon la province ou le territoire. On procède aussi à un suréchantillonnage pour tenir compte des unités disparues, non répondantes ou classées incorrectement.

L'EMCD est une enquête répétée avec maximisation du chevauchement des échantillons mensuels. On retient l'échantillon d’un mois à l’autre et, chaque mois, on y ajoute de nouvelles unités (naissances). Pour découvrir les nouvelles unités visées par l'EMCD, c'est-à-dire les nouvelles grappes d'établissement(s), on examine chaque mois l'univers le plus récent du RE. On stratifie ces nouvelles unités conformément aux mêmes critères que ceux appliqués à la population initiale, puis on les échantillonne conformément à la fraction d'échantillonnage de la strate à laquelle elles appartiennent et on les ajoute à l'échantillon mensuel. Des disparitions d'entité surviennent également chaque mois. Une entité disparue peut être une grappe d'établissements qui ont cessé leurs activités (fermeture) ou dont les activités principales ne se rattachent plus au commerce de détail (hors du champ). La situation de ces entreprises est mise à jour dans le RE d'après des renseignements de source administrative et les commentaires reçus lors des enquêtes, y compris ceux des entreprises prenant part à l'EMCD. Les méthodes suivies pour traiter les unités disparues et les unités classées incorrectement font partie des procédures d'échantillonnage et de mise à jour de la population.

5. Conception du questionnaire

L’Enquête mensuelle sur le commerce de détail englobe les sous-enquêtes suivantes :

Enquête mensuelle sur le commerce de détail – R8

Enquête mensuelle sur le commerce de détail (avec les stocks) – R8

Enquête sur les ventes et stocks de boissons alcooliques

Le questionnaire est conçu pour recueillir mensuellement auprès d'un échantillon de détaillants des données sur les ventes au détail, sur le nombre d'emplacements commerciaux par province ou territoire et sur les stocks de biens possédés et destinés à la revente. Lors du remaniement de 2004, la plupart des questionnaires n'ont subi que des changements de présentation. Le questionnaire sur les ventes et les stocks de boissons alcooliques a subi des modifications plus importantes. Les modifications ont été discutées avec les intervenants et les répondants ont eu l'occasion de faire des commentaires avant que le nouveau questionnaire ne soit finalisé. Si d'autres modifications devaient être apportées à l'un des questionnaires, les changements proposés seraient soumis à un comité d'examen et ferait l'objet d'un essai sur le terrain auprès de répondants et d'utilisateurs de données pour s'assurer de leur pertinence.

6. Réponse et non-réponse

6.1. Réponse et non-réponse

Bien que les gestionnaires d'enquête et les employés des opérations fassent tout leur possible pour maximiser la réponse à l'EMCD, un certain degré de non-réponse a lieu. Pour qu'un établissement statistique soit considéré comme répondant, il faut que le degré de réponse partielle (situation où une réponse exacte n'est obtenue que pour certaines questions posées au répondant) atteigne un seuil minimal au-dessous duquel la déclaration fournie par l'établissement serait rejetée et l'établissement, considéré comme une unité non répondante. Le cas échéant, on considère que l'entreprise n'a pas répondu du tout.

La non-réponse a deux effets sur les données : premièrement, elle introduit un biais dans les estimations si les non-répondants diffèrent des répondants en ce qui concerne les caractéristiques mesurées et, deuxièmement, elle fait augmenter la variance d'échantillonnage des estimations, parce que la taille effective de l'échantillon est réduite comparativement à celle considérée au départ.

L'ampleur des efforts déployés pour obtenir une réponse auprès d'un non-répondant dépend des contraintes budgétaires et de temps, de l'effet de la non-réponse sur la qualité globale et du risque de biais dû à la non-réponse.

La méthode principalement utilisée pour réduire l'effet de la non-réponse à l'étape de l'échantillonnage consiste à augmenter la taille de l'échantillon en appliquant un taux de suréchantillonnage déterminé d'après les résultats d'enquêtes similaires.

Les cas de non-réponse qui surviennent malgré les méthodes appliquées aux étapes de l'échantillonnage et de la collecte pour réduire l'effet de la non-réponse sont traités par imputation.

Afin de déterminer l'importance de la non-réponse qui a lieu chaque mois, on calcule divers taux de réponse. Pour un mois de référence donné, on produit les estimations au moins deux fois (estimations provisoires et estimations révisées). Entre les deux exécutions, certaines données fournies par les répondants peuvent être jugées inutilisables et des valeurs imputées peuvent être corrigées au moyen de données fournies par les répondants. Par conséquent, les taux de réponse sont calculés après chaque exécution du processus d'estimation.

Pour l'EMCD, deux types de taux sont calculés (non pondérés et pondérés). Afin d'évaluer l'efficacité du processus de collecte, on calcule les taux de réponse non pondérés. Les taux pondérés, fondés sur le poids d'estimation et la valeur de la variable d'intérêt, évaluent la qualité de l'estimation. À l'intérieur de chacun de ces types de taux, il existe des taux distincts pour les unités faisant partie de l'échantillon et pour les unités qui sont uniquement modélisées à partir de données administratives qui ont été extraites des fichiers de TPS.

Afin d’obtenir une meilleure idée du succès du processus de collecte de données, on calcule deux taux non pondérés appelés « taux de résultat de la collecte » et « taux de résultat de l'extraction ». On calcule ces taux en divisant le nombre de répondants par le nombre d'unités avec lesquelles on a essayé de prendre contact ou pour lesquelles on a essayé de recevoir des données extraites. Les déclarants non mensuels (répondants bénéficiant de modalités de déclaration spéciales leur permettant de ne pas produire de déclaration chaque mois, mais pour lesquels des données réelles sont disponibles lors des révisions subséquentes) sont exclus du numérateur ainsi que du dénominateur pour les mois où aucun contact n'est pris avec eux. Brièvement, les divers taux de réponse se calculent comme suit :

Taux pondérés :

Taux de réponse des unités faisant partie de l'échantillon (estimation) =
Somme des ventes pondérées des unités avec situation de réponse i / Somme des ventes pondérées des unités faisant partie de l'échantillon

i = unités pour lesquelles il existe des données déclarées qui seront utilisées dans l'estimation ou qui sont des refus convertis, ou pour lesquelles il existe des données déclarées qui n'ont pas encore été évaluées pour l'estimation.

Taux de réponse des unités modélisées à partir de données administratives (estimation) = Somme des ventes pondérées des unités avec situation de réponse ii / Somme des ventes pondérées des unités modélisées à partir de données administratives

ii = unités pour lesquelles il existe des données extraites des fichiers administratifs et qui sont utilisables pour l'estimation.

Taux de réponse total (estimation) =
Somme des ventes pondérées des unités avec situation de réponse i ou situation de réponse ii / Somme de toutes les ventes pondérées

Taux non pondérés :

Taux de réponse des unités faisant partie de l'échantillon (collecte) =
Nombre de questionnaires avec situation de réponse iii / Nombre de questionnaires avec situation de réponse iv

iii = unités pour lesquelles il existe des données déclarées (dont le cas n'est pas résolu, utilisées ou non utilisées pour l'estimation) ou qui sont des refus convertis;

iv = toutes les unités susmentionnées, ainsi que les unités qui ont refusé de répondre, les unités avec lesquelles on n'a pas pris contact et d'autres types d'unités non répondantes.

Taux de réponse des unités modélisées à partir de données administratives (extraction) =
Nombre de questionnaires avec situation de réponse vi / Nombre de questionnaires avec situation de réponse vii

vi = unités dans le champ d'observation pour lesquelles il existe des données (utilisables ou non utilisables) extraites des fichiers administratifs;

vii = toutes les unités susmentionnées, ainsi que les unités qui ont refusé de déclarer la source de données administratives, les unités avec lesquelles on n'a pas pris contact et d'autres types d'unités non répondantes.

(% de questionnaires recueillis par rapport à l'ensemble des questionnaires dans le champ d'observation)

Taux de résultat de la collecte =
Nombre de questionnaires avec situation de réponse iii / Nombre de questionnaires avec situation de réponse viii

iii = même que iii défini plus haut;

viii = même que iv, à part l'exclusion des unités avec lesquelles on a pris contact, parce que leur réponse n'est pas disponible pour un mois particulier, puisqu'il s'agit de déclarants non mensuels.

Taux de résultat de l'extraction =
Nombre de questionnaires avec situation de réponse ix / Nombre de questionnaires avec situation de réponse vii

ix = même que vi, avec l'ajout des unités extraites qui ont été imputées ou qui étaient hors du champ de l'enquête;

où vii = même que vii défini plus haut.

(% de questionnaires recueillis par rapport à l'ensemble des questionnaires dans le champ d'observation que nous avons tenté de recueillir)

Tous les taux pondérés et non pondérés susmentionnés sont calculés au niveau du groupe industriel, de la région et du groupe de taille, ainsi que pour toute combinaison de ces niveaux.

Utilisation des données administratives

Réduire le fardeau de réponse est un défi à long terme pour Statistique Canada. Afin d’alléger le fardeau de réponse et de réduire les coûts reliés à l’enquête, notamment en ce qui a trait aux petites entreprises, l’EMCD a réduit le nombre d’établissements simples de l’échantillon qui sont enquêtés directement et dérive plutôt les chiffres de vente pour ces établissements à partir des fichiers de la TPS en utilisant un modèle statistique. Le modèle explique les différences entre les ventes et les recettes déclarées aux fins de la TPS, ainsi que le décalage entre la période de référence de l’enquête et celle de la TPS.

Pour en savoir plus sur la méthode utilisée lors de la modélisation des ventes tirées de fichiers administratifs, veuillez consulter le document intitulé Enquête mensuelle sur le commerce de détail : Utilisation de données administratives sous la rubrique ‘Documentation’ du BMDI.

Le tableau 1 contient les fractions de réponses pondérées pour tous les groupes industriels ainsi que pour toutes les provinces et territoires. Pour des fractions de réponses pondérées plus détaillées, veuillez contacter la section du marketing et de la diffusion au (613) 951-3549, sans frais: 1-877-421-3067 or par courriel à retailinfo@statcan.

6.2. Méthodes utilisées pour réduire la non-réponse durant la collecte

Beaucoup d’efforts sont déployés en vue de réduire au minimum la non-réponse durant la collecte. Les méthodes utilisées incluent des techniques d'interview, comme l'utilisation de questions d'approfondissement et des techniques de persuasion, la replanification répétée des appels téléphoniques pour obtenir l'information et la mise en place de procédures indiquant aux intervieweurs comment s'y prendre avec les répondants qui refusent de participer à l'enquête.

Si les données demandées ne sont pas disponibles au moment de la collecte, la meilleure estimation fournie par le répondant est acceptée et est révisée par la suite, quand les données réelles sont disponibles.

Pour réduire au minimum la non-réponse totale pour toutes les variables, des réponses partielles sont acceptées. En outre, les questionnaires sont personnalisés pour la collecte de certaines variables, comme les stocks, de sorte que la collecte ait lieu durant les mois où les données sont disponibles.

Enfin, pour établir un climat de confiance entre les intervieweurs et les répondants, les cas sont généralement affectés au même intervieweur chaque mois. Ce dernier peut ainsi établir une relation personnelle avec le répondant et renforcer sa confiance.

7. Opérations de collecte et de saisie des données

La collecte des données est réalisée par les bureaux régionaux de Statistique Canada.

Tableau 1 : Fractions de réponse pondérées par SCIAN et pour les provinces et territoires, décembre 2015
Sommaire du tableau
Le tableau montre les résultats de Fractions de réponse pondérées par SCIAN et pour les provinces et territoires Fractions de réponse pondérées, calculées selon Total, Enquêté et Administrative unités de mesure (figurant comme en-tête de colonne).
  Fractions de réponse pondérées
Total Enquêté Administrative
SCIAN - Canada  
Concessionnaires de véhicules et de pièces automobiles 92,0 92,5 61,6
Concessionnaires d'automobiles 93,5 93,7 58,8
Concessionnaires d'automobiles neuves 94,8 94,8 Note ...: n'ayant pas lieu de figurer
Concessionnaires d'automobiles d'occasion 73,4 74,9 58,8
Autres concessionnaires de véhicules automobiles 67,5 66,3 81,3
Magasins de pièces, de pneus et d' accessoires pour véhicules automobiles 85,1 89,4 56,4
Magasins de meubles et d'accessoires de maison 75,2 79,1 35,0
Magasins de meubles 75,5 76,4 54,9
Magasins d'accessoires de maison 74,9 83,7 27,1
Magasin d'appareils électroniques et ménagers 90,9 91,5 56,0
Marchands de matériaux de construction et de matériel et fournitures de jardinage 86,8 89,7 51,5
Magasins d'alimentation 85,7 88,6 45,2
Épiceries 88,3 91,6 48,1
Supermarchés et autres épiceries (sauf les dépanneurs) 89,9 92,8 50,7
Dépanneurs 65,0 71,0 30,3
Magasins d'alimentation spécialisés 66,2 71,8 37,0
Magasins de bière, de vin et de spiritueux 83,0 84,0 29,9
Magasins de produits de santé et de soins personnels 83,1 83,0 85,9
Stations-service 67,9 68,7 56,8
Magasins de vêtements et d'accessoires vestimentaires 80,3 81,3 37,7
Magasins de vêtements 78,3 79,4 26,8
Magasins de chaussures 89,4 90,1 26,4
Bijouteries et magasins de bagages et de maroquinerie 85,3 86,4 64,3
Magasins d'articles de sport, d'articles de passe-temps, d'articles de musique et de livres 91,4 93,5 56,5
Magasins de marchandises diverses 98,3 98,8 31,4
Grands magasins 100,0 100,0 Note ...: n'ayant pas lieu de figurer
Autres magasins de marchandises diverses 97,0 97,9 31,4
Magasins de détail divers 78,0 81,4 37,5
Total 86,8 88,3 51,6
Régions  
Terre-Neuve-et-Labrador 85,2 86,6 36,7
Île-du-Prince-Édouard 81,4 81,8 50,4
Nouvelle Écosse 88,4 89,4 54,6
Nouveau-Brunswick 84,8 86,5 48,4
Québec 84,9 87,3 45,7
Ontario 89,2 90,7 55,4
Manitoba 85,8 86,3 49,1
Saskatchewan 90,2 92,1 43,9
Alberta 87,6 88,9 54,0
Colombie-Britannique 83,0 84,0 55,2
Territoire du Yukon 84,6 84,6 Note ...: n'ayant pas lieu de figurer
Territoires du Nord-Ouest 64,7 64,7 Note ...: n'ayant pas lieu de figurer
Nunavut 12,6 12,6 Note ...: n'ayant pas lieu de figurer

Fractions de réponse pondérées

Ces derniers envoient un questionnaire aux répondants ou communiquent avec ceux-ci par téléphone afin d'obtenir les valeurs de leurs ventes et de leurs stocks, et de confirmer l'ouverture ou la fermeture des emplacements d'affaires. Ils effectuent aussi un suivi auprès des non-répondants. La collecte des données débute environ sept jours ouvrables après la fin du mois de référence et se poursuit pendant tout le mois en question.

Les entités qui participent à l'enquête pour la première fois reçoivent une lettre d'introduction en vue d’informer le répondant qu'un représentant de Statistique Canada l'appellera. Cet appel a pour but de présenter l'enquête, de confirmer l'activité de l'entreprise, d'établir et de commencer la collecte des données, et de répondre à toutes questions que le répondant pourrait avoir.

8. Vérification

La vérification des données est l'application de contrôles pour déceler les entrées manquantes, invalides ou incohérentes, ou pour repérer les enregistrements de données susceptibles d'être erronés. Durant le processus d'enquête de l'EMCD, les données sont vérifiées à deux moments distincts.

Premièrement, une vérification est faite durant la collecte des données. Après leur collecte par téléphone ou au moyen du questionnaire à renvoyer par la poste, les données sont saisies à l'aide d'applications informatiques personnalisées. Toutes sont soumises à une vérification. Les contrôles réalisés durant la collecte des données, appelés contrôles sur le terrain, comprennent généralement des contrôles de validité et certains contrôles de cohérence simples. Ils servent aussi à déceler les erreurs commises durant l'interview par le répondant ou par l'intervieweur et de repérer l'information manquante à l'étape de la collecte en vue de réduire le besoin d'un suivi ultérieur. Les contrôles sur le terrain ont également pour but d'épurer les réponses. Dans le cas de l'EMCD, les réponses du mois courant sont comparées aux réponses fournies par le répondant le mois précédent et (ou) l'année précédente pour le mois courant. Les contrôles sur le terrain permettent de repérer les problèmes que posent les procédures de collecte des données et la conception des questionnaires, et de déterminer s'il faut offrir une formation supplémentaire aux intervieweurs.

Tout enregistrement de données rejeté lors des contrôles préliminaires fait l'objet d'un suivi auprès du répondant afin de valider les données soupçonnées d'être incorrectes. Une fois validé, les données recueillies sont transmises de façon régulière au Bureau central à Ottawa.

Deuxièmement, après la collecte, les données sont soumises à une vérification statistique dont la nature est plus empirique. On exécute la vérification statistique avant l'imputation, afin de repérer les données qui serviront de base pour l'imputation de valeurs pour les non-répondants. Les valeurs très extrêmes risquant de perturber une tendance mensuelle sont exclues des calculs de tendance lors de la vérification statistique. Il convient de souligner qu'aucun ajustement n'est fait à cette étape pour corriger les valeurs extrêmes déclarées.

La première étape de la vérification statistique consiste à repérer les réponses qui seront soumises aux règles de vérification statistique. Les données déclarées pour le mois de référence courant sont soumises à divers contrôles.

Le premier ensemble de contrôles est fondé sur la méthode d'Hidiroglou-Berthelot qui consiste à examiner le rapport des données du mois courant fournies par un répondant à des données historiques (c.-à-d. dernier mois ou même mois l'année précédente) ou administratives. Si le rapport calculé pour le répondant diffère significativement de ceux obtenus pour des répondants dont les caractéristiques sont comparables en ce qui concerne le groupe industriel et/ou la région géographique, la réponse est considérée comme une valeur extrême.

Le deuxième ensemble de contrôles est basé sur la vérification de la part de marché. Cette méthode, qui s'appuie sur les données du mois courant uniquement, permet de vérifier les données fournies par tous les répondants, mêmes ceux pour lesquels on ne dispose pas de données historiques ou de données auxiliaires. Par conséquent, parmi un groupe de répondants présentant des caractéristiques similaires en ce qui concerne le groupe industriel et (ou) la région géographique, toute valeur dont la contribution pondérée au total du groupe est trop importante sera considérée comme une valeur extrême.

Pour les contrôles fondés sur la méthode d'Hidiroglou-Berthelot, les données jugées extrêmes ne sont pas incluses dans les modèles d'imputation (ceux fondés sur les ratios). En outre, les données considérées comme des valeurs extrêmes lors de la vérification de la part de marché ne sont pas incluses dans les modèles d'imputation où les moyennes et les médianes sont calculées pour imputer des valeurs pour les réponses pour lesquelles il n'existe pas de données historiques.

Conjointement avec les vérifications statistiques effectuées après la collecte de données, on procède à la détection d’erreurs des données extraites des fichiers administratifs. Les données modélisées de la TPS sont également assujetties à une phase de vérification approfondie. Chaque fichier sur lequel les données modélisées sont fondées est vérifié de même que les valeurs modélisées. Les vérifications sont effectuées au niveau agrégé (industrie, géographie) afin de détecter les fichiers qui dévient de la norme (soit en exhibant des différences d’un mois à l’autre trop importantes ou qui diffèrent considérablement des autres unités. Toutes les données qui faillissent ces étapes de contrôle sont sujettes à une vérification manuelle, et si nécessaire, à une action corrective.

9. Imputation

Le processus d’imputation de l'EMCD a pour but de remplacer les données manquantes par des valeurs imputées. Des valeurs sont attribuées aux enregistrements pour lesquels la vérification a révélé des valeurs manquantes afin de s'assurer que les estimations soient de haute qualité et d'établir une cohérence interne plausible. Pour des raisons de fardeau de réponse, de coût et d'actualité des données, il est généralement impossible de réaliser auprès des répondants tous les suivis nécessaires pour résoudre les problèmes de réponses manquantes. Puisqu'il est souhaitable de produire un fichier de microdonnées complet et cohérent, on recourt à l'imputation pour traiter les cas persistants de données manquantes.

Dans le cas de l'EMCD, on peut fonder l'imputation des valeurs manquantes sur des données historiques ou sur des données administratives. Le choix de la méthode appropriée est fondé sur une stratégie qui dépend de l'existence de données historiques ou de données administratives et (ou) du mois de référence en question.

Il existe trois types de méthode d'imputation d'après des données historiques. Le premier est l’application d’une tendance générale qui s'appuie sur une source unique de données historiques (mois précédent, données recueillies pour le mois suivant ou données recueillies pour le même mois l'année précédente). Le deuxième est un modèle de régression dans lequel sont utilisées simultanément les données provenant du mois précédent et celles provenant du même mois l'année précédente. La troisième méthode consiste à remplacer directement les valeurs manquantes par des données historiques.

Selon le mois de référence, il existe, pour le choix de la méthode, un ordre de préférence en vue d'assurer une imputation de haute qualité. Le troisième type de méthode d'imputation historique est toujours la dernière option considérée pour chaque mois de référence.

La méthode d’imputation fondée sur des données administratives est sélectionnée automatiquement lorsqu'on ne dispose pas de données historiques pour un non-répondant.  Des tendances sont alors appliquées à la source de données administratives (mesure de taille mensuelle) selon que la structure est simple (entreprises ne comptant qu’un seul établissement) ou complexe.

10. Estimation

L'estimation est un processus qui consiste à calculer une valeur approximative des paramètres de population inconnus en utilisant uniquement la partie de la population qui est incluse dans un échantillon. Des inférences sont ensuite faites au sujet des paramètres inconnus en utilisant les données d'échantillon et les renseignements connexes sur le plan de sondage. Cette étape fait usage du Système généralisé d'estimation (SGE) de Statistique Canada.

Pour les ventes des détaillants, la population est divisée en une partie observée (strates à tirage complet et à tirage partiel) et une partie non observée (strate à tirage nul). D'après l'échantillon tiré à partir de la partie observée, on calcule une estimation pour la population au moyen d'un estimateur d'Horvitz-Thompson où les réponses concernant les ventes sont pondérées par l'inverse des probabilités d'inclusion des unités échantillonnées. Ces poids (appelés poids d'échantillonnage) peuvent être interprétés comme étant le nombre de fois que chaque unité échantillonnée devrait être répétée pour représenter la population complète. Les valeurs pondérées des ventes ainsi calculées sont totalisées par domaine, pour produire une estimation du total des ventes pour chaque combinaison des groupes industriels/région géographique. Un domaine est défini comme correspondant aux valeurs de classification les plus récentes disponibles dans le RE pour l'unité et la période de référence de l'enquête. Les domaines peuvent différer des strates d'échantillonnage originales, parce que les unités peuvent avoir changé de taille, d'industrie ou d'emplacement. Les changements de classification sont reflétés immédiatement dans les estimations et ne sont pas cumulés au cours du temps. Pour la partie non observée de la population, les ventes sont estimées à l’aide de modèles statistiques exploitant les ventes assujetties à la TPS exprimées sous forme mensuelle.

Pour en savoir plus sur la méthode utilisée lors de la modélisation des ventes tirées de fichiers administratifs, veuillez consulter le document intitulé Enquête mensuelle sur le commerce de détail : Utilisation de données administratives sous la rubrique ‘Documentation’ du BMDI.

La variance est la mesure de précision utilisée dans le cas de l'EMCD pour évaluer la qualité de l'estimation des paramètres de population et pour obtenir des inférences valides. Pour la partie observée de la population, la variance est calculée directement à partir d'un échantillon aléatoire simple stratifié sans remise.

Les estimations d'échantillon peuvent différer de la valeur prévue des estimations. Cependant, puisque l'estimation est fondée sur un échantillon probabiliste, il est possible d'évaluer la variabilité de l'estimation d'échantillon par rapport à la valeur prévue. La variance d'une estimation est une mesure de la précision de l'estimation d'échantillon qui est définie comme étant la moyenne, sur tous les échantillons possibles, de l'écart quadratique de l'estimation par rapport à sa valeur prévue.

11. Révisions et désaisonnalisation

Les données brutes sont révisées, sur une base mensuelle, pour le mois précédant immédiatement le mois de référence en cours qui fait l'objet de la publication. C'est donc dire que lorsque les données pour décembre sont publiées pour la première fois, on procédera aussi à des révisions, au besoin, à l'égard des données brutes pour novembre. En outre, des révisions sont aussi effectuées une fois par année, au moment de la première publication des données de février, pour tous les mois de l'année précédente. On vise ainsi à corriger tout problème important que l'on ait décelé et qui s'applique pour une période prolongée. La période de révision proprement dite dépend de la nature du problème décelé, mais elle ne dépasse rarement trois ans. Toutefois, la période de révision peut être plus longue lors de révisions historiques ou de restratification.

Depuis avril 2008, les données de l'Enquête mensuelle sur le commerce de détail sont désaisonnalisées en utilisant la méthode X12-ARIMA. Cette technique consiste essentiellement, dans un premier temps, à extrapoler une année de données brutes avec des modèles ARIMA (modèles autorégressifs à moyennes mobiles intégrées); et dans un deuxième temps, à désaisonnaliser la série brute prolongée par la méthode X-11. Ensuite, les données désaisonnalisées sont ajustées aux totaux annuels des données brutes.

Les données désaisonnalisées doivent aussi être révisées. Elles doivent notamment rendre compte des révisions déterminées pour les données brutes. Par ailleurs, les estimations désaisonnalisées sont calculées à partir de X-12-ARIMA, et la tendance est sensible aux valeurs les plus récentes déclarées dans les données brutes. C'est pourquoi, au moment de la diffusion de nouvelles données pour chaque mois, les valeurs désaisonnalisées pour les trois mois précédents sont révisées. Les séries de données désaisonnalisées sont des données chronologiques qui ont été modifiées pour éliminer l’effet des influences saisonnières et du calendrier.  Pour cette raison, la désaisonnalisation des données permet des comparaisons plus significatives des conditions économiques d’un mois à l’autre.

Une fois par année, les options de désaisonnalisation sont révisées afin d'intégrer les données les plus récentes. Des estimations désaisonnalisées révisées pour chacun des mois des années civiles précédentes sont diffusées en même temps que la révision annuelle des données brutes. La période exacte de révision dépend de la période de révision des données brutes.

12. Évaluation de la qualité des données

La méthodologie de l'enquête a pour objectif de contrôler les erreurs et de réduire leurs effets éventuels sur les estimations. Les résultats de l'enquête peuvent néanmoins contenir des erreurs dont l'erreur d'échantillonnage n'est que l'une des composantes. L'erreur d'échantillonnage survient lorsque les observations sont faites uniquement sur un échantillon et non sur l'ensemble de la population. Toutes les autres erreurs commises aux diverses phases de l'enquête sont appelées erreurs non dues à l'échantillonnage. Des erreurs de ce type peuvent survenir, par exemple, quand un répondant fournit des renseignements erronés ou qu'il ne répond pas à certaines questions; quand une unité du champ de l'enquête y est incluse erronément ou que des erreurs sont commises lors du traitement des données, comme des erreurs de codage ou de saisie.

Avant la publication, on analyse les résultats combinés de l'enquête afin d'en évaluer la comparabilité; il s'agit généralement d'un examen détaillé des réponses individuelles (particulièrement celles des grandes entreprises), de la conjoncture économique générale et des tendances historiques.

Une mesure habituelle de la qualité des données des enquêtes est le coefficient de variation (CV). Le coefficient de variation, défini comme étant l'erreur-type divisée par l'estimation d'échantillon, est une mesure de la précision relative. Puisque le coefficient de variation est calculé d'après les réponses des unités individuelles, il mesure aussi certaines erreurs non dues à l'échantillonnage.

La formule utilisée pour calculer le coefficient de variation (CV) en pourcentage est :

CV (X) = S(X) * 100% / X
où X représente l'estimation et S(X) représente l'erreur-type de X.

On peut construire les intervalles de confiance autour des estimations en utilisant l'estimation et le CV. Donc, pour notre échantillon, il est possible de déclarer avec un niveau donné de confiance que la valeur prévue sera comprise dans l'intervalle de confiance construit autour de l'estimation. Par exemple, si une estimation de 12 millions de dollars à un CV de 2 %, l'erreur-type sera de 240 000 $ (l'estimation multipliée par le CV). On peut déclarer avec 68 % de confiance que les valeurs prévues seront comprises dans l'intervalle dont la longueur est égale à un écart type de part et d'autre de l'estimation, c'est-à-dire entre 11 760 000 $ et 12 240 000 $. Ou bien, nous pouvons déclarer avec 95 % de confiance que la valeur prévue sera comprise dans l'intervalle dont la longueur est égale à deux écarts types de part et d'autre de l'estimation, c'est-à-dire entre 11 520 000 $ et 12 480 000 $.

Enfin, étant donné la faible contribution de la partie non observée de la population aux estimations totales, le biais dans la partie non observée a un effet négligeable sur les CV. Par conséquent, on utilise le CV provenant de la partie observée pour l'estimation totale qui est égale à la somme des estimations pour les parties observée et non observée de la population.

13. Contrôle de la divulgation

La loi interdit à Statistique Canada de rendre publique toute donnée susceptible de révéler l'information recueillie en vertu de la Loi sur la statistique et se rapportant à toute personne, entreprise ou organisation reconnaissable, sans que cette personne, entreprise ou organisation le sache ou y consente par écrit. Diverses règles de confidentialité s'appliquent à toutes les données diffusées ou publiées afin d'empêcher la publication ou la divulgation de toute information jugée confidentielle. Au besoin, des données sont supprimées pour empêcher la divulgation directe ou par recoupement de données reconnaissables.

L'analyse de la confidentialité des données inclut la détection de la « divulgation directe » éventuelle, qui survient lorsque la valeur figurant dans une cellule d'un tableau ne correspond qu'à quelques répondants ou que la cellule est dominée par un petit nombre d'entreprises.

Enquête mensuelle sur le commerce de détail (EMCD) – Énoncé de la qualité des données

Objectifs, utilisation et utilisateurs
Concepts, variables et classifications
Couverture et bases de sondage
Échantillonnage
Conception du questionnaire
Réponse et non-réponse
Opérations de collecte et de saisie des données
Vérification
Imputation
Estimation
Révisions et désaisonnalisation
Évaluation de la qualité des données
Contrôle de la divulgation

1. Objectifs, utilisation et utilisateurs

1.1. Objectifs

L’Enquête mensuelle sur le commerce de détail (EMCD) fournit des renseignements sur la performance du secteur du commerce de détail et, quand les données sont combinées à d’autres statistiques, représente un important indicateur de l'état de l’économie canadienne.

1.2. Utilisation

Les estimations fournissent une mesure de la santé et de la performance du secteur du commerce de détail. L'information recueillie est utilisée pour estimer le niveau et la tendance mensuelle des ventes ainsi que le nombre d’emplacements. À la fin de chaque année, les estimations donnent un premier aperçu de la valeur annuelle des ventes au détail et de la performance du secteur.

1.3. Utilisateurs

Divers organismes, associations sectorielles et gouvernements utilisent l'information. Les détaillants utilisent les résultats de l'enquête pour comparer leurs résultats à ceux d'entreprises similaires, ainsi qu'à des fins de marketing. Les associations de détaillants peuvent surveiller la performance de leur industrie et promouvoir les industries du commerce de détail. Les investisseurs peuvent surveiller la croissance de l'industrie, ce qui peut donner aux détaillants un meilleur accès au capital d'investissement. Les données de l'enquête aident les administrations à comprendre le rôle des détaillants dans l'économie, ce qui facilite l'élaboration des politiques et des encouragements fiscaux. Le commerce de détail étant un important secteur de l'économie canadienne, les données permettent aux administrations de déterminer plus exactement la santé globale de l'économie grâce à l'utilisation des estimations dans le calcul du produit intérieur brut (PIB) national.

2. Concepts, variables et classifications

2.1. Concepts

Le secteur du commerce de détail comprend les établissements dont l’activité principale consiste à vendre des marchandises au détail, généralement sans transformation, et à fournir des services connexes.

Le commerce de détail représente le dernier maillon de la chaîne de distribution; les détaillants sont donc organisés pour vendre des marchandises en petites quantités au grand public. Ce secteur comprend deux grands types d’établissements : les détaillants en magasin et les détaillants hors magasin. L’EMCD couvre uniquement les détaillants en magasin. Leurs principales caractéristiques sont décrites ci-après.

Les détaillants en magasin exploitent des points de vente fixes, situés et conçus de manière à attirer un grand nombre de passants. De façon générale, les magasins de détail ont de grands étalages et font de la publicité dans les médias. Ils vendent surtout des biens de consommation qui intéressent les particuliers ou les ménages, mais certains servent aussi les entreprises et une clientèle institutionnelle. Parmi ces établissements, on compte les magasins de fournitures de bureau, les magasins d’ordinateurs et de logiciels, les stations-service, les vendeurs de matériaux de construction, les magasins de fournitures de plomberie et de fournitures électriques.

En plus de vendre des marchandises, certains types de détaillants fournissent des services après-vente, comme des services de réparation et d’installation. Ainsi, les concessionnaires d’automobiles neuves, les magasins d’électronique et d’appareils ménagers, et les magasins d’instruments et de fournitures de musique assurent fréquemment un service de réparation, alors que les magasins de revêtements de sol et les magasins de garnitures de fenêtres fournissent souvent des services d’installation. En règle générale, les établissements qui vendent des marchandises au détail et qui ont un service après-vente sont classés dans ce secteur.

Les salles d’exposition des sociétés de vente sur catalogue, les stations-service et les marchands de maisons mobiles sont assimilés à des détaillants en magasin.

2.2. Variables

Les ventes sont définies comme étant les ventes de toutes les marchandises achetées pour la revente, nettes des rendus et des escomptes. Sont inclus les honoraires et les commissions résultant de la vente de biens et de services pour le compte de tiers, comme la vente de billets de loterie, de billets d’autobus et de cartes de téléphone. Sont également inclus les recettes provenant des pièces et de la main-d’oeuvre utilisées pour les services d'entretien et de réparation, les revenus de location et de location à bail de biens et de matériel, les revenus provenant de services, y compris les services de restauration, les ventes de biens fabriqués en tant qu’activité secondaire et la valeur des marchandises prélevées par le propriétaire pour son usage personnel. Sont exclus les autres revenus de location de biens immobiliers, les frais de placement, les subventions d’exploitation et autres, les redevances et les droits de franchise.

L’emplacement d’affaires comprend le ou les emplacements physiques où a lieu l’activité commerciale dans chaque province et territoire et dont les ventes sont créditées ou comptabilisées dans les états financiers de l’entreprise. Pour les détaillants, il s’agit normalement d’un magasin.

Dollars constants : La valeur du commerce de détail est mesurée de deux façons : par la prise en compte des effets de la variation des prix sur la valeur des ventes et par l’élimination des effets de la variation des prix. La première mesure est la valeur des ventes au détail en dollars courants et la seconde, la valeur des ventes au détail en dollars constants. Pour calculer l’estimation en dollars courants, on agrège la valeur des ventes pondérées de tous les points de vente au détail. Pour calculer l’estimation en dollars constants, il faut d’abord rajuster la valeur des ventes par rapport à une année de base en utilisant l’Indice des prix à la consommation, puis additionner les valeurs résultantes.

2.3. Classification

L’Enquête mensuelle sur le commerce de détail est fondée sur la définition du commerce de détail adoptée dans le SCIAN (Système de classification des industries de l’Amérique du Nord). Le SCIAN est le cadre commun reconnu pour la production de statistiques comparables par les organismes statistiques du Canada, du Mexique et des États-Unis. L’accord définit les limites de 20 secteurs. Le SCIAN est fondé sur un cadre conceptuel axé sur la production, ou l’offre, en ce sens que les établissements sont regroupés en classes ou branches d’activité d’après la similarité des processus utilisés pour produire les biens et les services.

Les estimations sont calculées pour 21 groupes fondés sur des agrégations spéciales du Système de classification des industries de l’Amérique du Nord (SCIAN) de 2012. Les 21 groupes sont en outre agrégés en onze sous-secteurs.

Du point de vue géographique, les estimations des ventes sont produites pour le Canada et pour chaque province et territoire.

3. Couverture et bases de sondage

La base de sondage de l'Enquête mensuelle sur le commerce de détail (EMCD) est le Registre des entreprises (RE) de Statistique Canada. Ce dernier est une liste structurée d'entreprises productrices de biens et de services au Canada. Cette base de données tenue à jour centralement contient des renseignements détaillés sur la plupart des entités commerciales exploitées au Canada. Le RE couvre toutes les entreprises constituées en société, avec ou sans employés. Pour les entreprises non constituées en société, le RE comprend toutes les entreprises ayant des employés, ainsi que les entreprises sans employés ayant des ventes annualisées provenant d'un compte de la taxe sur les produits et services (TPS) ou un revenu annuel provenant de la déclaration d'impôt individuelle.

Dans le RE, les entreprises sont représentées selon une structure hiérarchique à quatre niveaux ayant pour sommet l'entreprise statistique suivie, par ordre décroissant, par la compagnie statistique, l'établissement statistique et l'emplacement statistique. Une entreprise peut être reliée à une ou à plusieurs compagnies statistiques, une compagnie statistique à un ou à plusieurs établissements statistiques et un établissement statistique à un ou à plusieurs emplacements statistiques.

La population cible de l'EMCD comprend tous les établissements statistiques figurant dans le RE, excluant les entreprises non constituées en société n'ayant pas d'employés dont les ventes annuelles sont inférieures à 30 000 $, qui sont classés dans le secteur du commerce de détail d'après le Système de classification des industries de l'Amérique du Nord (SCIAN) (environ 200 000 établissements). La fourchette de codes du SCIAN pour le secteur du commerce de détail varie de 441100 à 453999. Un établissement statistique est l'entité de production ou le plus petit groupe d'entités de production qui produit un ensemble de biens ou de services homogènes, dont les activités ne débordent pas les frontières provinciales/territoriales, et qui est en mesure de fournir des données sur la valeur de la production, ainsi que sur le coût des matières utilisées et le coût et l'importance de la main-d'oeuvre affectée à la production. L'entité de production est l'unité physique où se déroulent les activités de l'entreprise. Elle doit avoir une adresse de voirie et une main-d'oeuvre directement affectée au processus de production.

Sont exclus de la population cible les établissements auxiliaires (producteurs de services de soutien de l'activité de production de biens et services destinés au marché de plus d'un établissement au sein de l'entreprise, et qui sont considérés comme un centre de coûts ou un centre de dépenses discrétionnaires pour lequel les données sur tous les coûts, y compris la main-d'oeuvre et l'amortissement, peuvent être déclarées par l'entreprise), les futurs établissements, les établissements pour lesquels les signaux économiques indiquent un revenu manquant ou nul, et les établissements appartenant aux catégories du SCIAN non couvertes qui suivent :

  • 4541 (entreprises de télémagasinage et de vente par correspondance)
  • 4542 (exploitants de distributeurs automatiques)
  • 45431 (marchands de combustible)
  • 45439 (autres établissements de vente directe)

4. Échantillonnage

L'échantillon de l'EMCD est formé de 10 000 groupes d'établissements (grappes) classés dans le secteur du commerce de détail et sélectionnés à partir du Registre des entreprises de Statistique Canada. Par définition, une grappe d'établissements comprend tous les établissements appartenant à une entreprise statistique qui font partie d'un même groupe industriel et d'une même région géographique. L’EMCD est fondée sur un plan d'échantillonnage stratifié avec sélection d'un échantillon aléatoire simple dans chaque strate. La stratification est faite selon des groupes industriels (majoritairement mais non exclusivement des SCIAN à quatre chiffres) et selon la région géographique, c'est-à-dire selon la province ou le territoire. Ensuite, la population est stratifiée selon la taille de l'établissement. La mesure de taille est créée en combinant des données provenant d'enquêtes indépendantes et trois variables administratives, à savoir le revenu annuel profilé, les ventes assujetties à la TPS exprimées sur une base annuelle et le revenu de la déclaration d’impôt (T1 ou T2).

Les strates de taille comptent une strate à tirage complet (recensement), au moins deux strates à tirage partiel (échantillonnées partiellement) et une strate à tirage nul (non échantillonnée). La strate à tirage nul est destinée à réduire le fardeau de réponse en excluant les entreprises les plus petites de la population observée. Ces entreprises représentent, en principe, au plus 10 % du total des ventes. Au lieu d'envoyer un questionnaire à ces entreprises, on produit les estimations d'après des données administratives.

L'échantillon est réparti de façon optimale afin d'atteindre les coefficients de variation cibles au niveau du Canada dans son ensemble, de la province ou du territoire, de l’industrie et des groupes industriels selon la province ou le territoire. On procède aussi à un suréchantillonnage pour tenir compte des unités disparues, non répondantes ou classées incorrectement.

L'EMCD est une enquête répétée avec maximisation du chevauchement des échantillons mensuels. On retient l'échantillon d’un mois à l’autre et, chaque mois, on y ajoute de nouvelles unités (naissances). Pour découvrir les nouvelles unités visées par l'EMCD, c'est-à-dire les nouvelles grappes d'établissement(s), on examine chaque mois l'univers le plus récent du RE. On stratifie ces nouvelles unités conformément aux mêmes critères que ceux appliqués à la population initiale, puis on les échantillonne conformément à la fraction d'échantillonnage de la strate à laquelle elles appartiennent et on les ajoute à l'échantillon mensuel. Des disparitions d'entité surviennent également chaque mois. Une entité disparue peut être une grappe d'établissements qui ont cessé leurs activités (fermeture) ou dont les activités principales ne se rattachent plus au commerce de détail (hors du champ). La situation de ces entreprises est mise à jour dans le RE d'après des renseignements de source administrative et les commentaires reçus lors des enquêtes, y compris ceux des entreprises prenant part à l'EMCD. Les méthodes suivies pour traiter les unités disparues et les unités classées incorrectement font partie des procédures d'échantillonnage et de mise à jour de la population.

5. Conception du questionnaire

L’Enquête mensuelle sur le commerce de détail englobe les sous-enquêtes suivantes :

Enquête mensuelle sur le commerce de détail – R8

Enquête mensuelle sur le commerce de détail (avec les stocks) – R8

Enquête sur les ventes et stocks de boissons alcooliques

Le questionnaire est conçu pour recueillir mensuellement auprès d'un échantillon de détaillants des données sur les ventes au détail, sur le nombre d'emplacements commerciaux par province ou territoire et sur les stocks de biens possédés et destinés à la revente. Lors du remaniement de 2004, la plupart des questionnaires n'ont subi que des changements de présentation. Le questionnaire sur les ventes et les stocks de boissons alcooliques a subi des modifications plus importantes. Les modifications ont été discutées avec les intervenants et les répondants ont eu l'occasion de faire des commentaires avant que le nouveau questionnaire ne soit finalisé. Si d'autres modifications devaient être apportées à l'un des questionnaires, les changements proposés seraient soumis à un comité d'examen et ferait l'objet d'un essai sur le terrain auprès de répondants et d'utilisateurs de données pour s'assurer de leur pertinence.

6. Réponse et non-réponse

6.1. Réponse et non-réponse

Bien que les gestionnaires d'enquête et les employés des opérations fassent tout leur possible pour maximiser la réponse à l'EMCD, un certain degré de non-réponse a lieu. Pour qu'un établissement statistique soit considéré comme répondant, il faut que le degré de réponse partielle (situation où une réponse exacte n'est obtenue que pour certaines questions posées au répondant) atteigne un seuil minimal au-dessous duquel la déclaration fournie par l'établissement serait rejetée et l'établissement, considéré comme une unité non répondante. Le cas échéant, on considère que l'entreprise n'a pas répondu du tout.

La non-réponse a deux effets sur les données : premièrement, elle introduit un biais dans les estimations si les non-répondants diffèrent des répondants en ce qui concerne les caractéristiques mesurées et, deuxièmement, elle fait augmenter la variance d'échantillonnage des estimations, parce que la taille effective de l'échantillon est réduite comparativement à celle considérée au départ.

L'ampleur des efforts déployés pour obtenir une réponse auprès d'un non-répondant dépend des contraintes budgétaires et de temps, de l'effet de la non-réponse sur la qualité globale et du risque de biais dû à la non-réponse.

La méthode principalement utilisée pour réduire l'effet de la non-réponse à l'étape de l'échantillonnage consiste à augmenter la taille de l'échantillon en appliquant un taux de suréchantillonnage déterminé d'après les résultats d'enquêtes similaires.

Les cas de non-réponse qui surviennent malgré les méthodes appliquées aux étapes de l'échantillonnage et de la collecte pour réduire l'effet de la non-réponse sont traités par imputation.

Afin de déterminer l'importance de la non-réponse qui a lieu chaque mois, on calcule divers taux de réponse. Pour un mois de référence donné, on produit les estimations au moins deux fois (estimations provisoires et estimations révisées). Entre les deux exécutions, certaines données fournies par les répondants peuvent être jugées inutilisables et des valeurs imputées peuvent être corrigées au moyen de données fournies par les répondants. Par conséquent, les taux de réponse sont calculés après chaque exécution du processus d'estimation.

Pour l'EMCD, deux types de taux sont calculés (non pondérés et pondérés). Afin d'évaluer l'efficacité du processus de collecte, on calcule les taux de réponse non pondérés. Les taux pondérés, fondés sur le poids d'estimation et la valeur de la variable d'intérêt, évaluent la qualité de l'estimation. À l'intérieur de chacun de ces types de taux, il existe des taux distincts pour les unités faisant partie de l'échantillon et pour les unités qui sont uniquement modélisées à partir de données administratives qui ont été extraites des fichiers de TPS.

Afin d’obtenir une meilleure idée du succès du processus de collecte de données, on calcule deux taux non pondérés appelés « taux de résultat de la collecte » et « taux de résultat de l'extraction ». On calcule ces taux en divisant le nombre de répondants par le nombre d'unités avec lesquelles on a essayé de prendre contact ou pour lesquelles on a essayé de recevoir des données extraites. Les déclarants non mensuels (répondants bénéficiant de modalités de déclaration spéciales leur permettant de ne pas produire de déclaration chaque mois, mais pour lesquels des données réelles sont disponibles lors des révisions subséquentes) sont exclus du numérateur ainsi que du dénominateur pour les mois où aucun contact n'est pris avec eux. Brièvement, les divers taux de réponse se calculent comme suit :

Taux pondérés :

Taux de réponse des unités faisant partie de l'échantillon (estimation) =
Somme des ventes pondérées des unités avec situation de réponse i / Somme des ventes pondérées des unités faisant partie de l'échantillon

i = unités pour lesquelles il existe des données déclarées qui seront utilisées dans l'estimation ou qui sont des refus convertis, ou pour lesquelles il existe des données déclarées qui n'ont pas encore été évaluées pour l'estimation.

Taux de réponse des unités modélisées à partir de données administratives (estimation) = Somme des ventes pondérées des unités avec situation de réponse ii / Somme des ventes pondérées des unités modélisées à partir de données administratives

ii = unités pour lesquelles il existe des données extraites des fichiers administratifs et qui sont utilisables pour l'estimation.

Taux de réponse total (estimation) =
Somme des ventes pondérées des unités avec situation de réponse i ou situation de réponse ii / Somme de toutes les ventes pondérées

Taux non pondérés :

Taux de réponse des unités faisant partie de l'échantillon (collecte) =
Nombre de questionnaires avec situation de réponse iii / Nombre de questionnaires avec situation de réponse iv

iii = unités pour lesquelles il existe des données déclarées (dont le cas n'est pas résolu, utilisées ou non utilisées pour l'estimation) ou qui sont des refus convertis;

iv = toutes les unités susmentionnées, ainsi que les unités qui ont refusé de répondre, les unités avec lesquelles on n'a pas pris contact et d'autres types d'unités non répondantes.

Taux de réponse des unités modélisées à partir de données administratives (extraction) =
Nombre de questionnaires avec situation de réponse vi / Nombre de questionnaires avec situation de réponse vii

vi = unités dans le champ d'observation pour lesquelles il existe des données (utilisables ou non utilisables) extraites des fichiers administratifs;

vii = toutes les unités susmentionnées, ainsi que les unités qui ont refusé de déclarer la source de données administratives, les unités avec lesquelles on n'a pas pris contact et d'autres types d'unités non répondantes.

(% de questionnaires recueillis par rapport à l'ensemble des questionnaires dans le champ d'observation)

Taux de résultat de la collecte =
Nombre de questionnaires avec situation de réponse iii / Nombre de questionnaires avec situation de réponse viii

iii = même que iii défini plus haut;

viii = même que iv, à part l'exclusion des unités avec lesquelles on a pris contact, parce que leur réponse n'est pas disponible pour un mois particulier, puisqu'il s'agit de déclarants non mensuels.

Taux de résultat de l'extraction =
Nombre de questionnaires avec situation de réponse ix / Nombre de questionnaires avec situation de réponse vii

ix = même que vi, avec l'ajout des unités extraites qui ont été imputées ou qui étaient hors du champ de l'enquête;

où vii = même que vii défini plus haut.

(% de questionnaires recueillis par rapport à l'ensemble des questionnaires dans le champ d'observation que nous avons tenté de recueillir)

Tous les taux pondérés et non pondérés susmentionnés sont calculés au niveau du groupe industriel, de la région et du groupe de taille, ainsi que pour toute combinaison de ces niveaux.

Utilisation des données administratives

Réduire le fardeau de réponse est un défi à long terme pour Statistique Canada. Afin d’alléger le fardeau de réponse et de réduire les coûts reliés à l’enquête, notamment en ce qui a trait aux petites entreprises, l’EMCD a réduit le nombre d’établissements simples de l’échantillon qui sont enquêtés directement et dérive plutôt les chiffres de vente pour ces établissements à partir des fichiers de la TPS en utilisant un modèle statistique. Le modèle explique les différences entre les ventes et les recettes déclarées aux fins de la TPS, ainsi que le décalage entre la période de référence de l’enquête et celle de la TPS.

Pour en savoir plus sur la méthode utilisée lors de la modélisation des ventes tirées de fichiers administratifs, veuillez consulter le document intitulé Enquête mensuelle sur le commerce de détail : Utilisation de données administratives sous la rubrique ‘Documentation’ du BMDI.

Le tableau 1 contient les fractions de réponses pondérées pour tous les groupes industriels ainsi que pour toutes les provinces et territoires. Pour des fractions de réponses pondérées plus détaillées, veuillez contacter la section du marketing et de la diffusion au (613) 951-3549, sans frais: 1-877-421-3067 or par courriel à retailinfo@statcan.

6.2. Méthodes utilisées pour réduire la non-réponse durant la collecte

Beaucoup d’efforts sont déployés en vue de réduire au minimum la non-réponse durant la collecte. Les méthodes utilisées incluent des techniques d'interview, comme l'utilisation de questions d'approfondissement et des techniques de persuasion, la replanification répétée des appels téléphoniques pour obtenir l'information et la mise en place de procédures indiquant aux intervieweurs comment s'y prendre avec les répondants qui refusent de participer à l'enquête.

Si les données demandées ne sont pas disponibles au moment de la collecte, la meilleure estimation fournie par le répondant est acceptée et est révisée par la suite, quand les données réelles sont disponibles.

Pour réduire au minimum la non-réponse totale pour toutes les variables, des réponses partielles sont acceptées. En outre, les questionnaires sont personnalisés pour la collecte de certaines variables, comme les stocks, de sorte que la collecte ait lieu durant les mois où les données sont disponibles.

Enfin, pour établir un climat de confiance entre les intervieweurs et les répondants, les cas sont généralement affectés au même intervieweur chaque mois. Ce dernier peut ainsi établir une relation personnelle avec le répondant et renforcer sa confiance.

7. Opérations de collecte et de saisie des données

La collecte des données est réalisée par les bureaux régionaux de Statistique Canada.

Tableau 1 :Fractions de réponse pondérées par SCIAN et pour les provinces et territoires, novembre 2015
Sommaire du tableau
Le tableau montre les résultats de Fractions de réponse pondérées par SCIAN et pour les provinces et territoires Fractions de réponse pondérées, calculées selon Total, Enquêté et Administrative unités de mesure (figurant comme en-tête de colonne).
  Fractions de réponse pondérées
Total Enquêté Administrative
SCIAN - Canada  
Concessionnaires de véhicules et de pièces automobiles 92,1 92,8 56,2
Concessionnaires d'automobiles 93,9 94,3 47,2
Concessionnaires d'automobiles neuves 95,6 95,6 Note ...: n'ayant pas lieu de figurer
Concessionnaires d'automobiles d'occasion 69,0 72,5 47,2
Autres concessionnaires de véhicules automobiles 67,5 68,9 51,7
Magasins de pièces, de pneus et d' accessoires pour véhicules automobiles 83,0 84,6 68,3
Magasins de meubles et d'accessoires de maison 77,9 80,4 53,9
Magasins de meubles 77,9 78,9 59,4
Magasins d'accessoires de maison 78,0 82,9 50,7
Magasin d'appareils électroniques et ménagers 86,0 86,7 32,7
Marchands de matériaux de construction et de matériel et fournitures de jardinage 88,7 92,1 51,7
Magasins d'alimentation 89,8 91,5 66,2
Épiceries 90,3 91,9 70,5
Supermarchés et autres épiceries (sauf les dépanneurs) 92,9 94,1 77,1
Dépanneurs 54,5 59,5 22,8
Magasins d'alimentation spécialisés 69,0 72,6 50,9
Magasins de bière, de vin et de spiritueux 93,1 94,3 38,2
Magasins de produits de santé et de soins personnels 85,3 84,9 91,7
Stations-service 72,4 73,2 59,4
Magasins de vêtements et d'accessoires vestimentaires 82,5 83,3 50,1
Magasins de vêtements 82,4 83,0 53,6
Magasins de chaussures 82,5 83,3 19,3
Bijouteries et magasins de bagages et de maroquinerie 83,9 86,0 46,3
Magasins d'articles de sport, d'articles de passe-temps, d'articles de musique et de livres 88,0 91,1 28,8
Magasins de marchandises diverses 99,2 99,4 74,3
Grands magasins 100,0 100,0 Note ...: n'ayant pas lieu de figurer
Autres magasins de marchandises diverses 98,7 99,0 74,3
Magasins de détail divers 77,6 83,5 23,0
Total 88,4 89,6 60,1
Régions  
Terre-Neuve-et-Labrador 83,5 84,7 39,9
Île-du-Prince-Édouard 80,4 81,3 9,2
Nouvelle Écosse 89,3 90,4 55,0
Nouveau-Brunswick 83,0 84,2 58,2
Québec 87,9 89,3 64,2
Ontario 89,3 90,7 58,4
Manitoba 87,5 87,9 68,7
Saskatchewan 91,0 92,4 54,6
Alberta 87,6 88,7 61,6
Colombie-Britannique 88,8 89,8 58,4
Territoire du Yukon 85,2 85,2 Note ...: n'ayant pas lieu de figurer
Territoires du Nord-Ouest 61,7 61,7 Note ...: n'ayant pas lieu de figurer
Nunavut 69,5 69,5 Note ...: n'ayant pas lieu de figurer

Fractions de réponse pondérées

Ces derniers envoient un questionnaire aux répondants ou communiquent avec ceux-ci par téléphone afin d'obtenir les valeurs de leurs ventes et de leurs stocks, et de confirmer l'ouverture ou la fermeture des emplacements d'affaires. Ils effectuent aussi un suivi auprès des non-répondants. La collecte des données débute environ sept jours ouvrables après la fin du mois de référence et se poursuit pendant tout le mois en question.

Les entités qui participent à l'enquête pour la première fois reçoivent une lettre d'introduction en vue d’informer le répondant qu'un représentant de Statistique Canada l'appellera. Cet appel a pour but de présenter l'enquête, de confirmer l'activité de l'entreprise, d'établir et de commencer la collecte des données, et de répondre à toutes questions que le répondant pourrait avoir.

8. Vérification

La vérification des données est l'application de contrôles pour déceler les entrées manquantes, invalides ou incohérentes, ou pour repérer les enregistrements de données susceptibles d'être erronés. Durant le processus d'enquête de l'EMCD, les données sont vérifiées à deux moments distincts.

Premièrement, une vérification est faite durant la collecte des données. Après leur collecte par téléphone ou au moyen du questionnaire à renvoyer par la poste, les données sont saisies à l'aide d'applications informatiques personnalisées. Toutes sont soumises à une vérification. Les contrôles réalisés durant la collecte des données, appelés contrôles sur le terrain, comprennent généralement des contrôles de validité et certains contrôles de cohérence simples. Ils servent aussi à déceler les erreurs commises durant l'interview par le répondant ou par l'intervieweur et de repérer l'information manquante à l'étape de la collecte en vue de réduire le besoin d'un suivi ultérieur. Les contrôles sur le terrain ont également pour but d'épurer les réponses. Dans le cas de l'EMCD, les réponses du mois courant sont comparées aux réponses fournies par le répondant le mois précédent et (ou) l'année précédente pour le mois courant. Les contrôles sur le terrain permettent de repérer les problèmes que posent les procédures de collecte des données et la conception des questionnaires, et de déterminer s'il faut offrir une formation supplémentaire aux intervieweurs.

Tout enregistrement de données rejeté lors des contrôles préliminaires fait l'objet d'un suivi auprès du répondant afin de valider les données soupçonnées d'être incorrectes. Une fois validé, les données recueillies sont transmises de façon régulière au Bureau central à Ottawa.

Deuxièmement, après la collecte, les données sont soumises à une vérification statistique dont la nature est plus empirique. On exécute la vérification statistique avant l'imputation, afin de repérer les données qui serviront de base pour l'imputation de valeurs pour les non-répondants. Les valeurs très extrêmes risquant de perturber une tendance mensuelle sont exclues des calculs de tendance lors de la vérification statistique. Il convient de souligner qu'aucun ajustement n'est fait à cette étape pour corriger les valeurs extrêmes déclarées.

La première étape de la vérification statistique consiste à repérer les réponses qui seront soumises aux règles de vérification statistique. Les données déclarées pour le mois de référence courant sont soumises à divers contrôles.

Le premier ensemble de contrôles est fondé sur la méthode d'Hidiroglou-Berthelot qui consiste à examiner le rapport des données du mois courant fournies par un répondant à des données historiques (c.-à-d. dernier mois ou même mois l'année précédente) ou administratives. Si le rapport calculé pour le répondant diffère significativement de ceux obtenus pour des répondants dont les caractéristiques sont comparables en ce qui concerne le groupe industriel et/ou la région géographique, la réponse est considérée comme une valeur extrême.

Le deuxième ensemble de contrôles est basé sur la vérification de la part de marché. Cette méthode, qui s'appuie sur les données du mois courant uniquement, permet de vérifier les données fournies par tous les répondants, mêmes ceux pour lesquels on ne dispose pas de données historiques ou de données auxiliaires. Par conséquent, parmi un groupe de répondants présentant des caractéristiques similaires en ce qui concerne le groupe industriel et (ou) la région géographique, toute valeur dont la contribution pondérée au total du groupe est trop importante sera considérée comme une valeur extrême.

Pour les contrôles fondés sur la méthode d'Hidiroglou-Berthelot, les données jugées extrêmes ne sont pas incluses dans les modèles d'imputation (ceux fondés sur les ratios). En outre, les données considérées comme des valeurs extrêmes lors de la vérification de la part de marché ne sont pas incluses dans les modèles d'imputation où les moyennes et les médianes sont calculées pour imputer des valeurs pour les réponses pour lesquelles il n'existe pas de données historiques.

Conjointement avec les vérifications statistiques effectuées après la collecte de données, on procède à la détection d’erreurs des données extraites des fichiers administratifs. Les données modélisées de la TPS sont également assujetties à une phase de vérification approfondie. Chaque fichier sur lequel les données modélisées sont fondées est vérifié de même que les valeurs modélisées. Les vérifications sont effectuées au niveau agrégé (industrie, géographie) afin de détecter les fichiers qui dévient de la norme (soit en exhibant des différences d’un mois à l’autre trop importantes ou qui diffèrent considérablement des autres unités. Toutes les données qui faillissent ces étapes de contrôle sont sujettes à une vérification manuelle, et si nécessaire, à une action corrective.

9. Imputation

Le processus d’imputation de l'EMCD a pour but de remplacer les données manquantes par des valeurs imputées. Des valeurs sont attribuées aux enregistrements pour lesquels la vérification a révélé des valeurs manquantes afin de s'assurer que les estimations soient de haute qualité et d'établir une cohérence interne plausible. Pour des raisons de fardeau de réponse, de coût et d'actualité des données, il est généralement impossible de réaliser auprès des répondants tous les suivis nécessaires pour résoudre les problèmes de réponses manquantes. Puisqu'il est souhaitable de produire un fichier de microdonnées complet et cohérent, on recourt à l'imputation pour traiter les cas persistants de données manquantes.

Dans le cas de l'EMCD, on peut fonder l'imputation des valeurs manquantes sur des données historiques ou sur des données administratives. Le choix de la méthode appropriée est fondé sur une stratégie qui dépend de l'existence de données historiques ou de données administratives et (ou) du mois de référence en question.

Il existe trois types de méthode d'imputation d'après des données historiques. Le premier est l’application d’une tendance générale qui s'appuie sur une source unique de données historiques (mois précédent, données recueillies pour le mois suivant ou données recueillies pour le même mois l'année précédente). Le deuxième est un modèle de régression dans lequel sont utilisées simultanément les données provenant du mois précédent et celles provenant du même mois l'année précédente. La troisième méthode consiste à remplacer directement les valeurs manquantes par des données historiques.

Selon le mois de référence, il existe, pour le choix de la méthode, un ordre de préférence en vue d'assurer une imputation de haute qualité. Le troisième type de méthode d'imputation historique est toujours la dernière option considérée pour chaque mois de référence.

La méthode d’imputation fondée sur des données administratives est sélectionnée automatiquement lorsqu'on ne dispose pas de données historiques pour un non-répondant.  Des tendances sont alors appliquées à la source de données administratives (mesure de taille mensuelle) selon que la structure est simple (entreprises ne comptant qu’un seul établissement) ou complexe.

10. Estimation

L'estimation est un processus qui consiste à calculer une valeur approximative des paramètres de population inconnus en utilisant uniquement la partie de la population qui est incluse dans un échantillon. Des inférences sont ensuite faites au sujet des paramètres inconnus en utilisant les données d'échantillon et les renseignements connexes sur le plan de sondage. Cette étape fait usage du Système généralisé d'estimation (SGE) de Statistique Canada.

Pour les ventes des détaillants, la population est divisée en une partie observée (strates à tirage complet et à tirage partiel) et une partie non observée (strate à tirage nul). D'après l'échantillon tiré à partir de la partie observée, on calcule une estimation pour la population au moyen d'un estimateur d'Horvitz-Thompson où les réponses concernant les ventes sont pondérées par l'inverse des probabilités d'inclusion des unités échantillonnées. Ces poids (appelés poids d'échantillonnage) peuvent être interprétés comme étant le nombre de fois que chaque unité échantillonnée devrait être répétée pour représenter la population complète. Les valeurs pondérées des ventes ainsi calculées sont totalisées par domaine, pour produire une estimation du total des ventes pour chaque combinaison des groupes industriels/région géographique. Un domaine est défini comme correspondant aux valeurs de classification les plus récentes disponibles dans le RE pour l'unité et la période de référence de l'enquête. Les domaines peuvent différer des strates d'échantillonnage originales, parce que les unités peuvent avoir changé de taille, d'industrie ou d'emplacement. Les changements de classification sont reflétés immédiatement dans les estimations et ne sont pas cumulés au cours du temps. Pour la partie non observée de la population, les ventes sont estimées à l’aide de modèles statistiques exploitant les ventes assujetties à la TPS exprimées sous forme mensuelle.

Pour en savoir plus sur la méthode utilisée lors de la modélisation des ventes tirées de fichiers administratifs, veuillez consulter le document intitulé Enquête mensuelle sur le commerce de détail : Utilisation de données administratives sous la rubrique ‘Documentation’ du BMDI.

La variance est la mesure de précision utilisée dans le cas de l'EMCD pour évaluer la qualité de l'estimation des paramètres de population et pour obtenir des inférences valides. Pour la partie observée de la population, la variance est calculée directement à partir d'un échantillon aléatoire simple stratifié sans remise.

Les estimations d'échantillon peuvent différer de la valeur prévue des estimations. Cependant, puisque l'estimation est fondée sur un échantillon probabiliste, il est possible d'évaluer la variabilité de l'estimation d'échantillon par rapport à la valeur prévue. La variance d'une estimation est une mesure de la précision de l'estimation d'échantillon qui est définie comme étant la moyenne, sur tous les échantillons possibles, de l'écart quadratique de l'estimation par rapport à sa valeur prévue.

11. Révisions et désaisonnalisation

Les données brutes sont révisées, sur une base mensuelle, pour le mois précédant immédiatement le mois de référence en cours qui fait l'objet de la publication. C'est donc dire que lorsque les données pour décembre sont publiées pour la première fois, on procédera aussi à des révisions, au besoin, à l'égard des données brutes pour novembre. En outre, des révisions sont aussi effectuées une fois par année, au moment de la première publication des données de février, pour tous les mois de l'année précédente. On vise ainsi à corriger tout problème important que l'on ait décelé et qui s'applique pour une période prolongée. La période de révision proprement dite dépend de la nature du problème décelé, mais elle ne dépasse rarement trois ans. Toutefois, la période de révision peut être plus longue lors de révisions historiques ou de restratification.

Depuis avril 2008, les données de l'Enquête mensuelle sur le commerce de détail sont désaisonnalisées en utilisant la méthode X12-ARIMA. Cette technique consiste essentiellement, dans un premier temps, à extrapoler une année de données brutes avec des modèles ARIMA (modèles autorégressifs à moyennes mobiles intégrées); et dans un deuxième temps, à désaisonnaliser la série brute prolongée par la méthode X-11. Ensuite, les données désaisonnalisées sont ajustées aux totaux annuels des données brutes.

Les données désaisonnalisées doivent aussi être révisées. Elles doivent notamment rendre compte des révisions déterminées pour les données brutes. Par ailleurs, les estimations désaisonnalisées sont calculées à partir de X-12-ARIMA, et la tendance est sensible aux valeurs les plus récentes déclarées dans les données brutes. C'est pourquoi, au moment de la diffusion de nouvelles données pour chaque mois, les valeurs désaisonnalisées pour les trois mois précédents sont révisées. Les séries de données désaisonnalisées sont des données chronologiques qui ont été modifiées pour éliminer l’effet des influences saisonnières et du calendrier.  Pour cette raison, la désaisonnalisation des données permet des comparaisons plus significatives des conditions économiques d’un mois à l’autre.

Une fois par année, les options de désaisonnalisation sont révisées afin d'intégrer les données les plus récentes. Des estimations désaisonnalisées révisées pour chacun des mois des années civiles précédentes sont diffusées en même temps que la révision annuelle des données brutes. La période exacte de révision dépend de la période de révision des données brutes.

12. Évaluation de la qualité des données

La méthodologie de l'enquête a pour objectif de contrôler les erreurs et de réduire leurs effets éventuels sur les estimations. Les résultats de l'enquête peuvent néanmoins contenir des erreurs dont l'erreur d'échantillonnage n'est que l'une des composantes. L'erreur d'échantillonnage survient lorsque les observations sont faites uniquement sur un échantillon et non sur l'ensemble de la population. Toutes les autres erreurs commises aux diverses phases de l'enquête sont appelées erreurs non dues à l'échantillonnage. Des erreurs de ce type peuvent survenir, par exemple, quand un répondant fournit des renseignements erronés ou qu'il ne répond pas à certaines questions; quand une unité du champ de l'enquête y est incluse erronément ou que des erreurs sont commises lors du traitement des données, comme des erreurs de codage ou de saisie.

Avant la publication, on analyse les résultats combinés de l'enquête afin d'en évaluer la comparabilité; il s'agit généralement d'un examen détaillé des réponses individuelles (particulièrement celles des grandes entreprises), de la conjoncture économique générale et des tendances historiques.

Une mesure habituelle de la qualité des données des enquêtes est le coefficient de variation (CV). Le coefficient de variation, défini comme étant l'erreur-type divisée par l'estimation d'échantillon, est une mesure de la précision relative. Puisque le coefficient de variation est calculé d'après les réponses des unités individuelles, il mesure aussi certaines erreurs non dues à l'échantillonnage.

La formule utilisée pour calculer le coefficient de variation (CV) en pourcentage est :

CV (X) = S(X) * 100% / X
où X représente l'estimation et S(X) représente l'erreur-type de X.

On peut construire les intervalles de confiance autour des estimations en utilisant l'estimation et le CV. Donc, pour notre échantillon, il est possible de déclarer avec un niveau donné de confiance que la valeur prévue sera comprise dans l'intervalle de confiance construit autour de l'estimation. Par exemple, si une estimation de 12 millions de dollars à un CV de 2 %, l'erreur-type sera de 240 000 $ (l'estimation multipliée par le CV). On peut déclarer avec 68 % de confiance que les valeurs prévues seront comprises dans l'intervalle dont la longueur est égale à un écart type de part et d'autre de l'estimation, c'est-à-dire entre 11 760 000 $ et 12 240 000 $. Ou bien, nous pouvons déclarer avec 95 % de confiance que la valeur prévue sera comprise dans l'intervalle dont la longueur est égale à deux écarts types de part et d'autre de l'estimation, c'est-à-dire entre 11 520 000 $ et 12 480 000 $.

Enfin, étant donné la faible contribution de la partie non observée de la population aux estimations totales, le biais dans la partie non observée a un effet négligeable sur les CV. Par conséquent, on utilise le CV provenant de la partie observée pour l'estimation totale qui est égale à la somme des estimations pour les parties observée et non observée de la population.

13. Contrôle de la divulgation

La loi interdit à Statistique Canada de rendre publique toute donnée susceptible de révéler l'information recueillie en vertu de la Loi sur la statistique et se rapportant à toute personne, entreprise ou organisation reconnaissable, sans que cette personne, entreprise ou organisation le sache ou y consente par écrit. Diverses règles de confidentialité s'appliquent à toutes les données diffusées ou publiées afin d'empêcher la publication ou la divulgation de toute information jugée confidentielle. Au besoin, des données sont supprimées pour empêcher la divulgation directe ou par recoupement de données reconnaissables.

L'analyse de la confidentialité des données inclut la détection de la « divulgation directe » éventuelle, qui survient lorsque la valeur figurant dans une cellule d'un tableau ne correspond qu'à quelques répondants ou que la cellule est dominée par un petit nombre d'entreprises.

Enquête mensuelle sur le commerce de détail (EMCD) – Énoncé de la qualité des données

Objectifs, utilisation et utilisateurs
Concepts, variables et classifications
Couverture et bases de sondage
Échantillonnage
Conception du questionnaire
Réponse et non-réponse
Opérations de collecte et de saisie des données
Vérification
Imputation
Estimation
Révisions et désaisonnalisation
Évaluation de la qualité des données
Contrôle de la divulgation

1. Objectifs, utilisation et utilisateurs

1.1. Objectifs

L’Enquête mensuelle sur le commerce de détail (EMCD) fournit des renseignements sur la performance du secteur du commerce de détail et, quand les données sont combinées à d’autres statistiques, représente un important indicateur de l'état de l’économie canadienne.

1.2. Utilisation

Les estimations fournissent une mesure de la santé et de la performance du secteur du commerce de détail. L'information recueillie est utilisée pour estimer le niveau et la tendance mensuelle des ventes ainsi que le nombre d’emplacements. À la fin de chaque année, les estimations donnent un premier aperçu de la valeur annuelle des ventes au détail et de la performance du secteur.

1.3. Utilisateurs

Divers organismes, associations sectorielles et gouvernements utilisent l'information. Les détaillants utilisent les résultats de l'enquête pour comparer leurs résultats à ceux d'entreprises similaires, ainsi qu'à des fins de marketing. Les associations de détaillants peuvent surveiller la performance de leur industrie et promouvoir les industries du commerce de détail. Les investisseurs peuvent surveiller la croissance de l'industrie, ce qui peut donner aux détaillants un meilleur accès au capital d'investissement. Les données de l'enquête aident les administrations à comprendre le rôle des détaillants dans l'économie, ce qui facilite l'élaboration des politiques et des encouragements fiscaux. Le commerce de détail étant un important secteur de l'économie canadienne, les données permettent aux administrations de déterminer plus exactement la santé globale de l'économie grâce à l'utilisation des estimations dans le calcul du produit intérieur brut (PIB) national.

2. Concepts, variables et classifications

2.1. Concepts

Le secteur du commerce de détail comprend les établissements dont l’activité principale consiste à vendre des marchandises au détail, généralement sans transformation, et à fournir des services connexes.

Le commerce de détail représente le dernier maillon de la chaîne de distribution; les détaillants sont donc organisés pour vendre des marchandises en petites quantités au grand public. Ce secteur comprend deux grands types d’établissements : les détaillants en magasin et les détaillants hors magasin. L’EMCD couvre uniquement les détaillants en magasin. Leurs principales caractéristiques sont décrites ci-après.

Les détaillants en magasin exploitent des points de vente fixes, situés et conçus de manière à attirer un grand nombre de passants. De façon générale, les magasins de détail ont de grands étalages et font de la publicité dans les médias. Ils vendent surtout des biens de consommation qui intéressent les particuliers ou les ménages, mais certains servent aussi les entreprises et une clientèle institutionnelle. Parmi ces établissements, on compte les magasins de fournitures de bureau, les magasins d’ordinateurs et de logiciels, les stations-service, les vendeurs de matériaux de construction, les magasins de fournitures de plomberie et de fournitures électriques.

En plus de vendre des marchandises, certains types de détaillants fournissent des services après-vente, comme des services de réparation et d’installation. Ainsi, les concessionnaires d’automobiles neuves, les magasins d’électronique et d’appareils ménagers, et les magasins d’instruments et de fournitures de musique assurent fréquemment un service de réparation, alors que les magasins de revêtements de sol et les magasins de garnitures de fenêtres fournissent souvent des services d’installation. En règle générale, les établissements qui vendent des marchandises au détail et qui ont un service après-vente sont classés dans ce secteur.

Les salles d’exposition des sociétés de vente sur catalogue, les stations-service et les marchands de maisons mobiles sont assimilés à des détaillants en magasin.

2.2. Variables

Les ventes sont définies comme étant les ventes de toutes les marchandises achetées pour la revente, nettes des rendus et des escomptes. Sont inclus les honoraires et les commissions résultant de la vente de biens et de services pour le compte de tiers, comme la vente de billets de loterie, de billets d’autobus et de cartes de téléphone. Sont également inclus les recettes provenant des pièces et de la main-d’oeuvre utilisées pour les services d'entretien et de réparation, les revenus de location et de location à bail de biens et de matériel, les revenus provenant de services, y compris les services de restauration, les ventes de biens fabriqués en tant qu’activité secondaire et la valeur des marchandises prélevées par le propriétaire pour son usage personnel. Sont exclus les autres revenus de location de biens immobiliers, les frais de placement, les subventions d’exploitation et autres, les redevances et les droits de franchise.

L’emplacement d’affaires comprend le ou les emplacements physiques où a lieu l’activité commerciale dans chaque province et territoire et dont les ventes sont créditées ou comptabilisées dans les états financiers de l’entreprise. Pour les détaillants, il s’agit normalement d’un magasin.

Dollars constants : La valeur du commerce de détail est mesurée de deux façons : par la prise en compte des effets de la variation des prix sur la valeur des ventes et par l’élimination des effets de la variation des prix. La première mesure est la valeur des ventes au détail en dollars courants et la seconde, la valeur des ventes au détail en dollars constants. Pour calculer l’estimation en dollars courants, on agrège la valeur des ventes pondérées de tous les points de vente au détail. Pour calculer l’estimation en dollars constants, il faut d’abord rajuster la valeur des ventes par rapport à une année de base en utilisant l’Indice des prix à la consommation, puis additionner les valeurs résultantes.

2.3. Classification

L’Enquête mensuelle sur le commerce de détail est fondée sur la définition du commerce de détail adoptée dans le SCIAN (Système de classification des industries de l’Amérique du Nord). Le SCIAN est le cadre commun reconnu pour la production de statistiques comparables par les organismes statistiques du Canada, du Mexique et des États-Unis. L’accord définit les limites de 20 secteurs. Le SCIAN est fondé sur un cadre conceptuel axé sur la production, ou l’offre, en ce sens que les établissements sont regroupés en classes ou branches d’activité d’après la similarité des processus utilisés pour produire les biens et les services.

Les estimations sont calculées pour 21 groupes fondés sur des agrégations spéciales du Système de classification des industries de l’Amérique du Nord (SCIAN) de 2012. Les 21 groupes sont en outre agrégés en onze sous-secteurs.

Du point de vue géographique, les estimations des ventes sont produites pour le Canada et pour chaque province et territoire.

3. Couverture et bases de sondage

La base de sondage de l'Enquête mensuelle sur le commerce de détail (EMCD) est le Registre des entreprises (RE) de Statistique Canada. Ce dernier est une liste structurée d'entreprises productrices de biens et de services au Canada. Cette base de données tenue à jour centralement contient des renseignements détaillés sur la plupart des entités commerciales exploitées au Canada. Le RE couvre toutes les entreprises constituées en société, avec ou sans employés. Pour les entreprises non constituées en société, le RE comprend toutes les entreprises ayant des employés, ainsi que les entreprises sans employés ayant des ventes annualisées provenant d'un compte de la taxe sur les produits et services (TPS) ou un revenu annuel provenant de la déclaration d'impôt individuelle.

Dans le RE, les entreprises sont représentées selon une structure hiérarchique à quatre niveaux ayant pour sommet l'entreprise statistique suivie, par ordre décroissant, par la compagnie statistique, l'établissement statistique et l'emplacement statistique. Une entreprise peut être reliée à une ou à plusieurs compagnies statistiques, une compagnie statistique à un ou à plusieurs établissements statistiques et un établissement statistique à un ou à plusieurs emplacements statistiques.

La population cible de l'EMCD comprend tous les établissements statistiques figurant dans le RE, excluant les entreprises non constituées en société n'ayant pas d'employés dont les ventes annuelles sont inférieures à 30 000 $, qui sont classés dans le secteur du commerce de détail d'après le Système de classification des industries de l'Amérique du Nord (SCIAN) (environ 200 000 établissements). La fourchette de codes du SCIAN pour le secteur du commerce de détail varie de 441100 à 453999. Un établissement statistique est l'entité de production ou le plus petit groupe d'entités de production qui produit un ensemble de biens ou de services homogènes, dont les activités ne débordent pas les frontières provinciales/territoriales, et qui est en mesure de fournir des données sur la valeur de la production, ainsi que sur le coût des matières utilisées et le coût et l'importance de la main-d'oeuvre affectée à la production. L'entité de production est l'unité physique où se déroulent les activités de l'entreprise. Elle doit avoir une adresse de voirie et une main-d'oeuvre directement affectée au processus de production.

Sont exclus de la population cible les établissements auxiliaires (producteurs de services de soutien de l'activité de production de biens et services destinés au marché de plus d'un établissement au sein de l'entreprise, et qui sont considérés comme un centre de coûts ou un centre de dépenses discrétionnaires pour lequel les données sur tous les coûts, y compris la main-d'oeuvre et l'amortissement, peuvent être déclarées par l'entreprise), les futurs établissements, les établissements pour lesquels les signaux économiques indiquent un revenu manquant ou nul, et les établissements appartenant aux catégories du SCIAN non couvertes qui suivent :

  • 4541 (entreprises de télémagasinage et de vente par correspondance)
  • 4542 (exploitants de distributeurs automatiques)
  • 45431 (marchands de combustible)
  • 45439 (autres établissements de vente directe)

4. Échantillonnage

L'échantillon de l'EMCD est formé de 10 000 groupes d'établissements (grappes) classés dans le secteur du commerce de détail et sélectionnés à partir du Registre des entreprises de Statistique Canada. Par définition, une grappe d'établissements comprend tous les établissements appartenant à une entreprise statistique qui font partie d'un même groupe industriel et d'une même région géographique. L’EMCD est fondée sur un plan d'échantillonnage stratifié avec sélection d'un échantillon aléatoire simple dans chaque strate. La stratification est faite selon des groupes industriels (majoritairement mais non exclusivement des SCIAN à quatre chiffres) et selon la région géographique, c'est-à-dire selon la province ou le territoire. Ensuite, la population est stratifiée selon la taille de l'établissement. La mesure de taille est créée en combinant des données provenant d'enquêtes indépendantes et trois variables administratives, à savoir le revenu annuel profilé, les ventes assujetties à la TPS exprimées sur une base annuelle et le revenu de la déclaration d’impôt (T1 ou T2).

Les strates de taille comptent une strate à tirage complet (recensement), au moins deux strates à tirage partiel (échantillonnées partiellement) et une strate à tirage nul (non échantillonnée). La strate à tirage nul est destinée à réduire le fardeau de réponse en excluant les entreprises les plus petites de la population observée. Ces entreprises représentent, en principe, au plus 10 % du total des ventes. Au lieu d'envoyer un questionnaire à ces entreprises, on produit les estimations d'après des données administratives.

L'échantillon est réparti de façon optimale afin d'atteindre les coefficients de variation cibles au niveau du Canada dans son ensemble, de la province ou du territoire, de l’industrie et des groupes industriels selon la province ou le territoire. On procède aussi à un suréchantillonnage pour tenir compte des unités disparues, non répondantes ou classées incorrectement.

L'EMCD est une enquête répétée avec maximisation du chevauchement des échantillons mensuels. On retient l'échantillon d’un mois à l’autre et, chaque mois, on y ajoute de nouvelles unités (naissances). Pour découvrir les nouvelles unités visées par l'EMCD, c'est-à-dire les nouvelles grappes d'établissement(s), on examine chaque mois l'univers le plus récent du RE. On stratifie ces nouvelles unités conformément aux mêmes critères que ceux appliqués à la population initiale, puis on les échantillonne conformément à la fraction d'échantillonnage de la strate à laquelle elles appartiennent et on les ajoute à l'échantillon mensuel. Des disparitions d'entité surviennent également chaque mois. Une entité disparue peut être une grappe d'établissements qui ont cessé leurs activités (fermeture) ou dont les activités principales ne se rattachent plus au commerce de détail (hors du champ). La situation de ces entreprises est mise à jour dans le RE d'après des renseignements de source administrative et les commentaires reçus lors des enquêtes, y compris ceux des entreprises prenant part à l'EMCD. Les méthodes suivies pour traiter les unités disparues et les unités classées incorrectement font partie des procédures d'échantillonnage et de mise à jour de la population.

5. Conception du questionnaire

L’Enquête mensuelle sur le commerce de détail englobe les sous-enquêtes suivantes :

Enquête mensuelle sur le commerce de détail – R8

Enquête mensuelle sur le commerce de détail (avec les stocks) – R8

Enquête sur les ventes et stocks de boissons alcooliques

Le questionnaire est conçu pour recueillir mensuellement auprès d'un échantillon de détaillants des données sur les ventes au détail, sur le nombre d'emplacements commerciaux par province ou territoire et sur les stocks de biens possédés et destinés à la revente. Lors du remaniement de 2004, la plupart des questionnaires n'ont subi que des changements de présentation. Le questionnaire sur les ventes et les stocks de boissons alcooliques a subi des modifications plus importantes. Les modifications ont été discutées avec les intervenants et les répondants ont eu l'occasion de faire des commentaires avant que le nouveau questionnaire ne soit finalisé. Si d'autres modifications devaient être apportées à l'un des questionnaires, les changements proposés seraient soumis à un comité d'examen et ferait l'objet d'un essai sur le terrain auprès de répondants et d'utilisateurs de données pour s'assurer de leur pertinence.

6. Réponse et non-réponse

6.1. Réponse et non-réponse

Bien que les gestionnaires d'enquête et les employés des opérations fassent tout leur possible pour maximiser la réponse à l'EMCD, un certain degré de non-réponse a lieu. Pour qu'un établissement statistique soit considéré comme répondant, il faut que le degré de réponse partielle (situation où une réponse exacte n'est obtenue que pour certaines questions posées au répondant) atteigne un seuil minimal au-dessous duquel la déclaration fournie par l'établissement serait rejetée et l'établissement, considéré comme une unité non répondante. Le cas échéant, on considère que l'entreprise n'a pas répondu du tout.

La non-réponse a deux effets sur les données : premièrement, elle introduit un biais dans les estimations si les non-répondants diffèrent des répondants en ce qui concerne les caractéristiques mesurées et, deuxièmement, elle fait augmenter la variance d'échantillonnage des estimations, parce que la taille effective de l'échantillon est réduite comparativement à celle considérée au départ.

L'ampleur des efforts déployés pour obtenir une réponse auprès d'un non-répondant dépend des contraintes budgétaires et de temps, de l'effet de la non-réponse sur la qualité globale et du risque de biais dû à la non-réponse.

La méthode principalement utilisée pour réduire l'effet de la non-réponse à l'étape de l'échantillonnage consiste à augmenter la taille de l'échantillon en appliquant un taux de suréchantillonnage déterminé d'après les résultats d'enquêtes similaires.

Les cas de non-réponse qui surviennent malgré les méthodes appliquées aux étapes de l'échantillonnage et de la collecte pour réduire l'effet de la non-réponse sont traités par imputation.

Afin de déterminer l'importance de la non-réponse qui a lieu chaque mois, on calcule divers taux de réponse. Pour un mois de référence donné, on produit les estimations au moins deux fois (estimations provisoires et estimations révisées). Entre les deux exécutions, certaines données fournies par les répondants peuvent être jugées inutilisables et des valeurs imputées peuvent être corrigées au moyen de données fournies par les répondants. Par conséquent, les taux de réponse sont calculés après chaque exécution du processus d'estimation.

Pour l'EMCD, deux types de taux sont calculés (non pondérés et pondérés). Afin d'évaluer l'efficacité du processus de collecte, on calcule les taux de réponse non pondérés. Les taux pondérés, fondés sur le poids d'estimation et la valeur de la variable d'intérêt, évaluent la qualité de l'estimation. À l'intérieur de chacun de ces types de taux, il existe des taux distincts pour les unités faisant partie de l'échantillon et pour les unités qui sont uniquement modélisées à partir de données administratives qui ont été extraites des fichiers de TPS.

Afin d’obtenir une meilleure idée du succès du processus de collecte de données, on calcule deux taux non pondérés appelés « taux de résultat de la collecte » et « taux de résultat de l'extraction ». On calcule ces taux en divisant le nombre de répondants par le nombre d'unités avec lesquelles on a essayé de prendre contact ou pour lesquelles on a essayé de recevoir des données extraites. Les déclarants non mensuels (répondants bénéficiant de modalités de déclaration spéciales leur permettant de ne pas produire de déclaration chaque mois, mais pour lesquels des données réelles sont disponibles lors des révisions subséquentes) sont exclus du numérateur ainsi que du dénominateur pour les mois où aucun contact n'est pris avec eux. Brièvement, les divers taux de réponse se calculent comme suit :

Taux pondérés :

Taux de réponse des unités faisant partie de l'échantillon (estimation) =
Somme des ventes pondérées des unités avec situation de réponse i / Somme des ventes pondérées des unités faisant partie de l'échantillon

i = unités pour lesquelles il existe des données déclarées qui seront utilisées dans l'estimation ou qui sont des refus convertis, ou pour lesquelles il existe des données déclarées qui n'ont pas encore été évaluées pour l'estimation.

Taux de réponse des unités modélisées à partir de données administratives (estimation) = Somme des ventes pondérées des unités avec situation de réponse ii / Somme des ventes pondérées des unités modélisées à partir de données administratives

ii = unités pour lesquelles il existe des données extraites des fichiers administratifs et qui sont utilisables pour l'estimation.

Taux de réponse total (estimation) =
Somme des ventes pondérées des unités avec situation de réponse i ou situation de réponse ii / Somme de toutes les ventes pondérées

Taux non pondérés :

Taux de réponse des unités faisant partie de l'échantillon (collecte) =
Nombre de questionnaires avec situation de réponse iii / Nombre de questionnaires avec situation de réponse iv

iii = unités pour lesquelles il existe des données déclarées (dont le cas n'est pas résolu, utilisées ou non utilisées pour l'estimation) ou qui sont des refus convertis;

iv = toutes les unités susmentionnées, ainsi que les unités qui ont refusé de répondre, les unités avec lesquelles on n'a pas pris contact et d'autres types d'unités non répondantes.

Taux de réponse des unités modélisées à partir de données administratives (extraction) =
Nombre de questionnaires avec situation de réponse vi / Nombre de questionnaires avec situation de réponse vii

vi = unités dans le champ d'observation pour lesquelles il existe des données (utilisables ou non utilisables) extraites des fichiers administratifs;

vii = toutes les unités susmentionnées, ainsi que les unités qui ont refusé de déclarer la source de données administratives, les unités avec lesquelles on n'a pas pris contact et d'autres types d'unités non répondantes.

(% de questionnaires recueillis par rapport à l'ensemble des questionnaires dans le champ d'observation)

Taux de résultat de la collecte =
Nombre de questionnaires avec situation de réponse iii / Nombre de questionnaires avec situation de réponse viii

iii = même que iii défini plus haut;

viii = même que iv, à part l'exclusion des unités avec lesquelles on a pris contact, parce que leur réponse n'est pas disponible pour un mois particulier, puisqu'il s'agit de déclarants non mensuels.

Taux de résultat de l'extraction =
Nombre de questionnaires avec situation de réponse ix / Nombre de questionnaires avec situation de réponse vii

ix = même que vi, avec l'ajout des unités extraites qui ont été imputées ou qui étaient hors du champ de l'enquête;

où vii = même que vii défini plus haut.

(% de questionnaires recueillis par rapport à l'ensemble des questionnaires dans le champ d'observation que nous avons tenté de recueillir)

Tous les taux pondérés et non pondérés susmentionnés sont calculés au niveau du groupe industriel, de la région et du groupe de taille, ainsi que pour toute combinaison de ces niveaux.

Utilisation des données administratives

Réduire le fardeau de réponse est un défi à long terme pour Statistique Canada. Afin d’alléger le fardeau de réponse et de réduire les coûts reliés à l’enquête, notamment en ce qui a trait aux petites entreprises, l’EMCD a réduit le nombre d’établissements simples de l’échantillon qui sont enquêtés directement et dérive plutôt les chiffres de vente pour ces établissements à partir des fichiers de la TPS en utilisant un modèle statistique. Le modèle explique les différences entre les ventes et les recettes déclarées aux fins de la TPS, ainsi que le décalage entre la période de référence de l’enquête et celle de la TPS.

Pour en savoir plus sur la méthode utilisée lors de la modélisation des ventes tirées de fichiers administratifs, veuillez consulter le document intitulé Enquête mensuelle sur le commerce de détail : Utilisation de données administratives sous la rubrique ‘Documentation’ du BMDI.

Le tableau 1 contient les fractions de réponses pondérées pour tous les groupes industriels ainsi que pour toutes les provinces et territoires. Pour des fractions de réponses pondérées plus détaillées, veuillez contacter la section du marketing et de la diffusion au (613) 951-3549, sans frais: 1-877-421-3067 or par courriel à retailinfo@statcan.

6.2. Méthodes utilisées pour réduire la non-réponse durant la collecte

Beaucoup d’efforts sont déployés en vue de réduire au minimum la non-réponse durant la collecte. Les méthodes utilisées incluent des techniques d'interview, comme l'utilisation de questions d'approfondissement et des techniques de persuasion, la replanification répétée des appels téléphoniques pour obtenir l'information et la mise en place de procédures indiquant aux intervieweurs comment s'y prendre avec les répondants qui refusent de participer à l'enquête.

Si les données demandées ne sont pas disponibles au moment de la collecte, la meilleure estimation fournie par le répondant est acceptée et est révisée par la suite, quand les données réelles sont disponibles.

Pour réduire au minimum la non-réponse totale pour toutes les variables, des réponses partielles sont acceptées. En outre, les questionnaires sont personnalisés pour la collecte de certaines variables, comme les stocks, de sorte que la collecte ait lieu durant les mois où les données sont disponibles.

Enfin, pour établir un climat de confiance entre les intervieweurs et les répondants, les cas sont généralement affectés au même intervieweur chaque mois. Ce dernier peut ainsi établir une relation personnelle avec le répondant et renforcer sa confiance.

7. Opérations de collecte et de saisie des données

La collecte des données est réalisée par les bureaux régionaux de Statistique Canada.

Tableau 1: Fractions de réponse pondérées par SCIAN et pour les provinces et territoires, octobre 2015 :
Sommaire du tableau
Le tableau montre les résultats de Tableau 1: Fractions de réponse pondérées par SCIAN et pour les provinces et territoires Fractions de réponse pondérées(figurant comme en-tête de colonne).
  Fractions de réponse pondérées
SCIAN - Canada      
Concessionnaires de véhicules et de pièces automobiles 92,4 92,7 77,2
Concessionnaires d'automobiles 94,1 94,3 80,0
Concessionnaires d'automobiles neuves 95,5 95,5 ...
Concessionnaires d'automobiles d'occasion 74,3 73,5 80,0
Autres concessionnaires de véhicules automobiles 72,5 71,0 79,9
Magasins de pièces, de pneus et d' accessoires pour véhicules automobiles 82,6 83,9 71,4
Magasins de meubles et d'accessoires de maison 79,7 81,9 60,5
Magasins de meubles 77,4 78,5 60,0
Magasins d'accessoires de maison 83,8 89,2 60,8
Magasin d'appareils électroniques et ménagers 81,8 82,2 64,2
Marchands de matériaux de construction et de matériel et fournitures de jardinage 91,9 92,9 83,6
Magasins d'alimentation 87,1 88,4 69,3
Épiceries 90,5 92,0 72,1
Supermarchés et autres épiceries (sauf les dépanneurs) 92,4 93,7 74,4
Dépanneurs 63,6 64,8 56,6
Magasins d'alimentation spécialisés 64,0 66,7 51,6
Magasins de bière, de vin et de spiritueux 79,8 80,0 69,0
Magasins de produits de santé et de soins personnels 84,6 84,5 86,0
Stations-service 72,7 72,2 82,1
Magasins de vêtements et d'accessoires vestimentaires 84,1 85,5 32,5
Magasins de vêtements 83,0 84,5 24,9
Magasins de chaussures 88,3 88,7 54,6
Bijouteries et magasins de bagages et de maroquinerie 88,0 89,9 57,5
Magasins d'articles de sport, d'articles de passe-temps, d'articles de musique et de livres 86,1 90,9 28,5
Magasins de marchandises diverses 99,0 99,2 72,2
Grands magasins 100,0 100,0 ...
Autres magasins de marchandises diverses 98,3 98,6 72,2
Magasins de détail divers 80,4 82,7 55,0
Total 88,0 88,8 71,2
Régions      
Terre-Neuve-et-Labrador 87,3 88,0 64,2
Île-du-Prince-Édouard 80,5 81,1 40,6
Nouvelle Écosse 90,8 90,8 90,9
Nouveau-Brunswick 87,6 88,9 62,2
Québec 88,3 89,6 70,2
Ontario 89,4 90,1 73,1
Manitoba 86,5 87,0 58,2
Saskatchewan 88,8 89,7 69,8
Alberta 87,4 88,2 69,3
Colombie-Britannique 85,0 85,5 71,8
Territoire du Yukon 85,6 85,6 ...
Territoires du Nord-Ouest 64,8 64,8 ...
Nunavut 77,2 77,2 ...

Fractions de réponse pondérées

Ces derniers envoient un questionnaire aux répondants ou communiquent avec ceux-ci par téléphone afin d'obtenir les valeurs de leurs ventes et de leurs stocks, et de confirmer l'ouverture ou la fermeture des emplacements d'affaires. Ils effectuent aussi un suivi auprès des non-répondants. La collecte des données débute environ sept jours ouvrables après la fin du mois de référence et se poursuit pendant tout le mois en question.

Les entités qui participent à l'enquête pour la première fois reçoivent une lettre d'introduction en vue d’informer le répondant qu'un représentant de Statistique Canada l'appellera. Cet appel a pour but de présenter l'enquête, de confirmer l'activité de l'entreprise, d'établir et de commencer la collecte des données, et de répondre à toutes questions que le répondant pourrait avoir.

8. Vérification

La vérification des données est l'application de contrôles pour déceler les entrées manquantes, invalides ou incohérentes, ou pour repérer les enregistrements de données susceptibles d'être erronés. Durant le processus d'enquête de l'EMCD, les données sont vérifiées à deux moments distincts.

Premièrement, une vérification est faite durant la collecte des données. Après leur collecte par téléphone ou au moyen du questionnaire à renvoyer par la poste, les données sont saisies à l'aide d'applications informatiques personnalisées. Toutes sont soumises à une vérification. Les contrôles réalisés durant la collecte des données, appelés contrôles sur le terrain, comprennent généralement des contrôles de validité et certains contrôles de cohérence simples. Ils servent aussi à déceler les erreurs commises durant l'interview par le répondant ou par l'intervieweur et de repérer l'information manquante à l'étape de la collecte en vue de réduire le besoin d'un suivi ultérieur. Les contrôles sur le terrain ont également pour but d'épurer les réponses. Dans le cas de l'EMCD, les réponses du mois courant sont comparées aux réponses fournies par le répondant le mois précédent et (ou) l'année précédente pour le mois courant. Les contrôles sur le terrain permettent de repérer les problèmes que posent les procédures de collecte des données et la conception des questionnaires, et de déterminer s'il faut offrir une formation supplémentaire aux intervieweurs.

Tout enregistrement de données rejeté lors des contrôles préliminaires fait l'objet d'un suivi auprès du répondant afin de valider les données soupçonnées d'être incorrectes. Une fois validé, les données recueillies sont transmises de façon régulière au Bureau central à Ottawa.

Deuxièmement, après la collecte, les données sont soumises à une vérification statistique dont la nature est plus empirique. On exécute la vérification statistique avant l'imputation, afin de repérer les données qui serviront de base pour l'imputation de valeurs pour les non-répondants. Les valeurs très extrêmes risquant de perturber une tendance mensuelle sont exclues des calculs de tendance lors de la vérification statistique. Il convient de souligner qu'aucun ajustement n'est fait à cette étape pour corriger les valeurs extrêmes déclarées.

La première étape de la vérification statistique consiste à repérer les réponses qui seront soumises aux règles de vérification statistique. Les données déclarées pour le mois de référence courant sont soumises à divers contrôles.

Le premier ensemble de contrôles est fondé sur la méthode d'Hidiroglou-Berthelot qui consiste à examiner le rapport des données du mois courant fournies par un répondant à des données historiques (c.-à-d. dernier mois ou même mois l'année précédente) ou administratives. Si le rapport calculé pour le répondant diffère significativement de ceux obtenus pour des répondants dont les caractéristiques sont comparables en ce qui concerne le groupe industriel et/ou la région géographique, la réponse est considérée comme une valeur extrême.

Le deuxième ensemble de contrôles est basé sur la vérification de la part de marché. Cette méthode, qui s'appuie sur les données du mois courant uniquement, permet de vérifier les données fournies par tous les répondants, mêmes ceux pour lesquels on ne dispose pas de données historiques ou de données auxiliaires. Par conséquent, parmi un groupe de répondants présentant des caractéristiques similaires en ce qui concerne le groupe industriel et (ou) la région géographique, toute valeur dont la contribution pondérée au total du groupe est trop importante sera considérée comme une valeur extrême.

Pour les contrôles fondés sur la méthode d'Hidiroglou-Berthelot, les données jugées extrêmes ne sont pas incluses dans les modèles d'imputation (ceux fondés sur les ratios). En outre, les données considérées comme des valeurs extrêmes lors de la vérification de la part de marché ne sont pas incluses dans les modèles d'imputation où les moyennes et les médianes sont calculées pour imputer des valeurs pour les réponses pour lesquelles il n'existe pas de données historiques.

Conjointement avec les vérifications statistiques effectuées après la collecte de données, on procède à la détection d’erreurs des données extraites des fichiers administratifs. Les données modélisées de la TPS sont également assujetties à une phase de vérification approfondie. Chaque fichier sur lequel les données modélisées sont fondées est vérifié de même que les valeurs modélisées. Les vérifications sont effectuées au niveau agrégé (industrie, géographie) afin de détecter les fichiers qui dévient de la norme (soit en exhibant des différences d’un mois à l’autre trop importantes ou qui diffèrent considérablement des autres unités. Toutes les données qui faillissent ces étapes de contrôle sont sujettes à une vérification manuelle, et si nécessaire, à une action corrective.

9. Imputation

Le processus d’imputation de l'EMCD a pour but de remplacer les données manquantes par des valeurs imputées. Des valeurs sont attribuées aux enregistrements pour lesquels la vérification a révélé des valeurs manquantes afin de s'assurer que les estimations soient de haute qualité et d'établir une cohérence interne plausible. Pour des raisons de fardeau de réponse, de coût et d'actualité des données, il est généralement impossible de réaliser auprès des répondants tous les suivis nécessaires pour résoudre les problèmes de réponses manquantes. Puisqu'il est souhaitable de produire un fichier de microdonnées complet et cohérent, on recourt à l'imputation pour traiter les cas persistants de données manquantes.

Dans le cas de l'EMCD, on peut fonder l'imputation des valeurs manquantes sur des données historiques ou sur des données administratives. Le choix de la méthode appropriée est fondé sur une stratégie qui dépend de l'existence de données historiques ou de données administratives et (ou) du mois de référence en question.

Il existe trois types de méthode d'imputation d'après des données historiques. Le premier est l’application d’une tendance générale qui s'appuie sur une source unique de données historiques (mois précédent, données recueillies pour le mois suivant ou données recueillies pour le même mois l'année précédente). Le deuxième est un modèle de régression dans lequel sont utilisées simultanément les données provenant du mois précédent et celles provenant du même mois l'année précédente. La troisième méthode consiste à remplacer directement les valeurs manquantes par des données historiques.

Selon le mois de référence, il existe, pour le choix de la méthode, un ordre de préférence en vue d'assurer une imputation de haute qualité. Le troisième type de méthode d'imputation historique est toujours la dernière option considérée pour chaque mois de référence.

La méthode d’imputation fondée sur des données administratives est sélectionnée automatiquement lorsqu'on ne dispose pas de données historiques pour un non-répondant.  Des tendances sont alors appliquées à la source de données administratives (mesure de taille mensuelle) selon que la structure est simple (entreprises ne comptant qu’un seul établissement) ou complexe.

10. Estimation

L'estimation est un processus qui consiste à calculer une valeur approximative des paramètres de population inconnus en utilisant uniquement la partie de la population qui est incluse dans un échantillon. Des inférences sont ensuite faites au sujet des paramètres inconnus en utilisant les données d'échantillon et les renseignements connexes sur le plan de sondage. Cette étape fait usage du Système généralisé d'estimation (SGE) de Statistique Canada.

Pour les ventes des détaillants, la population est divisée en une partie observée (strates à tirage complet et à tirage partiel) et une partie non observée (strate à tirage nul). D'après l'échantillon tiré à partir de la partie observée, on calcule une estimation pour la population au moyen d'un estimateur d'Horvitz-Thompson où les réponses concernant les ventes sont pondérées par l'inverse des probabilités d'inclusion des unités échantillonnées. Ces poids (appelés poids d'échantillonnage) peuvent être interprétés comme étant le nombre de fois que chaque unité échantillonnée devrait être répétée pour représenter la population complète. Les valeurs pondérées des ventes ainsi calculées sont totalisées par domaine, pour produire une estimation du total des ventes pour chaque combinaison des groupes industriels/région géographique. Un domaine est défini comme correspondant aux valeurs de classification les plus récentes disponibles dans le RE pour l'unité et la période de référence de l'enquête. Les domaines peuvent différer des strates d'échantillonnage originales, parce que les unités peuvent avoir changé de taille, d'industrie ou d'emplacement. Les changements de classification sont reflétés immédiatement dans les estimations et ne sont pas cumulés au cours du temps. Pour la partie non observée de la population, les ventes sont estimées à l’aide de modèles statistiques exploitant les ventes assujetties à la TPS exprimées sous forme mensuelle.

Pour en savoir plus sur la méthode utilisée lors de la modélisation des ventes tirées de fichiers administratifs, veuillez consulter le document intitulé Enquête mensuelle sur le commerce de détail : Utilisation de données administratives sous la rubrique ‘Documentation’ du BMDI.

La variance est la mesure de précision utilisée dans le cas de l'EMCD pour évaluer la qualité de l'estimation des paramètres de population et pour obtenir des inférences valides. Pour la partie observée de la population, la variance est calculée directement à partir d'un échantillon aléatoire simple stratifié sans remise.

Les estimations d'échantillon peuvent différer de la valeur prévue des estimations. Cependant, puisque l'estimation est fondée sur un échantillon probabiliste, il est possible d'évaluer la variabilité de l'estimation d'échantillon par rapport à la valeur prévue. La variance d'une estimation est une mesure de la précision de l'estimation d'échantillon qui est définie comme étant la moyenne, sur tous les échantillons possibles, de l'écart quadratique de l'estimation par rapport à sa valeur prévue.

11. Révisions et désaisonnalisation

Les données brutes sont révisées, sur une base mensuelle, pour le mois précédant immédiatement le mois de référence en cours qui fait l'objet de la publication. C'est donc dire que lorsque les données pour décembre sont publiées pour la première fois, on procédera aussi à des révisions, au besoin, à l'égard des données brutes pour novembre. En outre, des révisions sont aussi effectuées une fois par année, au moment de la première publication des données de février, pour tous les mois de l'année précédente. On vise ainsi à corriger tout problème important que l'on ait décelé et qui s'applique pour une période prolongée. La période de révision proprement dite dépend de la nature du problème décelé, mais elle ne dépasse rarement trois ans. Toutefois, la période de révision peut être plus longue lors de révisions historiques ou de restratification.

Depuis avril 2008, les données de l'Enquête mensuelle sur le commerce de détail sont désaisonnalisées en utilisant la méthode X12-ARIMA. Cette technique consiste essentiellement, dans un premier temps, à extrapoler une année de données brutes avec des modèles ARIMA (modèles autorégressifs à moyennes mobiles intégrées); et dans un deuxième temps, à désaisonnaliser la série brute prolongée par la méthode X-11. Ensuite, les données désaisonnalisées sont ajustées aux totaux annuels des données brutes.

Les données désaisonnalisées doivent aussi être révisées. Elles doivent notamment rendre compte des révisions déterminées pour les données brutes. Par ailleurs, les estimations désaisonnalisées sont calculées à partir de X-12-ARIMA, et la tendance est sensible aux valeurs les plus récentes déclarées dans les données brutes. C'est pourquoi, au moment de la diffusion de nouvelles données pour chaque mois, les valeurs désaisonnalisées pour les trois mois précédents sont révisées. Les séries de données désaisonnalisées sont des données chronologiques qui ont été modifiées pour éliminer l’effet des influences saisonnières et du calendrier.  Pour cette raison, la désaisonnalisation des données permet des comparaisons plus significatives des conditions économiques d’un mois à l’autre.

Une fois par année, les options de désaisonnalisation sont révisées afin d'intégrer les données les plus récentes. Des estimations désaisonnalisées révisées pour chacun des mois des années civiles précédentes sont diffusées en même temps que la révision annuelle des données brutes. La période exacte de révision dépend de la période de révision des données brutes.

12. Évaluation de la qualité des données

La méthodologie de l'enquête a pour objectif de contrôler les erreurs et de réduire leurs effets éventuels sur les estimations. Les résultats de l'enquête peuvent néanmoins contenir des erreurs dont l'erreur d'échantillonnage n'est que l'une des composantes. L'erreur d'échantillonnage survient lorsque les observations sont faites uniquement sur un échantillon et non sur l'ensemble de la population. Toutes les autres erreurs commises aux diverses phases de l'enquête sont appelées erreurs non dues à l'échantillonnage. Des erreurs de ce type peuvent survenir, par exemple, quand un répondant fournit des renseignements erronés ou qu'il ne répond pas à certaines questions; quand une unité du champ de l'enquête y est incluse erronément ou que des erreurs sont commises lors du traitement des données, comme des erreurs de codage ou de saisie.

Avant la publication, on analyse les résultats combinés de l'enquête afin d'en évaluer la comparabilité; il s'agit généralement d'un examen détaillé des réponses individuelles (particulièrement celles des grandes entreprises), de la conjoncture économique générale et des tendances historiques.

Une mesure habituelle de la qualité des données des enquêtes est le coefficient de variation (CV). Le coefficient de variation, défini comme étant l'erreur-type divisée par l'estimation d'échantillon, est une mesure de la précision relative. Puisque le coefficient de variation est calculé d'après les réponses des unités individuelles, il mesure aussi certaines erreurs non dues à l'échantillonnage.

La formule utilisée pour calculer le coefficient de variation (CV) en pourcentage est :

CV (X) = S(X) * 100% / X
où X représente l'estimation et S(X) représente l'erreur-type de X.

On peut construire les intervalles de confiance autour des estimations en utilisant l'estimation et le CV. Donc, pour notre échantillon, il est possible de déclarer avec un niveau donné de confiance que la valeur prévue sera comprise dans l'intervalle de confiance construit autour de l'estimation. Par exemple, si une estimation de 12 millions de dollars à un CV de 2 %, l'erreur-type sera de 240 000 $ (l'estimation multipliée par le CV). On peut déclarer avec 68 % de confiance que les valeurs prévues seront comprises dans l'intervalle dont la longueur est égale à un écart type de part et d'autre de l'estimation, c'est-à-dire entre 11 760 000 $ et 12 240 000 $. Ou bien, nous pouvons déclarer avec 95 % de confiance que la valeur prévue sera comprise dans l'intervalle dont la longueur est égale à deux écarts types de part et d'autre de l'estimation, c'est-à-dire entre 11 520 000 $ et 12 480 000 $.

Enfin, étant donné la faible contribution de la partie non observée de la population aux estimations totales, le biais dans la partie non observée a un effet négligeable sur les CV. Par conséquent, on utilise le CV provenant de la partie observée pour l'estimation totale qui est égale à la somme des estimations pour les parties observée et non observée de la population.

13. Contrôle de la divulgation

La loi interdit à Statistique Canada de rendre publique toute donnée susceptible de révéler l'information recueillie en vertu de la Loi sur la statistique et se rapportant à toute personne, entreprise ou organisation reconnaissable, sans que cette personne, entreprise ou organisation le sache ou y consente par écrit. Diverses règles de confidentialité s'appliquent à toutes les données diffusées ou publiées afin d'empêcher la publication ou la divulgation de toute information jugée confidentielle. Au besoin, des données sont supprimées pour empêcher la divulgation directe ou par recoupement de données reconnaissables.

L'analyse de la confidentialité des données inclut la détection de la « divulgation directe » éventuelle, qui survient lorsque la valeur figurant dans une cellule d'un tableau ne correspond qu'à quelques répondants ou que la cellule est dominée par un petit nombre d'entreprises.

Enquête mensuelle sur le commerce de détail (EMCD) – Énoncé de la qualité des données

Objectifs, utilisation et utilisateurs
Concepts, variables et classifications
Couverture et bases de sondage
Échantillonnage
Conception du questionnaire
Réponse et non-réponse
Opérations de collecte et de saisie des données
Vérification
Imputation
Estimation
Révisions et désaisonnalisation
Évaluation de la qualité des données
Contrôle de la divulgation

1. Objectifs, utilisation et utilisateurs

1.1. Objectifs

L’Enquête mensuelle sur le commerce de détail (EMCD) fournit des renseignements sur la performance du secteur du commerce de détail et, quand les données sont combinées à d’autres statistiques, représente un important indicateur de l'état de l’économie canadienne.

1.1. Utilisation

Les estimations fournissent une mesure de la santé et de la performance du secteur du commerce de détail. L'information recueillie est utilisée pour estimer le niveau et la tendance mensuelle des ventes ainsi que le nombre d’emplacements. À la fin de chaque année, les estimations donnent un premier aperçu de la valeur annuelle des ventes au détail et de la performance du secteur.

1.2. Utilisateurs

Divers organismes, associations sectorielles et gouvernements utilisent l'information. Les détaillants utilisent les résultats de l'enquête pour comparer leurs résultats à ceux d'entreprises similaires, ainsi qu'à des fins de marketing. Les associations de détaillants peuvent surveiller la performance de leur industrie et promouvoir les industries du commerce de détail. Les investisseurs peuvent surveiller la croissance de l'industrie, ce qui peut donner aux détaillants un meilleur accès au capital d'investissement. Les données de l'enquête aident les administrations à comprendre le rôle des détaillants dans l'économie, ce qui facilite l'élaboration des politiques et des encouragements fiscaux. Le commerce de détail étant un important secteur de l'économie canadienne, les données permettent aux administrations de déterminer plus exactement la santé globale de l'économie grâce à l'utilisation des estimations dans le calcul du produit intérieur brut (PIB) national.

2. Concepts, variables et classifications

2.1. Concepts

Le secteur du commerce de détail comprend les établissements dont l’activité principale consiste à vendre des marchandises au détail, généralement sans transformation, et à fournir des services connexes.

Le commerce de détail représente le dernier maillon de la chaîne de distribution; les détaillants sont donc organisés pour vendre des marchandises en petites quantités au grand public. Ce secteur comprend deux grands types d’établissements : les détaillants en magasin et les détaillants hors magasin. L’EMCD couvre uniquement les détaillants en magasin. Leurs principales caractéristiques sont décrites ci-après.

Les détaillants en magasin exploitent des points de vente fixes, situés et conçus de manière à attirer un grand nombre de passants. De façon générale, les magasins de détail ont de grands étalages et font de la publicité dans les médias. Ils vendent surtout des biens de consommation qui intéressent les particuliers ou les ménages, mais certains servent aussi les entreprises et une clientèle institutionnelle. Parmi ces établissements, on compte les magasins de fournitures de bureau, les magasins d’ordinateurs et de logiciels, les stations-service, les vendeurs de matériaux de construction, les magasins de fournitures de plomberie et de fournitures électriques.

En plus de vendre des marchandises, certains types de détaillants fournissent des services après-vente, comme des services de réparation et d’installation. Ainsi, les concessionnaires d’automobiles neuves, les magasins d’électronique et d’appareils ménagers, et les magasins d’instruments et de fournitures de musique assurent fréquemment un service de réparation, alors que les magasins de revêtements de sol et les magasins de garnitures de fenêtres fournissent souvent des services d’installation. En règle générale, les établissements qui vendent des marchandises au détail et qui ont un service après-vente sont classés dans ce secteur.

Les salles d’exposition des sociétés de vente sur catalogue, les stations-service et les marchands de maisons mobiles sont assimilés à des détaillants en magasin.

2.2. Variables

Les ventes sont définies comme étant les ventes de toutes les marchandises achetées pour la revente, nettes des rendus et des escomptes. Sont inclus les honoraires et les commissions résultant de la vente de biens et de services pour le compte de tiers, comme la vente de billets de loterie, de billets d’autobus et de cartes de téléphone. Sont également inclus les recettes provenant des pièces et de la main-d’oeuvre utilisées pour les services d'entretien et de réparation, les revenus de location et de location à bail de biens et de matériel, les revenus provenant de services, y compris les services de restauration, les ventes de biens fabriqués en tant qu’activité secondaire et la valeur des marchandises prélevées par le propriétaire pour son usage personnel. Sont exclus les autres revenus de location de biens immobiliers, les frais de placement, les subventions d’exploitation et autres, les redevances et les droits de franchise.

L’emplacement d’affaires comprend le ou les emplacements physiques où a lieu l’activité commerciale dans chaque province et territoire et dont les ventes sont créditées ou comptabilisées dans les états financiers de l’entreprise. Pour les détaillants, il s’agit normalement d’un magasin.

Dollars constants : La valeur du commerce de détail est mesurée de deux façons : par la prise en compte des effets de la variation des prix sur la valeur des ventes et par l’élimination des effets de la variation des prix. La première mesure est la valeur des ventes au détail en dollars courants et la seconde, la valeur des ventes au détail en dollars constants. Pour calculer l’estimation en dollars courants, on agrège la valeur des ventes pondérées de tous les points de vente au détail. Pour calculer l’estimation en dollars constants, il faut d’abord rajuster la valeur des ventes par rapport à une année de base en utilisant l’Indice des prix à la consommation, puis additionner les valeurs résultantes.

2.3. Classification

L’Enquête mensuelle sur le commerce de détail est fondée sur la définition du commerce de détail adoptée dans le SCIAN (Système de classification des industries de l’Amérique du Nord). Le SCIAN est le cadre commun reconnu pour la production de statistiques comparables par les organismes statistiques du Canada, du Mexique et des États-Unis. L’accord définit les limites de 20 secteurs. Le SCIAN est fondé sur un cadre conceptuel axé sur la production, ou l’offre, en ce sens que les établissements sont regroupés en classes ou branches d’activité d’après la similarité des processus utilisés pour produire les biens et les services.

Les estimations sont calculées pour 21 groupes fondés sur des agrégations spéciales du Système de classification des industries de l’Amérique du Nord (SCIAN) de 2012. Les 21 groupes sont en outre agrégés en onze sous-secteurs.

Du point de vue géographique, les estimations des ventes sont produites pour le Canada et pour chaque province et territoire.

3. Couverture et bases de sondage

La base de sondage de l'Enquête mensuelle sur le commerce de détail (EMCD) est le Registre des entreprises (RE) de Statistique Canada. Ce dernier est une liste structurée d'entreprises productrices de biens et de services au Canada. Cette base de données tenue à jour centralement contient des renseignements détaillés sur la plupart des entités commerciales exploitées au Canada. Le RE couvre toutes les entreprises constituées en société, avec ou sans employés. Pour les entreprises non constituées en société, le RE comprend toutes les entreprises ayant des employés, ainsi que les entreprises sans employés ayant des ventes annualisées provenant d'un compte de la taxe sur les produits et services (TPS) ou un revenu annuel provenant de la déclaration d'impôt individuelle.

Dans le RE, les entreprises sont représentées selon une structure hiérarchique à quatre niveaux ayant pour sommet l'entreprise statistique suivie, par ordre décroissant, par la compagnie statistique, l'établissement statistique et l'emplacement statistique. Une entreprise peut être reliée à une ou à plusieurs compagnies statistiques, une compagnie statistique à un ou à plusieurs établissements statistiques et un établissement statistique à un ou à plusieurs emplacements statistiques.

La population cible de l'EMCD comprend tous les établissements statistiques figurant dans le RE, excluant les entreprises non constituées en société n'ayant pas d'employés dont les ventes annuelles sont inférieures à 30 000 $, qui sont classés dans le secteur du commerce de détail d'après le Système de classification des industries de l'Amérique du Nord (SCIAN) (environ 200 000 établissements). La fourchette de codes du SCIAN pour le secteur du commerce de détail varie de 441100 à 453999. Un établissement statistique est l'entité de production ou le plus petit groupe d'entités de production qui produit un ensemble de biens ou de services homogènes, dont les activités ne débordent pas les frontières provinciales/territoriales, et qui est en mesure de fournir des données sur la valeur de la production, ainsi que sur le coût des matières utilisées et le coût et l'importance de la main-d'oeuvre affectée à la production. L'entité de production est l'unité physique où se déroulent les activités de l'entreprise. Elle doit avoir une adresse de voirie et une main-d'oeuvre directement affectée au processus de production.

Sont exclus de la population cible les établissements auxiliaires (producteurs de services de soutien de l'activité de production de biens et services destinés au marché de plus d'un établissement au sein de l'entreprise, et qui sont considérés comme un centre de coûts ou un centre de dépenses discrétionnaires pour lequel les données sur tous les coûts, y compris la main-d'oeuvre et l'amortissement, peuvent être déclarées par l'entreprise), les futurs établissements, les établissements pour lesquels les signaux économiques indiquent un revenu manquant ou nul, et les établissements appartenant aux catégories du SCIAN non couvertes qui suivent :

  • 4541 (entreprises de télémagasinage et de vente par correspondance)
  • 4542 (exploitants de distributeurs automatiques)
  • 45431 (marchands de combustible)
  • 45439 (autres établissements de vente directe)

4. Échantillonnage

L'échantillon de l'EMCD est formé de 10 000 groupes d'établissements (grappes) classés dans le secteur du commerce de détail et sélectionnés à partir du Registre des entreprises de Statistique Canada. Par définition, une grappe d'établissements comprend tous les établissements appartenant à une entreprise statistique qui font partie d'un même groupe industriel et d'une même région géographique. L’EMCD est fondée sur un plan d'échantillonnage stratifié avec sélection d'un échantillon aléatoire simple dans chaque strate. La stratification est faite selon des groupes industriels (majoritairement mais non exclusivement des SCIAN à quatre chiffres) et selon la région géographique, c'est-à-dire selon la province ou le territoire. Ensuite, la population est stratifiée selon la taille de l'établissement. La mesure de taille est créée en combinant des données provenant d'enquêtes indépendantes et trois variables administratives, à savoir le revenu annuel profilé, les ventes assujetties à la TPS exprimées sur une base annuelle et le revenu de la déclaration d’impôt (T1 ou T2).

Les strates de taille comptent une strate à tirage complet (recensement), au moins deux strates à tirage partiel (échantillonnées partiellement) et une strate à tirage nul (non échantillonnée). La strate à tirage nul est destinée à réduire le fardeau de réponse en excluant les entreprises les plus petites de la population observée. Ces entreprises représentent, en principe, au plus 10 % du total des ventes. Au lieu d'envoyer un questionnaire à ces entreprises, on produit les estimations d'après des données administratives.

L'échantillon est réparti de façon optimale afin d'atteindre les coefficients de variation cibles au niveau du Canada dans son ensemble, de la province ou du territoire, de l’industrie et des groupes industriels selon la province ou le territoire. On procède aussi à un suréchantillonnage pour tenir compte des unités disparues, non répondantes ou classées incorrectement.

L'EMCD est une enquête répétée avec maximisation du chevauchement des échantillons mensuels. On retient l'échantillon d’un mois à l’autre et, chaque mois, on y ajoute de nouvelles unités (naissances). Pour découvrir les nouvelles unités visées par l'EMCD, c'est-à-dire les nouvelles grappes d'établissement(s), on examine chaque mois l'univers le plus récent du RE. On stratifie ces nouvelles unités conformément aux mêmes critères que ceux appliqués à la population initiale, puis on les échantillonne conformément à la fraction d'échantillonnage de la strate à laquelle elles appartiennent et on les ajoute à l'échantillon mensuel. Des disparitions d'entité surviennent également chaque mois. Une entité disparue peut être une grappe d'établissements qui ont cessé leurs activités (fermeture) ou dont les activités principales ne se rattachent plus au commerce de détail (hors du champ). La situation de ces entreprises est mise à jour dans le RE d'après des renseignements de source administrative et les commentaires reçus lors des enquêtes, y compris ceux des entreprises prenant part à l'EMCD. Les méthodes suivies pour traiter les unités disparues et les unités classées incorrectement font partie des procédures d'échantillonnage et de mise à jour de la population.

5. Conception du questionnaire

L’Enquête mensuelle sur le commerce de détail englobe les sous-enquêtes suivantes :

Enquête mensuelle sur le commerce de détail – R8

Enquête mensuelle sur le commerce de détail (avec les stocks) – R8

Enquête sur les ventes et stocks de boissons alcooliques

Le questionnaire est conçu pour recueillir mensuellement auprès d'un échantillon de détaillants des données sur les ventes au détail, sur le nombre d'emplacements commerciaux par province ou territoire et sur les stocks de biens possédés et destinés à la revente. Lors du remaniement de 2004, la plupart des questionnaires n'ont subi que des changements de présentation. Le questionnaire sur les ventes et les stocks de boissons alcooliques a subi des modifications plus importantes. Les modifications ont été discutées avec les intervenants et les répondants ont eu l'occasion de faire des commentaires avant que le nouveau questionnaire ne soit finalisé. Si d'autres modifications devaient être apportées à l'un des questionnaires, les changements proposés seraient soumis à un comité d'examen et ferait l'objet d'un essai sur le terrain auprès de répondants et d'utilisateurs de données pour s'assurer de leur pertinence.

6. Réponse et non-réponse

6.1. Réponse et non-réponse

Bien que les gestionnaires d'enquête et les employés des opérations fassent tout leur possible pour maximiser la réponse à l'EMCD, un certain degré de non-réponse a lieu. Pour qu'un établissement statistique soit considéré comme répondant, il faut que le degré de réponse partielle (situation où une réponse exacte n'est obtenue que pour certaines questions posées au répondant) atteigne un seuil minimal au-dessous duquel la déclaration fournie par l'établissement serait rejetée et l'établissement, considéré comme une unité non répondante. Le cas échéant, on considère que l'entreprise n'a pas répondu du tout.

La non-réponse a deux effets sur les données : premièrement, elle introduit un biais dans les estimations si les non-répondants diffèrent des répondants en ce qui concerne les caractéristiques mesurées et, deuxièmement, elle fait augmenter la variance d'échantillonnage des estimations, parce que la taille effective de l'échantillon est réduite comparativement à celle considérée au départ.

L'ampleur des efforts déployés pour obtenir une réponse auprès d'un non-répondant dépend des contraintes budgétaires et de temps, de l'effet de la non-réponse sur la qualité globale et du risque de biais dû à la non-réponse.

La méthode principalement utilisée pour réduire l'effet de la non-réponse à l'étape de l'échantillonnage consiste à augmenter la taille de l'échantillon en appliquant un taux de suréchantillonnage déterminé d'après les résultats d'enquêtes similaires.

Les cas de non-réponse qui surviennent malgré les méthodes appliquées aux étapes de l'échantillonnage et de la collecte pour réduire l'effet de la non-réponse sont traités par imputation.

Afin de déterminer l'importance de la non-réponse qui a lieu chaque mois, on calcule divers taux de réponse. Pour un mois de référence donné, on produit les estimations au moins deux fois (estimations provisoires et estimations révisées). Entre les deux exécutions, certaines données fournies par les répondants peuvent être jugées inutilisables et des valeurs imputées peuvent être corrigées au moyen de données fournies par les répondants. Par conséquent, les taux de réponse sont calculés après chaque exécution du processus d'estimation.

Pour l'EMCD, deux types de taux sont calculés (non pondérés et pondérés). Afin d'évaluer l'efficacité du processus de collecte, on calcule les taux de réponse non pondérés. Les taux pondérés, fondés sur le poids d'estimation et la valeur de la variable d'intérêt, évaluent la qualité de l'estimation. À l'intérieur de chacun de ces types de taux, il existe des taux distincts pour les unités faisant partie de l'échantillon et pour les unités qui sont uniquement modélisées à partir de données administratives qui ont été extraites des fichiers de TPS.

Afin d’obtenir une meilleure idée du succès du processus de collecte de données, on calcule deux taux non pondérés appelés « taux de résultat de la collecte » et « taux de résultat de l'extraction ». On calcule ces taux en divisant le nombre de répondants par le nombre d'unités avec lesquelles on a essayé de prendre contact ou pour lesquelles on a essayé de recevoir des données extraites. Les déclarants non mensuels (répondants bénéficiant de modalités de déclaration spéciales leur permettant de ne pas produire de déclaration chaque mois, mais pour lesquels des données réelles sont disponibles lors des révisions subséquentes) sont exclus du numérateur ainsi que du dénominateur pour les mois où aucun contact n'est pris avec eux. Brièvement, les divers taux de réponse se calculent comme suit :

Taux pondérés :

Taux de réponse des unités faisant partie de l'échantillon (estimation) =
Somme des ventes pondérées des unités avec situation de réponse i / Somme des ventes pondérées des unités faisant partie de l'échantillon

i = unités pour lesquelles il existe des données déclarées qui seront utilisées dans l'estimation ou qui sont des refus convertis, ou pour lesquelles il existe des données déclarées qui n'ont pas encore été évaluées pour l'estimation.

Taux de réponse des unités modélisées à partir de données administratives (estimation) = Somme des ventes pondérées des unités avec situation de réponse ii / Somme des ventes pondérées des unités modélisées à partir de données administratives

ii = unités pour lesquelles il existe des données extraites des fichiers administratifs et qui sont utilisables pour l'estimation.

Taux de réponse total (estimation) =
Somme des ventes pondérées des unités avec situation de réponse i ou situation de réponse ii / Somme de toutes les ventes pondérées

Taux non pondérés :

Taux de réponse des unités faisant partie de l'échantillon (collecte) =
Nombre de questionnaires avec situation de réponse iii / Nombre de questionnaires avec situation de réponse iv

iii = unités pour lesquelles il existe des données déclarées (dont le cas n'est pas résolu, utilisées ou non utilisées pour l'estimation) ou qui sont des refus convertis;

iv = toutes les unités susmentionnées, ainsi que les unités qui ont refusé de répondre, les unités avec lesquelles on n'a pas pris contact et d'autres types d'unités non répondantes.

Taux de réponse des unités modélisées à partir de données administratives (extraction) =
Nombre de questionnaires avec situation de réponse vi / Nombre de questionnaires avec situation de réponse vii

vi = unités dans le champ d'observation pour lesquelles il existe des données (utilisables ou non utilisables) extraites des fichiers administratifs;

vii = toutes les unités susmentionnées, ainsi que les unités qui ont refusé de déclarer la source de données administratives, les unités avec lesquelles on n'a pas pris contact et d'autres types d'unités non répondantes.

(% de questionnaires recueillis par rapport à l'ensemble des questionnaires dans le champ d'observation)

Taux de résultat de la collecte =
Nombre de questionnaires avec situation de réponse iii / Nombre de questionnaires avec situation de réponse viii

iii = même que iii défini plus haut;

viii = même que iv, à part l'exclusion des unités avec lesquelles on a pris contact, parce que leur réponse n'est pas disponible pour un mois particulier, puisqu'il s'agit de déclarants non mensuels.

Taux de résultat de l'extraction =
Nombre de questionnaires avec situation de réponse ix / Nombre de questionnaires avec situation de réponse vii

ix = même que vi, avec l'ajout des unités extraites qui ont été imputées ou qui étaient hors du champ de l'enquête;

où vii = même que vii défini plus haut.

(% de questionnaires recueillis par rapport à l'ensemble des questionnaires dans le champ d'observation que nous avons tenté de recueillir)

Tous les taux pondérés et non pondérés susmentionnés sont calculés au niveau du groupe industriel, de la région et du groupe de taille, ainsi que pour toute combinaison de ces niveaux.

Utilisation des données administratives

Réduire le fardeau de réponse est un défi à long terme pour Statistique Canada. Afin d’alléger le fardeau de réponse et de réduire les coûts reliés à l’enquête, notamment en ce qui a trait aux petites entreprises, l’EMCD a réduit le nombre d’établissements simples de l’échantillon qui sont enquêtés directement et dérive plutôt les chiffres de vente pour ces établissements à partir des fichiers de la TPS en utilisant un modèle statistique. Le modèle explique les différences entre les ventes et les recettes déclarées aux fins de la TPS, ainsi que le décalage entre la période de référence de l’enquête et celle de la TPS.

Pour en savoir plus sur la méthode utilisée lors de la modélisation des ventes tirées de fichiers administratifs, veuillez consulter le document intitulé Enquête mensuelle sur le commerce de détail : Utilisation de données administratives sous la rubrique ‘Documentation’ du BMDI.

Le tableau 1 contient les fractions de réponses pondérées pour tous les groupes industriels ainsi que pour toutes les provinces et territoires. Pour des fractions de réponses pondérées plus détaillées, veuillez contacter la section du marketing et de la diffusion au (613) 951-3549, sans frais: 1-877-421-3067 or par courriel à retailinfo@statcan.

6.2. Méthodes utilisées pour réduire la non-réponse durant la collecte

Beaucoup d’efforts sont déployés en vue de réduire au minimum la non-réponse durant la collecte. Les méthodes utilisées incluent des techniques d'interview, comme l'utilisation de questions d'approfondissement et des techniques de persuasion, la replanification répétée des appels téléphoniques pour obtenir l'information et la mise en place de procédures indiquant aux intervieweurs comment s'y prendre avec les répondants qui refusent de participer à l'enquête.

Si les données demandées ne sont pas disponibles au moment de la collecte, la meilleure estimation fournie par le répondant est acceptée et est révisée par la suite, quand les données réelles sont disponibles.

Pour réduire au minimum la non-réponse totale pour toutes les variables, des réponses partielles sont acceptées. En outre, les questionnaires sont personnalisés pour la collecte de certaines variables, comme les stocks, de sorte que la collecte ait lieu durant les mois où les données sont disponibles.

Enfin, pour établir un climat de confiance entre les intervieweurs et les répondants, les cas sont généralement affectés au même intervieweur chaque mois. Ce dernier peut ainsi établir une relation personnelle avec le répondant et renforcer sa confiance.

7. Opérations de collecte et de saisie des données

La collecte des données est réalisée par les bureaux régionaux de Statistique Canada.

Tableau 1: Fractions de réponse pondérées par SCIAN et pour les provinces et territoires, février 2015 :
Sommaire du tableau
Le tableau montre les résultats de Tableau 1: Fractions de réponse pondérées par SCIAN et pour les provinces et territoires Fractions de réponse pondérées(figurant comme en-tête de colonne).
  Fractions de réponse pondérées
Total Enquêté Administrative
SCIAN - Canada  
Concessionnaires de véhicules et de pièces automobiles 90,6 91,3 63,8
Concessionnaires d'automobiles 92,1 92,5 58,3
Concessionnaires d'automobiles neuves 93,5 93,5 Note ...: n'ayant pas lieu de figurer
Concessionnaires d'automobiles d'occasion 71,4 73,9 58,3
Autres concessionnaires de véhicules automobiles 80,7 82,4 72,5
Magasins de pièces, de pneus et d' accessoires pour véhicules automobiles 75,7 77,7 60,3
Magasins de meubles et d'accessoires de maison 86,6 90,9 53,6
Magasins de meubles 92,3 93,9 66,0
Magasins d'accessoires de maison 77,1 84,8 47,6
Magasin d'appareils électroniques et ménagers 72,5 72,9 54,9
Marchands de matériaux de construction et de matériel et fournitures de jardinage 89,9 93,4 49,6
Magasins d'alimentation 88,5 90,1 68,3
Épiceries 92,4 94,1 72,9
Supermarchés et autres épiceries (sauf les dépanneurs) 94,8 96,1 79,0
Dépanneurs 54,5 59,7 25,0
Magasins d'alimentation spécialisés 65,0 69,0 47,3
Magasins de bière, de vin et de spiritueux 77,3 78,1 35,0
Magasins de produits de santé et de soins personnels 88,3 88,2 89,9
Stations-service 72,4 72,9 63,2
Magasins de vêtements et d'accessoires vestimentaires 87,7 88,9 30,8
Magasins de vêtements 88,4 89,6 33,0
Magasins de chaussures 84,9 85,7 16,7
Bijouteries et magasins de bagages et de maroquinerie 86,0 87,4 24,8
Magasins d'articles de sport, d'articles de passe-temps, d'articles de musique et de livres 87,2 90,5 39,2
Magasins de marchandises diverses 97,6 97,7 80,6
Grands magasins 100,0 100,0 Note ...: n'ayant pas lieu de figurer
Autres magasins de marchandises diverses 95,7 95,9 80,6
Magasins de détail divers 59,2 62,9 28,6
Total 87,2 88,4 63,1
Régions  
Terre-Neuve-et-Labrador 80,2 81,9 23,5
Île-du-Prince-Édouard 85,1 86,5 0,0
Nouvelle Écosse 89,2 90,6 50,4
Nouveau-Brunswick 86,3 88,2 49,5
Québec 86,6 88,4 62,1
Ontario 89,3 90,3 65,6
Manitoba 86,1 86,6 54,4
Saskatchewan 89,2 90,2 62,0
Alberta 86,3 87,1 69,5
Colombie-Britannique 84,6 85,6 61,0
Territoire du Yukon 83,8 83,8 Note ...: n'ayant pas lieu de figurer
Territoires du Nord-Ouest 84,7 84,7 Note ...: n'ayant pas lieu de figurer
Nunavut 73,4 73,4 Note ...: n'ayant pas lieu de figurer

Ces derniers envoient un questionnaire aux répondants ou communiquent avec ceux-ci par téléphone afin d'obtenir les valeurs de leurs ventes et de leurs stocks, et de confirmer l'ouverture ou la fermeture des emplacements d'affaires. Ils effectuent aussi un suivi auprès des non-répondants. La collecte des données débute environ sept jours ouvrables après la fin du mois de référence et se poursuit pendant tout le mois en question.

Les entités qui participent à l'enquête pour la première fois reçoivent une lettre d'introduction en vue d’informer le répondant qu'un représentant de Statistique Canada l'appellera. Cet appel a pour but de présenter l'enquête, de confirmer l'activité de l'entreprise, d'établir et de commencer la collecte des données, et de répondre à toutes questions que le répondant pourrait avoir.

8. Vérification

La vérification des données est l'application de contrôles pour déceler les entrées manquantes, invalides ou incohérentes, ou pour repérer les enregistrements de données susceptibles d'être erronés. Durant le processus d'enquête de l'EMCD, les données sont vérifiées à deux moments distincts.

Premièrement, une vérification est faite durant la collecte des données. Après leur collecte par téléphone ou au moyen du questionnaire à renvoyer par la poste, les données sont saisies à l'aide d'applications informatiques personnalisées. Toutes sont soumises à une vérification. Les contrôles réalisés durant la collecte des données, appelés contrôles sur le terrain, comprennent généralement des contrôles de validité et certains contrôles de cohérence simples. Ils servent aussi à déceler les erreurs commises durant l'interview par le répondant ou par l'intervieweur et de repérer l'information manquante à l'étape de la collecte en vue de réduire le besoin d'un suivi ultérieur. Les contrôles sur le terrain ont également pour but d'épurer les réponses. Dans le cas de l'EMCD, les réponses du mois courant sont comparées aux réponses fournies par le répondant le mois précédent et (ou) l'année précédente pour le mois courant. Les contrôles sur le terrain permettent de repérer les problèmes que posent les procédures de collecte des données et la conception des questionnaires, et de déterminer s'il faut offrir une formation supplémentaire aux intervieweurs.

Tout enregistrement de données rejeté lors des contrôles préliminaires fait l'objet d'un suivi auprès du répondant afin de valider les données soupçonnées d'être incorrectes. Une fois validé, les données recueillies sont transmises de façon régulière au Bureau central à Ottawa.

Deuxièmement, après la collecte, les données sont soumises à une vérification statistique dont la nature est plus empirique. On exécute la vérification statistique avant l'imputation, afin de repérer les données qui serviront de base pour l'imputation de valeurs pour les non-répondants. Les valeurs très extrêmes risquant de perturber une tendance mensuelle sont exclues des calculs de tendance lors de la vérification statistique. Il convient de souligner qu'aucun ajustement n'est fait à cette étape pour corriger les valeurs extrêmes déclarées.

La première étape de la vérification statistique consiste à repérer les réponses qui seront soumises aux règles de vérification statistique. Les données déclarées pour le mois de référence courant sont soumises à divers contrôles.

Le premier ensemble de contrôles est fondé sur la méthode d'Hidiroglou-Berthelot qui consiste à examiner le rapport des données du mois courant fournies par un répondant à des données historiques (c.-à-d. dernier mois ou même mois l'année précédente) ou administratives. Si le rapport calculé pour le répondant diffère significativement de ceux obtenus pour des répondants dont les caractéristiques sont comparables en ce qui concerne le groupe industriel et/ou la région géographique, la réponse est considérée comme une valeur extrême.

Le deuxième ensemble de contrôles est basé sur la vérification de la part de marché. Cette méthode, qui s'appuie sur les données du mois courant uniquement, permet de vérifier les données fournies par tous les répondants, mêmes ceux pour lesquels on ne dispose pas de données historiques ou de données auxiliaires. Par conséquent, parmi un groupe de répondants présentant des caractéristiques similaires en ce qui concerne le groupe industriel et (ou) la région géographique, toute valeur dont la contribution pondérée au total du groupe est trop importante sera considérée comme une valeur extrême.

Pour les contrôles fondés sur la méthode d'Hidiroglou-Berthelot, les données jugées extrêmes ne sont pas incluses dans les modèles d'imputation (ceux fondés sur les ratios). En outre, les données considérées comme des valeurs extrêmes lors de la vérification de la part de marché ne sont pas incluses dans les modèles d'imputation où les moyennes et les médianes sont calculées pour imputer des valeurs pour les réponses pour lesquelles il n'existe pas de données historiques.

Conjointement avec les vérifications statistiques effectuées après la collecte de données, on procède à la détection d’erreurs des données extraites des fichiers administratifs. Les données modélisées de la TPS sont également assujetties à une phase de vérification approfondie. Chaque fichier sur lequel les données modélisées sont fondées est vérifié de même que les valeurs modélisées. Les vérifications sont effectuées au niveau agrégé (industrie, géographie) afin de détecter les fichiers qui dévient de la norme (soit en exhibant des différences d’un mois à l’autre trop importantes ou qui diffèrent considérablement des autres unités. Toutes les données qui faillissent ces étapes de contrôle sont sujettes à une vérification manuelle, et si nécessaire, à une action corrective.

9. Imputation

Le processus d’imputation de l'EMCD a pour but de remplacer les données manquantes par des valeurs imputées. Des valeurs sont attribuées aux enregistrements pour lesquels la vérification a révélé des valeurs manquantes afin de s'assurer que les estimations soient de haute qualité et d'établir une cohérence interne plausible. Pour des raisons de fardeau de réponse, de coût et d'actualité des données, il est généralement impossible de réaliser auprès des répondants tous les suivis nécessaires pour résoudre les problèmes de réponses manquantes. Puisqu'il est souhaitable de produire un fichier de microdonnées complet et cohérent, on recourt à l'imputation pour traiter les cas persistants de données manquantes.

Dans le cas de l'EMCD, on peut fonder l'imputation des valeurs manquantes sur des données historiques ou sur des données administratives. Le choix de la méthode appropriée est fondé sur une stratégie qui dépend de l'existence de données historiques ou de données administratives et (ou) du mois de référence en question.

Il existe trois types de méthode d'imputation d'après des données historiques. Le premier est l’application d’une tendance générale qui s'appuie sur une source unique de données historiques (mois précédent, données recueillies pour le mois suivant ou données recueillies pour le même mois l'année précédente). Le deuxième est un modèle de régression dans lequel sont utilisées simultanément les données provenant du mois précédent et celles provenant du même mois l'année précédente. La troisième méthode consiste à remplacer directement les valeurs manquantes par des données historiques.

Selon le mois de référence, il existe, pour le choix de la méthode, un ordre de préférence en vue d'assurer une imputation de haute qualité. Le troisième type de méthode d'imputation historique est toujours la dernière option considérée pour chaque mois de référence.

La méthode d’imputation fondée sur des données administratives est sélectionnée automatiquement lorsqu'on ne dispose pas de données historiques pour un non-répondant.  Des tendances sont alors appliquées à la source de données administratives (mesure de taille mensuelle) selon que la structure est simple (entreprises ne comptant qu’un seul établissement) ou complexe.

10. Estimation

L'estimation est un processus qui consiste à calculer une valeur approximative des paramètres de population inconnus en utilisant uniquement la partie de la population qui est incluse dans un échantillon. Des inférences sont ensuite faites au sujet des paramètres inconnus en utilisant les données d'échantillon et les renseignements connexes sur le plan de sondage. Cette étape fait usage du Système généralisé d'estimation (SGE) de Statistique Canada.

Pour les ventes des détaillants, la population est divisée en une partie observée (strates à tirage complet et à tirage partiel) et une partie non observée (strate à tirage nul). D'après l'échantillon tiré à partir de la partie observée, on calcule une estimation pour la population au moyen d'un estimateur d'Horvitz-Thompson où les réponses concernant les ventes sont pondérées par l'inverse des probabilités d'inclusion des unités échantillonnées. Ces poids (appelés poids d'échantillonnage) peuvent être interprétés comme étant le nombre de fois que chaque unité échantillonnée devrait être répétée pour représenter la population complète. Les valeurs pondérées des ventes ainsi calculées sont totalisées par domaine, pour produire une estimation du total des ventes pour chaque combinaison des groupes industriels/région géographique. Un domaine est défini comme correspondant aux valeurs de classification les plus récentes disponibles dans le RE pour l'unité et la période de référence de l'enquête. Les domaines peuvent différer des strates d'échantillonnage originales, parce que les unités peuvent avoir changé de taille, d'industrie ou d'emplacement. Les changements de classification sont reflétés immédiatement dans les estimations et ne sont pas cumulés au cours du temps. Pour la partie non observée de la population, les ventes sont estimées à l’aide de modèles statistiques exploitant les ventes assujetties à la TPS exprimées sous forme mensuelle.

Pour en savoir plus sur la méthode utilisée lors de la modélisation des ventes tirées de fichiers administratifs, veuillez consulter le document intitulé Enquête mensuelle sur le commerce de détail : Utilisation de données administratives sous la rubrique ‘Documentation’ du BMDI.

La variance est la mesure de précision utilisée dans le cas de l'EMCD pour évaluer la qualité de l'estimation des paramètres de population et pour obtenir des inférences valides. Pour la partie observée de la population, la variance est calculée directement à partir d'un échantillon aléatoire simple stratifié sans remise.

Les estimations d'échantillon peuvent différer de la valeur prévue des estimations. Cependant, puisque l'estimation est fondée sur un échantillon probabiliste, il est possible d'évaluer la variabilité de l'estimation d'échantillon par rapport à la valeur prévue. La variance d'une estimation est une mesure de la précision de l'estimation d'échantillon qui est définie comme étant la moyenne, sur tous les échantillons possibles, de l'écart quadratique de l'estimation par rapport à sa valeur prévue.

11. Révisions et désaisonnalisation

Les données brutes sont révisées, sur une base mensuelle, pour le mois précédant immédiatement le mois de référence en cours qui fait l'objet de la publication. C'est donc dire que lorsque les données pour décembre sont publiées pour la première fois, on procédera aussi à des révisions, au besoin, à l'égard des données brutes pour novembre. En outre, des révisions sont aussi effectuées une fois par année, au moment de la première publication des données de février, pour tous les mois de l'année précédente. On vise ainsi à corriger tout problème important que l'on ait décelé et qui s'applique pour une période prolongée. La période de révision proprement dite dépend de la nature du problème décelé, mais elle ne dépasse rarement trois ans. Toutefois, la période de révision peut être plus longue lors de révisions historiques ou de restratification.

Depuis avril 2008, les données de l'Enquête mensuelle sur le commerce de détail sont désaisonnalisées en utilisant la méthode X12-ARIMA. Cette technique consiste essentiellement, dans un premier temps, à extrapoler une année de données brutes avec des modèles ARIMA (modèles autorégressifs à moyennes mobiles intégrées); et dans un deuxième temps, à désaisonnaliser la série brute prolongée par la méthode X-11. Ensuite, les données désaisonnalisées sont ajustées aux totaux annuels des données brutes.

Les données désaisonnalisées doivent aussi être révisées. Elles doivent notamment rendre compte des révisions déterminées pour les données brutes. Par ailleurs, les estimations désaisonnalisées sont calculées à partir de X-12-ARIMA, et la tendance est sensible aux valeurs les plus récentes déclarées dans les données brutes. C'est pourquoi, au moment de la diffusion de nouvelles données pour chaque mois, les valeurs désaisonnalisées pour les trois mois précédents sont révisées. Les séries de données désaisonnalisées sont des données chronologiques qui ont été modifiées pour éliminer l’effet des influences saisonnières et du calendrier.  Pour cette raison, la désaisonnalisation des données permet des comparaisons plus significatives des conditions économiques d’un mois à l’autre.

Une fois par année, les options de désaisonnalisation sont révisées afin d'intégrer les données les plus récentes. Des estimations désaisonnalisées révisées pour chacun des mois des années civiles précédentes sont diffusées en même temps que la révision annuelle des données brutes. La période exacte de révision dépend de la période de révision des données brutes.

12. Évaluation de la qualité des données

La méthodologie de l'enquête a pour objectif de contrôler les erreurs et de réduire leurs effets éventuels sur les estimations. Les résultats de l'enquête peuvent néanmoins contenir des erreurs dont l'erreur d'échantillonnage n'est que l'une des composantes. L'erreur d'échantillonnage survient lorsque les observations sont faites uniquement sur un échantillon et non sur l'ensemble de la population. Toutes les autres erreurs commises aux diverses phases de l'enquête sont appelées erreurs non dues à l'échantillonnage. Des erreurs de ce type peuvent survenir, par exemple, quand un répondant fournit des renseignements erronés ou qu'il ne répond pas à certaines questions; quand une unité du champ de l'enquête y est incluse erronément ou que des erreurs sont commises lors du traitement des données, comme des erreurs de codage ou de saisie.

Avant la publication, on analyse les résultats combinés de l'enquête afin d'en évaluer la comparabilité; il s'agit généralement d'un examen détaillé des réponses individuelles (particulièrement celles des grandes entreprises), de la conjoncture économique générale et des tendances historiques.

Une mesure habituelle de la qualité des données des enquêtes est le coefficient de variation (CV). Le coefficient de variation, défini comme étant l'erreur-type divisée par l'estimation d'échantillon, est une mesure de la précision relative. Puisque le coefficient de variation est calculé d'après les réponses des unités individuelles, il mesure aussi certaines erreurs non dues à l'échantillonnage.

La formule utilisée pour calculer le coefficient de variation (CV) en pourcentage est :

CV (X) = S(X) * 100%
X
où X représente l'estimation et S(X) représente l'erreur-type de X.

On peut construire les intervalles de confiance autour des estimations en utilisant l'estimation et le CV. Donc, pour notre échantillon, il est possible de déclarer avec un niveau donné de confiance que la valeur prévue sera comprise dans l'intervalle de confiance construit autour de l'estimation. Par exemple, si une estimation de 12 millions de dollars à un CV de 2 %, l'erreur-type sera de 240 000 $ (l'estimation multipliée par le CV). On peut déclarer avec 68 % de confiance que les valeurs prévues seront comprises dans l'intervalle dont la longueur est égale à un écart type de part et d'autre de l'estimation, c'est-à-dire entre 11 760 000 $ et 12 240 000 $. Ou bien, nous pouvons déclarer avec 95 % de confiance que la valeur prévue sera comprise dans l'intervalle dont la longueur est égale à deux écarts types de part et d'autre de l'estimation, c'est-à-dire entre 11 520 000 $ et 12 480 000 $.

Enfin, étant donné la faible contribution de la partie non observée de la population aux estimations totales, le biais dans la partie non observée a un effet négligeable sur les CV. Par conséquent, on utilise le CV provenant de la partie observée pour l'estimation totale qui est égale à la somme des estimations pour les parties observée et non observée de la population.

13. Contrôle de la divulgation

La loi interdit à Statistique Canada de rendre publique toute donnée susceptible de révéler l'information recueillie en vertu de la Loi sur la statistique et se rapportant à toute personne, entreprise ou organisation reconnaissable, sans que cette personne, entreprise ou organisation le sache ou y consente par écrit. Diverses règles de confidentialité s'appliquent à toutes les données diffusées ou publiées afin d'empêcher la publication ou la divulgation de toute information jugée confidentielle. Au besoin, des données sont supprimées pour empêcher la divulgation directe ou par recoupement de données reconnaissables.

L'analyse de la confidentialité des données inclut la détection de la « divulgation directe » éventuelle, qui survient lorsque la valeur figurant dans une cellule d'un tableau ne correspond qu'à quelques répondants ou que la cellule est dominée par un petit nombre d'entreprises.