Effets du mode de collecte à l’Enquête sur la santé dans les collectivités canadiennes : une comparaison de l’IPAO et l’ITAO

Martin St-Pierre (martin.st-pierre@statcan.ca) et Yves Béland (yves.beland@statcan.ca), Statistique Canada

Cet article devrait être cité comme suit: St-Pierre, M. et Béland, Y. (2004). «Mode effects in the Canadian Community Health Survey: a Comparison of CAPI and CATI», 2004 Proceedings of the American Statistical Association Meeting, Survey Research Methods. Toronto, Canada: American Statistical Association.

Mots–clés: effets du mode, IPAO, ITAO.

1. Introduction

L’Enquête sur la santé dans les collectivités canadiennes (ESCC) comprend deux enquêtes transversales distinctes formant un cycle bisannuel répétitif. La première enquête (2001, 2003, 2005, etc.) recueille des données auprès de plus de 130000 ménages sur une gamme de sujets ayant trait à la santé de la population pour produire des statistiques fiables à l’échelle de la région sociosanitaire. La deuxième enquête (2002, 2004, 2006, etc.), menée auprès d’un échantillon d’environ 30000 ménages et dont chaque cycle porte sur un sujet particulier, vise à produire des estimations fiables à l’échelle de la province (santé mentale, nutrition, mesures d’examen de la santé, etc.).

Pour la première enquête du premier cycle (cycle1.1) réalisée en 2001, on a utilisé de multiples bases de sondage et modes de collecte de données (Statistique Canada, 2003). Pour sélectionner l’échantillon de ménages du cycle1.1, on s’est servi surtout d’une base de sondage aréolaire. Les intervieweurs de l’équipe-terrain ont mené des interviews téléphoniques ou personnelles au moyen d’un questionnaire conçu pour l’interview assistée par ordinateur (IPAO ou ITAO). L’échantillon a été complété par des ménages sélectionnés à partir d’une base de sondage à composition aléatoire ou d’une liste de numéros de téléphone; les intervieweurs des centres d’appels ont mené des interviews téléphoniques assistées par ordinateur (ITAO) auprès des répondants sélectionnés à partir d’un centre d’appels. Pour des raisons opérationnelles et budgétaires, on a modifié le ratio entre les cas de la base de sondage aréolaire et ceux de la base de sondage téléphonique pour le cycle 2.1 de l’ESCC de manière à accroître le nombre de cas complétés par ITAO. Le tableau1 montre la variation de la répartition de l’échantillon entre les deux cycles. On s’attendait à ce que cette modification de la méthode de collecte ait un effet sur la comparabilité de certains indicateurs de la santé clés au cours des deux cycles en amplifiant ou en masquant artificiellement un véritable changement de comportement. Les pourcentages dans le tableau ci–dessous reflètent le fait que certaines unités de la base de sondage aréolaire et toutes les unités de la base de sondage téléphonique sont interviewées par la méthode ITAO.

Tableau 1. Répartition de l’échantillon selon la base de sondage et le mode
Cycle 1.1
(2001)
Cycle 2.1
(2003)
Base de sondage Aréolaire 80 % 50 %
Téléphonique 20 % 50 %
Mode IPAO 50 % 30 %
ITAO 50 % 70 %

Une étude basée sur les données du cycle 1.1. de l’ESCC a révélé d’éventuels effets de mode qui diffèrent selon qu’il s’agit d’IPAO ou d’ITAO; cependant, cette étude présentait de nombreuses limites, certains facteurs non contrôlés faussant l’interprétation des résultats de l’étude (PierreetBéland, 2002).

Afin de mieux comprendre les différences relatives aux méthodes de collecte (IPAO ou ITAO) dans une grande enquête sur la santé, il a été décidé de concevoir une étude spéciale des effets de mode et de l’intégrer au cycle2.1 de l’ESCC. Même si l’on comprend que les différences entre les estimations de l’enquête pourraient être attribuables à de nombreux facteurs, on croit que les résultats de cette étude fourniront aux utilisateurs des données de l’ESCC des renseignements utiles sur l’ampleur des différences dans certaines estimations clés liées à la santé attribuables à la méthode de collecte des données.

Le présent document expose les résultats de l’étude des modes. D’abord, la section 2 expose la méthodologie utilisée pour réaliser l’étude. Elle est suivie d’un résumé des procédures de collecte. La section 4 comprend une brève description de la stratégie de traitement, de pondération et d’estimation. Les résultats de l’étude des modes sont présentés aux sections 5 et 6 où l’on procède à plusieurs analyses univariées et multivariées pour évaluer la présence et l’ampleur des effets de mode. Vient ensuite une discussion des résultats, à la section7. Enfin, la dernière section du document présente les conclusions et quelques recommandations.

2. Méthodologie de l’étude

En raison de contraintes opérationnelles, on a procédé à l’intégration de l’étude des modes au cycle2.1 de l’ESCC et ce, en apportant des modifications minimales aux procédures régulières de collecte. Il importe de souligner qu’il ne s’agissait pas d’un véritable plan expérimental visant à mesurer les effets de mode purs, puisque tous les facteurs n’étaient pas contrôlés dans le plan (par exemple, les intervieweurs ne pouvaient pas être affectés au hasard à l’un ou l’autre mode de collecte). Toutefois, cette étude utilise un plan expérimental à panels partagés, c’est–à–dire un plan de sondage stratifié à plusieurs degrés où les unités d’échantillonnage secondaires sont affectées au hasard à l’échantillon de l’un ou l’autre mode de collecte.

2.1. Taille et répartition de l’échantillon

L’échantillon de chaque mode de collecte devait comprendre au moins 2500 répondants afin de permettre de détecter les différences significatives entre les estimations ponctuelles à un certain niveau α. Ces tailles d’échantillon, compte tenu de l’effet de plan de l’étude, permettent de détecter au niveau α=5% un écart de 2% pour une prévalence de 10% et un écart de 3% pour une prévalence de 25%.

Pour faciliter la mise en œuvre du plan de l’étude tout en perturbant le moins possible les procédures de collecte régulières de l’ESCC, il a été décidé de mener l’étude dans un nombre limité de sites (régions sociosanitaires) au Canada. Les diverses régions du Canada (Est, Québec, Ontario, Prairies et Colombie–Britannique) étaient bien représentées dans les 11sites choisis aux fins de l’étude. Les régions sociosanitaires rurales à très faible densité de population n’ont pas été prises en compte aux fins de cette étude en raison du coût de collecte des données.

L’échantillon de chaque mode a été réparti entre les sites de l’étude proportionnellement aux tailles des échantillons du cycle 2.1 de l’ESCC. Le tableau 2 montre la répartition détaillée des échantillons de l’étude des modes selon le site.

Tableau 2. Tailles des échantillons de l’étude des modes
Région sociosanitaire IPAO ITAO
St.John’s, Terre–Neuve–et–Labrador 135 100
Cape Breton, Nouvelle–Écosse. 125 100
Halifax, Nouvelle–Écosse 200 150
Chaudière–Appalaches, Québec. 230 215
Montérégie, Québec. 405 390
Niagara, Ontario 235 230
Waterloo, Ontario 235 230
Winnipeg, Manitoba 320 320
Calgary, Alberta 350 290
Edmonton, Alberta 335 290
South Fraser, Colombie–Britannique 240 240
Total 2810 2555

Des unités d’échantillonnage supplémentaires ont été attribuées à l’IPAO en prévision d’interviews téléphoniques éventuelles (p.ex., l’intervieweur doit mettre fin à un cas par téléphone pour diverses raisons); ces cas ont été exclus par la suite. On a augmenté ces tailles d’échantillons avant la collecte des données afin de tenir compte des logements hors du champ de l’enquête, des logements inoccupés et de la non–réponse prévue.

2.2. Base de sondage, sélection et randomisation

Dans les sites sélectionnés, on a utilisé pour le cycle 2.1 de l’ESCC deux bases de sondage chevauchantes, soit une base aréolaire et une base liste de numéros de téléphone. Toutefois, dans le but d’éliminer toute source possible de bruit durant l’analyse des données, il a été décidé de sélectionner l’échantillon de l’étude des modes à partir d’une seule base de sondage. Afin de réduire au minimum les modifications apportées aux procédures régulières de collecte de données de l’ESCC, il a été décidé de sélectionner l’échantillon à partir de la base téléphonique et d’attribuer ensuite la méthode de collecte; cette façon de procéder entraînant moins de modifications aux procédures de collecte que la sélection de l’échantillon à partir de la base aréolaire.

La base liste de numéros de téléphone utilisée pour le cycle 2.1 de l’ESCC est créée par couplage de l’annuaire téléphonique du Canada, un disque compact disponible sur le marché contenant les noms, adresses et numéros de téléphone répertoriés dans les annuaires de téléphone au Canada, à des fichiers internes administratifs de conversion de Statistique Canada afin d’obtenir les codes postaux. On a ensuite fait correspondre les numéros de téléphone assortis d’adresses complètes aux régions sociosanitaires de manière à créer des listes stratifiées de numéros de téléphone.

Comme nous l’avons mentionné précédemment, l’étude des modes est fondée sur un plan d’échantillonnage stratifié à deux degrés. Les 11sites représentent les strates du plan de l’étude. Les unités du premier degré sont les subdivisions de recensement (SDR), tandis que les numéros de téléphone sont les unités du deuxième degré. Dans chaque site, l’échantillon de numéros de téléphone a été sélectionné comme suit:

  1. Premier degré: sélection des SDR avec probabilité proportionnelle à la taille (PPT);
  2. Répartition de l’échantillon total (IPAO + ITAO) à un site donné aux SDR échantillonnées proportionnellement à leurs tailles;
  3. Deuxième degré: sélection aléatoire des numéros de téléphone dans chaque SDR.

Une fois l’échantillon de numéros de téléphone sélectionné, les cas pour lesquels une adresse valide n’était pas disponible ont été retirés et ajoutés à l’échantillon ITAO régulier du cycle 2.1 de l’ESCC. Ces numéros de téléphone, qui représentaient environ 7% de tous les numéros, auraient entraîné des modifications importantes des procédures suivies par les intervieweurs sur le terrain (méthode de collecte par IPAO) pour mener les interviews en personne; on a donc décidé de les exclure des échantillons de l’un et l’autre mode.

Enfin, et tout en contrôlant selon la SDR dans chaque site de l’étude, on a attribué de façon aléatoire une méthode de collecte (IPAO ou ITAO) aux numéros de téléphone pour lesquels il existait une adresse valide de manière à créer les échantillons pour les deux modes.

3. Collecte de données

La collecte de données pour le cycle 2.1 de l’ESCC a commencé en janvier 2003 et s’est terminée en décembre 2003. Les unités échantillonnées sélectionnées à partir de la base de sondage aréolaire et de la base téléphonique ont été envoyées aux bureaux régionaux ou aux centres d’appels sur une base mensuelle pour une période de collecte de deux mois (il y a avait un chevauchement d’un mois entre deux périodes de collecte consécutives). Deux semaines avant le début d’une période de collecte, des lettres d’introduction décrivant l’importance de la participation à l’enquête ont été envoyées à tous les cas (bases de sondage aréolaire et téléphonique) pour lesquels une adresse postale valide était disponible.
Pour les cas réguliers de la base de sondage aréolaire, les intervieweurs en personne devaient trouver l’adresse du logement, déterminer le statut du logement (dans le champ d’enquête ou hors de celui–ci) et énumérer tous les membres du ménage pour permettre la sélection aléatoire d’une personne de 12 ans ou plus. Si la personne sélectionnée était présente, alors l’intervieweur procédait à une interview personnelle. Si non, l’intervieweur pouvait soit revenir plus tard pour mener une interview personnelle, soit compléter l’interview par téléphone (dans le cycle 2.1 de l’ESCC, dans 40% des cas de la base de sondage aléatoire, l’interview a été complétée au téléphone).

Pour les cas de la base de numéros de téléphone, les intervieweurs dans les centres d’appels devaient déterminer le statut des numéros de téléphone (l’application électronique comprend des questions précises), énumérer tous les membres du ménage et procéder à une interview auprès de la personne sélectionnée immédiatement ou à une date ultérieure.

La collecte de données pour l’étude des modes s’est déroulée entre juillet et le début de novembre 2003. Pour l’échantillon du mode IPAO, seulement un sous–ensemble d’intervieweurs en personne (expérimentés et non expérimentés) a été désigné dans chaque site pour recueillir les données auprès des cas faisant partie de l’étude des modes, afin de faciliter le contrôle des opérations. Au début de juillet, les intervieweurs ont reçu les cas faisant partie de l’étude des modes (entre 20 et 60) sous forme d’une tâche distincte de leurs tâches dans le cadre de l’ESCC afin que ces cas soient identifiés clairement puisque les intervieweurs ne devaient mener auprès d’eux que des interviews personnelles (IPAO). Pour assurer un maximum de souplesse aux intervieweurs, la période de collecte pour les cas faisant partie de l’étude des modes a été prolongée à trois mois.

Les cas de l’échantillon du mode ITAO ont été divisés en trois et simplement ajoutés aux échantillons ITAO mensuels de l’ESCC (juillet, août et septembre) pour une période de collecte de deux mois. L’échantillon ITAO de l’étude des modes était complètement transparent pour les intervieweurs dans les centres d’appels. Ces cas n’étaient connus que du bureau central.

3.1. Taux de réponse

Au total et après le retrait des unités hors du champ de l’enquête, 3317 ménages ont été sélectionnés pour faire partie de l’échantillon du mode IPAO. Une réponse a été obtenue pour 2788 de ces ménages sélectionnés, ce qui a donné un taux de réponse à l’échelle du ménage de 84,1%. Parmi ces ménages répondants, 2788 personnes (une par ménage) ont été sélectionnées dont 2410 ont répondu, donnant un taux de réponse à l’échelle de la personne de 86,4%. Le taux de réponse combiné observé pour l’échantillon du mode IPAO est de 72,7%.

Pour l’échantillon du mode ITAO, 3460 ménages dans le champ de l’enquête ont été sélectionnés pour participer à l’étude. Une réponse a été obtenue pour 2966 de ces ménages sélectionnés, donnant un taux de réponse à l’échelle du ménage de 85,7%. Parmi ces ménages répondants, 2966 personnes (une par ménage) ont été sélectionnées dont 2598 ont fourni une réponse, donnant un taux de réponse à l’échelle de la personne de 87,6%. Le taux de réponse combiné observé pour l’échantillon du mode ITAO est de 75,1%.

Comme prévu, les taux de réponses observés dans l’étude des modes (particulièrement pour l’ITAO) sont inférieurs aux taux de réponses du cycle 2.1 de l’ESCC parce que les méthodes exhaustives de suivi de la non–réponse mises en place pour l’enquête principale, pour des raisons opérationnelles, n’étaient pas pleinement mises en œuvre pour les cas de l’étude des modes de collecte.

4. Traitement des données, pondération et estimation

Comme l’étude des modes était pleinement intégrée au cycle 2.1 de l’ESCC, on a traité les données recueillies pour les cas visés par l’étude au moyen du système de traitement de données de l’ESCC en même temps que le reste de l’échantillon de l’ESCC. Outre le poids d’échantillonnage principal, on a attribué aux participants à l’étude des modes un poids d’échantillonnage distinct et particulier à l’étude, de manière à bien représenter la population ciblée dans les 11 sites sélectionnés. Il convient de signaler au lecteur que les données sur les cas de l’étude des modes figuraient également dans le fichier de données principal du cycle 2.1 de l’ESCC.

Deux stratégies de pondération comportant divers ajustements ont été appliquées en parallèle (l’une pour l’IPAO et l’autre pour l’ITAO). La stratégie de pondération appliquée à l’échantillon de chaque mode était déterminée par divers facteurs clés, y compris:

  • l’utilisation d’un plan de sondage stratifié à plusieurs degrés comprenant l’échant-illonnage PPT des unités primaires d’échantillonnage et l’échantillonnage aléatoire simple des numéros de téléphone;
  • la non–réponse à l’échelle du ménage;
  • la sélection aléatoire d’une personne selon la composition du ménage ;
  • la non–réponse à l’échelle de la personne.

On a étalonné les poids d’échantillonnage de l’échantillon de chaque mode en ayant recours à une stratification à posteriori unidimensionnelle de dix post–strates âge–sexe (c.–à–d. par croisement des groupes d’âge 12–19, 20–29, 30–44, 45–64 et 65+ et des deux sexes).

Comme dans le cas de l’échantillon courant de l’ESCC et étant donné la complexité du plan de l’étude, on a calculé l’erreur d’échantillonnage pour l’étude des modes par la méthode de rééchantillonnage bootstrap en utilisant 500 répliques (Rust et Rao, 1996). Tous les résultats exposés dans ce document ont été pondérés avec les poids d’échantillonnage de l’étude des modes.

5. Analyse univariée

L’objectif principal de l’étude des modes était de comparer les indicateurs de la santé établis à partir des données recueillies en personne (IPAO) et celles recueillies par téléphone (ITAO). Cette section présente les résultats d’analyses univariées comparant les deux modes de collecte. En premier lieu, on a utilisé des tests d’association du Khi-carré pour comparer les échantillons des deux modes sur le plan des caractéristiques sociodémographiques. Dans tous les cas, on a comparé des distributions pondérées et utilisé un niveau de signification de 5% pour les tests d’association du Khi-carré rajustés. Nous présentons ensuite des comparaisons directes de plusieurs indicateurs de la santé entre les deux modes. Pour ces comparaisons, on a appliqué des tests Z pour déterminer s’il y a une différence significative entre les estimations. Des poids bootstrap ont été utilisés pour calculer les écarts–types. Comme les échantillons des deux modes n’étaient pas indépendants, on a calculé l’écart–type de la différence entre les estimations en mesurant la dispersion des 500 différences entre les estimations au moyen des 500 répliques bootstrap. Pour tous les indicateurs de la santé, la non–réponse partielle est exclue de toute analyse, sauf indication contraire. On suppose donc que la non–réponse partielle est répartie de façon similaire à la réponse partielle, ce qui n’est peut–être pas entièrement vrai. Toutefois, il convient de souligner que la non–réponse partielle est très faible pour l’un et l’autre mode. On présente également une comparaison des non–répondants au niveau du ménage et au niveau de la personne dans les deux échantillons des modes.

5.1. Comparaisons des caractéristiques sociodémographiques et du ménage

Même si les échantillons de l’un et l’autre mode sont représentatifs de la population cible et que les poids d’échantillonnage ont été calibrés selon les groupes âge–sexe, on observe néanmoins des différences sur le plan d’autres caractéristiques sociodémographiques ou du ménage. Pour évaluer ces différences éventuelles, on a procédé à une série de tests d’association du Khi-carré.

Les résultats des tests peuvent être répartis en deux groupes, soit les caractéristiques pour lesquelles aucune différence statistique n’est observée entre les échantillons des deux modes et celles pour lesquelles on relève des différences. On ne constate pas de différences sur le plan des distributions entre les caractéristiques suivantes: dispositions de vie, taille du ménage, niveau de scolarité du répondant, race, immigration et situation du point de vue de l’emploi. On observe cependant des différences statistiquement significatives pour les caractéristiques suivantes: état matrimonial, langue de l’interview, le niveau plus élevé de scolarité dans le ménage et mode d’occupation du logement. Les principales différences peuvent se résumer comme suit:

  • plus de personnes seules dans l’échantillon ITAO que dans l’échantillon IPAO (31% par rapport à 29%);
  • plus de propriétaires–occupants dans l’échantillon ITAO (82,7% par rapport à 79,5%);
  • plus de ménages dans l’échantillon ITAO où le plus haut niveau de scolarité est un diplôme d’études postsecondaires (74,4% par rapport à 71%);
  • plus d’interviews menées dans une langue autre que l’anglais dans le cas de l’échantillon ITAO (27% par rapport à 25,7%).

Pour les variables de revenu, le taux de non–réponse partielle est trop élevé pour permettre des comparaisons valables.

5.2. Comparaisons d’indicateurs de la santé

On a effectué des tests Z pour déterminer si les différences sont statistiquement significatives. Un examen d’environ 70 indicateurs de la santé pour divers domaines d’intérêt âge–sexe révèle des différences significatives pour 15indicateurs. Le tableau 3 montre des estimations ponctuelles de certains indicateurs à l’échelle nationale (11 sites) selon le mode.

L’indicateur de plus important pour lequel on observe des différences significatives est la catégorie «obèse» selon l’indice de masse corporelle (IMC). Le cycle 2.1 de l’ESCC a recueilli des données autodéclarées sur le poids et la taille sur lesquels on s’est fondé pour calculer un IMC. Selon l’Organisation mondiale de la santé, une personne est considérée comme obèse si son IMC est égal ou supérieur à 30. Le taux d’obésité calculé pour les répondants de 18 ans et plus qui ont participé à l’étude des modes est significativement plus élevé pour l’échantillon IPAO (17,9%) que pour l’échantillon ITAO (13,2%). On observe des différences encore plus grandes dans le cas du groupe d’âge de 30 à 44 ans (18,1% pour l’échantillon IPAO et 11,4% pour l’échantillon ITAO) ainsi que pour les hommes (20,4% et 14,7%).

L’indice de l’activité physique est un autre indicateur important pour lequel on observe des différences significatives. L’indice de l’activité physique est un indicateur qui indique la quantité d’activités physiques durant les loisirs faites par une personne au cours des trois derniers mois. Il est calculé à partir des réponses à une série de questions qui demandent aux répondants combien de fois et pendant combien de temps ils se sont adonnés à l’une de 20 activités différentes. L’échantillon IPAO comprend un nombre significativement plus élevé de personnes inactives (42,3%) que l’échantillon ITAO (34,4%).

Pour l’indicateur d’usage du tabac (fumeur quotidien ou occasionnel), le taux est de 2% plus élevé pour l’échantillon IPAO (23,6%) que pour l’échantillon ITAO (21,7%), mais il n’est pas statistiquement différent au niveau de signification de 5%. Toutefois, on observe une différence significative pour le groupe d’âge de 20 à 29 ans (37,7% pour l’échantillon IPAO et 28,2% pour l’échantillon ITAO). D’autres résultats montrent que la proportion de personnes déclarant avoir consulté un médecin et un spécialiste est plus élevée dans le cas de l’échantillon interviewé en personne. Toutefois, la comparaison des consultations de médecins ventilées selon le sexe révèlent des résultats intéressants, soit des différences significatives dans le cas des hommes (80,3% pour l’échantillon IPAO par rapport à 72,5% pour l’échantillon ITAO) mais non dans le cas des femmes (86,7% pour l’échantillon IPAO par rapport à 84,1% pour l’échantillon ITAO). En outre, le taux d’autodéclaration de besoins non satisfaits de soins de santé est sensiblement plus élevé dans le cas de l’échantillon IPAO (13,9%) que dans le cas de l’échantillon ITAO (10,7%).

5.3. Comparaison des non–répondants

La non–réponse totale au cycle 2.1 de l’ESCC et de l’étude des modes peut être divisée en deux catégories, selon qu’il s’agit de non–réponse à l’échelle du ménage et de non–réponse à l’échelle de la personne.

Tableau 3. Comparaison des indicateurs de la santé entre l’échantillon IPAO et l’échantillon ITAO(* = p<0,05, ** = p<0,01)
Indicateur de la santé IPAO ITAO Différence
% I.C. à 95% % I.C. à 95% %
Obésité (taille et poids autodéclarés) 17,9 15,9-19,9 13,2 11,4-15,1 4,7**
Inactivité physique 42,3 39,5-45,1 34,4 31,8-36,9 7,9**
Fumeur quotidien ou occasionnel – tous les âges 23,6 20,7-26,5 21,7 19,8-25,4 1,9
Fumeur quotidien ou occasionnel – 20 à 29 ans 37,7 31,4-44,0 28,2 21,-34,8 9,5*
Consomme de l’alcool 80,7 78,0-82,5 78,8 76,8-80,8 1,9
A au moins un problème de santé chronique 69,5 66,5-72,5 68,5 66,2-70,8 1,0
Limitation des activités 25,4 22,9-27,8 26,8 24,0-29,5 -1,4
Auto–évaluation de la santé comme passable ou mauvaise 9,3 7,9-10,7 9,9 8,6-11,1 -0,6
Auto–évaluation de la santé mentale comme passable ou mauvaise 4,0 2,8-5,2 3,9 2,9-4,9 0,1
Consultation d’un médecin au cours des 12 derniers mois 83,5 81,5-85,6 78,4 76,2-80,6 5,1**
Consultation d’un spécialiste au cours des 12 derniers mois 31,1 28,4-33,8 24,9 22,3-27,5 6,2**
Autodéclaration de besoins non satisfaits de soins de santé 13.9 12,0-15,8 10,7 9,0-12,3 3,2*
A conduit un véhicule moteur après avoir consommé 2verres d’alcool 13,5 11,3-15,7 7,2 5,1-9,3 6,3**
A–t–il (elle) déjà eu des rapports sexuels 90,2 88,5-91,9 87,3 85,1-89,5 2,9*

5.4. Comparaison des non–répondants

La non–réponse totale au cycle 2.1 de l’ESCC et de l’étude des modes peut être divisée en deux catégories, selon qu’il s’agit de non–réponse à l’échelle du ménage et de non–réponse à l’échelle de la personne. Très peu de renseignements sont disponibles sur les 529 ménages non répondants dans l’échantillon IPAO et les 494 ménages non répondants dans l’échantillon ITAO, mais une comparaison des raisons pour lesquelles ces ménages n’ont pas répondu ne révèle pas de différences importantes entre les deux modes. Pour la catégorie «personne à la maison/pas de contact», le taux pour l’échantillon IPAO est de 3,6% et pour celui de l’ITAO, de 2,1%. Les taux de «refus» sont également similaires, soit de 8,7% pour l’IPAO par rapport à 10,4% pour l’ITAO. La non–réponse à l’échelle de la personne s’observe que lorsque les intervieweurs réussissent à compléter la première étape (liste complète des personnes vivant dans le ménage et l’âge, le sexe, l’état matrimonial et le plus haut niveau de scolarité de tous les membres du ménage) mais non la deuxième étape, soit l’interview de l’ESCC auprès du répondant sélectionné. On trouvera au tableau4 une comparaison des taux de non-réponse selon le groupe d’âge des non–répondants (à l’échelle de la personne) dans les échantillons IPAO et ITAO. Il est intéressant de noter les différences à l’une et l’autre extrémité des groupes d’âge. Il est beaucoup plus difficile d’obtenir une réponse d’une personne âgée (65 ans et plus) par téléphone (taux de non–réponse de 13,9%) que en personne (8,9%), tandis qu’on observe l’inverse pour le groupe d’âge le plus jeune (12 à 19 ans). Même si la variable «âge» est utilisée pour créer des classes de propension à répondre pour la repondération pour la non–réponse à l’échelle de la personne, le biais de non–réponse pourrait être non négligeable pour certaines caractéristiques. On pourrait croire que les personnes âgées qui ont un problème physique ont peut–être de la difficulté à se rendre au téléphone. Ce pourrait également être le cas des adolescents où ceux qui sont plus actifs physiquement pourraient être à la maison moins souvent et donc être moins disponibles pour participer à une interview personnelle. Toutefois, il faudrait procéder à d’autres recherches pour vérifier cette hypothèse.

Tableau 4. Taux de non–réponse à l’échelle de la personne (%)
Mode Total 12-19 20-29 30-44 45-64 65+
IPAO 13,6 17,6 15,7 15,1 12,4 8,9
ITAO 12,4 11,9 16,9 12,0 10,1 13,9

6. Analyses multivariées

On a procédé à une série de régressions logistiques multiples pour mieux comprendre les différences observées et pour s’assurer que les effets de mode révélés par les comparaisons des indicateurs ne sont pas simplement attribuables à des divergences dans les caractéristiques sociodémographiques entre les échantillons des deux modes. Cette analyse évalue l’effet du mode de collecte sur la prévalence de plusieurs indicateurs de la santé lorsque les variables sociodémographiques et du ménage sont prises en compte. L’effet de mode est traité dans le modèle comme une variable confondue. Les variables sociodémographiques sont les autres variables confondues. Les termes d’interaction entre le mode de collecte et les variables sociodémographiques ont tous été testés dans le modèle.

Le tableau5 montre, pour certains indicateurs de la santé, la cote exprimant la possibilité de la présence d’un état ou d’un déterminant de la santé dans le cas des personnes interviewées par téléphone en comparaison des personnes interviewées en personne.

Le premier résultat présenté est celui pour l’indicateur de l’usage du tabac. Les résultats présentés à la section 5.2 n’ont pas montré un effet de mode significatif à l’échelle nationale pour cette variable. La présente analyse montre que la cote exprimant le risque de déclarer être un fumeur quotidien ou occasionnel est d’environ 1,8 fois (1/0,56 = 1,79) plus faible chez les personnes de race blanche de 12 à 29 ans lorsqu’elles sont interviewées par téléphone que lorsqu’elles sont interviewées en personne (ce résultat est significativement différent au niveau de 1%). Pour les personnes de race blanche de 30ans et plus, la cote exprimant le risque est la même (1,00) dans le cas de l’ITAO et de l’IPAO. La cote exprimant le risque de déclarer être un fumeur quotidien ou occasionnel est d’environ 1,5fois (1,49) plus élevée chez les non-Blancs lorsqu’ils sont interviewés en personne, mais ce résultat n’est pas significatif au niveau de 5%.

Comme nous l’avons montré à la section 5.2, la cote exprimant le risque de déclarer être obèse est plus faible chez les personnes interviewées par téléphone que chez celles interviewées en personne. Cette cote est encore plus faible en Alberta (0,48); ailleurs au Canada, elle est de 0,79. Pour l’indice de l’activité physique (inactif), on n’observe pas d’interaction entre le mode de collecte et les variables sociodémographiques. Dans l’ensemble, la cote exprimant le risque de déclarer être inactif est d’environ 1,5fois (1/0,65 = 1,54) plus faible chez les personnes interviewées par téléphone que chez celles interviewées en personne.

Pour les indicateurs de la consommation d’alcool, l’origine ethnique, le niveau de scolarité et le groupe d’âge sont les caractéristiques pour lesquelles on observe un effet de mode. Les non–immigrants de race blanche sont moins susceptibles de déclarer être des consommateurs d’alcool lorsqu’ils sont interviewés par téléphone (cote = 0,7), tandis que l’inverse est vrai pour les non–Blancs ou immigrants (cote = 1,71). De même, pour les non–Blancs, la cote exprimant le risque de déclarer avoir consommé au moins cinq verres d’alcool en une occasion au moins une fois par mois est d’environ 2,5 fois plus élevée chez ceux interviewés par téléphone que chez ceux interviewés en personne. On observe l’effet de mode opposé chez les personnes de race blanche dans la catégorie de capacité de revenu inférieure ou la plus faible (cote = 0,45).

Pour les caractéristiques associées à la conduite en état d’ivresse, on observe un effet de mode dans le groupe des 20 à 44 ans. Pour ces personnes, la cote exprimant le risque de déclarer avoir conduit en état d’ivresse est d’environ 3,4 fois (1/0,29) plus faible chez les personnes interviewées par téléphone que chez celles interviewées en personne.

Un autre résultat montre que les personnes qui ne se situent pas dans la catégorie supérieure de capacité du revenu et qui n’ont pas de diplôme d’études postsecondaires sont moins susceptibles de déclarer des besoins non satisfaits de soins de santé lorsqu’elles sont interviewées par téléphone.

7. Interprétation des résultats

Les résultats de l’étude des modes diffèrent considérablement. On n’observe presque aucune différence entre l’IPAO et l’ITAO dans les estimations ponctuelles pour la vaste majorité des indicateurs de la santé mesurés par l’ESCC comme l’usage du tabac (tous les âges), les problèmes de santé chroniques, les limitations des activités ou la consommation des fruits et légumes entre autres. Cela signifie que le nombre accru d’ITAO dans le deuxième cycle n’a pas d’effet sur la comparabilité des indicateurs de la santé pour les deux premiers cycles de l’ESCC.

Cependant, on observe des différences significatives entre l’IPAO et l’ITAO dans le cas de certains indicateurs de la santé, notamment, la taille et le poids autodéclarés, l’indice de l’activité physique, la consultation de médecins et l’autodéclaration de besoins non satisfaits de soins de santé. Même si l’analyse multivariée atténue quelque peu l’incidence des effets de mode lorsque les caractéristiques sociodémographiques sont prises en compte, on croit que toute comparaison des indicateurs ci–dessus au cours des deux cycles doit prendre en compte le nombre accru d’ITAO dans le deuxième cycle. Il importe de mentionner que, dans toute comparaison des indicateurs d’enquête au fil du temps, il faut toujours prendre en considération d’autres aspects méthodologiques (taille des échantillons, période de référence, questionnaire, etc.) et contextuels (modifications des normes, changement réel, etc.).

De nombreux ouvrages publiés portent sur des comparaisons de techniques d’interview téléphonique et en personne et l’on relève de nombreuses incohérences dans les résultats, les chercheurs faisant état d’effets de mode de diverses ampleurs. Selon Scherpenzeel (2001), l’incohérence des résultats est probablement attribuable à des différences en ce qui concerne le plan des études. L’étude des modes de collecte de données menée dans le cadre du cycle 2.1 de l’ESCC ne fait pas exception, puisqu’on ne peut trouver d’études comparables. Toutefois, il y a unanimité quant à la présence d’effets de mode pour certaines variables et de biais non négligeables dans les estimations d’enquête.

Selon les auteurs de ce document, les différences observées dans l’étude des effets du mode de collecte de l’Enquête sur la santé dans les collectivités canadiennes entre l’IPAO et l’ITAO sont attribuables principalement à deux facteurs confondants, soit la désirabilité sociale et la variabilité des intervieweurs. Le biais dans les réponses dû à la désirabilité sociale, qui a été largement documenté, tient aux mesures prises par les gens pour bien se faire voir des autres. Il pourrait se produire à différents niveaux et pour différents sujets tant pour l’IPAO que pour l’ITAO et il est très difficile de quantifier l’ampleur des biais de mesure étant donné l’absence de «normes repères» pour de nombreuses variables. De plus, l’ampleur du biais diffèrerait selon le profil sociodémographique et pourrait même varier au fil du temps. Parmi tous les indicateurs de la santé évalués dans cette étude, la taille et le poids autodéclarés sont de bons exemples de variables pour lesquelles l’ampleur du biais dans les réponses dû à la désirabilité sociale diffère selon qu’il s’agit de l’IPAO ou de l’ITAO. Les données provisoires de l’Enquête sur la nutrition au Canada de 2004 menée par Statistique Canada, qui permet de recueillir des mesures exactes de la taille et du poids auprès d’un grand échantillon, donnent à penser que le taux d’obésité chez les Canadiens de tout âge est significativement plus élevé que ceux calculés à l’aide des mesures autodéclarées de l’étude des modes menée dans le cadre du cycle 2.1 de l’ESCC (IPAO et ITAO). Le biais de mesure est manifestement plus important dans l’ITAO que dans l’IPAO, mais dans l’un et l’autre cas il est loin de la «norme repère» établie d’après l’enquête sur la nutrition. Il convient de signaler au lecteur que les résultats de l’Enquête sur la nutrition au Canada de 2004 seront disponibles à l’automne de 2005.

Tableau 5. Rapport de cotes pour l’état de santé pour l’ITAO par rapport à l’IPAO (* = p<0,05, ** = p<0,01)
Indicateur de la santé Facteur Rapport de cotes
Usage du tabac Blanc 12-29 0,56**
Blanc 30+ 1,00
Non-Blanc 1,49
Obésité (autodéclarée) Alberta 0,48**
Ailleurs 0,79*
Inactivité physique Tous 0,65**
Vaccination contre la grippe 12-15 4,48**
16-19 1,78
20+ 1,10
Consommateur d’alcool Blanc non–immigrant 0,70**
Non-blanc ou immigrant 1,71**
5 verres ou plus à une même occasion Blanc et revenu inférieur ou moyen–inférieur 0,45*
Blanc et revenu supérieur ou moyen-supérieur 0,97
Non-blanc 2,45*
Besoins insatisfaits (autodéclarés) Capacité de revenu la plus élevée 1,11
Pas la capacité de revenu la plus élevée mais avec un diplôme postsecondaire 0,81
Pas la capacité de revenu la plus élevée et sans diplôme postsecondaire 0,46**
Conduite en état d’ivresse 12-19 1,23
20-44 0,29**
45-64 0,97
65+ 0,60
A-t–il(elle) déjà eu des rapports sexuels Femme 15-24 0,43*
Autres 1,02

La variabilité des intervieweurs est l’expression utilisée pour décrire les erreurs qui sont attribuables aux intervieweurs. La variabilité des intervieweurs est inévitable dans les grandes enquêtes menées par les organismes de statistique nationaux. À Statistique Canada, le personnel préposé aux interviews personnelles se compose de plus 650 intervieweurs et 250 intervieweurs travaillent dans les centres d’appels. Malgré tous les efforts déployés pour normaliser la formation de tous les intervieweurs, certains aspects du milieu de travail (p. ex., la supervision) des deux méthodes de collecte sont tellement différents qu’il est raisonnable de supposer que les comportements des intervieweurs peuvent l’être également, ce qui pourrait introduire des biais dus à la variabilité des intervieweurs. Pour l’étude des modes, les renseignements supplémentaires fournis par les systèmes d’application informatique (IPAO et ITAO), comme la durée de chaque question, ont permis de faire des constatations intéressantes. Le module sur l’activité physique du questionnaire de l’ESCC qui a servi au calcul de l’indice de l’activité physique a pris sensiblement moins de temps à administrer par IPAO que par ITAO, ce qui donne à penser que certaines activités (comprises dans la liste de 20 activités lues par l’intervieweur), pour diverses raisons, n’ont peut–être pas été mentionnées clairement à certains répondants auprès desquels on a mené une IPAO. Parallèlement, les procédures de contrôle de la qualité mises en œuvre dans les centres d’appels n’ont pas détecté pareils comportements chez les intervieweurs ITAO. Selon les auteurs, la variabilité des intervieweurs explique une grande partie des différences observées dans l’étude des modes sur le plan de l’indice de l’activité physique, mais l’absence d’une norme repère pour cette variable ne permet pas d’évaluer le véritable biais de mesure (IPAO ou ITAO).

8. Conclusion

L’étude des modes a été intégrée au cycle 2.1 de l’ESCC pour permettre de mieux comprendre les différences éventuelles entre les estimations d’enquête attribuables aux deux méthodes de collecte utilisées aux fins de l’ESCC, soit l’IPAO et l’ITAO. On s’attendait à ce que l’augmentation du nombre d’ITAO dans le cycle 2.1 comparativement au cycle 1.1 ait un effet sur la comparabilité de certains indicateurs de la santé clés au cours des deux cycles, soit en amplifiant artificiellement ou en masquant un véritable changement de comportement.

Aux fins de l’étude des modes, on a utilisé une base de sondage unique où les unités d’échantillonnage secondaires ont été attribuées de façon aléatoire à l’IPAO ou à l’ITAO. L’étude a été menée de juillet à novembre 2003 dans 11sites choisis de manière à ce que toutes les régions du Canada soient bien représentées. Les taux de réponse sont acceptables pour l’un et l’autre mode de collecte et, malgré des différences mineures observées entre les profils sociodémographiques, les échantillons des deux modes sont représentatifs de la population cible et sont comparables. Des points d’échantillonnage spéciaux ont été calculés et calibrés pour dix post–strates pour les groupes d’âge–sexe pour l’échantillon de l’un et l’autre mode. Il importe de signaler qu’il ne s’agissait pas d’un véritable plan expérimental visant à déterminer l’effet de mode pur. Toutefois, l’étude des modes a été conçue afin de permettre des comparaisons valables des méthodes de collecte de l’IPAO et ITAO utilisées par Statistique Canada.

Les résultats de l’étude des modes sont très utiles pour permettre de mieux comprendre les différences entre l’IPAO et l’ITAO et plus particulièrement l’incidence du nombre accru d’ITAO dans le cycle 2.1 comparativement au cycle1.1. En outre, à la lumière des résultats observés, une série de recommandations a été formulée pour les cycles futurs de l’ESCC. En premier lieu, il a été décidé de mettre en œuvre pour le cycle 3.1 de l’ESCC prévu pour janvier 2005 le même plan d’échantillonnage que celui utilisé pour le cycle 2.1 (bases aréolaire/téléphonique et ratios IPAO/ITAO). À compter du cycle 3.1 de l’ESCC, des données exactes sur la taille et le poids seront recueillies auprès d’un sous–échantillon de personnes pour permettre de produire des estimations nationales pour des catégories de l’IMC pour des groupes âge–sexe particuliers. En outre, on renforcera les méthodes de formation des intervieweurs de manière à assurer une plus grande normalisation des procédures de collecte selon les deux méthodes.

Ces améliorations devraient donc améliorer la qualité des données de l’ESCC de manière à fournir aux décideurs et aux professionnels de la santé une base d’information solide leur permettant de mieux suivre les changements au fil du temps et de prendre les mesures voulues pour régler les diverses questions relatives à la santé des Canadiens.

9. Remerciements

Les auteurs tiennent à remercier tous leurs collègues à Statistique Canada qui ont participé à l’élaboration et à la réalisation de la présente étude. Ils sont également reconnaissants à VincentDale, JohaneDufour et Jean–LouisTambay de leurs observations éclairées.

10. Références

Pierre, F. et Béland, Y. (2002). Étude sur quelques erreurs de réponse dans le cadre de l’Enquête sur la santé dans les collectivités canadiennes. 2002 Proceedings of the Survey Methods Section, Statistical Society of Canada.
Rust, K.F. et Rao, J.N.K (1996). “Variance estimation for complex surveys using replication techniques”, Statistical Methods in Medical Research, 5, p. 281-310.
Scherpenzeel, A. (2001). Mode effects in panel surveys: A comparison of CAPI and CATI. Bases statistiques et vues d’ensemble. Neuchâtel: Bundesamt, für Statistik, Office fédéral de la statistique (http://www.unine.ch/psm).

Statistique Canada (2003). ESCC Cycle 1.1, 2000-2001, Fichier de micro-données à grande diffusion. Numéro de catalogue 82M0013GPE.