Guide de l′utilisateur
Décembre 2009
1.0 Introduction
2.0 Contexte
3.0 Objectif
4.0 Contenu de l´enquête
5.0 Plan d′échantillonnage
6.0 Collecte des données
7.0 Traitement des données
8.0 Pondération
9.0 Qualité des données
10.0 Lignes directrices pour la totalisation, l´analyse et la diffusion
11.0 Utilisation du fichier
1.0 Introduction
L′Enquête sur les personnes ayant une maladie chronique au Canada (EPMCC) est une enquête transversale sous l′égide de l′Agence de la santé publique du Canada (ASPC) qui permet de recueillir des renseignements sur l′expérience des Canadiens qui souffrent de problèmes de santé chroniques. L′EPMCC sera produite au deux ans couvrant deux maladies chroniques par cycle d′enquête. L′Enquête de 2009 couvrira l′arthrite et l′hypertension.
La présente enquête comporte deux questionnaires - un questionnaire sur l′arthrite et un questionnaire sur l′hypertension. L′EPMCC porte sur divers enjeux liés aux problèmes de santé chronique, dont le diagnostic d′un tel problème, les soins reçus d′un professionnel de la santé, les médicaments utilisés et l′autogestion.
La population cible de l′enquête est l′ensemble de la population canadienne âgée de 20 ans et plus souffrant d′arthrite ou d′hypertension et vivant dans un ménage privé des dix provinces. Les résidents des trois territoires, les personnes vivant sur les réserves indiennes, les résidents d′institutions, ainsi que les membres à temps plein des Forces armées canadiennes sont exclus de l′enquête. La collecte de données de L′EPMCC a eu lieu en février et mars 2009.
Le présent document a pour but de faciliter la manipulation du fichier maître de L′EPMCC et de décrire la méthodologie utilisée.
Pour toute question concernant l′ensemble de données ou son utilisation, s′adresser à:
Totalisations spéciales ou renseignements généraux sur les données:
Services personnalisés à la clientèle, Division de la statistique de la santé: 613–951-1746
Courriel: hd-ds@statcan.gc.ca
2.0 Contexte
L′objectif central de l′Enquête sur les personnes ayant une maladie chronique au Canada (EPMCC) est de recueillir des données sur les expériences des personnes qui vivent avec une maladie chronique, y compris sur le diagnostic de problème de santé chronique, les soins reçus de professionnels de la santé, la consommation de médicaments et l′autogestion du problème de santé chronique. L′enquête a été parrainée par l′Agence de la santé publique du Canada. L′EPMCC est une enquête transversale qui fait suite à l′Enquête sur la santé dans les collectivités canadiennes de 2008.
3.0 Objectif
L′objectif de L′EPMCC est de fournir des données sur les répercussions des maladies chroniques sur les personnes, ainsi que sur la façon dont les personnes qui ont une maladie chronique gèrent leur problème de santé. Plus particulièrement, l′enquête visait à :
- Déterminer l′impact des conditions de santé chroniques envers la qualité de vie
- De fournir plus d′information pour savoir comment les gens gèrent leurs conditions de santé chroniques
- D′identifier les comportements liés à la santé influençant les effets de la maladie
- D′identifier les barrières à l′autogestion des conditions de santé chroniques
4.0 Contenu de l′enquête
La présente section décrit le processus de consultation utilisé pour élaborer le contenu de l′enquête et résume le contenu final qui sera inclus dans L′EPMCC.
Le contenu de L′EPMCC a été élaboré à la suite d′un processus permanent de consultation entre la Division de la statistique de la santé de Statistique Canada et l′Agence de la santé publique du Canada (ASPC), avec la contribution importante de membres de groupes consultatifs d′experts dans les domaines de l′arthrite et de l′hypertension. La sélection du contenu a été fondée sur les objectifs et les besoins de données précisés par l′ASPC. Les membres de l′équipe de projet de l′ASPC ont été consultés régulièrement tout au long de l′élaboration et de la mise à l′essai des questionnaires de L′EPMCC. Le processus de consultation a abouti à deux questionnaires : 1) un sur l′arthrite; et 2) un sur l′hypertension.
Un sommaire décrivant chacun des modules des questionnaires sur l′arthrite et l′hypertension figure à la section 4.2.
4.1 Essais qualitatifs
Comme il est indiqué précédemment, L′EPMCC de 2009 comprend deux questionnaires distincts : un sur l′arthrite et un sur l′hypertension. Ceux ci ont été élaborés par Statistique Canada, en collaboration avec l′ASPC. Des groupes d′experts dans les domaines de l′hypertension artérielle et de l′arthrite ont également été consultés durant l′élaboration du contenu. Les questionnaires ont ensuite été traduits par la Division des langues officielles et de la traduction de Statistique Canada. Les deux questionnaires (en anglais et en français) ont été mis à l′essai par le Centre de ressources en conception de questionnaires (CRCQ), à partir d′interviews individuelles.
On a procédé à des essais qualitatifs pour évaluer le contenu et l′enchaînement des questionnaires de L′EPMCC. Ceux–ci ont été administrés en personne aux répondants. Les interviews individuelles ont porté sur les quatre étapes du processus cognitif de réponse : compréhension de la question et des catégories de réponse, rappel/recherche des renseignements demandés, réflexion au sujet de la réponse et décision quant aux données à déclarer, et réponse.
Les essais en anglais ont été menés en mai 2008 à Ottawa (Ontario) et ont été suivis par des essais en français, effectués en juin 2008, à Montréal (Québec). La base de sondage utilisée pour sélectionner les répondants des interviews était celle de l′ESCC de 2007 et 2008. Au total, 32 participants ont pris part à l′essai, représentant un échantillon de personnes qui ont déclaré avoir reçu un diagnostic d′arthrite ou d′hypertension d′un médecin ou d′un autre professionnel de la santé, ou avoir des symptômes d′arthrite (douleur et raideur dans les articulations) dans leur interview de l′ESCC. Toutes les interviews qualitatives ont été menées par des intervieweurs formés au CRCQ et observées par des membres de l′équipe de projet de L′EPMCC, y compris des employés de la Division de la statistique de la santé de StatCan et de l′ASPC. Certains des principaux résultats des essais qualitatifs sont abordés ci–après.
Principaux résultats du questionnaire sur l′arthrite :
En général, les questions semblaient bien fonctionner pour les participants ayant des symptômes d′arthrite ou des symptômes articulaires. Toutefois, pour certains participants, particulièrement ceux ayant des symptômes très mineurs, certaines des questions ne semblaient pas s′appliquer parce que les symptômes n′étaient pas suffisamment graves pour entraîner des problèmes. Il semble qu′un grand nombre de questions étaient destinées aux personnes ayant des symptômes plus graves. Quelques participants étaient d′avis que leur état n′était pas suffisamment grave pour qu′ils soient inclus dans la population cible de l′enquête. Toutefois, ces personnes ont pu répondre à la majorité des questions et ont indiqué que l′enquête était probablement pertinente.
À la suite des essais qualitatifs, il a été décidé d′inclure uniquement les personnes ayant reçu un diagnostic d′arthrite d′un professionnel de la santé dans la population cible de L′EPMCC. Les personnes ayant des symptômes articulaires, mais aucun diagnostic d′arthrite, devaient être exclues de la population cible.
Principaux résultats du questionnaire sur l′hypertension :
Dans l′ensemble, les participants ont indiqué que le questionnaire sur l′hypertension était simple et facile à comprendre. En général, les répondants ne croyaient pas que les questions étaient de nature trop délicate, sauf pour quelques questions liées à l′autogestion de la maladie (p. ex., perte de poids, diminution de la consommation d′alcool, etc.). Certains répondants ont aussi eu de la difficulté à se rappeler quelle était leur pression artérielle diastolique et systolique la dernière fois que celle ci a été mesurée par un professionnel de la santé.
Après les essais qualitatifs, les questions ont été modifiées pour réduire les répercussions des sujets de nature délicate, p. ex., la perte de poids, la consommation d′alcool et le tabagisme, et pour tenir compte des cas où certaines questions ne s′appliquaient pas à certains répondants. Afin d′aider les répondants à déclarer leur pression diastolique et systolique, des fourchettes ont été incluses comme catégorie de réponse, mais les répondants ont pu aussi déclarer des valeurs exactes pour leur pression artérielle.
4.2 Contenu du questionnaire final
Cette section fait état des modules qui constituent le contenu des questionnaires sur l′arthrite et l′hypertension de L′EPMCC. Le questionnaire sur l′arthrite comprenait 13 modules, et celui sur l′hypertension, 10 modules.
Module Description
GENX
Module Content
GENX
5.0 Plan d′échantillonnage
5.1 Population cible
La population cible de l′enquête sur les personnes ayant une maladie chronique au Canada (EPMCC) est l′ensemble de la population canadienne âgée de 20 ans et plus souffrant d′arthrite ou d′hypertension ayant été diagnostiqué par un professionnel de la santé et vivant dans un logement privé des dix provinces. Les résidents des trois territoires, les personnes vivant sur les réserves indiennes ou terre de la couronne, les résidents d′institutions, ainsi que les membres à temps plein des Forces armées canadiennes et les résidents de certaines régions éloignées sont exclus de l′enquête, représentant moins de 2% de la population cible.
5.2 Domaines d′intérêt
L′EPMCC est conçue pour produire des estimations fiables au niveau national, selon le groupe d′âge et le sexe. Les groupes d′âge visés sont les 20 à 44 ans, les 45 à 64 ans, les 65 à 74 ans et les 75 ans et plus.
5.3 Base de sondage
Dans le cadre de L′EPMCC, on a utilisé l′Enquête sur la santé dans les collectivités canadiennes (ESCC) de 2008 pour sélectionner le sous échantillon. L′EPMCC est donc un plan à deux phases, la première phase correspondant à l′échantillon de l′ESCC, et la deuxième, à celui de L′EPMCC.
L′échantillon de l′ESCC (première phase) est sélectionné à partir de plusieurs bases de sondage. La première est une base aréolaire conçue pour l′Enquête sur la population active (EPA). La deuxième est une liste de numéros de téléphone. Environ la moitié de l′échantillon de l′ESCC est sélectionnée à partir de la base aréolaire, et l′autre moitié, à partir de la liste. Pour des renseignements plus détaillés sur les processus d′échantillonnage de l′ESCC, voir le Guide de l′utilisateur de l′ESCC de 2008.
L′échantillon de L′EPMCC a été sélectionné à partir des répondants de l′ESCC de 2008 qui étaient âgés de 20 ans ou plus en décembre 2008 et qui avaient déclaré avoir reçu un diagnostic d′arthrite ou d′hypertension par un professionnel de la santé. À noter que les répondantes de l′ESCC qui ont reçu un diagnostic d′hypertension artérielle uniquement pendant la grossesse ont été exclues de l′échantillon de l′hypertension.
5.4 Taille et répartition de l′échantillon
Afin de produire des estimations fiables au niveau national, par groupe d′âge et sexe, on a procédé à une stratification des répondants de l′ESCC au même niveau selon les groupes d′âge d′intérêt suivant: 20 à 44 ans (20 à 44), 45 à 64 ans (45 à 64), 65 à 74 ans (65 à 74) et 75 ans et plus (75+), pour chacun des problèmes de santé chroniques. Par conséquent, les répondants de l′ESCC ont été classés en huit catégories – quatre groupes d′âge et deux groupes de sexe (hommes et femmes).
Un échantillon global de 7 062 personnes pour l′arthrite et de 9 055 personnes pour l′hypertension a été sélectionné à partir de 13 549 et 17 437 répondants de l′ESCC respectivement. L′échantillon a été augmenté de 1,4 pour tenir compte du taux d′unités hors du champ de l′enquête (p. ex., les répondants décédés ou qui sont déménagés à l′extérieur du Canada), estimé à 10 %, et le taux de non–réponse, estimé à 20 %. La répartition de l′échantillon de première phase et de l′échantillon de L′EPMCC par strate est fournie dans les tableaux 5.1 et 5.2 pour chacun des problèmes de santé chroniques.
Strate (Sexe, groupe d′âge) | ESCC 2008 répondants ayant l′arthrite (première phase) | EPMCC 2009 taille d′échantillon arthrite (deuxième phase) échantillon brute | EPMCC 2009 taille d′échantillon arthrite (deuxième phase) répondants attendus | |
---|---|---|---|---|
Femme | 20 à 44 ans | 687 | 503 | 352 |
Femme | 45 à 64 ans | 3 269 | 1 324 | 927 |
Femme | 65 à 74 ans | 2 163 | 1 224 | 857 |
Femme | 75+ ans | 2 682 | 1 311 | 918 |
Total Femme | 8 801 | 4 362 | 3 054 | |
Homme | 20 à 44 ans | 465 | 343 | 240 |
Homme | 45 à 64 ans | 1 914 | 1 167 | 817 |
Homme | 65 à 74 ans | 1 173 | 616 | 431 |
Homme | 75+ ans | 1 196 | 574 | 402 |
Total Homme | 4 748 | 2 700 | 1 890 | |
Total | 13 549 | 7 062 | 4 944 |
Strate (Sexe, groupe d′âge) | ESCC 2008 répondants ayant l′hypertension (première phase) | EPMCC 2009 taille d′échantillon hypertension (deuxième phase) échantillon brute | EPMCC 2009 taille d′échantillon hypertension (deuxième phase) répondants attendus | |
---|---|---|---|---|
Femme | 20 à 44 ans | 1 050 | 844 | 591 |
Femme | 45 à 64 ans | 3 490 | 1 324 | 927 |
Femme | 65 à 74 ans | 2 507 | 1 324 | 927 |
Femme | 75+ ans | 3 042 | 1 324 | 927 |
Total Femme | 10 089 | 4 816 | 3 371 | |
Homme | 20 à 44 ans | 761 | 619 | 433 |
Homme | 45 à 64 ans | 3 114 | 1 324 | 927 |
Homme | 65 à 74 ans | 1 856 | 1 289 | 902 |
Homme | 75+ ans | 1 617 | 1 007 | 705 |
Total Homme | 7 348 | 4 239 | 2 967 | |
Total | 17 437 | 9 055 | 6 338 |
Afin de réduire le fardeau de réponse, il a été décidé que tous les répondants échantillonnés recevraient un seul questionnaire, soit le questionnaire sur l′hypertension ou le questionnaire sur l′arthrite. Les personnes ayant ces deux problèmes de santé ont été réparties en deux groupes : un groupe a reçu le questionnaire sur l′hypertension et l′autre, le questionnaire sur l′arthrite. La répartition de l′échantillon par questionnaire a été effectuée en proportion du nombre de répondants de l′ESCC de 2008 pour chaque problème de santé.
L′échantillon pour chaque problème de santé chronique a été sélectionné au moyen d′un échantillonnage systématique, une fois les unités triées selon la province, la période de collecte de l′ESCC et l′âge. On a procédé à des exclusions avant la sélection de l′échantillon. Des unités ont été exclues si elles ne comportaient pas suffisamment d′information de contact pour mener l′enquête, par exemple, aucun numéro de téléphone dans l′ESCC, ou encore si les répondants de l′ESCC n′ont pas donner l′autorisation de partager leurs données avec d′autres ministères ou de les coupler avec des fichiers administratifs. Ces exclusions représentaient 18 % de l′échantillon de première phase et ont été prises en compte à l′étape de l′estimation, étant donné qu′elles font partie de la population d′intérêt.
6.0 Collecte des données
La collecte de L′EPMCC s′est déroulée en février et mars 2009. Au cours de la période de collecte, on a mené au total 10 707 interviews valides au moyen de la méthode d′interviews téléphoniques assistées par ordinateur (ITAO).
6.1 Interview assistée par ordinateur
L′interview assistée par ordinateur (IAO) offre deux grands avantages par rapport aux autres méthodes de collecte des données. D′abord, la technique est étayée d′un système de gestion des cas et d′une fonctionnalité de transmission de données. Le système de gestion des cas enregistre automatiquement l′information de gestion importante sur chaque tentative visant un cas particulier et produit des rapports aux fins de la gestion du processus de collecte. L′IAO comporte aussi un ordonnanceur automatique d′appels, c′est–à–dire un système central qui optimise l′horaire des rappels et le calendrier des rendez vous utilisés pour appuyer la collecte par ITAO.
Le système de gestion des cas achemine les applications de questionnaire et les fichiers d′échantillons du Bureau central de Statistique Canada aux bureaux régionaux de collecte (dans le cas de l′ITAO). Les données destinées au Bureau central sont acheminées en sens inverse. Par souci de confidentialité, les données sont encodées avant la transmission. Elles sont ensuite désencodées une fois sauvegardées sur un ordinateur sécurisé distinct, sans accès à distance.
Deuxièmement, l′IAO permet de concevoir une interview personnalisée à l′intention de chaque répondant en fonction de leurs caractéristiques particulières et de leurs réponses à l′enquête. Notamment, l′application :
- saute automatiquement les questions qui ne s′appliquent pas au répondant;
- applique automatiquement des règles de vérification pour repérer les réponses incohérentes ou non incluses dans la fourchette de valeurs permises et affiche des messages guides à l′écran quand une entrée est invalide, ce qui permet au répondant de recevoir une rétroaction immédiate et à l′intervieweur, de corriger toute incohérence;
- personnalise automatiquement le libellé des questions, y compris les périodes de référence et les pronoms, en fonction de facteurs comme l′âge et le sexe du répondant, la date de l′interview et les réponses aux questions précédentes.
6.2 Développement de l′application de l′ESCC
Pour L′EPMCC, on a eu recours à une application d′ITAO. Celle–ci comprenait des composantes d′entrée, de contenu et de sortie.
Les composantes Entrée et Sortie comprennent des séries standard de questions conçues pour permettre à l′intervieweur de prendre contact avec le répondant, de confirmer la participation de ce dernier, de procéder au dépistage (au besoin) et de déterminer l′état du cas. La composante de contenu de l′enquête comprenait les modules des questionnaire sur l′arthrite et l′hypertension de L′EPMCC, qui constituent la partie principale de l′application. La mise à l′essai et l′élaboration de l′application de l′ITAO ont commencé en septembre 2008. Elles comprenaient trois étapes d′essai interne : essai modulaire, essai intégré et essai de bout en bout.
L′essai modulaire consiste à mettre à l′essai indépendamment chaque module de contenu afin de vérifier que les instructions « passez à », la logique d′enchaînement et le texte, dans les deux langues officielles, sont spécifiés correctement. Les instructions « passez à » et la logique d′enchaînement entre modules ne sont pas testées à cette étape, car chaque module est considéré comme un questionnaire autonome. Quand plusieurs responsables des essais ont vérifié tous les modules, ces derniers sont regroupés avec les composantes Entrée et Sortie pour former une application intégrée. Cette nouvelle application intégrée passe alors à l′étape suivante des essais.
L′essai intégré porte sur l′ensemble des modules testés à l′étape précédente, regroupés en applications intégrées avec les composantes Entrée et Sortie. Cette deuxième étape d′essai a permis de s′assurer que des renseignements clés, comme l′âge et le sexe, étaient transmis du fichier d′échantillon aux composantes d′entrée, de sortie et de contenu de l′enquête des applications. Elle a en outre permis de confirmer que les variables qui influent sur l′enchaînement des questions sont transmises correctement de module en module à l′intérieur de la composante du contenu. Étant donné qu′à cette étape, le fonctionnement de l′application est essentiellement identique à ce qu′il sera sur le terrain, tous les scénarios possibles auxquels feront face les intervieweurs sont simulés, afin de s′assurer qu′ils fonctionnent bien. Ces scénarios servent à tester divers aspects des composantes d′entrée et de sortie, y compris la prise de contact, la confirmation qu′il s′agit du bon répondant, la question de savoir si un cas fait partie du champ de l′enquête et la prise de rendez-vous.
L′essai de bout en bout situe l´application entièrement intégrée dans un environnement de collecte simulé. L′application est chargée dans des ordinateurs connectés à un serveur d′essai. Ensuite, des données sont recueillies, transmises et extraites en temps réel, comme cela se ferait sur le terrain. Cette dernière étape des essais permet d′expérimenter tous les aspects techniques de la saisie, de la transmission et de l′extraction des données pour chacune des applications de L′EPMCC. Il s′agit aussi de la dernière occasion de déceler des erreurs dans les composantes Entrée, Contenu de l′enquête et Sortie.
6.3 Formation des intervieweurs
À la fin de janvier et au début de février 2009, des représentants de la Division de la planification et de la gestion de la collecte de Statistique Canada ont visité quatre des cinq bureaux régionaux participant à la collecte des données de L′EPMCC (Halifax, Sherbrooke, Toronto et Edmonton). Les visites visaient à former les gestionnaires de projet et les équipes d′intervieweurs des bureaux régionaux au sujet des modules de l′arthrite et de l′hypertension de L′EPMCC. Des membres de l′équipe de projet de L′EPMCC de la Division de la statistique de la santé ont aussi participé aux séances de formation, en vue de présenter de l′information concernant le contexte et l′élaboration de L′EPMCC et d′offrir un soutien additionnel, ainsi que de préciser les questions et préoccupations soulevées. Le gestionnaire de projet du bureau régional de Winnipeg a été formé à Edmonton, puis a assuré la formation des intervieweurs de Winnipeg.
L′objet de ces séances était de permettre aux intervieweurs d′être confortable avec l′utilisation de l′application de L′EPMCC, ainsi que de familiariser ceux-ci avec le contenu. La formation était centrée sur :
- les buts et objectifs de l′enquête;
- la méthodologie de l′enquête;
- les fonctionnalités des applications;
- l′examen du contenu du questionnaire, y compris des exercices;
- la simulation d′interviews difficiles et de situations de non–réponse;
- la gestion de l′enquête.
La formation visait en priorité à réduire au minimum les cas de non–réponse. À cette fin, les intervieweurs ont participé à des exercices qui consistaient à persuader des répondants réticents de participer à l′enquête.
6.4 L′interview
Les unités d′échantillonnage sélectionnées dans la base de sondage ont été interviewées par la méthode d′ITAO à partir d′une centrale d′appels. Un intervieweur principal affecté à la même centrale d′appels assurait la surveillance des intervieweurs.
De nombreuses techniques, y compris les suivantes, ont été mises en œuvre afin de parvenir à un taux de réponse optimal;
Lettre d′introduction
Avant le début de la période de collecte, les ménages échantillonnés ont reçu des lettres d′introduction qui expliquaient l′objet de l′enquête. On ne disposait pas de données sur l′adresse postale pour tous les répondants de l′ESCC de 2008. Dans les cas où les adresses postales n′étaient pas disponibles, on n′a pas envoyé de lettres d′introduction. Elles énonçaient notamment l′importance de l′enquête et offraient des exemples de l′utilisation prévue des données tirées de L′EPMCC.
Prise de contact
Les intervieweurs ont reçu l′instruction de faire toutes les tentatives raisonnables pour obtenir les interviews. Lorsque l′appel avait eu lieu à un moment inopportun, l′intervieweur fixait le moment d′un rappel qui convenait au répondant. De nombreux rappels ont été effectués, à divers moments de la journée et à des jours différents.
Lorsqu′un répondant n′était plus disponible au numéro de téléphone recueilli dans l′ESCC de 2008, on a procédé au dépistage. Afin de dépister les répondants, on a communiqué avec les personnes ressources identifiées par le répondant dans l′ESCC de 2008 pour obtenir le nouveau numéro de téléphone du répondant.
Conversion des cas de refus
Aux personnes qui refusaient dès le premier contact de participer à l′enquête, le bureau régional envoyait une lettre insistant sur l′importance de l′enquête et de la collaboration du répondant. Ensuite, un intervieweur principal, un surveillant de projet ou un autre intervieweur rappelait le répondant pour essayer de le convaincre de l′importance de sa participation à l′enquête.
Obstacles linguistiques
Pour parer au problème de langue susceptible de nuire aux interviews, le bureau régional de Statistique Canada a embauché des intervieweurs qui parlaient un grand nombre de langues. Au besoin, les cas étaient transférés à un intervieweur capable de remplir le questionnaire dans la langue voulue.
Interviews par procuration
Les interviews par procuration n′étaient pas permises pour L′EPMCC.
6.5 Opération sur le terrain
La période de collecte de L′EPMCC s′est étendue sur deux mois. Toutefois, l′échantillon a été divisé en deux, la moitié de la collecte ayant été effectuée en février, et l′autre moitié, en mars. Les bureaux régionaux de collecte ont reçu l′instruction d′interviewer la majorité de l′échantillon les deux premières semaines de chaque mois, les deux semaines suivantes étant consacrées aux interviews restantes et au suivi des cas de non–réponse. À la deuxième semaine de chaque mois, des tentatives devaient avoir été effectuées relativement à tous les cas.
Il incombait au superviseur du projet, à l′intervieweur principal et à l′équipe de soutien technique du bureau régional d′Edmonton de s′occuper de la transmission des cas au Bureau central. Tous les cas achevés ont été transmis chaque nuit au Bureau central de Statistique Canada.
6.6 Contrôle de la qualité et gestion de la collecte
Durant le cycle de collecte des données de L′EPMCC, plusieurs méthodes ont été appliquées pour s′assurer de la qualité des données et de l′optimisation de la collecte. Elles comportaient, entre autres, des mesures internes de vérification du rendement de l′intervieweur et une série de rapports de contrôle des diverses cibles de collecte et de la qualité des données.
Les intervieweurs par ITAO ont été sélectionnés au hasard pour la validation. Cette dernière comportait la surveillance des interviews téléphoniques par des intervieweurs principaux en vue de s′assurer que l′intervieweur suivait les techniques et procédures prévues (c.–à–d. qu′il lisait le libellé des questions tel qu′il figurait dans les applications, qu′il ne posait pas de question pour susciter des réponses, etc.). En outre, les membres de l′équipe d′enquête du bureau central ont rendu visite à un certain nombre de bureaux régionaux pour observer la collecte à divers moments au cours de la période de collecte.
Les responsables ont produit une série de rapports visant à contrôler et à gérer efficacement les objectifs de collecte, ainsi qu′à mettre au jour les problèmes posés par la collecte. Des rapports cumulatifs ont été produits quotidiennement et comprenaient les taux de réponse, les taux de refus et les taux d′unités hors du champ de l′enquête. Les taux de couplage et de partage ont été calculés chaque semaine. Par ailleurs, des rapports personnalisés ont été établis et utilisés pour examiner des questions particulières de qualité des données qui se sont posées au cours de la collecte.
Parmi les problèmes qui se sont posés au cours de la collecte des données figuraient les taux d′unités hors du champ de l′enquête plus élevés que prévu. On a déterminé que de nombreux répondants qui avaient indiqué avoir de l′hypertension et de l′arthrite dans l′ESCC de 2008 ont dit le contraire dans L′EPMCC. Du fait de ce problème, des instructions particulières ont été envoyées aux bureaux régionaux pour expliquer la marche à suivre par les intervieweurs dans le cas des unités hors du champ de l′enquête. En outre, les cas hors du champ de l′enquête au début de la période de collecte (pour lesquels on n′avait pas suivi les nouvelles procédures) ont été renvoyés pour qu′un suivi soit assuré par les intervieweurs principaux. Par suite du suivi, ces cas ont été classés de l′une des trois façons suivantes :
- Hors du champ de l′enquête : Ces cas comprenaient les répondants ayant déclaré avoir de l′arthrite ou de l′hypertension dans l′ESCC de 2008, mais ayant dit le contraire lorsqu′ils ont été appelés pour L′EPMCC. Cela pourrait être dû en partie au libellé des questions de l′ESCC et de L′EPMCC, cette dernière mettant davantage l′accent sur les maladies diagnostiquées par un professionnel de la santé. De nombreux répondants ont indiqué que leurs problèmes n′avaient jamais été diagnostiqués par un professionnel de la santé. Ils avaient plutôt des symptômes et ont posé eux mêmes un diagnostic. Certains répondants croyaient souffrir d′arthrite mais étaient atteints de différentes maladies telles que l′ostéoporose. Ces répondants étaient véritablement des cas hors du champ de l′enquête et ont été exclus de l′enquête.
- Dans le champ de l′enquête : Ces cas comprenaient les répondants qui ont indiqué ne pas avoir le problème de santé en question. Toutefois, après le suivi, il a été déterminé que ces répondants avaient reçu un diagnostic d′arthrite ou d′hypertension d′un professionnel de la santé, mais que leurs symptômes étaient contrôlés grâce à des médicaments ou à une modification de leur mode de vie. Ces répondants ne devaient pas être hors du champ de l′enquête et des tentatives ont été faites pour les interviewer.
- Refus : Certains répondants ne voulaient pas participer à l′enquête et ont indiqué qu′ils n′avaient pas le problème de santé en question pour être laissés de côté. Des tentatives ont été faites pour déterminer si les cas hors du champ de l′enquête étaient des refus dans les faits.
Les répercussions des cas hors du champ de l′enquête sur la pondération et la qualité des données seront abordées aux chapitres 8 et 9 respectivement.
7.0 Traitement des données
7.1 Vérification
La vérification des données a été exécutée en grande partie par l′application d′interview assistée par ordinateur (IAO) durant la collecte des données. Les intervieweurs ne pouvaient pas entrer de valeurs hors norme et les erreurs d′enchaînement faisaient l′objet de l′instruction de contrôle programmée « passez à ». Par exemple, l′IAO s′assurait de ne pas poser au répondant les questionsnon pertinentes.
En réponse à certaines données incompatibles ou inhabituelles, on a signalé des messages d′avertissement, mais sans prendre de mesures correctrices au moment de l′interview. On a plutôt mis au point, le cas échéant, des versions révisées à appliquer après la collecte des données au bureau central. Les incohérences ont été le plus souvent corrigées en attribuant à l′une ou aux deux variables en question la valeur « non déclaré ».
7.2 Codage
On a fourni des catégories de réponses précodées pour toutes les variables appropriées. Les intervieweurs ont reçu une formation durant laquelle ils ont appris à classer les réponses recueillies dans la catégorie appropriée.
Dans les cas où la réponse donnée par le répondant ne pouvait être assignée facilement à une catégorie existante, l′intervieweur pouvait poser plusieurs questions lui permettant d′entrer une réponse en toutes lettres dans la catégorie « Autre–précisez ». Les réponses à toutes ces questions ont été examinées attentivement lors du traitement des données au bureau central. Dans certains cas, on a donné aux réponses en toutes lettres le code d′une catégorie figurant sur la liste si la réponse faisait double emploi. On tiendra compte des réponses « Autre–précisez » fournies pour toutes les questions lors du perfectionnement des catégories de réponses en vue de futurs cycles de l′enquête.
7.3 Création de variables dérivées et de variables groupées
Pour faciliter l′analyse des données, on a dérivé un certain nombre de variables à partir des éléments disponibles sur le questionnaire de L′EPMCC. Le cinquième caractère du nom des variables dérivées est en général un « D » ou un « G ». Dans certains cas, les variables dérivées sont simples, donnant lieu à un regroupement des catégories de réponses. Dans d′autrescas, on a combiné plusieurs variables pour en créer une nouvelle. La Documentation sur les variables dérivées (VD) fournit des détails sur la façon de dériver ces variables plus complexes. Pour de plus amples renseignements concernant la nomenclature, veuillez vous référer à la section 12.3.1.
7.4 Pondération
Le principe de base de l′estimation dans un échantillon aléatoire comme celui de L′EPMCC repose sur le fait que chaque personne représente, en plus d′elle-même, plusieurs autres personnes qui ne font pas partie de l′échantillon. Par exemple, dans un échantillon aléatoire simple de 2 % de la population, chaque personne en représente 50.
L′étape de détermination des facteurs de pondération donne lieu au calcul du poids d′échantillonnage de chaque personne échantillonnée. Ce poids apparaît dans le fichier de microdonnées à grande diffusion et doit servir à extraire des estimations de l′enquête. Par exemple, si l′on doit évaluer le nombre de personnes ayant éprouvé des symptômes articulaires de douleur, de douleur continue ou de raideur liés à l′arthrite, on le fait en choisissant dans l′échantillon les enregistrements des personnes qui présentent cette caractéristique et en faisant la somme des facteurs de pondération que représentent ces enregistrements.
Vous trouverez les détails sur la façon dont on calcule les poids d′échantillonnage au chapitre 8.
8.0 Pondération
Pour que les estimations produites à partir de données d′enquête soient représentatives de la population couverte, et non pas seulement représentatives de l′échantillon comme tel, l′utilisateur doit incorporer les facteurs de pondération, appelés ici les poids d′enquête, dans ses calculs. Un poids d′enquête est attribué à chaque personne incluse dans l′échantillon final, c′est-à-dire dans l′échantillon de personnes ayant répondu à l′enquête. Le poids de chaque répondants correspond au nombre de personnes représentées par le répondant dans l′ensemble de la population de l′enquête.
Comme il est décrit dans le chapitre 5, la base de sondage de L′EPMCC est fondée sur les répondants de l′ESCC 2008. Le point de départ du processus de pondération de L′EPMCC est donc le poids du fichier de partage de l′ESCC 2008. Pour plus de renseignements sur ce poids, consulter le guide de l′utilisateur des données de l′ESCC 2008.
8.1 Pondération de l′échantillon
Le tableau 8.1 donne un aperçu des divers ajustements qui font partie de la stratégie de pondération de L′EPMCC, dans l′ordre où ils sont appliqués.
CD 1 Procuration Couplage Ajustement téléphonique |
---|
CD 2 Ajustement des critères de sélection |
CD 3 Ajustement des unités hors champ de L′EPMCC |
CD 4 Ajustement des non-réponse à L′EPMCC |
CD 5 Ajustement (final) poids du fichier de partage |
8.1.1 Ajustement lié aux interviews par procuration, au couplage et aux numéros de téléphone
La première étape de pondération de L′EPMCC a été de supprimer les répondants de l′ESCC âgés de 12 à 19 ans ainsi que ceux des territoires, car ils ne faisaient pas partie de la population cible. L′étape suivante a consisté à procéder à un ajustement pour tenir compte du fait que certaines personnes avaient été exclues de L′EPMCC même si elles faisaient partie de la population cible, principalement pour des raisons pratiques. La liste des personnes exclues et les motifs de leur exclusion se présentent comme suit :
- Les personnes dont les numéros de téléphone étaient invalides ont été exclues, car il était impossible de communiquer avec elles, L′EPMCC étant une enquête téléphonique;
- Les personnes ayant refusé le partage ou le couplage de leurs données de l′ESCC de 2008 ont été exclues parce que L′EPMCC visait à coupler les réponses données à L′EPMCC avec l′ESCC de 2008. Le fichier d′enquête couplé sera ensuite transmis aux partenaires de l′enquête, notamment à l′Agence de la santé publique du Canada, qui parraine l′enquête;
- Les personnes pour lesquelles l′interview de l′ESCC de 2008 a été effectuée par procuration ont été exclues, car on ne pouvait pas répondre au questionnaire de L′EPMCC par procuration.
Comme ces personnes exclues faisaient partie de la population d′intérêt, des ajustements ont été faits pour allouer leur poids aux répondants de l′ESCC restants. Le processus d′ajustement débute avec les poids de partage de l′ESCC de 2008. La probabilité que chacun des répondants ayant accepté le partage des données de l′ESCC fasse partie de la population d′échantillonnage a été prédite à l′aide d′une régression logistique et de variables auxiliaires de l′ESCC. Des groupes de réponses homogènes (GRH) ont été créés à partir des probabilités prédites.
L′ajustement a été calculé à l′intérieur de chaque GRH comme suit :
Le poids wgtCD1 a été calculé comme étant wgts3*adjCD1, où wgts3 est le poids de partage final de l′ESCC de 2008. Après le calcul de l′ajustement, les unités exclues ont été supprimées du fichier.
8.1.2 Ajustement lié aux critères de sélection de L′EPMCC
Les répondants de l′ESCC ont été stratifiés en fonction des groupes d′âge et du sexe dans le plan d′échantillonnage de L′EPMCC (voir le chapitre 5). Dans chaque strate (groupe d′âge par sexe), une unité pouvait souffrir d′un seul problème de santé (arthrite ou hypertension) ou des deux problèmes de santé (voir le graphique 8.1. ci-dessous). Afin de réduire le fardeau de réponse, chaque répondant de l′échantillon ne pouvait recevoir qu′un questionnaire, soit celui sur l′hypertension ou celui sur l′arthrite. Cette approche a entraîné un ajustement différent pour les unités ne souffrant que d′un problème de santé par rapport à celles souffrant des deux problèmes de santé.
Graphique 8.1: Chevauchement des deux problèmes de santé
L′ajustement effectué pour les unités ne souffrant que d′un problème de santé a été calculé à l′intérieur de chaque strate comme suit :
L′ajustement effectué pour les unités souffrant des deux problèmes de santé a été calculé à l′intérieur de chaque strate comme suit :
Pour les répondants ayant reçu le questionnaire sur l′arthrite, le poids a été calculé comme étant wgtCD2a=wgtCD1*adjCD2a. De même, pour les répondants ayant reçu le questionnaire sur l′hypertension, le poids a été calculé comme étant wgtCD2h=wgtCD1*adjCD2h. Après le calcul de l′ajustement, les unités non sélectionnées ont été supprimées du fichier.
8.1.3 Ajustement lié aux unités hors du champ de L′EPMCC
Une fois la collecte terminée, les unités ont été classées en deux groupes principaux. Le premier groupe comptait les cas résolus, soit les unités avec lesquelles on avait communiqué et dont on avait confirmé qu′elles étaient dans le champ de l′enquête (c.-à-d. dans la population cible) ou hors du champ de l′enquête (c.-à-d. pas dans la population cible). Toutes les unités faisant partie du champ de l′enquête correspondaient aux répondants. Le deuxième groupe comptait les unités non résolues. Pour ces dernières, il n′a pas été possible de déterminer si elles faisaient partie de la population cible (dans le champ de l′enquête) ou non (hors du champ de l′enquête), car il a été impossible de les joindre lors du suivi. Par conséquent, un modèle logistique a été utilisé pour estimer la probabilité qu′un cas non résolu soit dans le champ de l′enquête. Les cas résolus ont servi à déterminer le modèle logistique qui a permis de prédire le plus précisément possible la probabilité d′être dans le champ de l′enquête. Le modèle a ensuite été appliqué aux cas non résolus pour prédire la probabilité que chaque unité non résolue soit dans le champ de l′enquête.
Le poids des unités non résolues ayant reçu le questionnaire sur l′arthrite a été calculé comme étant wgtCD3a=wgtCD2a*p_inscope, où p_inscope est la probabilité prédite qu′une unité soit dans le champ de l′enquête. De même, le poids des unités non résolues ayant reçu le questionnaire sur l′hypertension a été calculé comme étant wgtCD3h=wgtCD2h*p_inscope. Cet ajustement a eu pour effet de réduire le poids total des unités non résolues selon le nombre prédit d′unités hors du champ de l′enquête dans la population qu′elles représentaient. Après le calcul de l′ajustement, les unités résolues qui étaient hors du champ de l′enquête ont été supprimées du fichier.
8.1.4 Ajustement lié à la non-réponse à L′EPMCC
Il est à noter que tous les cas non résolus sont maintenant considérés comme des non-répondants étant donné qu′on a ajusté leur poids pour tenir compte du fait qu′ils étaient hors du champ de l′enquête, et que tous les cas résolus qui restaient (unités faisant partie du champ de l′enquête) représentaient les répondants. Un modèle logistique utilisant principalement des variables auxiliaires de l′ESCC a été créé pour prédire les probabilités d′être considéré comme un répondant. Des groupes de réponses homogènes (GRH) ont été créés à partir des probabilités prédites. Pour s′assurer que l′ajustement lié à la non-réponse ne modifie pas le nombre estimé de personnes souffrant d′un problème de santé au niveau de la strate ou à l′échelle régionale, les GRH ont été créés dans chaque strate par région étant donné qu′il s′agissait de domaines d′intérêt importants. Il est arrivé que, pour satisfaire aux critères de qualité (au moins 20 unités par GRH et au moins 50 % des répondants dans chaque GRH) établis pour la création de GRH, des GRH de régions différentes soient regroupés. Il n′était cependant pas possible de regrouper deux GRH de strates différentes.
L′ajustement a été calculé à l′intérieur de chaque GRH comme suit :
Le poids de l′arthrite (wgtCD4a) a été calculé comme étant wgtCD3a*adjCD4a. De même, le poids de l′hypertension (wgtCD4h) a été calculé comme étant wgtCD3h*adjCD4h. Après l′ajustement, les unités non-répondantes ont été supprimées du fichier.
8.1.5 Ajustement (final) lié au partage et au couplage
Seule l′information relative aux personnes ayant accepté le partage et le couplage de leurs données de L′EPMCC sera diffusée (98% des répondants ont donné leur accord pour le partage et le couplage des données). Comme les personnes ayant refusé le partage ou le couplage de leurs données se trouvent dans la population d′intérêt, des ajustements ont été faits pour allouer le poids des personnes n′ayant pas accepté de partager ou de coupler leurs données aux unités restantes. La probabilité qu′un répondant accepte le partage et le couplage de ses données de L′EPMCC a été prédite à l′aide d′une régression logistique. Des groupes de réponses homogènes (GRH) ont été créés à partir des probabilités prédites, de la même façon que celle décrite à la section 8.1.4.
L′ajustement a été calculé à l′intérieur de chaque GRH comme suit :
Le poids final de l′arthrite (wgtCD5a) pour les répondants ayant reçu le questionnaire sur l′arthrite et accepté le partage et le couplage de leurs données de L′EPMCC a été calculé comme étant wgtCD4a*adjCD5a. De même, le poids final de l′hypertension (wgtCD5h) a été calculé comme étant wgtCD4h*adjCD5h. Après le calcul de l′ajustement, les répondants ayant refusé le partage ou le couplage de leurs données de L′EPMCC de 2009 ont été supprimés du fichier.
Les poids wgtCD5a et wgtCD5h correspondent au poids final de L′EPMCC de 2009 qu′on peut trouver dans le fichier de données sur l′arthrite et de l′hypertension, selon le cas sous le nom de variable WTSX_S.
8.2 Poids bootstraps
Des poids bootstrap coordonnés ont été utilisés pour L′EPMCC, en raison de la dépendance de cette dernière à l′égard de l′échantillon de l′ESCC. Donc, le point de départ du calcul de poids bootstrap de L′EPMCC a été les 500 répliques tirées du fichier bootstrap principal de l′ESCC. Chaque réplique bootstrap a été corrigée en utilisant les quatre ajustements énumérés au tableau 8.1.
9.0 Qualité des données
9.1 Cas hors du champ de l′enquête
Comme il est mentionné plus haut dans le Guide de l′utilisateur, un nombre plus élevé que prévu de cas se situait hors du champ de l′enquête. Bien que l′on se soit efforcé dans la mesure du possible de limiter ce nombre, 17 % des cas d′arthrite et 13 % des cas d′hypertension étaient hors du champ d′observation. Parmi les raisons de cette situation figurent les suivantes :
- Des répondants ont été classés incorrectement dans la catégorie des personnes souffrant d′arthrite au moment de l′ESCC. Par exemple, un certain nombre de personnes ont déclaré que leur arthrite n′avait pas été diagnostiquée par un professionnel de la santé, l′une des exigences pour pouvoir participer à L′EPMCC. En outre, certains répondants pensaient qu′ils étaient atteints d′arthrite, mais cela n′était pas le cas en réalité (c.–à–d. ostéoporose).
- Les répondants ont dit qu′ils ne souffraient plus du problème de santé parce qu′ils ne présentaient plus aucun symptôme.
- Les répondants ont appris, après l′ESCC, à répondre négativement à certaines questions en sachant qu′ils seraient ainsi écartés de l′enquête (ceux-ci pourraient être considérés comme des cas de refus).
À cause du taux élevé de cas hors du champ de l′enquête, le nombre total de personnes atteintes du problème de santé dans l′ESCC n′est pas le même que dans L′EPMCC. L′ESCC a probablement inclus un certain nombre de répondants qui ont déclaré avoir le problème de santé, mais qui en réalité ne l′ont pas (faux positifs). Cependant, L′EPMCC a sans doute exclu certaines personnes qui avaient réellement le problème de santé, mais qui ont dit ne pas l′avoir pour éviter de participer à l′enquête (faux négatifs). Le choix de l′enquête auquel avoir recours dépend des besoins de chaque utilisateur. L′ESCC fournit une série chronologique des taux de prévalence de l′arthrite et de l′hypertension. En outre, les données de l′ESCC peuvent servir à l′examen des comorbidités avec d′autres maladies ou affections. En revanche, L′EPMCC permet d′obtenir des mesures détaillées relatives à la qualité de vie et des comportements ayant une incidence sur la santé chez les personnes souffrant d′arthrite et d′hypertension.
9.2 Taux de réponse
Un total de 16 117 personnes ont été sélectionnés pour prendre part à L′EPMCC 2009: 7 062 pour le questionnaire de l′arthrite et 9 055 pour le questionnaire de l′hypertension.
Pour le questionnaire de l′arthrite, de tous les cas résolus (i.e ceux pouvant être clairement identifié comme étant ou non hors du champ d′enquête), 979 cas ne faisaient plus partie de la population cible de L′EPMCC (par exemple, dû èa un décès, èa un déménagement en dehors du Canada, l′absence d′une maladie chronique, etc.). Des 5 820 personnes estimées comme étant potentiellement éligibles, 4 565 ont répondu à l′enquête et ont permis le partage de leurs données avec nos partenaires ainsi que l′appariement de leurs données avec celles de l′ESCC. Le taux de réponse global se chiffre alors à 78.4%. Le tableau ci-dessous contient un sommaire des taux de réponses de L′EPMCC par groupe d′âge et sexe pour le questionnaire de l′arthrite.
Sexe | Groupe d′âge | Échantillon sélectionné | Répondants potentiels à l′enquête | Taux de succès (%) | Répondants | Taux de Réponse (%) |
---|---|---|---|---|---|---|
Femme | 20 à 44 ans | 503 | 393 | 78.1 | 284 | 72.3 |
Femme | 45 à 64 ans | 1 324 | 1 152 | 87.0 | 924 | 80.2 |
Femme | 65 à 74 ans | 1 224 | 1 068 | 87.3 | 877 | 82.1 |
Femme | 75+ ans | 1 311 | 1 053 | 80.3 | 801 | 76.1 |
Total Femme | 4 362 | 3 666 | 84.0 | 2 886 | 78.7 | |
Homme | 20 à 44 ans | 343 | 252 | 73.6 | 181 | 81.8 |
Homme | 45 à 64 ans | 1 167 | 965 | 82.7 | 759 | 78.7 |
Homme | 65 à 74 ans | 616 | 491 | 79.7 | 385 | 78.4 |
Homme | 75+ ans | 574 | 445 | 77.6 | 354 | 79.6 |
Total Homme | 2 700 | 2 153 | 79.7 | 1 679 | 78.0 | |
Total | 7 062 | 5 820 | 82.4 | 4 565 | 78.4 |
Pour le questionnaire de l′hypertension, de tous les cas résolus (ceux pouvant être clairement identifié comme étant ou non hors du champ d′enquête), 903 cas ne faisaient plus partie de la population cible de L′EPMCC. Des 7 862 personnes estimées comme étant potentiellement éligibles, 6 142 ont répondu à l′enquête et ont permis le partage de leurs données avec nos partenaires ainsi que l′appariement de leurs données avec celles de l′ESCC. Le taux de réponse global se chiffre alors à 78.2%. Le tableau ci-dessous contient un sommaire des taux de réponses de L′EPMCC par groupe d′âge et sexe pour le questionnaire de l′hypertension.
Sexe | Groupe d′âge | Échantillon sélectionné | Répondants potentiels à l′enquête | Taux de succès (%) | Répondants | Taux de Réponse (%) |
---|---|---|---|---|---|---|
Femme | 20 à 44 ans | 844 | 431 | 51.1 | 309 | 71.7 |
Femme | 45 à 64 ans | 1 324 | 1 214 | 91.7 | 969 | 79.8 |
Femme | 65 à 74 ans | 1 324 | 1 253 | 94.7 | 1 029 | 82.1 |
Femme | 75+ ans | 1 324 | 1 207 | 91.1 | 951 | 78.8 |
Total Femme | 4 816 | 4 105 | 85.2 | 3 258 | 79.4 | |
Homme | 20 à 44 ans | 619 | 465 | 75.2 | 305 | 65.6 |
Homme | 45 à 64 ans | 1 324 | 1 202 | 90.8 | 953 | 79.3 |
Homme | 65 à 74 ans | 1 289 | 1 200 | 93.1 | 956 | 79.7 |
Homme | 75+ ans | 1 007 | 890 | 88.3 | 670 | 75.3 |
Total Homme | 4 239 | 3 757 | 88.6 | 2 884 | 76.8 | |
Total | 9 055 | 7 862 | 86.8 | 6 142 | 78.2 |
9.3 Interprétation des données
L′EMPCC est une enquête de suivi qui a été conçue pour recueillir des données supplémentaires auprès d′un groupe cible de répondants de l′ESCC 2008. Par conséquent, la population observée de 2008 est la même pour l′ESCC et L′EPMCC. Dans le cas de cette dernière, les données recueillies en février et en mars 2009 figurent dans les fichiers de données avec celles recueillies en 2008 dans le cadre de l′ESCC. Les données de L′EPMCC reflètent la situation de la population observée de 2008 durant la période de référence de février et mars 2009, tandis que les données de l′ESCC reflètent la même population, mais pour la période de référence de 2008. L′interprétation des estimations fondées sur les données de L′EPMCC doit donc tenir compte de la période de référence si l′on estime que celle ci a une incidence sur les réponses des répondants. Par exemple, la proportion de personnes souffrant d′arthrite qui prennent des médicaments prescrits peut être mesurée à 38,6 %. L′information sur la consommation de médicaments a été recueillie dans le cadre du suivi de L′EPMCC, de sorte qu′elle reflète la population de 2008 étudiée en février ou en mars 2009. Dans une analyse comparable, la proportion de personnes souffrant d′hypertension qui pensent aussi avoir de l′embonpoint peut être mesurée à 61 %. L′information sur l′obésité a été recueillie dans le cadre de l′ESCC, de sorte qu′elle reflète la population de 2008 étudiée en 2008. Cette légère nuance ne devrait causer un problème que si l′on estime que la période de collecte a un effet sur la réponse.
9.4 Erreurs relatives à l′enquête
Les estimations issues de l′enquête reposent sur un échantillon de personnes. Elles auraient pu être légèrement différentes si on avait procédé par dénombrement complet au moyen du même questionnaire et si on avait eu recours aux mêmes intervieweurs, superviseurs, méthodes de traitement, etc. que pour l′enquête. L′écart entre les estimations découlant de l′échantillon et celles que donnerait un dénombrement complet réalisé dans des conditions semblables est appelé erreur d′échantillonnage de l′estimation.
Presque toutes les étapes des opérations d′enquête peuvent comporter des erreurs qui n′ont pas rapport à l′échantillonnage. Il arrive que les intervieweurs comprennent mal les instructions, que les enquêtés répondent incorrectement aux questions, que les réponses soient mal saisies ou que des erreurs surviennent durant le traitement et la totalisation des données. Voilà des exemples d′erreurs non dues à l′échantillonnage.
Sur un grand nombre d′observations, les erreurs aléatoires auront peu d′effet sur les estimations issues de l′enquête. Toutefois, les erreurs systématiques contribuent à biaiser les estimations. On a consacré beaucoup de temps et d′efforts à réduire les erreurs non dues à l′échantillonnage. Afin de contrôler la qualité des données, on a prévu des mesures d′assurance de la qualité à chacune des étapes du cycle de collecte et de traitement des données. Ces mesures consistaient à recourir à des intervieweurs hautement qualifiés, à former intensément les intervieweurs au déroulement de l′enquête et du questionnaire, à les observer au travail pour cerner les problèmes liés à la conception du questionnaire ou à l′incompréhension des instructions, à prévoir le nécessaire pour éviter le plus possible les erreurs de saisie et à effectuer des contrôles pour vérifier la logique du traitement.
9.4.1 Base de sondage
L′EPMCC 2009 était un supplément de l′Enquête sur la santé dans les collectivités canadiennes 2008 (ESCC), cette dernière étant principalement fondée sur une base aréolaire et une base de sondage téléphonique. La couverture de L′EPMCC 2009 devrait donc être la même que celle de l′ESCC qui est estimée à 98% de la population canadienne. Il est peu probable que la sous couverture produise tout biais significatif dans les données de l′enquête.
9.4.2 Non-réponse
L′effet de la non-réponse sur les résultats de l′enquête constitue une source importante d′erreurs non dues à l′échantillonnage dans les enquêtes. L′ampleur de la non-réponse varie de non-réponse partielle (l′absence de réponse à une ou plusieurs questions) à une non-réponse complète. Dans le cas de L′EPMCC 2009, seulement les cas complétés ont été conservés. Il est à mentionner qu′une fois l′interview débutée, les répondants complétaient généralement l′enquête. Il y a eu non-réponse complète lorsque la personne sélectionnée pour participer à l′enquête a refusé de le faire ou que l′intervieweur a été incapable d′entrer en contact avec elle. On a traité les cas de non-réponse complète en corrigeant les poids des personnes qui ont répondu à l′enquête afin de compenser pour ceux qui n′y ont pas répondu.
Il est important de noter que les interviews de L′EPMCC ont eu lieu entre trois et quatorze mois après les interviews de l′ESCC 2008. Certains des cas n′ont pu être rejoint durant L′EPMCC dû au fait qu′ils ont déménagé ou changé de numéro de téléphone. Pour les cas non résolus, une estimation des cas valides et des cas hors champs a été calculée basé sur la proportion d′unités valides et la proportion d′unités hors champs parmi les unités résolus. La portion “hors du champs d′enquête” a été estimé a 17% pour l′arthrite et à 13% pour l′hypertension. Ceci a été pris en considération à l′étape de l′estimation.
Voir le chapitre 8 pour avoir de plus amples détails sur la correction de la pondération pour la non-réponse.
9.4.3 Mesure de l′erreur d′échantillonnage
Puisqu′il est inévitable que des estimations établies à partir d′une enquête-échantillon (ou par sondage) soient sujettes à une erreur d′échantillonnage, une saine pratique de la statistique exige que les chercheurs fournissent aux utilisateurs une certaine indication de l′importance de cette erreur d′échantillonnage. Cette section de la documentation renferme un aperçu des mesures de l′erreur d′échantillonnage dont Statistique Canada se sert couramment et que le Bureau conseille vivement aux utilisateurs qui produisent des estimations à partir de ce fichier de microdonnées d′employer également.
La base pour mesurer l′importance potentielle des erreurs d′échantillonnage est l′erreur-type des estimations calculées à partir des résultats d′une enquête. En raison, cependant, de la diversité des estimations pouvant être produites à partir d′une enquête, l′erreur-type d′une estimation est habituellement exprimée en fonction de l′estimation à laquelle elle se rapporte. La mesure résultante, appelée coefficient de variation (CV) d′une estimation, s′obtient en divisant l′erreur-type de l′estimation par l′estimation elle-même et s′exprime en pourcentage de l′estimation.
Par exemple, supposons que d′après les résultats de l′enquête, on estime que 45,1% des Canadiennes et des Canadiens ont été diagnostiqués ou traités par un professionnel de la santé pour au moins une des conditions chroniques énumérées dans l′enquête et l′on constate que l′erreur-type de cette estimation est de 0,009. Le coefficient de variation de l′estimation est donc calculé comme suit :
Le chapitre 10 contient plus de détail sur le calcul du coefficient de variation.
10.0 Lignes directrices pour la totalisation, l′analyse et la diffusion
Cette section de la documentation décrit les lignes directrices que doivent suivre les utilisateurs pour totaliser, analyser, publier ou diffuser de toute autre façon des données tirées du fichier de données de l′enquête. Ces lignes directrices devraient leur permettre de reproduire les chiffres déjà publiés par Statistique Canada et de produire des chiffres non encore publiés conformes aux lignes directrices établies.
10.1 Lignes directrices pour l′arrondissement d′estimations
Afin que les estimations destinées à la publication, ou à toute autre forme de diffusion, qui sont calculées à partir de ces fichiers de données correspondent à celles produites par Statistique Canada, nous conseillons vivement aux utilisateurs de respecter les lignes directrices qui suivent en ce qui concerne leur arrondissement :
a) les estimations qui figurent dans le corps d′un tableau statistique doivent être arrondies à la centaine près par la méthode d′arrondissement classique. Selon cette méthode, si le premier ou le seul chiffre à supprimer se situe entre 0 et 4, le dernier chiffre retenu ne change pas. Si le premier ou le seul chiffre à supprimer se situe entre 5 et 9, on augmente d′une unité (1) la valeur du dernier chiffre retenu. Par exemple, si l′on veut arrondir à la centaine près de la façon classique une estimation dont les deux derniers chiffres sont compris entre 00 et 49, il faut les remplacer par 00 et ne pas modifier le chiffre précédent (le chiffre des centaines). Si les deux derniers chiffres sont compris entre 50 et 99, il faut les remplacer par 00 et augmenter d′une unité (1) le chiffre précédent;
b) les totaux partiels de marge et les totaux de marge des tableaux statistiques doivent être calculés à partir de leurs éléments correspondants non arrondis, puis arrondis à leur tour à la centaine près selon la méthode d′arrondissement classique;
c) les moyennes, les proportions, les taux et les pourcentages doivent être calculés à partir d′éléments non arrondis (c′est–à–dire les numérateurs et (ou) dénominateurs), puis arrondis à une décimale par la méthode d′arrondissement classique. Si l′on veut arrondir une estimation à un seul chiffre décimal par cette méthode et que le dernier ou le seul chiffre à supprimer se situe entre 0 et 4, le dernier chiffre à retenir ne change pas. Si le premier ou le seul chiffre à supprimer se situe entre 5 et 9, on augmente d′une unité (1) le dernier chiffre à retenir;
d) les sommes et les différences d′agrégats (ou de rapports) doivent être calculées à partir de leurs éléments correspondants non arrondis, puis arrondies à leur tour à la centaine près (ou à la décimale près) selon la méthode d′arrondissement classique;
e) si, en raison de contraintes d′ordre technique ou autre, on applique une autre méthode que l′arrondissement classique, si bien que les estimations qui seront publiées ou diffusées de toute autre façon diffèrent des estimations correspondantes publiées par Statistique Canada, il est vivement conseillé à l′utilisateur d′indiquer la raison de ces divergences dans le ou les documents à publier ou à diffuser;
f) des estimations non arrondies ne doivent être publiées ou diffusées de toute autre façon en aucune circonstance. Des estimations non arrondies donnent l′impression d′être beaucoup plus précises qu′elles ne le sont en réalité.
10.2 Lignes directrices pour la pondération de l′échantillon en vue de la totalisation
Le plan d′échantillonnage utilisé pour cette enquête n′est pas autopondéré. Autrement dit, le poids d′échantillonnage n′est pas le même pour toutes les personnes qui font partie de l′échantillon. Même pour produire des estimations simples, y compris des tableaux statistiques ordinaires, l′utilisateur doit employer le poids d′échantillonnage approprié. Si les poids appropriés ne sont pas utilisés, les estimations calculées à partir des fichiers de données ne peuvent pas être considérées comme représentatives de la population visée par l′enquête et ne correspondront pas à celles produites par Statistique Canada.
L′utilisateur ne doit pas non plus perdre de vue qu′en raison du traitement réservé au champ du poids, certains progiciels ne permettent pas d′obtenir des estimations qui coïncident exactement avec celles de Statistique Canada.
10.2.1 Définitions : Estimations de type nominal, estimations quantitatives
Avant d′exposer la façon de totaliser et d′analyser les données de l′enquête, il est bon de décrire les deux grandes catégories d′estimations ponctuelles des caractéristiques de la population qui peuvent être produites d′après le fichier de données.
Estimations de type nominal:
Les estimations de type nominal sont des estimations du nombre ou du pourcentage de personnes qui, dans la population visée par l′enquête, possèdent certaines caractéristiques ou rentrent dans une catégorie particulière. La fréquence à laquelle une personne ressent des douleurs articulaires est un exemple de ce type d′estimation. Une estimation du nombre de personnes possédant une caractéristique particulière ou manifestant un comportement particulier peut aussi être considérée comme une estimation d′un agrégat.
Exemple de question de type nominal:
Au cours du dernier mois, à quelle fréquence avez-vous éprouvé des douleurs articulaires? (SSAX_01)
Toujours
Souvent
Parfois
Rarement
Jamais
Estimations quantitatives:
Les estimations quantitatives sont des estimations de totaux ou de moyennes, de médianes ou d′autres mesures de tendance centrale de quantités qui ont trait à tous les membres de la population observée ou à certains d′entre eux.
Un exemple d′estimation quantitative est l′âge moyen à laquel les personnes reçoivent leur premier diagnostique d′hypertension. Le numérateur correspond à l′estimation de l′âge à laquel les personnes reçoivent leur premier diagnostique d′hypertension et le dénominateur, à l′estimation du nombre de personnes qui font de l′hypertension.
Exemple de question quantitative:
Quel âge aviez-vous quand on a diagnostiqué pour la première fois que vous faisiez de l′hypertension? (CNHX_05)
Âge lors du diagnostic
10.2.2 Totalisation d′estimations de type nominal
Les estimations du nombre de personnes présentant une caractéristique particulière peuvent être calculées d′après le fichier de données en totalisant les poids finals des enregistrements de toutes les personnes possédant la caractéristique d′intérêt.
Pour obtenir les proportions et les rapports de la forme on doit :
a) additionner les poids finals des enregistrements contenant la caractéristique voulue pour le numérateur ();
b) faire la somme des poids finals des enregistrements contenant la variable étudiée pour obtenir le dénominateur ( ); ensuite
c) diviser l′estimation du numérateur par celle du dénominateur
10.2.3 Totalisation d′estimations quantitatives
Pour obtenir l′estimation d′une somme ou d′une moyenne pour une variable quantitative, on procède aux étapes suivantes (seule l′étape (a) est nécessaire pour obtenir l′estimation pour une somme):
a) multiplier la valeur de la variable étudiée par le poids final, puis faire la somme de cette quantité pour tous les enregistrements visés pour obtenir le numérateur();
b) faire la somme des poids finals des enregistrements contenant la variable étudiée pour obtenir le dénominateur (); ensuite
c) diviser l′estimation du numérateur par celle du dénominateur.
Par exemple, pour obtenir l′estimation de l′âge moyen au moment du diagnostic d′hypertension, il faut d′abord calculer le numérateur () en faisant la somme du produit de la valeur de la variable CNHX_05 et du poids WTSX_S. Le dénominateur () est obtenu en additionnant le poids final des enregistrements comportant une valeur de « 2 » à la variable CONFLAG. Diviser () par () pour obtenir l′âge moyen au moment du diagnostic d′ hypertension.
10.3 Lignes directrices pour l′analyse statistique
L′EPMCC se fonde sur un plan de sondage complexe qui prévoit une stratification et un échantillonnage à plusieurs degrés, ainsi que la sélection des répondants avec probabilités inégales. L′utilisation des données provenant d′une enquête aussi complexe pose des difficultés aux analystes, car le choix des méthodes d′estimation et de calcul de la variance dépend du plan de sondage et des probabilités de sélection.
Nombre de méthodes d′analyse intégrées aux progiciels statistiques permettent d′utiliser des poids, mais la signification et la définition de ces derniers peuvent différer de celles applicables dans le contexte d′une enquête par sondage. Par conséquent, si les estimations calculées au moyen de ces progiciels sont souvent exactes, les variances n′ont, quant à elles, pratiquement aucune signification.
Dans le cas de nombreuses méthodes d′analyse (par exemple la régression linéaire, la régression logistique, l′analyse de la variance), une méthode permet de rendre plus significatifs les résultats produits par les progiciels standard. Elle consiste à rééchelonner les poids qui figurent dans les enregistrements de façon à ce que le poids moyen soit égal à un (1). Les résultats produits par les progiciels standard sont ainsi plus raisonnables puisque, même s′ils ne reflètent toujours pas la stratification et la mise en grappes du plan d′échantillonnage, ils tiennent compte de la sélection avec probabilités inégales. On peut effectuer cette transformation en utilisant dans l′analyse un poids égal au poids original divisé par la moyenne des poids originaux pour les unités échantillonnées (personnes) qui contribuent à l′estimation en question.
10.4 Lignes directrices pour la diffusion
Avant de diffuser et/ou publier des estimations tirées du fichier de données, l′utilisateur doit déterminer le nombre de répondants dans l′échantillon qui ont la caractéristique d′intérêt (p. ex., le nombre de répondants ayant l′arthrite et souffrant de douleur articulaire). Si ce nombre est inférieur à 30, l′estimation non pondérée ne doit pas être diffusée, quelle que soit la valeur de son coefficient de variation. Pour les estimations pondérées basées sur des échantillons d′au moins 30 personnes, l′utilisateur doit calculer le coefficient de variation de l′estimation arrondie et suivre les lignes directrices qui suivent.
Type d′estimation | CV (en %) | Lignes directrices |
---|---|---|
Acceptable | 0.0 ≤ CV ≤ 16.6 | On peut envisager une diffusion générale non restreinte des estimations. Aucune annotation particulière n′est nécessaire. |
Marginal | 16.6 < CV ≤ 33.3 | On peut envisager une diffusion générale non restreinte des estimations, en y joignant une mise en garde aux utilisateurs quant à la variabilité d′échantillonnage élevée liée aux estimations. Les estimations de ce genre doivent être identifiées par la lettre E (ou d′une autre manière similaire). |
Inacceptable | CV > 33.3 | Statistique Canada recommande de ne pas publier d′estimations dont la qualité est inacceptable. Toutefois, si l′utilisateur choisit de le faire, il doit les marquer de la lettre F (ou d′un autre identificateur semblable) et les diffuser avec l′avertissement suivant: “Nous avisons l′utilisateur que…(précisez les données)…ne répondent pas aux normes de qualité de Statistique Canada pour ce programme statistique. Les conclusions tirées de ces données ne sauraient être fiables et seront fort probablement erronées. Ces données et toute conclusion qu′on pourrait en tirer ne doivent pas être publiées. Si l′utilisateur choisit de les publier, il est tenu de publier également le présent avertissement.” |
10.5 Variances et coefficients de variation
Le calcul des coefficients de variation exacte n′est pas une tâche aisée, car il n′existe aucune formule mathématique simple permettant de tenir compte de tous les aspects de la base de sondage et de la pondération de L′EPMCC. Il faut donc recourir à d′autres méthodes, comme des méthodes de rééchantillonnage, pour estimer les mesures de précision. Parmi ces méthodes, celle du bootstrap est recommandée pour l′analyse des données de L′EPMCC.
Le calcul des coefficients de variation (ou de toute autre mesure de précision) par la méthode du bootstrap nécessite l′accès à des renseignements qui sont considérés confidentiels.
Pour le calcul des coefficients de variation, il est conseillé d′utiliser la méthode du bootstrap. Un programme macro, appelé « Bootvar », a été développé afin de permettre aux utilisateurs d′appliquer plus facilement cette méthode. Le programme Bootvar est offert en formats SAS et SPSS, et est constitué de macros qui calculent les variances de totaux, de ratios, de différences entre ratios, et de régressions linéaires et logistiques
Certains progiciels statistiques standard permettent d′intégrer les poids d′échantillonnage aux analyses, mais, souvent, les variances produites ne tiennent pas bien compte de la stratification et de la mise en grappes de l′ échantillon, contrairement à celles obtenues grâce au programme de calcul de la variance exacte.
11.0 Utilisation du fichier
Cette section débute par la description du fichier maître et de la variable de poids de ce fichier et donne des explications sur la façon de l′utiliser dans les totalisations. Vient ensuite l′explication des règles d′attribution des noms de variables employées pour L′EPMCC.
11.1 Fichier de données
L′EPMCC comporte deux fichiers de données distincts, l′un pour l′arthrite et l′autre pour l′hypertension. Ces fichiers ont tous deux été couplés aux fichiers de données de l′ESCC 2008.
Puisque les variables provenant des deux enquêtes figurent dans le même fichier de données, il est important que les utilisateurs connaissent les variables qu′ils utilisent dans leurs analyses. Par exemple, les renseignements concernant certaines variables démographiques (âge, sexe et province de résidence) ont été recueillis sur l′ESCC et l′EMPCC. Les utilisateurs des données devraient par conséquent savoir quelles variables ils utilisent pour s′assurer que leurs estimations sont cohérentes. Plus de renseignements sur la façon de faire la distinction entre les variables de l′EMPCC et de l′ESCC figurent aux sections 11.3 et 11.4.
Contrairement aux autres fichiers de données de l′ESCC, L′EPMCC ne comporte pas de fichier principal distinct du fichier de partage. Le fichier de données de L′EPMCC comprend plutôt uniquement les répondants qui ont accepté que leurs données de L′EPMCC soient couplées aux données de l′ESCC de 2008. En outre, seuls les répondants qui ont accepté le partage des données couplées avec les partenaires sont inclus dans le fichier de données.
Les données sont accessibles de diverses façons, qui sont décrites dans les sections suivantes.
11.1.1 Partenaires du partage
Les partenaires du partage ont accès aux données en vertu des modalités des accords de partage. Ces fichiers de partage comprennent uniquement les données de répondants qui ont accepté de partager leurs données avec les partenaires de Statistique Canada. Les partenaires de partage de L′EPMCC sont l′Agence de la santé publique du Canada (qui parraine l′enquête), Santé Canada et les ministères provinciaux de la santé. Statistique Canada demande également aux répondants résidant au Québec leur permission de partager leurs données avec l′Institut de la Statistique du Québec. Statistique Canada ne fournit le fichier de partage qu′à ces organisations. Les identificateurs personnels sont retirés des fichiers de partage pour préserver la confidentialité des répondants. Les utilisateurs de ces fichiers doivent au préalable confirmer qu′ils ne divulgueront en aucun temps de l′information susceptible d′identifier un répondant à l′enquête.
11.1.2 Centres de données de recherche
Le Programme des Centres de données de recherche (CDR) permet aux chercheurs d′utiliser les données d′enquête dans un environnement sécuritaire dans plusieurs universités au Canada. Les chercheurs doivent soumettre des propositions de recherche qui, une fois acceptées, leur donneront accès aux CDR. Pour plus de renseignements, consultez la page web suivante : CDR.
11.1.3 Totalisations personnalisées
Une façon de donner accès au fichier de données consiste à offrir aux utilisateurs l′option de demander au personnel des Services à la clientèle de la Division de la statistique de la santé de préparer des totalisations personnalisées. Ce service est offert contre recouvrement des coûts. Il permet aux utilisateurs qui ne savent pas se servir des logiciels de totalisation d′obtenir des résultats personnalisés. Les résultats sont filtrés pour s′assurer qu′ils sont conformes aux normes de confidentialité et de fiabilité avant d′être diffusés. Pour plus de renseignements, s′adresser aux Services à la clientèle, au 613–951–1746, ou par courriel, à fe-hd-ds@statcan.gc.ca.
11.2 Utilisation de la variable de poids
La variable de poids WTSX_S représente le poids d′échantillonnage utilisé dans L′EPMCC. Pour un répondant donné, ce poids d′échantillonnage peut être interprété comme étant le nombre de personnes que le répondant représente dans la population. Il doit être utilisé en tout temps dans les calculs d′estimations statistiques, afin de permettre l′inférence à l′échelle de la population. La production de résultats non pondérés n′est pas recommandée. La répartition de l′échantillon, de même que les détails du plan de sondage, peuvent entraîner des résultats biaisés qui ne représentent pas correctement la population. Pour une description plus détaillée du calcul de ce poids, consulter le chapitre 8 sur la pondération.
11.3 Règles d′affectations des noms des variables
Pour L′EPMCC, on a adopté des règles d′affectation des noms des variables qui permettent d′utiliser et d′identifier facilement les données en se fondant sur le module et les conditions. Les règles d′affectation des noms des variables satisfont à l′obligation de restreindre les noms de variables à un maximum de huit caractères afin de faciliter leur utilisation dans les produits logiciels analytiques.
11.3.1 Structure des composantes du nom des variables dans L′EPMCC
Chacun des huit caractères du nom d′une variable fournit des renseignements sur le type de données que contient la variable.
Positions 1-2: Référence du module (p. ex., SS – Symptômes et sévérité, ME – Consommation de médicaments, AD – Utilisation d′appareils d′aide fonctionnelle et HU – Utilisation des services de soins de santé)
Position 3: Référence propre au questionnaire (A = Arthrite, H = Hypertension). Certains modules tel que état de santé générale, sont identiques pour les deux questionnaires, il n′y a donc pas de A ou de H dans le nom des variables.
Position 4: Référence à l′Enquête sur les personnes ayant une maladie chronique au Canada (X)
Position 5: Type de variable (_ – question, D – variable dérivée)
Positions 6-8: Numéro de la question
Par exemple : la variable correspondant à la question 1, module de l′utilisation des services de soins de santé, questionnaire de l′hypertension, EPMCC (HUHX_01) :
Position 1-2: HU Tiré du module Utilisation des services de soins de santé
Position 3: H Composante du questionnaire sur l′hypertension
Position 4: X EPMCC
Position 5: _ Tiret de soulignement (_ = données recueillies)
Position 6-8: 01 Numéro de question (et option de réponse au besoin)
11.3.2 Positions 1 à 3: Nom de la variable/section du questionnaire
On se sert des valeurs suivantes pour la composante du nom de la variable correspondant à la section du questionnaire:
GEN | État de santé général (utilisé pour les questionnaires de l′arthrite et de l′hypertension) |
---|---|
DH | Diagnostic et antécédents familiaux |
SS | Symptômes et sévérité |
RA | Limitation des activités |
AD | Utilisation d′aides fonctionnelles |
RW | Limitation des activités liées au travail |
ME | Consommation de medicaments |
HU | Utilisation des services de soins de santé |
CL | Recommandations cliniques |
SM | Autogestion |
SW | Soutien et bien-être |
IN | Information reçue |
CN | Confirmation d′un diagnostic d′hypertension |
BM | Mesure de la tension artérielle |
MO | Autosurveillance de la tension artérielle |
ADM | Administration (utilisé pour les questionnaires de l′arthrite et de l′hypertension) |
La troisième position du nom de la variable est un A si le module appartient au questionnaire sur l′arthrite ou un H si le module appartient au questionnaire sur l′hypertension. Un certain nombre de modules figurent dans les deux questionnaires, mais les questions diffèrent pour l′arthrite et l′hypertension.
11.3.3 Position 4: Cycle et nom de l′enquête
Le X se retrouvant à la quatrième position de la variable indique que cette variable fait partie de L′EPMCC.
- | Variable collectée | Variable qui figure directement sur le questionnaire. |
---|---|---|
C | Variable codée | Variable codée à partir d′une ou de plusieurs variables collectées (par exemple, code de la Classification type des industries (CTI)). |
D | Variable dérivée | Variable calculée d′après une ou plusieurs variables collectées ou codées, ordinairement pendant le traitement au Bureau central (p. ex., indice de l′état de santé). |
F | Variable indicatrice | Variable calculée à partir d′une ou de plusieurs variables collectées (comme variable dérivée), mais ordinairement par l′application informatique de collecte des données, aux fins de son utilisation ultérieure durant l′interview (p. ex., indicateur de travail). |
G | Variable groupée | Variables collectées, codées, supprimées ou dérivées, agrégées en un groupe (p. ex., groupes d′âge). |
11.3.5 Positions 6-8: Nom de la variable
En général, les trois dernières positions correspondent à la numérotation de la variable qui figure sur le questionnaire. On supprime la lettre « Q » utilisée pour représenter le mot "question" et on présente tous les numéros de question au moyen d′un groupe de deux chiffres. Par exemple, la question Q01A d′un questionnaire devient simplement 01A, et la question Q15 devient simplement 15.
Quand certaines questions comportent plusieurs réponses, la position finale dans la séquence du nom de la variable correspond à une lettre. Pour ce genre de questions, de nouvelles variables sont créées dans le but de différencier un « oui » d′un « non » pour chaque possibilité de réponse. Par exemple, si la question Q2 possède 4 réponses possibles, les nouvelles questions seront Q2A pour la première possibilité, Q2B pour la deuxième, Q2C pour la troisième et ainsi de suite. Si les options 2 et 3 seulement sont choisies, Q2A = Non, Q2B = Oui, Q2C = Oui et Q2D = Non.
11.4 Structure des composantes du nom des variables dans l′ESCC
Comme les fichiers de données de L′EPMCC ont été couplés à ceux de l′ESCC, il est important de pouvoir faire la distinction entre les deux enquêtes. Les règles d′attribution de noms de variables de L′EPMCC et de l′ESCC sont très similaires. La seule exception étant que pour L′EPMCC, un X figure à la position quatre pour indiquer que la variable vient de cette enquête.
Par exemple, la variable d′âge figure dans l′ESCC ainsi que dans L′EPMCC. Voici à quoi ressemble son nom dans les deux enquêtes :
EPMCC : DHHX_AGE
ESCC : DHH_AGE
Ainsi, si la même variable figure dans L′EPMCC et dans l′ESCC, il est important de veiller à ce que la bonne variable soit spécifiée dans l′analyse.