- Appariement des enregistrements de l'Enquête du Programme d'évaluation internationale des compétences des adultes (PEICA), 2011, du Recensement de la population de 2011 et de l'Enquête nationale auprès des ménages de 2011 (ENM); (002-2015)
- Élaboration de modèles prédictifs pour l'admission dans des établissements de soins de longue durée et des établissements de soins pour bénéficiaires internes au Canada – couplage des données de l'Enquête sur la santé dans les collectivités canadiennes (ESCC) aux données sur les hôpitaux, sur la mortalité, aux données du Recensement de 2011, aux données fiscales et aux données du Système d'information sur les soins de longue durée (003-2015)
- Enquête sociale générale de 2015 sur l'Emploi du temps : couplage des données fiscales tirées des Fichiers Maître T1, T1FF et Sommaire et supplémentaire T4 (007-2015)
- Banque de développement du Canada : L'importance des services aux clients de la Banque de développement du Canada par rapport au rendement et à la survie des entreprises (008-2015)
- Couplage des données du questionnaire de l'enseignant de 2014 aux données de l'Étude sur la santé des jeunes Ontariens (ESJO) de 2014 (010-2015)
- Surveillance du cancer de la prostate et expositions professionnelles : utilisation subséquente du couplage 049-2012 (011-2015)
- Couplage des données de l'Enquête canadienne sur l'incapacité de 2012 et de l'Enquête nationale auprès des ménages de 2011 (013 2015)
- Agence de développement économique du Canada pour les régions du Québec (ADECRQ) – Retombées économiques 2001- 2012 (018-2015)
- Accroître la pertinence des fichiers longitudinaux (023-2015)
- Examen de l'association entre l'incidence du cancer de la peau avec présence de mélanome et l'exposition au rayonnement ultraviolet environnemental, à partir de la Cohorte du recensement canadien de 1991. Utilisation subséquente du fichier de couplage 049-2012. (030-2015)
- Examen des effets de mortalité et des inégalités socioéconomiques des émissions industrielles au moyen de la Cohorte du recensement canadien de 1991. Utilisation subséquente du couplage 049-2012. (032-2015)
- Enquête nationale auprès des apprentis (ENA) – 2015: couplage des données fiscales tirées du Fichier de la Famille T1 (033-2015)
- Amendement en vue d'inclure le T1FF et de prolonger d'une année la période de conservation des fichiers couplés; Enquête sociale générale de 2014 sur la victimisation : couplage des données fiscales tirées des Fichiers Maître T1, T1FF et Sommaire et supplémentaire T4 (040-2015, 075-2013)
- Titre : Conséquences économiques à long terme pour la famille à la suite d'un diagnostic de cancer infantile (041-2015)
- MODIFICATION : Couplage de données visant à examiner le cheminement des étudiants durant leurs études postsecondaires et sur le marché du travail, de 2005 à 2013 (042-2015)
- Initiative pour les femmes entrepreneurs : couplage de la liste de clients à la Base de données canadienne sur la dynamique employeurs-employés, 2007 à 2012 (044-2015)
- Étude sur la pollution atmosphérique : couplage des enregistrements du Recensement de la population de 2001, des fichiers de l'univers T1, de la Base canadienne de données sur la mortalité et de la Base canadienne de données sur le cancer (045-2015)
- Couplage de l'Enquête annuelle de télédistribution (titre d'enquête de Statistique Canada) Rapport annuel pour les titulaires d'une licence d'entreprise de télédistribution (titre d'enquête du CRTC) aux données fiscales des entreprises T2 à des fins d'imputation pour les petites entités de télédistribution non enquêté (053-2015)
- Plateforme de couplage longitudinal en éducation (PCLE) : Création d'une plateforme de couplage d'enregistrements afin de permettre le développement d'indicateurs clés de l'éducation et la réalisation d'analyses liées aux programmes de l'éducation postsecondaire et d'apprentissage. (059-2015)
- Base de données longitudinales sur les immigrants (BDIM) : Élargissement et mises à jour (060-2015)
- Enquête canadienne sur les mesures de la santé (ECMS) de 2016, cycle 5, Couplage avec les données fiscales (061-2015)
- Enquête canadienne sur le revenu : couplage avec les fichiers des données sur le revenu (063-2015)
- Surveillance du cancer dans les professions au moyen des données de suivi de la mortalité et du cancer de 1991 à 2009 chez la cohorte du Recensement du Canada de 1991. Utilisation subséquente du couplage 049-2012 (064-2015)
- Renforcement du Fichier de données longitudinales sur la main-d'œuvre (065-2015)
- Ajout de nouvelles cohortes à la base de données sur la mobilité intergénérationnelle du revenu (066-2015)
- Renforcement de la base de données des personnes qui revendiquent le statut de réfugié (067-2015)
- Couplage du Programme du Recensement de la Population de 2016 avec les dossiers de déclaration d'impôt sur le revenu des particuliers et de prestations (071-2015)
- Couplage des données de la composante annuelle de 2016 de l'Enquête sur la santé dans les collectivités canadiennes (ESCC) avec les données fiscales (072-2015)
- La relation entre le développement social dans la petite enfance et les résultats économiques à long terme : un couplage des données de l’Étude longitudinale et expérimentale de Montréal (ELEM), de l’Étude longitudinale des enfants de maternelle au Québec (ELEMQ), et du fichier sur la famille T1 (FFT1) (073-2015)
- Ajout des variables de la catégorie d'admission des immigrants au Programme du Recensement de la population de 2016 (075-2015)
- Disparités en matière de mortalité entre Noirs et Blancs : utilisation subséquente des fichiers de couplage 049 2012 – (076 2015)
- Analyse de microsimulation de l'hétérogénéité cachée dans la mortalité de la population : utilisation subséquente du couplage 049-2012 – (077-2015)
- Déterminants sociaux et spatiaux de la mortalité dans les maritimes d'après la cohorte du Recensement du Canada de 1991 : utilisation subséquente du couplage 049-2012 – (078-2015)
- Les déterminants socioéconomiques des changements dans la distribution des décès selon l'âge, le sexe et la cause au Canada : utilisation subséquente du couplage 049-2012 – (079-2015)
- Changements dans le travail et les gains après des chocs pour la santé (082-2015)
- Couplage de l'Enquête financière sur les fermes et des données fiscales (083-2015)
- Agence de promotion économique du Canada atlantique (APECA) – Mise à jour du rapport d'évaluation de rendement des entreprises (2016) (087-2015)
- Enquête canadienne sur le revenu : couplage avec les fichiers des données sur le revenu (091-2015)
- Perspectives longitudinales sur l'emploi, le revenu et la santé : couplage du Fichier de données longitudinales sur la main-d'œuvre, du Recensement de 1991, de la Base canadienne de données sur la mortalité et de la Base canadienne de données sur le cancer (092-2015)
- Couplage du Recensement de la population de 2006 et du Registre des Indiens (RI) aux enregistrements sur la mortalité dans le but d'estimer les taux de mortalité parmi les Premières Nations, ce qui comprend les Indiens inscrits, les Inuits et les Métis, et d'examiner l'effet des déterminants sociaux de la santé sur le risque relatif de décès parmi les populations autochtones. (093-2015)
- Création d'un dépôt d'enregistrements dérivés et d'un registre des clés pour l'Environnement de couplage de données sociales (094-2015)
Appariement des enregistrements de l'Enquête du Programme d'évaluation internationale des compétences des adultes (PEICA), 2011, du Recensement de la population de 2011 et de l'Enquête nationale auprès des ménages de 2011 (ENM); (002-2015)
Objet : Compte tenu du fait que les pratiques linguistiques des minorités de langue officielle sur le marché du travail et au sein de leurs communautés exercent une influence sur leur vitalité culturelle et économique, le couplage des données du PEICA avec celles de l'ENM et du Recensement de 2011 permettra d'avoir de l'information sur chacun des membres du ménage des répondants à l'enquête PEICA, ce qui n'est pas possible pour l'instant. Cela nous permettra de mieux comprendre le lien entre les caractéristiques des membres du ménage et le niveau des compétences mesurées dans le PEICA. De plus, le recensement et l'ENM comportent des questions qui n'ont pas été posées dans l'enquête PEICA (par ex. questions pour dériver la première langue officielle parlée, question sur l'utilisation régulière des langues au travail, etc.), d'où l'importance de coupler ces données provenant de sources différentes.
Description : L'Enquête du PEICA s'inscrit dans la série d'enquêtes internationales réalisées depuis le milieu des années 1980 visant à mesurer les diverses dimensions des compétences des adultes en matière de littératie, de numératie et de résolution de problèmes. Le Recensement et l'ENM de 2011 contiennent des informations sur la première langue officielle parlée des répondants ainsi que sur les membres du ménage du répondant.
Le couplage d'enregistrements du PEICA, du Recensement et de l'ENM de 2011 utilise un programme d'appariement d'enregistrements (hiérarchique déterministe).
Seuls les répondants à l'Enquête du PEICA ainsi que les membres de leur ménage seront conservés pour ce couplage d'enregistrements.
Produit : Seules les estimations présentant des données agrégées conformément aux éléments sur la confidentialité tel que stipulé dans la Loi sur la Statistique seront diffusées à l'extérieur de Statistique Canada. Les produits découlant de ce couplage entre le PEICA, le recensement et l'ENM prendront la forme de tableaux croisés, de graphique, de cartes géographiques et de résultats de régressions logistiques et linéaires multivariées.
Les résultats du couplage, incluant les variables utilisées pour effectuer le couplage des enregistrements, telles que les identifiants personnels et l'information pour mesurer la qualité de ce couplage, seront détruits au plus tard, le 31 mars 2016 ou dès qu'ils ne seront plus requis. Tous les fichiers seront conservés sur un serveur dans un endroit sécurisé. L'accès aux résultats du couplage est limité aux employés de Statistique Canada et aux employés réputés de Statistique Canada dont l'affectation de travail requiert un tel accès.
Élaboration de modèles prédictifs pour l'admission dans des établissements de soins de longue durée et des établissements de soins pour bénéficiaires internes au Canada – couplage des données de l'Enquête sur la santé dans les collectivités canadiennes (ESCC) aux données sur les hôpitaux, sur la mortalité, aux données du Recensement de 2011, aux données fiscales et aux données du Système d'information sur les soins de longue durée (003-2015)
Objet : Ce projet de couplage vise à déterminer les facteurs associés à l'admission dans des établissements de soins de longue durée et des établissements de soins pour bénéficiaires internes de Canadiens résidant dans des ménages, ainsi qu'à élaborer un modèle prédictif qui peut être utilisé pour estimer la demande future de ces services. À l'heure actuelle, au Canada, comme dans d'autres pays développés, il existe des préoccupations et un débat permanent concernant la demande future de soins de longue durée et de soins pour bénéficiaires internes. À l'heure actuelle, les estimations des besoins futurs de soins de longue durée dépendent généralement uniquement de projections démographiques fondées sur l'âge et le sexe, et ne tiennent pas compte d'autres facteurs connus pour être reliés à l'admission, y compris l'incapacité physique et mentale, les affections aiguës (p. ex. accident vasculaire cérébral et fracture de la hanche), le soutien social et la composition du ménage (p. ex. vivre seul ou avec d'autres) et le revenu. Même si quelques études canadiennes ont été menées sur des prédicteurs des soins de longue durée fondés sur la population, aucune n'a tenu compte d'une gamme complète d'états de santé et d'affections aiguës ou de changements dans le statut du logement des ménages. Par ailleurs, on dispose actuellement de très peu d'information concernant les facteurs associés à l'admission dans des établissements de soins pour bénéficiaires internes, un service de plus en plus important pour les personnes âgées ayant des besoins moins grands en matière de santé. Cette initiative de couplage de données créera une cohorte longitudinale rétrospective unique, grâce au couplage de données d'une enquête sur la santé, de données administratives sur la santé et de données du recensement, afin de suivre les répondants d'enquête au fil du temps en vue de déterminer les facteurs associés à la transition de la collectivité à des soins de longue durée ou des soins pour bénéficiaires internes.
Description :Misant sur les couplages existants, ce projet élargira le couplage des données de l'ESCC (2000-2001 à 2011, 4.2) à la Base de données sur les congés des patients (BDCP, 1996-1997 à 2013-2014), à la Base canadienne de données sur la mortalité (BCDM, 2000 à 2012), et au Fichier historique de données fiscales sommaires (FHDFS, 1990 à 2012, couplage d'enregistrements no 030-2012), de façon à inclure les données du Recensement de 2011, du Fichier T1 sur les familles (2000 à 2013) et du Système d'information sur les soins de longue durée (SISLD), pour fournir des renseignements sur les personnes vivant en établissement. Seuls seront couplés les enregistrements des participants à l'ESCC qui ont consenti à ce que leurs données d'enquête soient couplées à d'autres renseignements.
L'ESCC fournit des renseignements exhaustifs concernant l'état de santé, la situation socioéconomique et le statut du logement des personnes âgées vivant dans la collectivité. La BDCP et le Système national d'information sur les soins ambulatoires fournissent des renseignements exhaustifs concernant l'utilisation des services hospitaliers, y compris le diagnostic, le traitement et l'utilisation des ressources qui peuvent servir à déterminer des événements indésirables importants touchant la santé. La BCDM fournira des renseignements concernant les résultats en matière de mortalité et la cause principale du décès, et elle permettra de calculer la perte de sujets au suivi et aux événements concurrents. Le FHDFS sera utilisé pour faciliter le couplage des enregistrements. Le Fichier T1 sur les familles fournira des renseignements sur le revenu des particuliers et des familles ainsi que sur la composition du ménage. Le Recensement de la population de 2011 et le SISLD serviront à identifier les personnes qui ont effectué la transition vers des institutions ou des établissements de soins pour bénéficiaires internes après avoir répondu à l'enquête. Le fichier d'analyse final ne contiendra pas d'identificateurs personnels directs tels que les noms, les numéros d'assurance-maladie ou les numéros d'enregistrement de décès, ni de données fiscales.
Produit : Les fichiers de données couplées demeureront en tout temps dans les locaux du bureau central de Statistique Canada. Seules des données agrégées non confidentielles qui sont conformes aux dispositions en matière de confidentialité de la Loi sur la statistique seront diffusées à l'extérieur de Statistique Canada. Les résultats principaux serviront à rédiger des documents de recherche en vue de leur publication dans des revues à comité de lecture (y compris les Rapports sur la santé de Statistique Canada) et de leur présentation dans le cadre d'ateliers et de conférences.
Les fichiers d'analyse couplés, dépouillés d'identificateurs personnels directs, seront conservés jusqu'à ce que Statistique Canada n'en ait plus besoin, au plus tard le 31 décembre 2020, après quoi ils seront détruits. Les fichiers correspondants de clés de couplage se trouvant au bureau central de Statistique Canada seront aussi conservés jusqu'à ce que Statistique Canada n'en ait plus besoin, au plus tard le 31 décembre 2020, après quoi ils seront détruits.
Enquête sociale générale de 2015 sur l'Emploi du temps : couplage des données fiscales tirées des Fichiers Maître T1, T1FF et Sommaire et supplémentaire T4 (007-2015)
Objet : Le programme de l'Enquête sociale générale (ESG), qui a débuté en 1985, consiste à mener des enquêtes téléphoniques provenant d'un échantillon sélectionné dans les 10 provinces (excluant les Territoires). L'ESG est reconnue comme un outil qui assure la collecte continue de données transversales, ce qui permet l'analyse des tendances ainsi que l'élaboration et la mise à l'essai de nouveaux concepts qui tiennent compte des nouvelles questions d'intérêt. Chaque année, l'ESG dirige son attention sur un sujet différent tel que la famille, la victimisation, le soutien social et le vieillissement de la population ainsi que l'emploi du temps. Un sujet précis est habituellement répété environ tous les cinq ans. L'ESG de 2015 porte sur l'Emploi du temps.
L'ESG de 2015 sur l'Emploi du temps en est à sa cinquième itération d'une série d'enquêtes qui a débuté en 1986.
Le couplage des réponses fournies pendant l'ESG de 2015 sur l'Emploi du temps aux dossiers fiscaux des répondants, ainsi qu'à ceux des personnes vivant avec lui dans le même ménage, donnera lieu à des données beaucoup plus justes quant au revenu (personnel et du ménage). Du même coup, le couplage représente également un allègement du fardeau du répondant et une réduction des coûts liés à la collecte et au traitement de données
Description : L'ESG de 2015 sur l'Emploi du temps est une enquête échantillon effectuée selon un plan transversal. Elle est menée à titre d'enquête téléphonique et/ou internet au moyen d'interview assistée par ordinateur ou du questionnaire électronique pour les individus résidant dans les 10 provinces canadiennes.
En ayant recours au couplage d'enregistrements, on cherche à obtenir des données de meilleure qualité quant aux revenus (personnel et du ménage).
Les questions portant sur le revenu montrent des taux de non-réponse plutôt élevés, les revenus rapportés par les répondants sont habituellement approximatifs et l'imputation par donneur est utilisée pour imputer les non-réponses partielle et ponctuelle.
Les renseignements recueillis lors de l'ESG de 2015 sur l'Emploi du temps seront couplés aux dossiers fiscaux (T1, T1FF ou T4) du répondant, ainsi qu'à ceux de chacun des membres du ménage.
Les répondants seront prévenus du couplage avant et lors de l'interview. Pour ceux qui s'y opposent, leur refus sera retenu et aucun couplage à leurs données fiscales ne sera effectué.
Produit : La disponibilité du fichier de données analytiques de l'ESG de 2015 sur L'emploi du temps fera l'objet d'une annonce dans le Quotidien. Ce dernier fichier sera accessible aux chercheurs de Statistique Canada, ainsi qu'aux employés réputés des Centres de données de recherche de Statistique Canada. Toutes les données demeureront confidentielles et protégées en vertu de la Loi sur la statistique.
Des résultats agrégés non confidentiels feront l'objet d'une analyse diffusée à l'occasion de l'annonce de la disponibilité du fichier de données analytiques (dans le Quotidien).
Banque de développement du Canada : L'importance des services aux clients de la Banque de développement du Canada par rapport au rendement et à la survie des entreprises (008-2015)
Objet : Le projet examine le rendement des clients de la BDC comparativement à celui des entreprises qui ne reçoivent pas d'orientation et de soutien de la part de la BDC, les caractéristiques les plus touchées par un soutien de la BDC, et les services qui ont la plus grande influence sur la croissance et la survie des entreprises. En ayant une meilleure compréhension de l'influence des services qu'elle offre, la BDC pourra les adapter afin de donner un meilleur soutien à ses clients dans le futur.
Description : Une liste des entreprises du portefeuille de la BDC pour la période de 2008 à 2012 sera couplée aux données du Fichier de microdonnées longitudinales des comptes nationaux (données du Registre des entreprises, de la base de données de l'impôt des sociétés- T2, PD7, T4). Les enregistrements des entreprises de la BDC seront couplés de manière probabiliste à l'aide du nom et de l'adresse. Il s'agit d'un couplage unique.
Produit : Seuls les analyses et produits statistiques agrégés non confidentiels conformes aux dispositions relatives à la confidentialité de la Loi sur la statistique seront diffusés à l'extérieur de Statistique Canada.L'information sera présentée sous forme de tableaux des résultats de régression et de statistiques sommaires en lien avec l'objectif du projet quant à la détermination de l'influence de recevoir un soutien de la BDC.
Le fichier couplé sera conservé jusqu'au 31 mars 2020. Une fois le couplage terminé, tous les identificateurs directs des entreprises seront supprimés du fichier d'analyse et placés dans un fichier de clé de couplage distinct. Le fichier de couplage et le fichier de clé de couplage seront conservés jusqu'à ce qu'ils ne soient plus utiles ou jusqu'au 31 mars 2020, puis seront détruits.
Couplage des données du questionnaire de l'enseignant de 2014 aux données de l'Étude sur la santé des jeunes Ontariens (ESJO) de 2014 (010-2015)
Objet : Le principal objectif de ce couplage est de combiner les données fournies par l'enseignant d'un jeune qui a participé à l'Étude sur la santé des jeunes Ontariens (ESJO) de 2014 avec les données tirées de l'ESJO principale. Le couplage permettra de brosser un portrait plus complet de la santé mentale des jeunes en Ontario.
Description : Les réponses au questionnaire de l'enseignant et à l'Étude sur la santé des jeunes Ontariens (ESJO) de 2014 seront appariées pour chaque répondant au moyen du numéro d'identification de l'échantillon (variable qui permet d'identifier un enfant dans l'échantillon seulement). Ce couplage de données servira à créer un fichier analytique.
Produit : Les données tirées du questionnaire de l'enseignant comprendront des renseignements au sujet des résultats scolaires de l'enfant et de son comportement à l'école et seront combinées aux données déclarées par le parent ou tuteur dans l'Étude sur la santé des jeunes Ontariens de 2014. Les données sont traitées et préparées en vue de leur diffusion au moyen d'un ensemble de produits statistiques courants, y compris des fichiers analytiques (dont les identificateurs personnels ont été supprimés) accessibles dans les centres de données de recherche.
Surveillance du cancer de la prostate et expositions professionnelles : utilisation subséquente du couplage 049-2012 (011-2015)
Objet : L'utilisation d'un ensemble de données démographiques vaste et accessible comme celui de la cohorte du recensement canadien de 1991 permettra d'obtenir des données sur les expositions professionnelles multiples et le cancer de la prostate afin de faire avancer la recherche sur l'identification des facteurs de risque pour le cancer de la prostate. Il est nécessaire d'examiner les expositions professionnelles et le cancer de la prostate au niveau national à la lumière des renseignements disponibles sur les professions. Ce vaste ensemble de données ajoutera aux connaissances et à la compréhension tout en contribuant à combler les lacunes de la littérature. Il s'agit d'un important domaine de recherche, car l'incidence du cancer de la prostate est à la hausse et l'on sait encore peu de choses sur l'étiologie de ce cancer. Ce que les chercheurs veulent savoir, c'est s'il existe un lien entre les expositions professionnelles et le cancer de la prostate chez les travailleurs canadiens. Leurs objectifs sont de tester les hypothèses pertinentes liées aux expositions professionnelles dans l'étiologie du cancer de la prostate et de déterminer si les expositions propres à un secteur ou une profession donnés sont associées au cancer de la prostate chez les travailleurs canadiens.
Description : L'Étude canadienne de suivi de la mortalité et du cancer selon le recensement de la population canadienne de 1991 est une base de données produite par couplage probabiliste d'enregistrements. Cette étude faisait le suivi de la mortalité, du cancer et du lieu de résidence annuel chez environ 2,7 millions de personnes de 25 ans et plus qui avaient répondu au questionnaire complet du Recensement de 1991.
Produit : Seules des données agrégées et des analyses respectant les dispositions en matière de confidentialité de la Loi sur la statistique seront diffusées à l'extérieur des centres de données de recherche de Statistique Canada, sous la forme d'articles de revue à comité de lecture, de présentations à des conférences et d'une partie d'un mémoire de maîtrise ou d'une thèse de doctorat.
Couplage des données de l'Enquête canadienne sur l'incapacité de 2012 et de l'Enquête nationale auprès des ménages de 2011 (013 2015)
Objet : L'Enquête canadienne sur l'incapacité (ECI) est une enquête postcensitaire qui sert à recueillir des renseignements sur les Canadiens dont les activités quotidiennes sont limitées par leur état de santé ou un problème de santé. Les renseignements provenant de cette enquête sont essentiels à l'élaboration efficace et au bon fonctionnement de programmes nationaux comme ceux axés sur l'équité en matière d'emploi, et le gouvernement du Canada en a besoin pour s'acquitter de divers engagements internationaux, dont ceux découlant de la Convention des Nations Unies relative aux droits des personnes handicapées.
Une demande (024 2013) avait été présentée en avril 2013 afin d'effectuer le couplage des données de l'ECI de 2012 et de l'Enquête nationale auprès des ménages (ENM) de 2011. Le couplage des fichiers de données a été approuvé, et un fichier analytique final a été créé à l'automne de 2013. La période de conservation du fichier composite de l'ECI et de l'ENM a pris fin en août 2014, mais nous recevons un certain nombre de demandes en vue d'incorporer d'autres variables de l'ENM au fichier. La présente demande vise donc à enrichir le potentiel analytique du fichier de microdonnées de l'ECI de 2012 en y incorporant des variables additionnelles, qui n'étaient pas incluses dans la demande initiale.
Les chercheurs utilisant les données de l'ECI ont dit souhaiter que les nouvelles variables de l'ENM soient ajoutées au fichier existant, afin d'accroître les possibilités d'analyse. Les données de l'ENM complètent celles de l'ECI, fournissant des renseignements sur des sujets qui étaient exclus de la portée de l'ECI ou qui n'y étaient abordés que de façon très limitée dans le but d'alléger le fardeau de réponse. Les nouvelles variables que l'on propose d'incorporer concordent avec l'objectif d'enrichir le potentiel analytique du fichier de microdonnées de l'ECI de 2012.
Description : Les réponses recueillies dans le cadre de l'ECI de 2012 et de l'ENM de 2011 seront appariées pour chaque répondant au moyen des variables frame_id (qui identifie de façon unique un ménage donné au Canada) et persnr (qui identifie de façon unique une personne donnée à l'intérieur du ménage). Le couplage servira à produire le fichier de microdonnées analytiques couplées de l'ECI et de l'ENM.
Produit : Les données couplées de l'Enquête canadienne sur l'incapacité de 2012 et de l'Enquête nationale auprès des ménages de 2011, incluant les nouvelles variables demandées, seront diffusées dans le fichier de microdonnées d'analyse produit pour l'ECI de 2012. Un fichier de microdonnées a été transmis au Centre fédéral de données de recherche en janvier 2014, et il sera diffusé de nouveau au printemps de 2015, une fois que les nouvelles variables y auront été incorporées. Tous les produits de l'ECI contenant des données couplées seront diffusés en conformité avec les politiques, les lignes directrices et les normes de Statistique Canada. Seules des estimations statistiques agrégées respectant les dispositions de la Loi sur la statistique en matière de confidentialité seront diffusées à l'extérieur de Statistique Canada.
Agence de développement économique du Canada pour les régions du Québec (ADECRQ) – Retombées économiques 2001- 2012 (018-2015)
Objet : Appuyer l'évaluation du programme des services de financement de l'Agence de développement économique du Canada pour les régions du Québec (ADECRQ) en produisant des mesures objectives des retombées économiques du programme sur le rendement des petites et moyennes entreprises. Des indicateurs de rendement clé ainsi que des mesures de la valeur ajoutée (p. ex. ventes, bénéfices, taux de survie des entreprises, emploi) seront calculés pour les entreprises s'appuyant sur l'ADECRQ et pour les entreprises comparables n'ayant pas recours à l'Agence.
Description : Une liste d'entreprises qui étaient des clientes de l'ADECRQ pendant la période de 2001 à 2012 sera couplée au Registre des entreprises pour obtenir le Numéro d'entreprise et le numéro d'entreprise statistique afin de faciliter l'appariement des données sur la paie et des données fiscales. Afin de mesurer l'efficacité et les retombées des services de financement de l'ADECRQ, un groupe de comparaison formé d'entreprises non clientes de l'ADECRQ aux caractéristiques semblables sera sélectionné.
Les enregistrements des clients de l'ADECRQ et des entreprises du groupe de comparaison seront couplés au compte de retenues sur la paie (PD7), aux données fiscales des sociétés T2, à l'Index général des renseignements financiers (IGRF), aux données de Recherche et développement dans l'industrie canadienne et aux données du Plane comptable pour la période de 2001 à 2012. Les enregistrements seront couplés à l'aide du Numéro d'entreprise (NE) et du numéro d'entreprise statistique. Le fichier de couplage qui en résultera servira à l'analyse longitudinale de chaque cohorte. Il s'agit d'un couplage unique.
Produit : Seuls des analyses et des produits agrégés non confidentiels respectant les dispositions en matière de confidentialité de la Loi sur la statistique seront diffusés à l'extérieur de Statistique Canada. Il s'agira de tableaux sommaires distincts des résultats d'analyses de régression liés aux hypothèses à l'étude quant aux retombées économiques des services de financement de l'ADECRQ et de tableaux de profils.Un rapport sur la méthodologie sera préparé afin d'expliquer le processus d'appariement des fichiers ainsi que les contraintes et les principales difficultés entourant la qualité des données. Statistique Canada produira un rapport d'analyse.
Accroître la pertinence des fichiers longitudinaux (023-2015)
Objet : L'objet de ce couplage est d'ajouter des mesures répétées qui ont trait aux domaines de résultats importants pour chacun des répondants aux cinq enquêtes longitudinales qui ont pris fin. Le couplage accroîtra la pertinence analytique de ces enquêtes et exige peu d'investissement comparativement aux coûts d'une nouvelle collecte de données. Le couplage permettra aux chercheurs à Statistique Canada et dans les centres de données de recherche d'analyser les résultats à plus long terme pour les cohortes des cinq enquêtes longitudinales.
Description : Les enquêtes longitudinales dont il est question sont :
- l'Enquête auprès des jeunes en transition (EJET),
- l'Enquête nationale sur la santé de la population (ENSP), volet des ménages,
- l'Enquête sur la dynamique du travail et du revenu (EDTR),
- l'Enquête longitudinale nationale sur les enfants et les jeunes (ELNEJ),
- l'Enquête longitudinale auprès des immigrants du Canada (ELIC)
Pour accroître la valeur analytique de ces enquêtes, un fichier comportant les variables qui mesurent des résultats clés (p. ex. le revenu, la santé, l'emploi et la mobilité) sera créé à l'aide des bases de données administratives et d'enquêtes de Statistique Canada suivantes :
- Recensements de 2006 et de 2011
- Enquête nationale auprès des ménages de 2011
- Statistique de l'état civil – Base de données sur les décès (de 1993 à 2011)
- Registre canadien du cancer (qui comporte les diagnostics de cancer de 1992 à 2011)
- Fichier sur la famille T1 (T1FF) (de 1993 à 2011)
Produit : Seules des données agrégées et des analyses respectant les dispositions en matière de confidentialité de la Loi sur la statistique seront diffusées en dehors des centres de données de recherche de Statistique Canada, sous forme d'articles de revue à comité de lecture, d'exposés dans le cadre de conférences et de thèses ou de mémoires de deuxième cycle.
Examen de l'association entre l'incidence du cancer de la peau avec présence de mélanome et l'exposition au rayonnement ultraviolet environnemental, à partir de la Cohorte du recensement canadien de 1991. Utilisation subséquente du fichier de couplage 049-2012. (030-2015)
Objet : La présente étude épidémiologique nationale examinera la relation entre le rayonnement ultraviolet (UV) moyen ambiant résidentiel sur une période de 16 ans et le risque relatif de développer le mélanome au Canada. Les répondants de la Cohorte du recensement canadien de 1991 seront couplés sur le plan spatial avec une moyenne mensuelle modélisée du rayonnement UV environnemental et les estimations de l'indice UV selon le code postal. Des modèles de surface des valeurs UV de chaque mois seront établis à l'aide de l'interpolation spatiale du Système d'information géographique (SIG). À partir de ces modèles de surface, les valeurs du rayonnement UV et de l'indice UV seront attribuées aux localités définies selon un code postal unique pour chacun des mois d'été et mises en correspondance avec les répondants de la Cohorte du recensement canadien de 1991 répartis selon leur code postal pour chacune des 16 années du suivi de la cohorte. Les modèles à risques proportionnels de Cox seront utilisés pour estimer le risque de diagnostic de mélanome associé à l'exposition au rayonnement UV estival selon le sexe, le groupe d'âge, les groupes de minorités visibles et les groupes socioéconomiques.
Description : Les modèles de rayonnement UV environnemental seront transmis aux chercheurs de Statistique Canada dans le cadre d'une collaboration avec Environnement Canada et le Centre mondial de données sur l'ozone et le rayonnement ultraviolet (WOUDC). Les ensembles de données sur le rayonnement UV comprennent des valeurs des moyennes mensuelles du rayonnement UV quotidien et de l'indice UV moyen à midi, pour la période allant de 1980 à 1990.
La Cohorte du recensement canadien de 1991 : Projet pilote de suivi de la mortalité et de l'incidence du cancer est une base de données produite par couplage probabiliste d'enregistrements. Quelque 2,7 millions de personnes âgées de 25 ans et plus, ayant rempli le questionnaire complet du Recensement de 1991, ont fait l'objet d'un suivi relatif à la mortalité, au cancer et au lieu de résidence annuel.
Examen des effets de mortalité et des inégalités socioéconomiques des émissions industrielles au moyen de la Cohorte du recensement canadien de 1991. Utilisation subséquente du couplage 049-2012. (032-2015)
Objet : La présente recherche examinera les différences socioéconomiques et les effets de mortalité potentiels découlant du fait d'habiter à proximité d'installations industrielles. Au moyen de la Cohorte du recensement canadien de 1991, les sujets seront liés sur le plan spatial aux installations industrielles dans une aire géographique précise, grâce au code postal résidentiel (de 1984 à 2006) et à l'emplacement des installations. L'analyse fera d'abord l'examen des différences socioéconomiques dans le potentiel d'exposition aux émissions industrielles au moyen de variables individuelles tirées du Recensement de la population de 1991 et de variables écologiques du Recensement de 1991. Ensuite, une modélisation de survie sera entreprise en assignant les émissions aux sujets en fonction de leurs codes postaux résidentiels. L'analyse comprendra les variables individuelles du Recensement de 1991 et les variables écologiques aux niveaux du secteur de recensement et de la division de recensement calculées précédemment par Statistique Canada.
Description : La Cohorte du recensement canadien de 1991 : suivi de la mortalité et de l'incidence du cancer est une base de données produite par couplage probabiliste d'enregistrements. Environ 2,7 millions de personnes de 25 ans et plus, qui ont répondu au questionnaire complet du Recensement de 1991, ont fait l'objet d'un suivi pour la mortalité, l'incidence du cancer et le lieu de résidence annuel.
Produit : Seules des données agrégées et des analyses conformes aux dispositions sur la confidentialité de la Loi sur la statistique seront publiées en dehors des centres de données de recherche de Statistique Canada, sous forme d'articles de revues à comité de lecture.
Enquête nationale auprès des apprentis (ENA) – 2015: couplage des données fiscales tirées du Fichier de la Famille T1 (033-2015)
Objet : L'Enquête nationale auprès des apprentis (ENA), qui a débuté en 1989, consiste à mener des enquêtes téléphoniques provenant d'un échantillon sélectionné des 10 provinces et des 3 territoires. L'ENA est une enquête occasionnelle, la dernière étant réalisée en 2007. L'ENA de 2015 est une enquête auprès des apprentis qui cible les personnes qui ont complété ou cessé l'apprentissage d'un métier en 2011, 2012 ou 2013. Cette enquête vise à comprendre les facteurs qui influencent le fait de terminer ou non l'apprentissage de son métier, les défis qui touchent la certification et l'efficacité des plus récents programmes de soutien financier. Elle sert également à examiner la transition vers le marché du travail des apprentis qui ont complété ou cessé l'apprentissage d'un métier.
Le couplage des réponses fournies pendant l'ENA de 2015 aux dossiers fiscaux des répondants, donnera lieu à des données beaucoup plus justes quant au revenu (personnel). Du même coup, le couplage représente également un allègement du fardeau du répondant et une réduction des coûts liés à la collecte et au traitement de données.
Description : L'ENA de 2015 est une enquête échantillon effectuée selon un plan transversal. Elle est menée à titre d'enquête téléphonique au moyen d'interview assistée par ordinateur pour les individus résidant dans les 13 provinces et territoires canadiens. En ayant recours au couplage d'enregistrements, on cherche à obtenir des données de meilleure qualité quant aux revenus (personnel).
Les renseignements recueillis lors de l'ENA de 2015 seront couplés aux dossiers fiscaux (T1FF) du répondant.
Les répondants seront prévenus du couplage lors de l'interview. Pour ceux qui s'y opposent, leur refus sera retenu et aucun couplage à leurs données fiscales ne sera effectué.
Produit : La disponibilité du fichier de données analytiques de l'ENA de 2015 fera l'objet d'une annonce dans le Quotidien. Ce dernier fichier sera accessible aux chercheurs de Statistique Canada, ainsi qu'aux employés réputés des Centres de données de recherche de Statistique Canada. Toutes les données demeureront confidentielles et protégées en vertu de la Loi sur la statistique.
Des résultats agrégés non confidentiels feront l'objet d'une analyse diffusée à l'occasion de l'annonce de la disponibilité du fichier de données analytiques (dans le Quotidien).
Amendement en vue d'inclure le T1FF et de prolonger d'une année la période de conservation des fichiers couplés; Enquête sociale générale de 2014 sur la victimisation : couplage des données fiscales tirées des Fichiers Maître T1, T1FF et Sommaire et supplémentaire T4 (040-2015, 075-2013)
Objet : Cette demande d'amendement au couplage d'enregistrements antérieurement revue et approuvée (#075-2013) ne change en rien l'objectif du couplage d'enregistrements et ne concerne que l'addition des données fiscales tirées du T1FF.
Le programme de l'Enquête sociale générale (ESG), qui a débuté en 1985, consiste à mener des enquêtes téléphoniques provenant d'un échantillon sélectionné dans les 10 provinces. Les habitants du Yukon, des Territoires du Nord-Ouest et du Nunavut ne font habituellement pas partie de la population cible de la plupart des ESG, exception faite des cycles portant sur la victimisation. L'ESG est reconnue comme un outil qui assure la collecte continue de données transversales, ce qui permet l'analyse des tendances ainsi que l'élaboration et la mise à l'essai de nouveaux concepts qui tiennent compte des nouvelles questions d'intérêt. Chaque année, l'ESG dirige son attention sur un sujet différent tel que la famille, la victimisation, le soutien social et le vieillissement de la population ainsi que l'emploi du temps. Un sujet précis est habituellement répété environ tous les cinq ans. L'ESG de 2014 qui porte sur la victimisation en est à sa sixième itération. Cette enquête est une source importante d'information afin de mieux comprendre à quel point les gens se sentent en sécurité, ce qu'ils pensent du système de justice et leurs expériences de la criminalité.
Le couplage des réponses fournies pendant l'ESG de 2014 sur la victimisation aux dossiers fiscaux des répondants, ainsi qu'à ceux des personnes vivant avec lui dans le même ménage, donnera lieu à des données beaucoup plus justes quant au revenu (personnel et du ménage). Du même coup, le couplage représente également un allègement du fardeau du répondant et une réduction des coûts liés à la collecte, au traitement de données ainsi qu'aux essais.
Description : L'ESG de 2014 sur la victimisation est une enquête échantillon effectuée selon un plan transversal. Elle est menée à titre d'enquête au moyen d'interview assistée par ordinateur pour les individus résidant dans les provinces canadiennes et est menée au moyen d'interview assistée par ordinateur et d'interview sur place assistée par ordinateur dans les territoires. En ayant recours au couplage d'enregistrements, on cherche à obtenir des données de meilleure qualité quant aux revenus (personnel et du ménage).
Les questions portant sur le revenu montrent des taux de non-réponse plutôt élevés, les revenus rapportés par les répondants sont habituellement approximatifs. Le couplage permettra d'obtenir l'information sans avoir à poser des questions à ce propos.
Les renseignements recueillis lors de l'ESG de 2014 sur la victimisation seront couplés aux dossiers fiscaux (T1 ou T4) du répondant, ainsi qu'à ceux de chacun des membres du ménage. Les variables clés concernant le ménage (adresse, code postal, numéro de téléphone), le répondant (numéro d'assurance sociale, nom, prénom, date de naissance/âge, sexe) et les autres membres du ménages (nom, prénom, âge, sexe et lien au répondant) seront utilisées au fin du couplage.
Les répondants seront prévenus du couplage avant et lors de l'interview. Pour ceux qui s'y opposent, leur refus sera retenu et aucun couplage à leurs données fiscales ne sera effectué.
Produit : La disponibilité du fichier analytique de données agrégées de l'ESG de 2014 sur la victimisation fera l'objet d'une annonce dans Le Quotidien. Ce dernier fichier sera accessible aux chercheurs de Statistique Canada, ainsi qu'aux employés réputés des Centres de données de recherche de Statistique Canada. Toutes les données demeureront confidentielles et protégées en vertu de la Loi sur la statistique.
Uniquement des résultats agrégés non confidentiels feront l'objet d'une analyse diffusée à l'occasion de l'annonce de la disponibilité du fichier de données analytiques (dans Le Quotidien).
Titre : Conséquences économiques à long terme pour la famille à la suite d'un diagnostic de cancer infantile (041-2015)
Objet : Les objectifs de cette étude sont les suivants : (1) évaluer la proportion de familles dont le revenu subit des répercussions et quantifier la mesure de ces répercussions à la suite d'un diagnostic de cancer infantile en couplant les cas incidents de cancer infantile aux données du fichier de l'impôt sur le revenu des parents et en examinant les conséquences économiques à court et à long terme en comparaison d'un ensemble de témoins appariés; (2) évaluer les facteurs liés au patient, à la maladie et à la famille susceptibles de se traduire par un plus grand écart économique, ou qui pourraient améliorer ou atténuer un tel écart; (3) évaluer la proportion de survivants du cancer dont le revenu subit des répercussions et quantifier la mesure de ces répercussions en examinant les conséquences économiques à court et à long terme en comparaison d'un ensemble de témoins appariés.
Descriptions : Les renseignements sur les enfants ayant reçu un diagnostic de cancer en Ontario contenus dans le Pediatric Oncology Group of Ontario Networked Information System (POGONIS) seront couplés avec le Fichier sur la famille T1 de Statistique Canada (T1FF), ainsi qu'avec deux variables du Fichier d'établissement des immigrants (FEI). Plus précisément, les diagnostics de cancer chez les enfants âgés de 0 à 14 ans, en Ontario, reçus entre 1992 et 2006, seront couplés au T1FF, à partir de 1989 jusqu'au T1FF le plus récent disponible au moment du couplage, ainsi qu'avec les variables de l'identificateur d'immigrant et de l'année d'établissement tirées du FEI. Les renseignements du T1FF et du FEI concernant les familles et les personnes survivantes d'un cancer seront examinés et comparés aux renseignements du T1FF et du FEI provenant d'un ensemble de familles appariées qui n'ont pas reçu un diagnostic de cancer infantile.
Le couplage sera produit par le personnel de Statistique Canada dans les locaux de l'organisme.
Produit : Seules les données agrégées qui respectent les dispositions de la Loi sur la statistique en matière de confidentialité seront diffusées à l'extérieur de Statistique Canada. Les résultats, notamment les documents de recherche, seront soumis aux fins de publication dans des rapports courants de Statistique Canada tels que les Rapports sur la santé et seront préparés en vue de leur soumission à des revues scientifiques internationales dotées d'un comité de lecture. Tous les rapports seront à la disposition du Pediatric Oncology Group of Ontario. Afin de permettre l'analyse continue des données, Statistique Canada conservera le fichier d'analyse couplé jusqu'au 31 décembre 2022, après quoi il sera détruit. La période de conservation pourra être raccourcie si les données ne sont plus utiles. L'accès au fichier d'analyse couplé sera limité aux employés de Statistique Canada et aux personnes réputées être employées de Statistique Canada dont le travail exige cet accès.
MODIFICATION : Couplage de données visant à examiner le cheminement des étudiants durant leurs études postsecondaires et sur le marché du travail, de 2005 à 2013 (042-2015)
Objet : Le principal objet de ce projet est de coupler les données administratives des étudiants d'établissements postsecondaires de 2005 à 2013 aux données fiscales des années correspondantes, tirées du fichier sur la famille T1 (FFT1). Cette modification vise à étendre jusqu'à 2013 la période d'observation, qui prenait fin à l'origine en 2012. Les données du FFT1 de 2013 ayant été diffusées, il est désormais possible d'étendre la portée du projet pour inclure l'année 2013.
Le couplage permettra de suivre les trajectoires des gains d'emploi après les études d'étudiants ayant fréquenté des établissements postsecondaires, selon le domaine d'études et par cohorte de diplômés.
Description : Les enregistrements d'étudiants de 14 établissements postsecondaires seront couplés aux données du FFT1. Le couplage visera les données sur une période de huit ans (2005 à 2013) et sera effectué en deux étapes.
Au cours de la première étape, les établissements postsecondaires transmettront un fichier renfermant, pour chaque étudiant, des variables d'identification ainsi qu'une variable de pseudo-identification. Le couplage sera fait avec le FFT1 renfermant un numéro d'identification et certaines variables qui serviront à mener la recherche. À la suite de ce couplage, toutes les variables d'identification des étudiants seront détruites, à l'exception de la variable de pseudo-identification fournie par les établissements postsecondaires.
Au cours de la deuxième étape, les établissements postsecondaires fourniront un fichier renfermant la variable de pseudo-identification et les renseignements des étudiants. Ce deuxième fichier sera couplé au FFT1 réduit de la première étape. Le couplage des enregistrements sera effectué par le personnel de Statistique Canada.
Produit : Les produits seront de deux types : 1) un rapport, qui sera présenté à Emploi et Développement social Canada, renfermant des tableaux de données et des modèles de régression sur l'ensemble des établissements postsecondaires participants; et 2) des rapports individuels sur chacun des établissements participants renfermant des statistiques agrégées sur leurs étudiants.
Deux types de fichiers de microdonnées seront créés afin de générer les deux types de produits : un fichier couplé sur l'ensemble des établissements participants pour la production du premier rapport, et un fichier couplé par établissement pour la production de rapports individuels.
D'autres travaux de recherche analytique pourraient être à partir des fichiers couplés.
Initiative pour les femmes entrepreneurs : couplage de la liste de clients à la Base de données canadienne sur la dynamique employeurs-employés, 2007 à 2012 (044-2015)
Objet : Fournir des renseignements statistiques en vue d'appuyer l'évaluation de l'efficacité de l'Initiative pour les femmes entrepreneurs (IFE) à venir en aide aux entreprises appartenant à des femmes, en comparant le rendement des entreprises d'une région donnée qui ont reçu une aide financière de l'Initiative à celui des entreprises de la même région qui n'en ont pas reçu. Diversification de l'économie de l'Ouest Canada (DEO), qui gère les programmes de l'IFE, utilisera cette information pour trouver des moyens plus efficaces de prêter assistance à ses clients. Les variations de l'emploi, les entreprises entrantes et sortantes, certaines statistiques financières ainsi que les mesures de l'emploi seront analysées.
Description : Une liste des entreprises qui ont bénéficié du soutien de l'IFE sera couplée à la Base de données canadienne sur la dynamique employeurs-employés (BDCDEE), 2007 à 2012, afin de distinguer les groupes qui reçoivent une aide et ceux qui n'en reçoivent pas et de produire des totalisations personnalisées sur les deux groupes.
Produit : Seuls les analyses et les produits statistiques agrégés non confidentiels et conformes aux dispositions relatives à la confidentialité de la Loi sur la statistique seront diffusés à l'extérieur de Statistique Canada. L'information sera présentée sous forme de tableaux statistiques et ventilée selon le secteur d'activité et la taille de l'entreprise.
Le fichier d'analyse couplé contenant les clés de couplage et les identificateurs sera conservé jusqu'au 31 mars 2018, ou jusqu'à ce qu'on n'en ait plus besoin, après quoi il sera détruit.
Étude sur la pollution atmosphérique : couplage des enregistrements du Recensement de la population de 2001, des fichiers de l'univers T1, de la Base canadienne de données sur la mortalité et de la Base canadienne de données sur le cancer (045-2015)
Objet : Évaluer l'impact sur la santé humaine de l'exposition à long terme à la pollution atmosphérique, en vue de fournir des renseignements sur lesquels fonder l'élaboration de normes pancanadiennes pour les polluants clés. Le couplage de sources distinctes d'information est pour Statistique Canada un moyen important de combler les lacunes connues dans les données environnementales ayant trait à l'exposition humaine à la pollution atmosphérique.
Les objectifs spécifiques de l'étude sont les suivants : déterminer si les décès non accidentels et les cancers sont associés à l'exposition à long terme à de faibles niveaux de polluants présents dans l'air ambiant.
Description : Un échantillon d'approximativement 3,7 millions de Canadiens a été sélectionné parmi les personnes ayant répondu au questionnaire complet du Recensement de la population de 2001 et les renseignements qu'elles ont fournis au recensement ont été couplés aux données des fichiers de l'univers T1 (1981 à 2021), de la Base de données sur la mortalité (2001 à 2021) et du Registre canadien du cancer (1992 à 2021) combinés. Les données sur la pollution atmosphérique (p. ex. les matières particulaires fines [PM2,5], le dioxyde d'azote [NO2], l'ozone [O3]) seront intégrées spatialement dans ces fichiers.
Les fichiers couplés ne contiendront que les éléments de données requis pour effectuer l'étude. Les identificateurs personnels, tels que le nom et le numéro d'assurance sociale, seront utilisés uniquement pour les besoins des couplages, puis supprimés du fichier de microdonnées couplées. Un échantillon seulement des personnes qui ont répondu au questionnaire complet du Recensement de 2001 est inclus dans le fichier.
Produit : Tout accès au fichier de microdonnées couplées sera limité aux employés de Statistique Canada (y compris aux personnes réputées être employées de Statistique Canada) dont le travail exige cet accès. Seules des données agrégées conformes aux dispositions relatives à la confidentialité de la Loi sur la statistique seront diffusées à l'extérieur de Statistique Canada. Les principaux résultats de l'étude serviront à rédiger des rapports de recherche en vue de leur publication dans des revues révisées par les pairs ainsi qu'à présenter des communications lors de conférences ou d'ateliers.
Le fichier couplé, dont auront été supprimés les identificateurs personnels, sera conservé jusqu'à ce qu'il ne soit plus nécessaire, puis sera détruit.
Couplage de l'Enquête annuelle de télédistribution (titre d'enquête de Statistique Canada) Rapport annuel pour les titulaires d'une licence d'entreprise de télédistribution (titre d'enquête du CRTC) aux données fiscales des entreprises T2 à des fins d'imputation pour les petites entités de télédistribution non enquêté (053-2015)
Objet : Couplage des données fiscales des entreprises en utilisant l'allocation GDA et la Charte comptable (COA) de façon à imputer certaines variables financières pour les petites entités de télédistribution non enquêté. L'utilisation des données fiscales pour le remplacement de données et la dérivation de ratios minimise le fardeau de réponse et fournit une meilleure couverture de l'industrie.
Description : Certaines variables financières comme les recettes et les dépenses d'exploitation, les salaires et rémunérations et l'amortissement pour les petites entités de télédistribution non enquêté sont imputés par remplacement direct de données fiscales au moyen de l'allocation GDA et sa Charte comptable (cellules COA). Des ratios de recettes et dépenses sont produits pour dériver le détail de certains postes de revenus et dépenses. Les numéros de BN et les noms des entités sont utilisés dans le processus de couplage.
Produit : Seuls des agrégats au niveau national ou pour de regroupements de provinces sont diffusés, une fois que la vérification de la confidentialité a été effectuée. Aucune donnée fiscale n'est fournie aux partenaires en vertu d'accords de partage. Les fichiers temporaires incluant des données fiscales au niveau de l'entreprise sont détruits après chaque cycle d'enquête, une fois que les données imputées ont été validées et intégrées dans la base de données de production finale.
Plateforme de couplage longitudinal en éducation (PCLE) : Création d'une plateforme de couplage d'enregistrements afin de permettre le développement d'indicateurs clés de l'éducation et la réalisation d'analyses liées aux programmes de l'éducation postsecondaire et d'apprentissage. (059-2015)
Objet : Les données longitudinales sont nécessaires pour l'élaboration d'indicateurs longitudinaux clés pancanadiens, ainsi que pour la réalisation d'analyses liées aux programmes d'études postsecondaires et d'apprentissage. Ces produits mèneront à une meilleure compréhension du cheminement scolaire dans le système postsecondaire et celui des programmes d'apprentissage, notamment les taux de persévérance et d'achèvement, ainsi que la situation des diplômés sur le marché du travail. Ces indicateurs seront utiles aux fins de l'élaboration et de la planification des politiques en matière d'éducation et de marché du travail, ainsi que pour combler les lacunes dans les connaissances actuelles.
Les fichiers de données administratives du Système d'information sur les étudiants postsecondaires (SIEP), du Système d'information sur les apprentis inscrits (SIAI) et du Fichier sur la famille T1 (FFT1) seront utilisés pour créer une plateforme de couplage des données longitudinales sur l'éducation avec d'autres sources de données énumérées plus bas.
La plateforme de couplage permettra d'utiliser les données administratives longitudinales tout en s'assurant de la protection des renseignements personnels.
Description : La population cible aux fins de la plateforme de couplage et l'élaboration des indicateurs de l'éducation comprend les personnes qui étaient inscrites à un établissement d'enseignement postsecondaire (SIEP) ou à un programme d'apprentissage, y compris des ouvriers qualifiés (SIAI), à un moment ou un autre depuis 2008. Les données relatives à certains secteurs pourront remonter jusqu'à 2004.
Des clés de couplage anonymisées seront associées aux enregistrements de variables analytiques des sources de données et tous les identificateurs personnels y seront supprimés. Un registre de ces clés de couplages sera créé. Afin d'assurer la confidentialité des renseignements, le registre des clés et les identificateurs personnels nécessaires à la mise à jour de la plateforme de couplage seront conservés séparément, et leur accès sera limité aux employés de Statistique Canada qui doivent les utiliser dans le cadre de leurs tâches. Le registre des clés sera utilisé pour créer des fichiers couplés personnalisés qui fusionneront des variables provenant des différentes sources de données afin de créer des indicateurs longitudinaux de l'éducation et de réaliser des analyses. Ces fichiers couplés personnalisés ne contiendront ni de clés de couplage des sources de données, ni d'identificateurs personnels.
Les sources de données utilisées pour construire la plateforme de couplage ou qui seront couplés aux fins d'analyses sont les suivantes :
- Enregistrements pancanadiens annuels tirés du Système d'information sur les étudiants postsecondaires (SIEP) à partir de 2008-09, et enregistrements pour certains territoires pour 2004-05, 2005-06, 2006-07 et 2007-08.
- Enregistrements pancanadiens annuels tirés du Système d'information sur les apprentis inscrits (SIAI) à partir de 2008-2009, et enregistrements pour certains territoires pour 2004, 2005, 2006 et 2007.
- Certains fichiers fiscaux, administratifs et certains fichiers de concordance nécessaires pour établir et valider la mise en correspondance des enregistrements entre les fichiers de données du SIEP et du SIAI.
- Fichier sur la famille T1 (FFT1), à partir de 1997.
- Enquête nationale auprès des apprentis, à partir de 2015.
- Enquête nationale auprès des diplômés, à partir de 2013 (diplômés de 2009-2010).
- Enquête auprès des diplômés de l'Alberta, à partir de 2004 ou de la première année disponible après 2004.
- Fichiers supplémentaires tirés des systèmes de données de l'Alberta qui sont utilisés pour déclarer les données du SIEP et du SIAI à Statistique Canada et fichiers provenant d'établissements d'enseignement sélectionnés, à partir de 2004.
- Fichier des immigrants reçus de Citoyenneté et Immigration Canada; le recensement; l'Enquête nationale auprès des ménages (ENM); la Base de données sur la dynamique canadienne entre employeurs et employés (BDDCEE); la base de données longitudinales sur les apprentis et les travailleurs qualifiés; tous à partir de 2004 ou de la première année disponible après 2004.
- Données sur les prêts et bourses aux étudiants et apprentis octroyés par les provinces, les territoires ou par Emploi et Développement social Canada (EDSC), à partir de 2004.
Des années additionnelles s'ajouteront au fur et à mesure que les données seront disponibles.
La production éventuelle de la plateforme de couplage longitudinale en éducation au sein de l'environnement de couplage de données sociales (ECDS) sera envisagée.
Produit : Les données analytiques couplées au moyen de la plateforme de couplage serviront à préparer des indicateurs, des tableaux, des rapports d'analyse et des documents de recherche, aux fins de publication, de présentations à des conférences, à des ateliers et à des réunions, ainsi qu'à répondre aux demandes de clients des projets à frais recouvrables. Elles serviront également à éclairer l'amélioration de la collecte des données sur l'éducation et la qualité des données.
Seules des statistiques et des analyses agrégées non confidentielles conformes aux dispositions de confidentialité de la Loi sur la statistique ou permises en vertu de cette loi seront diffusées à l'extérieur de Statistique Canada. Une approbation de divulgation discrétionnaire a été accordée afin de permettre au programme du SIEP de diffuser des renseignements agrégés sur les inscriptions et les diplômés à l'échelon des établissements d'enseignement postsecondaire pour les établissements qui ont signé une renonciation pour la période de diffusion précise du SIEP.
Base de données longitudinales sur les immigrants (BDIM) : Élargissement et mises à jour (060-2015)
Objet : La Base de données longitudinales sur les immigrants (BDIM) est utilisée pour analyser l'intégration économique des immigrants ainsi que leur mobilité interne. Il s'agit d'une source unique de données à Statistique Canada qui établit un lien direct entre la politique d'immigration et la performance économique des immigrants.
De façon plus particulière, la BDIM fournit aux ministères fédéraux et provinciaux concernés par les questions et les programmes d'immigration, de même qu'à la communauté des chercheurs et aux organismes d'aide à l'établissement des immigrants au Canada, des données essentielles pour effectuer de la recherche concernant le processus de sélection des immigrants, leur répartition au Canada et leur intégration économique.
Description : La Base de données longitudinales sur les immigrants (BDIM) est une base de données qui est créée grâce au couplage des fichiers administratifs sur les immigrants de Immigration, Réfugiés et Citoyenneté Canada (IRCC) et des dossiers de l'impôt des particuliers obtenus par Statistique Canada de l'Agence du revenu du Canada.
La BDIM comprend actuellement des données fiscales de 1982 à 2013 et englobe les immigrants ayant obtenu le droit d'établissement au Canada de 1980 à 2013. Elle est en voie d'être remaniée de la façon suivante :
- élargir l'univers de la base de données afin d'inclure les immigrants qui ont obtenu le droit d'établissement avant 1980 (1952 à 1979), pour assurer une meilleure couverture de la population immigrante du Canada;
- élargir l'univers de la base de données afin d'inclure les résidents temporaires qui sont arrivés au Canada de 1980 à 2019, pour tenir compte de l'expérience acquise avant l'établissement au Canada et pour étudier les trajectoires, à partir de l'arrivée comme résidents temporaires jusqu'à l'obtention du droit d'établissement;
- inclure une date de citoyenneté afin d'étudier les trajectoires menant à l'obtention de la citoyenneté;
- inclure une date de décès tirée de la Base de données combinées sur la mortalité, pour mieux tenir compte de la population faisant partie du champ d'observation;
- tirer parti de fichiers nouvellement élaborés comme le registre des personnes à charge, pour améliorer le couplage d'enregistrements;
- utiliser cette nouvelle méthodologie pour sept années de référence de mises à jour, c'est-à-dire les années de référence de données de 2013 à 2019 (pour les dossiers de l'immigration et les dossiers fiscaux).
On continuera d'ajouter des identificateurs d'immigrants à la Banque de données administratives longitudinales (DAL).
Produit : Seules des statistiques agrégées et des analyses conformes aux dispositions en matière de confidentialité de la Loi sur la statistique seront diffusées à l'extérieur de Statistique Canada. Elles prendront la forme de tableaux sur la répartition des revenus, la mobilité interprovinciale, le secteur d'emploi et les indicateurs provinciaux produits pour IRCC, ainsi que d'autres organismes fédéraux et provinciaux. Sur demande, des analyses multidimensionnelles et des tableaux statistiques seront produits à partir du fichier d'analyse de la BDIM pour les chercheurs. Le fichier d'analyse ne pourra être consulté que dans les locaux de Statistique Canada et que par les employés et les personnes réputées être employées de Statistique Canada dont les fonctions officielles exigent l'accès à ce fichier.
La base de données d'analyse couplée de la BDIM sera conservée au moins jusqu'en juillet 2021, date à laquelle le Conseil exécutif de gestion devra évaluer la poursuite du programme.
Enquête canadienne sur les mesures de la santé (ECMS) de 2016, cycle 5, Couplage avec les données fiscales (061-2015)
Objet : L'Enquête canadienne sur les mesures de la santé (ECMS), lancée en 2007, recueille des renseignements importants liés à la santé des Canadiens, au moyen de mesures physiques directes, comme la pression artérielle, la taille, le poids et la condition physique. En outre, dans le cadre de l'enquête, des échantillons de sang et d'urine sont prélevés et font l'objet de tests, afin de déterminer la présence de maladies chroniques et infectieuses, l'état nutritionnel et les marqueurs environnementaux.
Au moyen d'interviews menées auprès des ménages, des renseignements sont recueillis sur la nutrition, l'usage du tabac, la consommation d'alcool, les antécédents médicaux, l'état de santé actuel, le comportement sexuel, le mode de vie et l'activité physique, ainsi que sur certaines caractéristiques démographiques et socioéconomiques.
Tous ces renseignements précieux serviront à produire des données nationales de base, qui permettront d'évaluer l'étendue de problèmes de santé comme l'obésité, l'hypertension, la maladie cardiovasculaire et l'exposition aux maladies infectieuses et aux contaminants présents dans l'environnement. De plus, l'ECMS permettra de mieux connaître certaines maladies et d'avoir une meilleure idée de la proportion de maladies non diagnostiquées chez les Canadiens. Les données de l'enquête nous permettront d'examiner le lien entre l'état de santé et les facteurs de risque associés à la maladie et d'explorer les nouveaux enjeux en matière de santé publique.
Les données de l'ECMS sont représentatives de la population, rendent compte du fait qu'elle est en santé ou non, et donnent un meilleur aperçu de l'état de santé réel des Canadiens.
En couplant les données du cycle 5 de l'ECMS et les fichiers d'impôts des répondants, on obtiendra des renseignements plus précis sur le revenu (des particuliers et des ménages). Parallèlement, on allégera le fardeau de réponse et on réduira les coûts de la collecte et du traitement des données.
Description : Le cycle 5 de l'ECMS est une enquête sur échantillon comportant un plan transversal.
L'échantillon est réparti selon 11 groupes âge sexe, de 500 à 600 unités par groupe (5 700 au total) étant nécessaires pour produire des estimations nationales.
La collecte comprend une combinaison d'interviews sur place assistées par ordinateur et, pour les mesures physiques, de visites à un centre d'examen mobile (CEM) spécialement conçu pour les besoins de l'enquête.
Pour la période de collecte du cycle 5 (janvier 2016 à décembre 2017), environ 5 700 participants âgés de 3 à 79 ans répondront à un questionnaire sur la santé et passeront des tests administrés en vue de prendre des mesures physiques. La clinique mobile (CEM) sera installée dans 16 emplacements différents au Canada, et elle demeurera à chaque emplacement pendant environ cinq semaines.
Les données recueillies dans le cadre de l'ECMS de 2016 seront couplées aux fichiers d'impôts des particuliers (T1, FFT1 ou T4) des répondants, ainsi qu'aux fichiers d'impôts de tous les membres des ménages.
Les répondants seront informés du couplage prévu à la fin de l'interview des ménages. Tous les répondants qui s'opposent au couplage de leurs données ou des données des autres membres du ménage verront leurs objections consignées, et aucun couplage avec les données fiscales n'aura lieu.
Produit : La disponibilité du ou des fichiers de données du cycle 5 de l'Enquête canadienne sur les mesures de la santé sera annoncée dans Le Quotidien. Le fichier de données renfermant les données sur le revenu devrait être mis à la disposition, à l'automne 2016, des chercheurs autorisés dans les ministères et organismes partenaires (Santé Canada et l'Agence de la santé publique du Canada) dans le cadre d'un accord de partage, des chercheurs de Statistique Canada et des personnes réputées être employées des centres de données de recherche de Statistique Canada. Toutes les données demeureront confidentielles et seront protégées en vertu de la Loi sur la statistique. Le fichier de données ne comprendra aucun identificateur personnel.
Parallèlement à l'annonce de disponibilité du fichier de données analytiques (dans Le Quotidien), seules des statistiques agrégées non confidentielles seront diffusées.
Enquête canadienne sur le revenu : couplage avec les fichiers des données sur le revenu (063-2015)
Objet : L'objet est d'obtenir des données sur le revenu et de réduire le fardeau des répondants, la durée des interviews et les coûts de collecte pour l'Enquête canadienne sur le revenu. Le couplage permet d'obtenir des renseignements sur les variables du revenu sans imposer aux répondants des questions détaillées sur leur revenu.
Description : La base de données de l'Enquête canadienne sur le revenu et les fichiers T1, T1IDENT et T5007 seront couplés au moyen des variables d'appariement suivantes : l'adresse, la ville, la date de naissance, le prénom, le nom de famille, le sexe, la province, numéro d'assurance sociale, les codes pour le nom de famille, le code postal, l'état matrimonial, le numéro de téléphone et la première initiale. Ces renseignements seront retirés du fichier couplé dès que le couplage sera terminé et ils seront stockés séparément. L'accès à ces fichiers sera limité aux employés de Statistique Canada dont les fonctions justifient cet accès.
Produit : Aucune information renfermant des identificateurs personnels ne serait diffusée à l'extérieur de Statistique Canada à partir de cette activité de couplage. Seules les statistiques non confidentielles agrégées et les analyses conformes aux dispositions de la Loi sur la statistique en matière de confidentialité seront diffusées à l'extérieur de Statistique Canada.
Surveillance du cancer dans les professions au moyen des données de suivi de la mortalité et du cancer de 1991 à 2009 chez la cohorte du Recensement du Canada de 1991. Utilisation subséquente du couplage 049-2012 (064-2015)
Objet : Les objectifs de l'étude sont les suivants : 1) vérifier diverses hypothèses d'actualité et pertinentes au sujet du rôle de l'exposition professionnelle dans l'étiologie du cancer; 2) cibler des sièges de cancer et des agents soupçonnés d'être cancérigènes pour effectuer des analyses qui permettent de formuler des hypothèses éclairées; et 3) faire une analyse globale des liens entre la profession et le cancer au Canada. Les objectifs généraux de l'étude englobent la création d'une plateforme de surveillance du cancer professionnel, l'identification d'industries/profession et de niveaux d'exposition cibles sur lesquels axer les efforts de prévention et d'atténuation des risques, et la formulation d'hypothèses en vue de futures études étiologiques.
Une totalisation personnalisée de l'Enquête sur la dynamique du travail et du revenu (1996) a été utilisée pour élaborer une matrice de l'exposition au travail par quart. Cette matrice servira à estimer l'exposition au travail par quart dans la Cohorte du recensement canadien de 1991 selon le sexe, la profession et l'industrie.
Description : La Base de données de suivi de la mortalité et du cancer chez la cohorte du Recensement du Canada de 1991 est une base de données produite par couplage probabiliste d'enregistrements. On a procédé au suivi de la mortalité, du cancer et du lieu de résidence annuel chez environ 2,7 millions de personnes de 25 ans et plus qui avaient répondu au questionnaire complet du Recensement de 1991.
Produit : Seules des données agrégées et des analyses respectant les dispositions en matière de confidentialité de la Loi sur la statistique seront diffusées en dehors des centres de données de recherche de Statistique Canada, sous forme d'articles de revue à comité de lecture et d'exposés.
Renforcement du Fichier de données longitudinales sur la main-d'œuvre (065-2015)
Objet : Cette initiative vise à renforcer la valeur analytique du Fichier de données longitudinales sur la main d'œuvre en y intégrant des fichiers de données d'entrées supplémentaires et en faisant croître la taille de l'échantillon. Le Fichier de données longitudinales sur la main-d'œuvre est un fichier multifonctionnel qui vise à appuyer la recherche sur un éventail de questions relatives au marché du travail, telles que la mobilité des travailleurs, les mises à pied et les départs à la retraite.
Description : Les renseignements sur les entreprises seront tirés du fichier du Programme d'analyse longitudinale de l'emploi (PALE), tandis que les renseignements sur les personnes et les emplois seront tirés des fichiers T1, du fichier supplémentaire T4, du fichier T4, État des prestations d'assurance-emploi versées et du fichier des relevés d'emploi (RE). Tous les couplages seront effectués selon une méthode déterministe au moyen des numéros d'entreprise (NE) ou des numéros d'assurance sociale (NAS).
Les numéros d'entreprise et les NAS seront transformés en identificateurs personnels uniques, lesquels demeureront indiqués sous forme codée dans le fichier couplé sur les personnes. L'utilisation d'identificateurs codés permettra aux utilisateurs d'assurer un suivi longitudinal des personnes au fil du temps. Les codes postaux serviront à créer des variables géographiques, puis seront retirés des fichiers.
Tous les NE, les NAS et les codes postaux seront supprimés du fichier couplé et conservés séparément, et seuls les employés de Statistique Canada qui doivent les utiliser dans le cadre de leurs tâches pourront y accéder.
Produit : Les résultats méthodologiques et analytiques découlant de ces données couplées serviront à préparer des documents de recherche, en vue de leur publication dans des rapports analytiques, des publications scientifiques à comité de lecture (y compris les Rapports sur la santé de Statistique Canada) et CANSIM, ainsi que de présentations à des conférences, ateliers et réunions.
Seules des statistiques agrégées et des analyses conformes aux dispositions de confidentialité de la Loi sur la statistique seront diffusées à l'extérieur de Statistique Canada. Le fichier couplé sera conservé par Statistique Canada jusqu'au 31 décembre 2025, moment auquel il sera déterminé s'il faut continuer de le garder. L'ensemble des clés de couplage et des identificateurs seront supprimés du fichier couplé et conservés séparément, et leur accès sera limité aux employés de Statistique Canada qui doivent les utiliser dans le cadre de leurs tâches.
Ajout de nouvelles cohortes à la base de données sur la mobilité intergénérationnelle du revenu (066-2015)
Objet : Cette initiative vise à élargir l'étendue de la base de données sur la mobilité intergénérationnelle du revenu en intégrant des cohortes supplémentaires formées de jeunes Canadiens et de leurs parents au fichier et en mettant à jour plusieurs fichiers de données d'entrée. La base de données est utilisée pour étudier la portée dans laquelle les résultats au chapitre du revenu qu'atteindront les adolescents plus tard dans leur vie sont liés au revenu de leurs parents.
Description : Au moyen des renseignements du fichier sur la famille T1, la base de données sur la mobilité intergénérationnelle du revenu permet de jumeler chacun des adolescents avec les parents avec lesquels ils résident. Ces jumelages parents-adolescent sont par la suite couplés au Fichier maître des particuliers T1, ce qui permet d'effectuer le suivi des trajectoires du revenu des jeunes au cours de la trentaine et de la quarantaine. Des renseignements sont également disponibles sur le revenu déclaré par les parents de ces adolescents alors qu'ils étaient eux-mêmes dans la trentaine et la quarantaine. Cela permet aux chercheurs de comparer le revenu des jeunes avec celui de leurs parents alors que ces derniers se trouvaient à la même étape de leur vie.
Pour sélectionner la cohorte de 1991, un échantillon de toutes les personnes âgées de 16 à 19 ans en 1991 sera prélevé dans le fichier des familles T1 (FFT1) de 1991. Les jumelages parents-enfant sont fondés sur le numéro d'identification de la famille (FIN) indiqué dans le FFT1. Si aucun jumelage n'est possible pour 1991, on tentera d'en établir un pour chacune des années suivantes entre 1992 et 1995, afin d'améliorer la couverture de l'échantillon et d'atténuer le biais d'échantillonnage possible. Une fois que le fichier d'appariement des familles aura été créé, toutes les personnes dont le nom figure dans ce fichier seront liées aux renseignements administratifs contenus dans les fichiers T1 et les fichiers couplés T4-RE-PALE afin d'obtenir des renseignements longitudinaux sur les variations du revenu et de l'emploi au fil du temps. Ces couplages seront effectués selon une méthode déterministe fondée sur le numéro d'assurance sociale (NAS). Lorsque les fichiers de données couplés auront été créés, le NAS sera retiré du fichier couplé et remplacé par un identificateur personnel unique à 15 chiffres. Cela permettra de dégager des observations pour les années visées sans connaître le NAS des personnes concernées. Un programme confidentiel sera mené séparément pour convertir les NAS en identificateurs personnels, et son accès sera limité aux employés de Statistique Canada qui doivent utiliser le fichier couplé dans le cadre de leurs tâches. De plus, le numéro de compte de retenues sur la paie (PD) et le numéro d'entreprise (NE) seront supprimés du fichier et remplacés par un numéro d'identification du Registre des entreprises longitudinal (NIREL) unique. Le même processus sera suivi pour déterminer les cohortes de jeunes âgés de 16 à 19 ans en 1996 ou en 2001.
Produit : Les résultats méthodologiques et analytiques découlant des données couplées serviront à préparer des documents de recherche, en vue de leur publication dans des rapports analytiques, des publications scientifiques à comité de lecture et CANSIM, ainsi que de présentations à des conférences, ateliers et réunions. Le fichier couplé servira également dans l'élaboration de données tabulaires et d'indicateurs en vue de leur publication sur le site Web de Statistique Canada. Seules des statistiques agrégées non confidentielles qui ne permettent pas de déterminer l'identité d'une personne, d'une entreprise ou d'une organisation seront diffusées à l'extérieur de Statistique Canada.
Renforcement de la base de données des personnes qui revendiquent le statut de réfugié (067-2015)
Objet : Cette initiative vise à renforcer la base de données des personnes qui revendiquent le statut de réfugié, un fichier de données utilisé pour examiner les caractéristiques sur le revenu des personnes qui revendiquent le statut de réfugié au Canada. Le fait d'inclure des renseignements sur le revenu des personnes qui revendiquent le statut de réfugié et d'établir des liens vers les fiches d'établissement accroîtra les taux de couplage des dossiers, la qualité des données et la valeur analytique de la base de données. L'initaitive permettra d'obtenir de meilleurs renseignements sur les personnes qui revendiquent le statut de réfugié au Canada ainsi que sur leurs caractéristiques financières et leurs activités sur le marché du travail au fil du temps.
Description : En intégrant la décision rendue par la Commission de l'immigration et du statut de réfugié et la date à laquelle elle a été rendue dans le fichier de données couplé, nous ferons en sorte que ce dernier fournisse de meilleurs renseignements sur le revenu des demandeurs. Ces deux renseignements sont nécessaires pour cerner les personnes qui revendiquent le statut de réfugié qui ont quitté le pays et supprimer de la base de données ce groupe qui présente des données incertaines au chapitre du revenu. De plus, les renseignements sur le droit d'établissement provenant du fichier d'établissement des immigrants de Statistique Canada seront intégrés aux données.
Produit : Les résultats de l'analyse du fichier de données couplées seront utilisés pour préparer des totalisations et des documents de recherche pour publication.
Seules des statistiques agrégées et des analyses conformes aux dispositions de confidentialité de la Loi sur la statistique seront diffusées à l'extérieur de Statistique Canada. Le fichier couplé sera conservé à Statistique Canada jusqu'à ce qu'il ne soit plus utile, au plus tard le 31 décembre 2017, après quoi il sera détruit. L'ensemble des clés de couplage et des identificateurs seront supprimés des dossiers de sortie et conservés séparément, et leur accès sera limité aux employés de Statistique Canada qui doivent les utiliser dans le cadre de leurs tâches.
Couplage du Programme du Recensement de la Population de 2016 avec les dossiers de déclaration d'impôt sur le revenu des particuliers et de prestations (071-2015)
Objet : Le but est d'obtenir de l'information sur le revenu des personnes participant au Programme du Recensement de la population de 2016. Le Programme du Recensement exige des renseignements détaillés sur plusieurs différentes sources de revenus, ainsi que les impôts versés et diverses déductions et contributions. En outre, pour veiller à l'exactitude des données fournies, les répondants auraient à vérifier ces données dans leurs dossiers personnels. Le couplage du recensement avec les fichiers administratifs permet de réduire le fardeau de réponse et d'améliorer la qualité des données. Les données sur le revenu sont utilisées, entre autres, pour mesurer le revenu total, le revenu après impôt, les contributions à divers programmes, le revenu disponible et la mesure de faible revenu fondée sur un panier de consommation.
Description : Les renseignements des répondants sur les sources de revenus, les impôts payés et diverses dépenses sont extraites de leurs dossiers de déclaration fiscale de revenu des particuliers et des prestations (y compris, la déclaration d'impôt T1, divers feuillets d'information détenus par l'ARC et les programmes de la PFCE et de crédit pour la TPS) et joints à leurs réponses au Programme du Recensement (questionnaires abrégé et détaillé).
Produit : Seules les analyses et les estimations statistiques agrégées qui sont conformes aux dispositions en matière de confidentialité de la Loi sur la statistique sont diffusées à l'extérieur de Statistique Canada. Le recensement couplés aux renseignements des dossiers de déclaration fiscale de revenu des particuliers et des prestations sont utilisés pour produire des estimations sur le revenu diffusées dans la gamme de produits du recensement. Les produits du recensement comprennent un large éventail d'analyses et de tableaux standards de données ainsi que des tableaux personnalisés.
Les fichiers de contrôle et d'imputation couplée du recensement seront conservés indéfiniment. Le fichier des clés de couplage, qui contient les identificateurs personnels, sera conservé jusqu'en juin 2020 ou jusqu'à ce qu'il ne soit plus nécessaire, et il sera alors détruit. Tous les fichiers sont protégés par des mots de passe et conservés sur un serveur dans une zone sécuritaire. Seuls les employés de Statistique Canada dont les activités de travail nécessitent un accès à ces données sont autorisés à accéder aux fichiers des clés de couplage et aux fichiers de contrôle et d'imputation couplée du recensement.
Couplage des données de la composante annuelle de 2016 de l'Enquête sur la santé dans les collectivités canadiennes (ESCC) avec les données fiscales (072-2015)
Objet : Ce couplage a pour objet de réduire le fardeau de réponse des répondants tout en améliorant la qualité des données. Il vise également à réduire la durée globale de l'enquête, ce qui entraînera une réduction des coûts de la collecte des données.
Description : La Division de la statistique de la santé prévoit coupler les données de l'ESCC de 2016 aux fichiers d'impôt existants afin de recueillir de l'information au sujet du revenu.
La première étape consiste à déterminer si des données fiscales sont disponibles au sujet des ménages de l'échantillon de l'ESCC de 2016. Une fois ce renseignement obtenu, le répondant obtiendra un énoncé relatif au couplage d'enregistrements qui fait précisément mention du couplage avec les données fiscales. Le répondant peut refuser que ses données soient couplées. S'il refuse le couplage, il doit alors répondre à une série de questions sur son revenu. Dans le cas des ménages pour lesquels aucune donnée fiscale n'est disponible, les questions sur le revenu seront posées, puis seront suivies de l'énoncé relatif au couplage d'enregistrements.
À la suite de la collecte, l'étape suivante consiste à coupler les données de l'ESCC de 2016 avec les fichiers d'impôt les plus récents (il y a habituellement un décalage de deux ans par rapport à l'année de collecte) afin de recueillir les renseignements sur le revenu des répondants qui n'ont pas refusé le couplage de leurs données.
Comme l'échantillon de l'ESCC est tiré de deux bases de sondage (fichier de la Prestation fiscale canadienne pour enfants pour les répondants âgés de 12 à 17 ans et base aréolaire de l'Enquête sur la population active pour les répondants de 18 ans et plus), la stratégie de couplage en deux étapes suivra deux méthodes légèrement différentes. Dans le cas des répondants de 18 ans et plus, les enregistrements de l'échantillon contiendront tous un identifiant ARUID (identifiant unique du registre des adresses). Préalablement à la collecte de la composante annuelle de 2016 de l'ESCC, les identifiants ARUID liés à l'échantillon sélectionné seront couplés avec ceux du fichier IDENT_ARUID de 2014, puis couplés avec les données fiscales les plus récentes disponibles au moment de la collecte, afin de déterminer les répondants pour lesquels les données fiscales de 2014 ne sont pas disponibles. Ainsi, pour le fichier de données maître de l'ESCC de 2016, le Fichier maître des particuliers T1 de 2014 sera utilisé. Quant aux répondants qui n'ont pas de données fiscales de 2014, on leur posera des questions sur leur revenu en guise de solution de rechange pour obtenir des données sur le revenu. Tous les répondants obtiendront l'énoncé relatif au couplage avec les dossiers fiscaux. Pour tous ceux qui acceptent le couplage avec les dossiers fiscaux (qu'on leur ait posé des questions sur leur revenu ou non), nous tenterons un couplage des données en procédant comme suit :
- Nous couplerons l'identifiant ARUID avec le fichier IDENT_ARUID de 2015, puis nous utiliserons ce couplage pour effectuer un couplage avec les fichiers T1, T1FF ou T4 de 2015 afin d'obtenir les données fiscales.
- Si aucun couplage n'est trouvé pour 2015, alors nous tenterons un couplage avec le fichier IDENT_ARUID de 2014, puis nous utiliserons ce couplage afin d'obtenir les données fiscales des fichiers T1, T1FF et T4 de 2014.
Les renseignements personnels tels que le nom, la date de naissance et le sexe, ou les coordonnées telles que le numéro de téléphone ou le code postal, peuvent être utilisés pour vérifier les couplages (au moyen de l'identifiant ARUID) ou améliorer les taux de couplage.
Dans le cas des répondants sélectionnés de 12 à 17 ans, les enregistrements peuvent être couplés au moyen du NAS des parents afin de déterminer ceux qui n'ont pas de données T1, T1FF ou T4 pour 2014. Quant aux répondants qui n'ont pas de données fiscales T1 pour 2014, on leur posera des questions sur leur revenu en guise de solution de rechange. Tous les répondants obtiendront l'énoncé relatif au couplage avec les dossiers fiscaux. Pour tous ceux qui acceptent le couplage avec les dossiers fiscaux (qu'on leur ait posé des questions sur leur revenu ou non), nous tenterons un couplage des données en procédant comme suit :
- Si l'enfant vit toujours avec le bénéficiaire (parent ou tuteur), alors nous couplerons le NAS du parent avec les fichiers T1, T1FF ou T4 de 2015 afin d'obtenir les données fiscales les plus récentes.
- Si aucun couplage n'est trouvé pour les fichiers T1 ou T1FF de 2015 et que l'enfant vit toujours chez le bénéficiaire (parent ou tuteur), alors nous utiliserons le NAS pour effectuer un couplage avec les fichiers T1, T1FF ou T4 de 2014 afin d'obtenir les données fiscales.
Si l'enfant ne vit plus chez le bénéficiaire (parent ou tuteur), alors nous pourrons tenter d'effectuer un couplage avec des renseignements personnels tels que le nom, l'adresse ou le numéro de téléphone.
Produit : La diffusion des données de l'Enquête sur la santé dans les collectivités canadiennes sera annoncée dans Le Quotidien. Les données seront mises à la disposition des personnes réputées être employées dans les centres de données de recherche de Statistique Canada. Toutes les données demeureront confidentielles et protégées en vertu de la Loi sur la statistique. Le fichier de données ne contiendra aucun identificateur personnel.
Dans la foulée de l'annonce de la disponibilité du fichier de données analytiques (dans Le Quotidien), seules les statistiques agrégées non confidentielles seront diffusées.
La relation entre le développement social dans la petite enfance et les résultats économiques à long terme : un couplage des données de l’Étude longitudinale et expérimentale de Montréal (ELEM), de l’Étude longitudinale des enfants de maternelle au Québec (ELEMQ), et du fichier sur la famille T1 (FFT1) (073-2015)
Objet : L’objectif de l’étude proposée est d’examiner les liens entre les indicateurs de certains comportements sociaux dans la petite enfance (agressivité-opposition, hyperactivité-inattention, anxiété, comportement prosocial) et les résultats économiques plus tard dans la vie (situation d’emploi, revenu, prestation d’aide au revenu). Les données sur les liens entre les indicateurs de santé mentale dans la petite enfance et les résultats économiques plus tard dans la vie apporteront un éclairage utile aux discussions stratégiques concernant les investissements en programmes de santé mentale, pour la préventation et le traitement dans la petite enfance et plus tard dans la vie, ainsi qu’en programmes visant l’amélioration des résultats sur le marché du travail pour les Canadiens.
Produit : Seules les données agrégées conformes aux dispositions de protection des renseignements personnels de la Loi sur la statistique seront diffusées à l’extérieur de Statistique Canada. Les résultats principaux serviront à rédiger des documents de recherche en vue de leur publication dans des revues internes et externes à comité de lecture ainsi que de leur présentation lors d’ateliers et de conférences.
Ajout des variables de la catégorie d'admission des immigrants au Programme du Recensement de la population de 2016 (075-2015)
Objet : Dans le cadre de ce projet, on ajoutera la catégorie d'admission des immigrants (p. ex., catégorie de l'immigration économique, catégorie du regroupement familial, réfugiés. etc.) et le statut du demandeur principal au à la base de données du Recensement de la population de 2016 grâce à un couplage avec le Fichier des immigrants reçus d'Immigration, Réfugiés et Citoyenneté Canada (IRCC).
Description : Le Recensement de la population fournit des renseignements détaillés sur les caractéristiques démographiques, sociales et économiques des personnes vivant au Canada, ainsi que sur les logements dans lesquels elles habitent. Le Fichier des immigrants reçus d'IRCC fournit des renseignements sur les immigrants admis au Canada depuis 1980, comme la catégorie d'admission.
Ce projet tirera parti du projet antérieur de couplage d'enregistrements financé par CIC (037-2013), qui a permis le couplage du Fichier des immigrants reçus et de l'Enquête nationale auprès des ménages de 2011, grâce à l'intégration des variables de la catégorie d'admission dans les bases de données du Programme du Recensement de la population de 2016, au traitement des variables pour résoudre les incohérences et les valeurs manquantes, à l'élaboration de documents de référence et à la diffusion des variables en résultant avec les variables du Programme du Recensement de la population de 2016, pour un accès plus large.
Produit : Seules des estimations statistiques agrégées conformes aux dispositions en matière de confidentialité de la Loi sur la statistique seront diffusées à l'extérieur de Statistique Canada. Les variables de la catégorie d'admission reposeront sur les mêmes considérations en matière de diffusion et de produits que toute autre variable du Programme du Recensement de la population de 2016, et elles pourraient être incluses dans des totalisations personnalisées, des tableaux normalisés ou des articles.
Une clé de couplage sera conservée indéfiniment dans le cadre de ce couplage d'enregistrements. Les résultats du couplage, y compris les variables utilisées pour l'effectuer, comme les identificateurs personnels, ainsi que les renseignements utilisés pour mesurer la qualité du couplage, seront détruits au plus tard le 31 mars 2019. Tous les fichiers seront conservés sur un serveur situé dans une zone sécuritaire. L'accès à ces fichiers sera limité aux employés de Statistique Canada dont les fonctions officielles exigent un tel accès.
Disparités en matière de mortalité entre Noirs et Blancs : utilisation subséquente des fichiers de couplage 049 2012 – (076 2015)
Objet : Estimer les écarts relatifs et absolus de mortalité toutes causes confondues et de mortalité liée aux maladies cardiovasculaires entre Noirs et Blancs au Canada et faire une comparaison avec les estimations concernant les États Unis.
Description : La Cohorte du recensement canadien de 1991 : Suivi de la mortalité et du cancer est un ensemble de données produit par couplage probabiliste d'enregistrements. Environ 2,7 millions de personnes de 25 ans ou plus, qui ont été dénombrées au moyen du questionnaire complet du Recensement de 1991, ont fait l'objet d'un suivi pour la mortalité, l'incidence du cancer et le lieu de résidence annuel.
Nous estimerons le taux de mortalité normalisé selon l'âge et le sexe pour les membres de la cohorte s'identifiant comme étant « Noir » et n'appartenant pas à une minorité visible. Le temps-personne pour chacun des membres de la cohorte sera calculé à partir du début de l'étude (4 juin 1992) jusqu'à la date du décès ou la date de fin de l'étude (31 décembre 2009). La structure démographique de la cohorte canadienne sera utilisée comme structure/population type pour l'estimation des taux de mortalité (et également pour les données concernant les États-Unis afin de faciliter la comparabilité entre les pays). Pour ce qui est de la comparaison entre les Noirs et les personnes n'appartenant pas à une minorité visible, les différences de taux (DT) et les rapports de taux (RT) normalisés selon l'âge feront l'objet d'une estimation. Nous ajusterons également les courbes de survie normalisées afin d'évaluer les probabilités de survie absolues pour les deux groupes, et ce, en les corrigeant en fonction de l'âge et de variables sociodémographiques. Cette méthode permet de surmonter certaines des limites inhérentes au modèle standard qu'est le modèle de régression à risques proportionnels de Cox et permet de faire une estimation des mesures de l'effet absolues.
Produit : Seules des données agrégées et des analyses respectant les dispositions en matière de confidentialité de la Loi sur la statistique seront diffusées en dehors des centres de données de recherche de Statistique Canada, sous forme d'articles de revue à comité de lecture et d'exposés.
Analyse de microsimulation de l'hétérogénéité cachée dans la mortalité de la population : utilisation subséquente du couplage 049-2012 – (077-2015)
Objet : Cette étude vise à examiner l'hétérogénéité cachée dans la population canadienne en utilisant, comme point de départ, les différences dans les profils de survie parmi les grands groupes ethniques, tirées de base de données de suivi de la mortalité et du cancer chez la cohorte du Recensement du Canada de 1991.
Description : La base de données de suivi de la mortalité et du cancer chez la cohorte du Recensement du Canada de 1991 est une base de données produite par couplage probabiliste d'enregistrements. On a procédé au suivi de la mortalité, du cancer et du lieu de résidence annuel chez environ 2,7 millions de personnes de 25 ans et plus qui avaient répondu au questionnaire complet du Recensement de 1991.
Les principales questions de recherche de cette étude sont les suivantes :
- Y a-t-il des différences dans la survie entre les divers groupes ethniques au Canada?
- Ces différences dans la survie, lorsque l'on tient compte de diverses covariables, peuvent-elles être expliquées par des différences postulées ou hypothétiques dans les proportions de sous-populations ayant un faible niveau et un niveau élevé de fragilité parmi les groupes ethniques?
- Les proportions de sous-populations ayant un faible niveau et un niveau élevé de fragilité parmi les différents groupes ethniques sont-elles comparables à la fréquence des sous-populations ayant un faible niveau et un niveau élevé de fragilité dans les ouvrages publiés?
Produit : Seules des données agrégées et des analyses respectant les dispositions de la Loi sur la statistique en matière de confidentialité seront diffusées à l'extérieur des centres de données de recherche de Statistique Canada, sous forme d'articles de revue à comité de lecture et d'exposés.
Déterminants sociaux et spatiaux de la mortalité dans les maritimes d'après la cohorte du Recensement du Canada de 1991 : utilisation subséquente du couplage 049-2012 – (078-2015)
Objet : Ce projet vise à examiner les déterminants sociaux et spatiaux de la santé dans les Maritimes.
Le gradient social de santé est bien établi, des études mettant en lumière des taux de mortalité et de morbidité plus élevés entre différentes strates sociales (Mackenbach et coll., 2008). Les différences sur le plan de la santé peuvent être expliquées par des caractéristiques individuelles, des dimensions sociales et des attributs environnementaux (Marmot, 2005; O'Neill et coll., 2003). Au Canada, on a mené des recherches approfondies sur les déterminants sociaux de la santé, et certaines percées ont été réalisées à partir des données sur la cohorte du Recensement du Canada de 1991 (Hwang et coll., 2009; Omariba, Ng et Vissandjée, 2014; Peters et coll., 2013; Simonet et coll., 2010; Tjepkema et Wilkins, 2011; Tjepkema et coll., 2011; Wilkins et coll., 2008). Ce projet est centré sur les variations géographiques au niveau des déterminants sociaux de la santé dans les Maritimes.
Description : La base de données de suivi de la mortalité et du cancer chez la cohorte du Recensement du Canada de 1991 est une base de données produite par couplage probabiliste d'enregistrements. On a procédé au suivi de la mortalité, du cancer et du lieu de résidence annuel chez environ 2,7 millions de personnes de 25 ans et plus qui avaient répondu au questionnaire complet du Recensement de 1991.
Plusieurs questions de recherche sont abordées dans l'étude :
- Quelles sont les inégalités socioéconomiques en matière de santé chez les personnes qui résidaient dans les Maritimes à la date de référence, et comment celles-ci diffèrent-elles par rapport aux autres régions canadiennes?
- Comment les profils de migration des résidents des Maritimes sont-ils associés aux disparités en matière de santé? Quelles sont les différences au chapitre des résultats en matière de santé entre les personnes qui ont migré et celles qui sont restées?
Produit : Seules des données agrégées et des analyses respectant les dispositions de la Loi sur la statistique en matière de confidentialité seront diffusées à l'extérieur des centres de données de recherche de Statistique Canada, sous forme d'articles de revue à comité de lecture et d'exposés.
Les déterminants socioéconomiques des changements dans la distribution des décès selon l'âge, le sexe et la cause au Canada : utilisation subséquente du couplage 049-2012 – (079-2015)
Objet : Dans le cadre de ce projet, on examinera le rôle de certains déterminants socioéconomiques par rapport à de nouvelles tendances liées à la mortalité à un âge avancé, plus précisément la compression de la mortalité ou le déplacement de la mortalité vers des âges plus avancés, de même que les différences de longévité selon le sexe. Le niveau de scolarité fera l'objet d'un examen particulier, car il s'agit d'un déterminant important de la survie jusqu'à un âge avancé.
Description : La base de données de suivi de la mortalité et du cancer chez la cohorte du Recensement du Canada de 1991 est une base de données produite par couplage probabiliste d'enregistrements. On a procédé au suivi de la mortalité, du cancer et du lieu de résidence annuel chez environ 2,7 millions de personnes de 25 ans et plus qui avaient répondu au questionnaire complet du Recensement de 1991.
L'étude vise principalement à répondre aux questions de recherche suivantes :
- Est-ce que certaines caractéristiques socioéconomiques, en particulier le niveau de scolarité, expliquent les différences touchant l'âge modal au décès (âge le plus fréquent) et la dispersion des décès à un âge avancé, dans l'optique à la fois de la mortalité générale et de certaines causes de décès?
- Comment la situation au Canada se compare-t-elle à celle observée aux États-Unis sur le plan des disparités au chapitre de la survie selon le niveau de scolarité?
Produit : Seules des données agrégées et des analyses respectant les dispositions de la Loi sur la statistique en matière de confidentialité seront diffusées à l'extérieur des centres de données de recherche de Statistique Canada, sous forme d'articles de revue à comité de lecture et d'exposés.
Changements dans le travail et les gains après des chocs pour la santé (082-2015)
Objet : Cette initiative a pour objet de créer une base de données couplées qui appuiera la recherche sur les résultats sur le marché du travail et les résultats financiers des particuliers et des familles après une hospitalisation découlant d'un accident ou d'une maladie aiguë. Le couplage proposé combinera les données sur les hospitalisations de courte durée avec les données provenant de différents fichiers administratifs relatifs à l'impôt et à l'emploi. Les fichiers analytiques résultants appuieront la recherche sur les conséquences économiques des « chocs pour la santé » pour les particuliers et leurs familles et les incidences sur les politiques en matière de revenu, de travail et de santé. Cette information n'existe pas à l'heure actuelle et ce projet de couplage comblera une importante lacune statistique.
Description : Les données liées à la santé proviendront de la Base de données sur les congés des patients (BDCP), qui contient des données démographiques, administratives et cliniques sur toutes les admissions à l'hôpital au Canada (à l'exclusion du Québec) depuis le 1er avril 1999. Les données comprennent l'information sur les dates d'admission à l'hôpital et de congé, l'admission aux soins intensifs et les diagnostics hospitaliers. Ces données permettent de déterminer le type et la gravité des « chocs pour la santé ».
Les renseignements sur les résultats sur le marché du travail et les résultats financiers des personnes ainsi que les données au niveau de l'emploi seront tirés des fichiers de données administratives suivants : fichier sur la famille T1, fichier maître des particuliers T1, fichier maître des particuliers historique T1, fichier sommaire T4, État des prestations d'a.-e. T4E, fichier des données du profil vectoriel de l'a.-e., Relevé d'emploi et Programme d'analyse longitudinale de l'emploi. Ces données permettent de déterminer les caractéristiques économiques des particuliers (et de leurs conjoints) avant et après un choc pour la santé, pour qu'il soit possible d'estimer les répercussions du choc sur des résultats tels que la cessation d'emploi, les pertes de gains, l'instabilité de l'emploi et la réception d'un soutien au revenu.
Les identificateurs disponibles dans les deux fichiers de données – date de naissance, code postal et sexe – seront couplés afin de créer un lien entre le numéro d'assurance-maladie dans la BDCP et le numéro d'assurance sociale dans les fichiers de données fiscales. Les clés de couplage seront conservées séparément et accessibles seulement aux employés de Statistique Canada qui doivent avoir accès au fichier dans l'exercice de leurs fonctions.
Produit : Les constatations méthodologiques et analytiques résultant de ces données couplées seront utilisées pour préparer des rapports de recherche pour publication. Le fichier couplé servira également à produire des données tabulaires et des indicateurs à publier sur le site Web de Statistique Canada. Seules des statistiques agrégées non confidentielles ne permettant pas d'identifier une personne, une entreprise ou une organisation seront diffusées à l'extérieur de Statistique Canada.
Couplage de l'Enquête financière sur les fermes et des données fiscales (083-2015)
Objet : Le couplage des données de l'Enquête financière sur les fermes et des données fiscales permettra à Statistique Canada de continuer de produire des estimations des aspects financiers et physiques des exploitations agricoles au Canada tout en réduisant le fardeau des répondants. Ces derniers auront l'option de remplacer, au moyen de données fiscales, 18 questions particulières sur les revenus et les dépenses, auparavant posées dans l'Enquête financière sur les fermes.
Le couplage permet d'effectuer d'importantes totalisations croisées qui sont utilisées par le commanditaire de l'enquête pour prendre des décisions éclairées. Les données produites servent aussi de mesures de rendement pour les programmes agricoles gouvernementaux qui profitent aux répondants. De plus, elles sont utilisées par la Division de l'agriculture (dans des processus qui alimentent le Système canadien des comptes macroéconomiques) et la Division de l'investissement, des sciences et de la technologie.
Description : À partir de l'année de référence 2015, les données de l'Enquête financière sur les fermes seront couplées aux données fiscales des entreprises agricoles tirées des fichiers maître T1 des entreprises et des particuliers, ainsi que des fichiers de données fiscales T2, T3 et T4.
Produit : Les résultats du couplage serviront à produire des estimations agrégées non confidentielles qui seront diffusées à l'extérieur de Statistique Canada; les estimations diffusées seront conformes aux dispositions de confidentialité de la Loi sur la statistique.
Le fichier couplé utilisé pour produire les estimations agrégées sera sauvegardé pour une période indéterminée afin de pouvoir répondre aux demandes des clients désirant obtenir des totalisations personnalisées des données.
Agence de promotion économique du Canada atlantique (APECA) – Mise à jour du rapport d'évaluation de rendement des entreprises (2016) (087-2015)
Objet : Évaluer l'efficacité des programmes et des activités de l'APECA de même que l'utilité des efforts déployés par l'Agence pour appuyer les petites et les moyennes entreprises, et déterminer des moyens plus efficaces de venir en aide à la collectivité de ces entreprises. L'APECA aide les entreprises en consentant des prêts et en offrant une vaste gamme de programmes et de services aux fins de l'établissement, de l'expansion et de la modernisation des entreprises ainsi que du perfectionnement des ressources humaines. L'APECA utilisera l'information obtenue grâce au couplage pour mesurer le rendement des entreprises ayant reçu un soutien financier dans le cadre des programmes de l'Agence et comparera ce rendement à celui d'autres entreprises de la région de l'Atlantique. Les variations de l'emploi, les entreprises entrantes et sortantes, certaines statistiques financières, les mesures de la productivité de la main-d'œuvre et les caractéristiques des propriétaires d'entreprises seront analysées. L'APECA peut utiliser les constatations de l'évaluation pour mieux appuyer les entreprises.
Description : Une liste des entreprises ayant bénéficié du soutien de l'APECA sera couplée aux fichiers suivants : le Registre des entreprises, 2003 à 2013; le Programme d'analyse longitudinale de l'emploi (PALE), version 2013; l'Index général des renseignements financiers (IGRF) et les Dépenses de recherche scientifique et développement expérimental (RSDE) – Impôts sur le revenu des sociétés, 2003 à 2013; le Commerce par caractéristique d'entreprises (CCE), 2013; et la Base de données canadienne sur la dynamique employeurs-employés (BDCDEE), 2013. Les fichiers seront couplés à l'aide du numéro d'entreprise (NE), du numéro d'entreprise statistique (NES) et de la dénomination sociale ou du nom commercial.
Produit : Seuls les analyses et les produits statistiques agrégés non confidentiels et conformes aux dispositions relatives à la confidentialité de la Loi sur la statistique seront diffusés à l'extérieur de Statistique Canada. L'information sera présentée sous forme de tableaux statistiques et ventilée selon le secteur d'activité et la taille de l'entreprise pour le Canada atlantique. L'APECA publiera ces résultats dans son rapport annuel sur le rendement présenté au Parlement, qui sera accessible sur le site Web de l'Agence, ainsi que dans des études de recherche sur des sujets comme les jeunes entreprises, les tendances de l'emploi et la croissance économique du Canada atlantique.
Enquête canadienne sur le revenu : couplage avec les fichiers des données sur le revenu (091-2015)
Objet : L'objet est d'obtenir des données sur le revenu et de réduire le fardeau des répondants, la durée des interviews et les coûts de collecte pour l'Enquête canadienne sur le revenu. Le couplage permet d'obtenir des renseignements sur les variables du revenu sans imposer aux répondants des questions détaillées sur leur revenu.
Description : La base de données de l'Enquête canadienne sur le revenu et les fichiers T1, T1IDENT, T5007, PFCE et seront couplés au moyen des variables d'appariement suivantes : l'adresse, la ville, la date de naissance, le prénom, le nom de famille, le sexe, la province, numéro d'assurance sociale, les codes pour le nom de famille, le code postal, l'état matrimonial, le numéro de téléphone et la première initiale. Ces renseignements seront retirés du fichier couplé dès que le couplage sera terminé et ils seront stockés séparément. L'accès à ces fichiers sera limité aux employés de Statistique Canada dont les fonctions justifient cet accès.
Produit : Aucune information renfermant des identificateurs personnels ne serait diffusée à l'extérieur de Statistique Canada à partir de cette activité de couplage. Seules les statistiques non confidentielles agrégées et les analyses conformes aux dispositions de la Loi sur la statistique en matière de confidentialité seront diffusées à l'extérieur de Statistique Canada.
Perspectives longitudinales sur l'emploi, le revenu et la santé : couplage du Fichier de données longitudinales sur la main-d'œuvre, du Recensement de 1991, de la Base canadienne de données sur la mortalité et de la Base canadienne de données sur le cancer (092-2015)
Objet : L'objectif de ce projet est de créer une nouvelle base de données qui appuiera l'analyse longitudinale et les mesures des résultats concernant l'emploi, le revenu et la santé. La base de données sera utilisée pour examiner diverses questions liées au rendement de la scolarité et de la formation, aux résultats sur le marché du travail des immigrants, aux transitions à la retraite et aux changements dans les gains aux niveaux individuel et familial, suivant une mise à pied ou un diagnostic de cancer. Le fichier servira aussi à améliorer les données d'entrée dans le module du cancer du modèle de santé de la population et la modélisation socioéconomique dynamique (DYSEM).
Description : Ce projet tire parti d'initiatives antérieures entreprises par Statistique Canada. Tout d'abord, en 2003, le Comité des politiques de Statistique Canada a approuvé une initiative permettant de tirer un échantillon de 15 % des Canadiens de 25 ans et plus, à partir des formulaires détaillés 2B et 2D du Recensement de 1991, et de les coupler aux déclarations de revenus T1 de 1991 et/ou de 1992 et, par la suite, à la Base canadienne de données sur la mortalité. En 2009, cette base de données a été élargie pour englober une période de référence plus longue et inclure des données de la Base canadienne de données sur le cancer, ainsi que des données sur les codes postaux sur une base annuelle.
En deuxième lieu, en 1999, le Comité des politiques de Statistique Canada a approuvé la création et la mise à jour annuelle du Fichier des données longitudinales sur la main-d'œuvre (FDLMO), pour les années à partir de 1983. Une modification a été approuvée en 2007, en vue d'ajouter des variables additionnelles du fichier de l'impôt des particuliers T1. En 2015, une amélioration du FDLMO a été approuvée, laquelle a fait passer la taille de l'échantillon du fichier d'un échantillon aléatoire de 10 % des travailleurs canadiens à 100 % des travailleurs canadiens (couplage d'enregistrements no 065-2015). Le FDLMO contient des renseignements tirés des fichiers T1 et T4 et des fichiers des relevés d'emploi et du Programme d'analyse longitudinale de l'emploi (PALE). Le FDLMO fournit des données longitudinales sur l'emploi et les gains à partir de 1987.
Ces deux initiatives ont produit des bases de données importantes et complémentaires, la première comprenant des données sociodémographiques riches (mais peu de renseignements sur les résultats économiques) et la deuxième, des données riches sur les résultats économiques (mais peu de données démographiques). Étant donné la taille importante des deux bases de données, leur chevauchement produit un sous-échantillon constitué d'environ 15 % des Canadiens âgés de 25 ans et plus en 1991.
Quatre fichiers d'analyse distincts seront créés et pourront être couplés au moyen d'un numéro de répondant généré de façon aléatoire par Statistique Canada.
Fichier de données longitudinales de sortie sur la main-d'œuvre : Ce fichier comprend les variables démographiques et économiques du FDLMO à partir de 1987, les variables au niveau de la personne et de la famille, en annexe au fichier sur la famille T1, et un numéro de répondant généré de façon aléatoire par Statistique Canada.
Fichier de sortie du recensement de la population : Ce fichier comprend les variables sociodémographiques des formulaires 2B et 2D (formulaires détaillés) du Recensement de 1991 disponibles dans la cohorte de mortalité originale du Recensement de 1991, ainsi qu'un numéro de répondant généré de façon aléatoire par Statistique Canada.
Fichier de sortie sur la mortalité : Ce fichier comprendra le numéro généré de façon aléatoire par Statistique Canada pour chaque personne de la cohorte, ainsi que les renseignements suivants sur la mortalité : âge, province/pays de naissance, cause sous-jacente du décès, nature de la blessure, province/pays du décès, sexe, code postal et codes géographiques types du lieu de résidence (p. ex., subdivision de recensement), année, mois et jour du décès, années-personnes à risque dérivées et poids de couplage de la mortalité.
Fichier de sortie du cancer : Ce fichier comprendra le numéro attribué de façon aléatoire par Statistique Canada pour chaque personne de la cohorte, et les renseignements suivants à partir de la Base canadienne de données sur le cancer : sexe, province et année, mois et jour du diagnostic, année de naissance, âge, province ou pays de naissance, données sur le diagnostic (codes de diagnostic, morphologie et topographie, indicateur de code de morphologie, source de l'enregistrement, méthode de diagnostic, latéralité, numéro du siège primaire), état vital du patient, province de résidence, code postal du lieu de résidence au moment du diagnostic, année et province de décès (le cas échéant), code postal du lieu de décès (le cas échéant), cause du décès (le cas échéant), et poids de couplage de l'incidence du cancer.
Produit : Seules les statistiques agrégées et les analyses conformes aux dispositions de la Loi sur la statistique en matière de confidentialité seront diffusées à l'extérieur de Statistique Canada. Les résultats méthodologiques et analytiques découlant de ces données couplées serviront à préparer des documents de recherche, en vue de leur publication dans des rapports analytiques, des publications scientifiques à comité de lecture (y compris les Rapports sur la santé de Statistique Canada) et CANSIM, ainsi que de présentations à des conférences, des ateliers et réunions.
Les fichiers de sortie seront conservés par Statistique Canada jusqu'au 31 décembre 2022, moment auquel il sera déterminé s'il faut continuer de les garder. L'ensemble des clés de couplage et des identificateurs seront supprimés des dossiers de sortie et conservés séparément, et leur accès sera limité aux employés de Statistique Canada qui doivent les utiliser dans le cadre de leurs tâches.
Couplage du Recensement de la population de 2006 et du Registre des Indiens (RI) aux enregistrements sur la mortalité dans le but d'estimer les taux de mortalité parmi les Premières Nations, ce qui comprend les Indiens inscrits, les Inuits et les Métis, et d'examiner l'effet des déterminants sociaux de la santé sur le risque relatif de décès parmi les populations autochtones. (093-2015)
Objet : Ce projet de couplage d'enregistrements et d'analyse connexe est mis de l'avant par la Division de la statistique sociale et autochtone (DSSEA) dans le but de produire de nouvelles estimations des taux de mortalité chez les Premières Nations, ce qui comprend les Indiens inscrits, les Inuits et les Métis. L'objectif de l'initiative est de combler d'importantes lacunes en matière d'information au sujet des taux de mortalité, de l'espérance de vie et du rôle des déterminants sociaux de la santé dans les disparités au niveau des taux de mortalité, et également de se pencher sur des améliorations d'ordre méthodologique aux fins de l'estimation des taux de mortalité. À cette fin, les ensembles de données sur la mortalité (BDCM, BCDM) seront couplés au Recensement de la population de 2006 et au Registre des Indiens. De plus, on évaluera la validité du fichier couplé à des fins analytiques.
Il est essentiel de disposer d'une estimation des taux de mortalité associés à différentes causes pour pouvoir élaborer des politiques en vue d'affecter efficacement les ressources limitées disponibles aux programmes de prévention, pour élaborer des programmes de prévention, pour paver la voie et fournir une orientation en vue des futures recherches des organismes gouvernementaux (dont Statistique Canada), des chercheurs universitaires et des organismes autochtones ou autres, et pour informer le public et les décideurs à propos des disparités potentielles au niveau des taux de mortalité entre, d'une part, les membres des Premières Nations, les Métis et les Inuits, et d'autre part les populations non autochtones. Cette information devrait être utile aux organismes publics de tous les ordres de gouvernement ainsi qu'aux organismes qui se consacrent à des enjeux touchant les Premières Nations, les Métis et les Inuits ou qui élaborent des politiques ou des programmes.
Enfin, une meilleure compréhension de l'estimation du risque de décès, après la prise en compte des caractéristiques socioéconomiques des différents groupes autochtones par rapport au groupe non autochtone permettra aux décideurs de voir dans quelle mesure les disparités au niveau des taux de mortalité peuvent être attribuées à ces caractéristiques.
Description : Le Recensement de la population de 2006 et le Registre des Indiens (RI) seront couplés aux ensembles de données sur la mortalité (BDCM, BCDM) pour les années 2006 à 2011.
Le fichier couplé du Recensement, du RI et de la BCDM comprendra uniquement les éléments de données requis pour effectuer les études. Tous les identificateurs personnels directs et les adresses seront supprimés du fichier d'analyse. Les identificateurs personnels utilisés aux fins du couplage, comme le nom, le numéro d'enregistrement du décès et le numéro d'assurance-maladie, seront conservés dans des fichiers séparés.
Produit : Le fichier couplé du Recensement, du RI et de la BCDM demeurera à Statistique Canada. L'accès au fichier de microdonnées couplées sera limité aux employés de Statistique Canada dont le travail le nécessite. Seules des données agrégées respectant les dispositions de la Loi sur la statistique en matière de confidentialité seront diffusées à l'extérieur de Statistique Canada. Les documents de recherche reposant sur des analyses des données couplées seront publiés par la DSSEA ou seront soumis pour publication dans la revue trimestrielle à comité de lecture de Statistique Canada, Rapports sur la santé.
Le fichier d'analyse couplé sera conservé jusqu'au 31 décembre 2025, ou jusqu'à ce que Statistique Canada n'en ait plus besoin, moment auquel il sera déterminé s'il faut continuer de le garder.
Création d'un dépôt d'enregistrements dérivés et d'un registre des clés pour l'Environnement de couplage de données sociales (094-2015)
Objet : L'Environnement de couplage de données sociales (ECDS) s'appuie sur l'expérience acquise du couplage d'enregistrements afin de rendre possible un programme de recherche de couplage d'enregistrements socioéconomiques pancanadien. Un programme bien structuré et réglementé de couplage d'enregistrements augmentera la pertinence des enquêtes actuelles de Statistique Canada, accroîtra substantiellement l'utilisation des données administratives, facilitera l'intégration des données de divers domaines sociaux comme la santé, l'éducation, la justice et le revenu, accroissant par conséquent la capacité d'analyser l'incidence des déterminants sociaux de n'importe quel de ces domaines sur les résultats d'autres domaines, réduira le fardeau des répondants aux enquêtes en réutilisant des données déjà recueillies et maintiendra les normes les plus élevées en matière de sécurité et de protection des renseignements personnels.
Un dépôt d'enregistrements dérivés (DED) et un registre des clés distinct seront créés pour diminuer les risques liés à la protection de la vie privée et améliorer l'efficacité et la qualité des couplages.
Statistique Canada est responsable de la conservation et du traitement sécuritaires des fichiers de données ainsi que de la production des fichiers d'analyse nécessaires pour réaliser les études approuvées. Les projets de recherche dans l'ECDS reposeront sur l'utilisation d'enregistrements couplés et, conformément à la Directive sur le couplage d'enregistrements de Statistique Canada, chaque nouveau projet de couplage doit être approuvé par le statisticien en chef.
Description : Le DED est créé en couplant différents fichiers de données de Statistique Canada dans le but de produire une liste de particuliers. On attribue à chacun des particuliers figurant dans le DED un identificateur anonyme de l'ECDS. L'identificateur est attribué aléatoirement et n'a aucune valeur à l'extérieur de l'ECDS. Parmi les fichiers de données utilisés pour le DED figurent les fichiers maîtres de Déclaration de revenus des particuliers (déclaration T1), les fichiers de la Prestation fiscale canadienne pour enfants, les fichiers de la Prestation fiscale canadienne pour enfants – Ident (CCTB-Ident), le SIN_ARUID, le DIN_ARUID, le SINSIN, le DINDIN, le DINSIN, le Registre des dépendants, le Registre de l'assurance sociale, Statistique de l'état civil - la Base de données sur les naissances, Statistique de l'état civil - la Base de données sur les décès, le fichier des Immigrants reçus et le Registre des Indiens. Les mises à jour futures de ces fichiers seront utilisées pour mettre à jour le DED.
Au départ, le DED comprendra les identificateurs personnels suivants : nom de famille, prénom, date de naissance, sexe, état matrimonial, date d'établissement/d'immigration, date d'émigration, date du décès, numéro d'assurance sociale (NAS), numéro d'identification temporaire (NIT), numéro d'identification de personne à charge (NIPC); NAS/NIT du conjoint; NAS/NIT/NIPC de la personne à charge/de la personne souffrant d'incapacité physique; NAS/NIT du parent; numéro d'assurance-maladie; adresse; identificateur unique du registre des adresses; code de classification géographique type; numéro de téléphone; nom de famille du conjoint; nom de famille de la mère; nom de famille du père; autre nom de famille et un numéro d'identification séquentiel généré par Statistique Canada pour chaque personne identifiée au moyen du processus annuel de couplage du DED. L'accès au DED sera restreint aux employés de Statistique Canada qui sont responsables de son développement et de sa maintenance.
Le couplage du DED et des bases de données administratives et des enquêtes de Statistique Canada se fera dans un environnement spécialisé de couplage d'enregistrements du domaine social (soit l'ECDS). Pour garantir un haut niveau de sécurité des données et la protection de la vie privée, les numéros d'identification générés par le DED de Statistique Canada et les codes d'identification des bases de données administratives et des enquêtes seront stockés dans un registre des clés distinct, afin d'éviter d'avoir à conserver les données d'enquête avec les identificateurs personnels. Pour les études analytiques, les identificateurs de l'ECDS et les codes d'identification associés seront utilisés pour faire le couplage des dossiers individuels dans les bases de données de l'ECDS. Toutes ces études analytiques exigeront l'approbation préalable du couplage par le Conseil exécutif de gestion de Statistique Canada. L'accès au registre des clés sera restreint aux employés de Statistique Canada qui sont responsables de son développement et de sa maintenance, ainsi qu'à ceux qui créent les fichiers de données d'analyse couplés.
Le registre des clés contiendra les clés de couplage pour permettre le couplage à des bases de données tenues par Statistique Canada dans le cadre d'études approuvées. Ces fichiers comprennent notamment ce qui suit :
- fichiers maîtres de Déclaration de revenus des particuliers (déclaration T1);
- fichiers de la Prestation fiscale canadienne pour enfants;
- fichier des Immigrants reçus;
- Statistique de l'état civil -Bases de données sur les naissances et sur les décès;
- Recensement de la population (1991 et années suivantes);
- Enquête nationale auprès des ménages;
- Enquête longitudinale nationale sur les enfants et les jeunes;
- Enquête longitudinale auprès des immigrants du Canada;
- Enquête sur la dynamique du travail et du revenu;
- Enquête auprès des jeunes en transition;
- Enquête nationale sur la santé de la population;
- Fichier sur la famille T1;
- bases de données administratives cliniques (dossiers des patients hospitalisés et des visites de consultation externe, 1992 et années suivantes);
- Registre canadien du cancer;
- Enquête sur la santé dans les collectivités canadiennes (tous les cycles);
- Enquête canadienne sur les mesures de la santé (tous les cycles).
Produit : Aucune information contenue dans le DED ne sera diffusée hors de Statistique Canada. Le DED et le registre des clés serviront exclusivement à soutenir le développement de fichiers de recherche dans le cadre de l'ECDS. Statistique Canada conservera les fichiers du DED et du registre des clés tant qu'il en aura besoin.
Les projets de recherche seront approuvés au cas par cas. Cela pourra se faire dans le cadre d'un programme de recherche établi par Statistique Canada ou en réponse aux demandes des clients. Un résumé de chacune des études approuvées sera affiché sur le site Web de Statistique Canada.