Bulletin de la division de l'accès aux données - Numéro d'hiver 2020
Meilleurs vœux pour la nouvelle année!
La Division de l'accès aux données vous souhaite une bonne et heureuse année! Nous tenons à vous remercier et à offrir nos meilleurs vœux à tous nos clients et amis qui ont contribué à nos progrès en matière d'accès aux données. Nos pensées accompagnent tous ceux qui ont été touchés par la pandémie de COVID-19. Nous sommes heureux de constater que notre communauté demeure forte et optimiste en cette période difficile.
Nous espérons que vous avez profité de la période des Fêtes avec vos proches et nous avons hâte de poursuivre notre collaboration avec vous au cours de la nouvelle année.
Division de l'accès aux données : nouveau nom de la division
Dans le cadre du remaniement de son image et de sa réorganisation, la Division de l'accès aux microdonnées est heureuse d'annoncer qu'elle a changé de nom pour devenir la Division de l'accès aux données (DAD). Cette modification est entrée en vigueur en novembre 2020 pour tenir compte des changements structurels qui se produisent au sein de la Division.
Au cours de l'année qui s'annonce, la DAD continuera de fournir un accès élargi, rapide et novateur aux données. La Division continuera également d'offrir des services de grande qualité aux chercheurs et aux clients partout au pays afin de mieux répondre à leurs besoins en données.
Pour obtenir de plus amples renseignements, visitez la Division de l'accès aux données.
Accès libre-service
L'équipe de l'initiative de démocratisation des données fait le point
Les premières séances de formation virtuelles de l'Initiative de démocratisation des données (IDD) ont eu lieu du 23 au 27 novembre. Ces séances ont été organisées par le Comité de perfectionnement professionnel (CPP) et Statistique Canada. Au total, 155 participants étaient inscrits et 73,4 % ont participé aux séances. De nombreux sujets ont été abordés. Vous pouvez consulter la programmation sur le site Web de la formation de l'IDD. Si vous n'avez pas pu y assister, les présentations et les ressources de formation se trouvent dans le répertoire de formation de l'IDD. Nous tenons à remercier tous les présentateurs, les étudiants, les traducteurs, les preneurs de notes et les modérateurs, car cette formation n'aurait pas été possible sans leur temps et leur expertise.
Ce que les étudiants avaient à dire
« Entendre parler des projets d'avenir de StatCan a été très utile. Je suis heureux de constater que certains concepts seront mis à jour pour le prochain recensement (en particulier en ce qui concerne le sexe et le genre). L'amélioration du recensement est un processus continu, et bien que je ne pense pas qu'il y ait eu de surprises parmi les changements discutés, je commence à être enthousiaste par rapport à 2021. Je suis également ravi d'entendre parler des façons dont StatCan sécurise les microdonnées et les rend plus facilement accessibles. Je suis un bibliothécaire étudiant qui effectue à l'occasion des tâches de référence et je ferai personnellement l'expérience de la valeur tangible de ce service, en particulier lorsque les données sur les entreprises seront mises à notre disposition! » – Dan Philips
Lisez le commentaire intégral dans ce document (en anglais seulement).
Un article rédigé par Barbara Znamirowski, intitulé « DLI National Training : Accessing data and building a community » (en anglais seulement), offre un excellent aperçu de la formation d'une semaine.
Comité de perfectionnement professionnel
Au cours de la nouvelle année, le CPP lancera un appel sur le serveur de liste afin de trouver deux bénévoles pour représenter les régions du Québec et de l'Ontario. L'équipe de l'IDD et le CPP veulent profiter de l'occasion pour souhaiter la bienvenue aux nouveaux membres du CPP et remercier ceux qui quittent leurs fonctions.
Nouveaux membres
- Région de l'Atlantique : Margaret Vail
Université St. Francis Xavier - Région du Québec : Emanuela Chiriac
Université du Québec en Outaouais - Représentant collégial : Caleb Domsy
Collège Humber
Membres quittant leurs fonctions
- Carolyn DeLorey
Université St. Francis Xavier - Caroline Patenaude
Université de Montréal - Gaston Quirion
Université Laval (en mai 2021) - Deena Yanofsky
Université de Toronto
Le CPP a créé un groupe de travail pour mettre à jour la Trousse de survie de l'IDD. La nouvelle trousse sera conforme au projet de remaniement Web de StatCan. Dans le cadre de cette initiative, un avis a été envoyé à la communauté pour obtenir des commentaires.
Projet de mise en ligne des fichiers de microdonnées à grande diffusion
Le projet visant à mettre en ligne des fichiers de microdonnées à grande diffusion (FMGD) en format téléchargeable est en cours. Dans le cadre de ce projet, des identificateurs d'objets numériques seront attribués aux FMGD. Depuis le mois de mai, Statistique Canada a diffusé 20 FMGD, dont 12 sur la COVID-19.
Colectica, qui utilise la norme de l'Initiative de documentation des données, a été approuvé par l'organisme comme outil de documentation des données. Une fois qu'il sera mis en œuvre et largement utilisé dans l'ensemble de l'organisme, il sera plus facile de créer des FMGD. Cela devrait accroître le nombre de FMGD diffusés chaque année.
Initiatives d'accès à distance en temps réel : élargissement de l'accès
L'accès des chercheurs des centres de données de recherche (CDR) au programme d'accès à distance en temps réel (ADTR) a été prolongé jusqu'au 31 mars 2021. L'équipe de l'ADTR a compilé les mesures d'utilisation suivantes :
- 48 utilisateurs présentant des soumissions;
- 1 455 soumissions;
- 922 soumissions acceptées;
- 2 779 tableaux produits.
Une liste de tous les produits de l'IDD peut être consultée sur le site Web.
Diffusions de données de l'IDD depuis octobre 2020
- Fichiers de l'Enquête sur la population active — diffusion mensuelle
- Enquête sur la couverture de l'assuranceemploi, 2019
- Enquête canadienne sur le tabac, l'alcool et les drogues chez les élèves, 2014, 2016 et 2018
- Base de données et modèle de simulation de politique sociale (BD/MSPS), version « boîte de verre » pour la COVID-19, version 3.0
- Approche participative 2020 : Répercussions de la COVID-19 sur les Canadiens — Expérience de la discrimination
- Série d'enquêtes sur les perspectives canadiennes 4 : les sources d'information consultées pendant la pandémie — fichier de microdonnées à grande diffusion
- Tableaux normalisés de l'enquête « Frais de scolarité et de subsistance », 2020-2021
- Flux du commerce interprovincial et international, 2017
- Tableaux des ressources et des emplois, 2017
Une liste de tous les produits de l'ADTR peut être consultée sur le site Web suivant : Enquêtes et métadonnées.
Diffusions de données à l'ADTR depuis Octobre 2020
- Système d'information sur les apprentis inscrits
- Enquête sur la population active — diffusion mensuelle
Centres de données de recherche
Mises à jour concernant les centres de données de reserche
Les centres de données de recherche (CDR) sont de nouveau opérationnels après la fermeture survenue au début de la pandémie. Seuls deux centres demeurent fermés et les autres fonctionnent à capacité réduite en raison des mesures de sécurité liées à la COVID-19. Alors que la résurgence de la pandémie est en cours, le personnel se prépare au cas où une deuxième série de fermetures serait nécessaire dans certaines régions.
Le travail est en cours pour veiller à ce que les recherches utilisant les données de Statistique Canada puissent se poursuivre en cas de fermeture. Par exemple, la DAD se prépare à mettre à l'essai une nouvelle plateforme virtuelle d'accès aux données. Dans le cadre de ce projet, il sera possible d'accéder aux microdonnées de Statistique Canada de façon sécuritaire de l'extérieur des installations des CDR au moyen d'une plateforme d'infrastructure infonuagique de Statistique Canada. Quatre universités participeront à ce projet pour commencer, mais ce dernier sera mis en œuvre dans le cadre d'une planification d'urgence élargie si les CDR d'autres universités doivent fermer en raison de la pandémie. Environ huit équipes de recherche des CDR utilisant des données d'enquête admissibles se verront offrir cette nouvelle possibilité en janvier 2021. Les leçons tirées de ce projet aideront à déterminer les prochaines étapes du programme pour élargir davantage l'accès d'ici la fin de 2021.
Les travaux se poursuivent concernant le projet de modernisation de l'infrastructure des technologies de l'information (TI) des CDR en mettant à jour l'architecture de réseau et en passant à un environnement virtuel centralisé. Cette initiative, appelée le CDR virtuel, améliorera grandement les ressources informatiques pour les chercheurs universitaires et contribuera à la fiabilité du système. L'accès à distance au CDR virtuel suivra le même cadre d'accès que celui utilisé dans l'environnement du Laboratoire virtuel de données (LVD). La mise en œuvre devrait commencer à la fin de 2021.
Au printemps 2020, un groupe de travail de haut niveau, coprésidé par Martin Taylor (directeur, Réseau canadien des centres de données de recherche) et Jacques Fauteux (statisticien en chef adjoint, StatCan), a été créé afin d'élaborer des stratégies d'accès aux données à court et à long terme pour les chercheurs universitaires. Il a pour mandat d'harmoniser différentes initiatives, dont le CDR virtuel et le LVD.
En octobre, le Réseau canadien des centres de données de recherche, en partenariat avec Statistique Canada, a tenu une conférence virtuelle très réussie à l'occasion de son 20e anniversaire. La participation à la conférence a atteint un niveau record, plus de 950 personnes y ayant pris part. La rétroaction a été extrêmement positive.
Fonds des centres de données
Au total, 31 produits ont été ajoutés aux fonds de microdonnées au cours du troisième trimestre de 2020. Ils comprennent deux nouvelles enquêtes (Approche participative : Répercussions de la COVID19 sur les Canadiens — Expérience de la discrimination et Enquête canadienne sur la santé des aînés, 2019), ainsi que des cycles d'enquêtes mis à jour et des ensembles de données couplées et administratives.
Liste partielle des nouvelles diffusions de données de septembre à décembre 2020
- Enquête sur la population active, septembre 2020 — module d'enquête accélérée sur la COVID-19
- Série d'enquêtes sur les perspectives canadiennes 3 à 5, 2020
- Enquête sur la sécurité individuelle au sein de la population étudiante postsecondaire, 2019
- Enquête canadienne sur le logement de 2018 couplée à des données sur les impôts, l'inclusion sociale, les mesures de proximité, la répartition du revenu et les adresses historiques
- Banque de données administratives longitudinales (DAL) couplées à la Base de données sur les congés des patients — 1997 à 2016
- Programme de statistiques canadiennes de l'éducation couplé au Fichier des familles T1, au Recensement de 2016 et aux DAL
- Fichiers de données personnalisés de la Société canadienne d'hypothèques et de logement couplés à l'Enquête canadienne sur l'incapacité, 2017
- Registre canadien du cancer, 2017
- Centre international de recherche sur le cancer
- Programme Surveillance, Epidemiology, and End Results
- Données provisoires sur les décès — janvier à septembre 2020 (extrait mensuel de l'ensemble de données de l'état civil)
Pour obtenir une liste complète des données accessibles dans les CDR et les centres d'accès du gouvernement, visitez Données accessibles dans les CDR.
Accès aux données du gouvernement : Centre Fédéral de Données de Recherche
En avril 2020, la DAD a assumé la responsabilité de fournir l'accès aux fonds de données sur les entreprises de Statistique Canada à des chercheurs réputés être employés par l'entremise de programmes d'accès aux données. Tout au long de l'automne, l'équipe de l'accès aux données du gouvernement a travaillé à l'intégration de l'accès aux données sur les entreprises sous l'égide du Centre fédéral de données de recherche (CFDR). À l'heure actuelle, le CFDR exploite deux centres de données au pré Tunney sous cette égide, soit le Centre d'accès aux données sociales et le Centre d'accès aux données sur les entreprises (anciennement connu sous le nom de Centre canadien d'élaboration de données et de recherche économique). À court terme, les deux centres poursuivront leurs activités afin de faciliter un accès maximal aux personnes réputées être employées, tout en assurant une distanciation physique appropriée. À l'avenir, les deux centres seront entièrement intégrés en un seul emplacement physique pour servir tous les utilisateurs du gouvernement fédéral.
Dans le cadre de la transition, le contenu du site Web est mis à jour pour veiller à ce que les processus de demande d'accès aux données sur les entreprises soient affichés sur le site Web de la DAD et figurent dans les instructions du Portail d'accès aux microdonnées (PAM). Les chercheurs souhaitant accéder aux données sur les entreprises sont invités à consulter un expert en la matière de Statistique Canada avant de soumettre une proposition par l'entremise du PAM. Veuillez communiquer avec l'équipe pour entrer en contact avec un expert.
Élargissement de l'accès afin d'inclure les données sur les entreprises
Le personnel de la DAD continue d'élargir l'accès aux données sur les entreprises à l'extérieur des centres de données situés au bureau central de Statistique Canada à Ottawa. À cette fin, le site à distance de la Banque du Canada a ouvert ses portes en septembre pour faciliter l'accès sur place au personnel de la Banque du Canada. De plus, des plans sont en cours d'élaboration pour déplacer l'accès pour les clients universitaires vers les CDR universitaires dans un proche avenir.
Points d'accès sécurisés provinciaux
À l'automne 2020, deux points d'accès sécurisés ont été ouverts dans les provinces pour faciliter l'accès aux données de la Plateforme longitudinale entre l'éducation et le marché du travail. Ils sont situés respectivement au Bureau de la statistique et de l'information de l'Alberta à Edmonton et au Bureau de la statistique de la Colombie-Britannique à Victoria. De plus, un bureau ouvrira bientôt ses portes au ministère des Finances de l'Ontario à Toronto. Nous continuons de chercher des occasions d'ouvrir d'autres sites provinciaux pour faciliter l'accès à l'extérieur d'Ottawa. Des discussions sont en cours avec les provinces du Manitoba et de l'Îledu-Prince-Édouard. Pour obtenir de plus amples renseignements sur ces initiatives, veuillez communiquer avec nous à l'adresse suivante : statcan.mad-ssap-dam-pass.statcan@canada.ca.
Modernisation de l’accès
Projets pilotes et essais
L'équipe du LVD continue de travailler avec l'équipe de l'Analyse des données en tant que service (ADS) pour mettre des plateformes à l'essai dans un environnement infonuagique avec divers outils afin de faciliter la préparation des données et la recherche. Les travaux d'évaluation et d'amélioration des plateformes se poursuivent, assurant ainsi que les utilisateurs auront accès à l'environnement et aux outils dont ils ont besoin pour mener à bien leurs recherches. En outre, l'équipe de l'ADS travaille à incorporer diverses spécifications pour un outil de recherche qui aidera les chercheurs à cerner les ensembles de données accessibles pertinents.
Les calendriers d'élaboration et de mise à l'essai du LVD sont régulièrement examinés, en collaboration avec les équipes de TI, afin d'assurer la poursuite des essais et du dépannage avant que les utilisateurs n'accèdent au LVD. L'équipe du LVD a cerné plusieurs projets pilotes utilisant des microdonnées confidentielles de nature délicate faible à moyenne dans l'environnement infonuagique. Les utilisateurs seront intégrés une fois que des ententes appropriées auront été signées, conformément à la structure de gouvernance approuvée.
Les projets pilotes établis aident à évaluer les nuances de l'intégration de différents types de chercheurs. De plus, les leçons tirées de chaque projet seront surveillées et les problèmes seront résolus ou atténués en vue du projet suivant, ce qui aidera l'équipe à se diriger vers un environnement de production.
Une fois que l'équipe du LVD aura effectué avec succès des projets pilotes utilisant des données de nature délicate faible à moyenne, en 2021, des projets pilotes supplémentaires pourraient être menés à l'aide de données de nature délicate moyenne à élevée, ce qui est plus représentatif des données que les chercheurs utilisent habituellement. Le Comité de gestion stratégique de Statistique Canada a approuvé cette stratégie le 25 novembre 2020.
Cadre d'accès approuvé
Conformément à l'objectif de modernisation de l'accès aux données, l'équipe du LVD a obtenu l'autorisation de mettre en place un nouveau lieu d'accès : les espaces de travail autorisés. Un espace de travail autorisé peut être le lieu de travail d'une personne réputée être employée, ainsi qu'un espace privé à l'intérieur de sa résidence personnelle. Cette mesure arrive à point nommé compte tenu de la situation de santé publique actuelle. Un résumé de l'évaluation des facteurs relatifs à la vie privée pour ce nouveau lieu de travail sera bientôt affiché sur le site Web de Statistique Canada.
En plus d'introduire un modèle d'accréditation pour les chercheurs et les organisations de confiance, l'équipe du LVD a élaboré un tableau pour les lieux d'accès approuvés. Ce tableau utilise la nature délicate des données, ainsi que les pointages d'accréditation du chercheur et de l'organisation, afin de déterminer les options de lieux d'accès approuvés pour un projet donné. Ce tableau a été approuvé par le Comité de coordination de la sécurité et le Comité des services, de l'accès, de la diffusion et de la communication — données sortantes de Statistique Canada. Il sera mis en œuvre dans le cadre des projets pilotes du LVD.
Mises à jour concernant le projet du Laboratoire Virtuel de Données
Le LVD améliorera grandement l'accès à l'information statistique pour les chercheurs en leur fournissant un accès à distance 24 heures sur 24, 7 jours sur 7, aux données hébergées à Statistique Canada au moyen d'une connexion TI sécurisée et d'un environnement infonuagique protégé. Des progrès sont en cours relativement à un certain nombre d'initiatives clés visant à accroître l'accès aux données virtuelles et à promouvoir la collaboration. Elles comprennent l'élaboration de plateformes analytiques, ainsi que l'évaluation et le développement continus du Système de gestion des relations avec les clients (SGRC) et de l'Outil de recherche de microdonnées.
Le projet pilote du SGRC de la DAD est terminé et le projet du SGRC de l'organisme relève maintenant de la Division de la diffusion. Sous la direction de Mathieu Laporte, la Diffusion examinera les capacités et la fonctionnalité du portail interne pour le SGRC.
Un nouveau calendrier de production est en cours d'élaboration pour intégrer les exigences de la DAD. Un consultant de Microsoft Dynamics devrait commencer à travailler en collaboration avec la Diffusion au cours de la nouvelle année. Restez à l'affût!
Des questions ou des commentaires? Visitez Accès aux microdonnées.
Consultez le blogue de StatCan.
- Date de modification :