Bulletin de la division de l'accès aux données - Édition du printemps 2022
Message à notre personnel et à notre clientèle
Avec l'arrivée du printemps et des températures plus clémentes, la Division de l'accès aux données (DAD) aimerait prendre un instant pour remercier tous les membres de son personnel pour leur dévouement et leur travail acharné. Grâce à leurs efforts, nous menons la division et ses programmes sur la voie de la réussite. Nous souhaitons aussi remercier tous nos clients et nos partenaires de leur soutien indéfectible et de la confiance qu'ils nous accordent. Nous demeurons engagés à fournir aux chercheurs et aux clients un accès en temps réel aux données et services afin de mieux répondre aux besoins de l'ensemble de la population canadienne.
Nos réalisations à ce jour et nos objectifs pour l'année à venir
La DAD souhaite souligner et célébrer quelquesunes de ses plus grandes réussites au cours des derniers mois. La Section de l'accès libre-service (SALS) a reçu l'approbation d'accorder deux comptes d'accès à distance en temps réel (ADTR) à chaque établissement. Elle a également terminé sa partie du projet de mise en ligne des fichiers de microdonnées à grande diffusion (FMGD). Le Réseau canadien des centres de données de recherche (RCCDR), en collaboration avec les centres de données de recherche (CDR), a organisé en 2021 une autre conférence qui a été couronnée de succès, attirant quelque 400 participants. Le Laboratoire virtuel de données (LvD) est officiellement en production depuis le mois d'octobre 2021. Il s'agit là d'une importante réalisation qui permettra à Statistique Canada d'être mieux placé pour faire progresser son approche axée sur l'utilisateur. Ce nouveau mode d'accès améliorera les modes d'accès existants de l'organisme et augmentera l'offre des microdonnées pour les chercheurs accrédités.
Au cours de l'année à venir, la DAD continuera à concentrer ses efforts sur la collaboration avec une variété d'équipes et de partenaires, ainsi que sur l'exploitation de nouvelles technologies pour appuyer la modernisation à Statistique Canada. Les travaux se poursuivront, y compris la mise au point du Centre de données de recherche virtuel (CDRv), la disponibilité croissante des bases de données sur les entreprises dans les CDR, la migration des chercheurs actuels et l'intégration de nouveaux chercheurs dans le LvD. Tout cela en mobilisant les intervenants actuels et futurs autour du nouveau mode d'accès aux données de la Division et du déploiement du plan de marketing.
Pour obtenir de plus amples renseignements, veuillez visiter le site Web de la Division de l'accès aux données.
Accès libre-service
Le point sur l'initiative de démocratisation des données
Nous sommes ravis d'annoncer que StatCan a choisi la plateforme Rich Data Services (RDS) pour remplacer le serveur Nesstar, afin de fournir des données et métadonnées aux chercheurs. Cette initiative permettra d'appuyer davantage les efforts de modernisation de l'organisme.
La plateforme RDS fera l'objet d'un certain nombre d'améliorations et de nouvelles fonctionnalités y seront ajoutées pour la renforcer et répondre aux besoins de l'organisme et des utilisateurs y compris le soutien multilingue pour les métadonnées et les interfaces utilisateurs Explorer et TabEngine de la plateforme RDS, l'analyse de régression bivariée, et la conformité aux normes 508 et WCAG en matière d'accessibilité.
La plateforme RDS s'intégrera aussi à d'autres systèmes, dont Colectica et la plateforme Aria de Metadata Technologies North America dont StatCan se sert déjà pour gérer ses classifications. La plateforme RDS fournira un soutien technique lors de la migration des ensembles de données existants dans le serveur Nesstar.
Suivant les conseils du Centre canadien pour la cybersécurité et de l'équipe de la sécurité des TI de StatCan, le serveur Nesstar a été mis hors service en raison d'une vulnérabilité en matière de cybersécurité. Nesstar n'était pas en mesure de fournir un correctif qui répondait aux exigences de StatCan. Entre-temps, nous sommes heureux de répondre aux demandes liées aux totalisations ou aux téléchargements sur le serveur Nesstar.
Examen de programmes
En octobre et novembre 2021, Intergage a mené des consultations auprès des membres de l'Initiative de démocratisation des données (IDD). Ces consultations comprenaient des entrevues avec un groupe d'environ 25 membres de comités consultatifs, de spécialistes de Sujet-Matière et d'employés de StatCan, dans le but de déterminer les points forts, les points à améliorer et les risques du programme de l'IDD
Jennifer Smith d'Intergage a présenté les résultats des consultations le 22 novembre 2021, dans le cadre de la formation nationale. Intergage prépare maintenant un rapport et un plan en collaboration avec le comité exécutif de l'IDD.
Projet de fichiers de microdonnées à grande diffusion en ligne
La SALS a terminé sa partie du projet. À l'heure actuelle, l'équipe de Diffusion de StatCan met en ligne tous les anciens FMGD dans un format téléchargeable. Les FMGD récemment publiés sont téléversés sur le site Web dès qu'ils sont accessibles. Les identificateurs d'objets numériques sont attribués aux FMGD au fur et à mesure qu'ils deviennent accessibles.
Totalisations personnalisées
StatCan offre un nombre limité de totalisations personnalisées gratuitement aux membres du programme d'IDD, gracieuseté des Centres de service de données. Cette initiative s'adresse aux étudiants qui travaillent sur des projets de recherche qui n'ont pas les moyens de se procurer des totalisations personnalisées. Une fois prêtes, les totalisations personnalisées sont transmises au bibliothécaire qui en a fait la demande et au chercheur par l'intermédiaire du Service de transfert électronique de fichiers. Le délai d'exécution prévu pour les totalisations personnalisées varie selon la nature de la demande, mais normalement le processus devrait prendre de deux semaines à deux mois.
Nous vous demandons d'envoyer les détails de la demande de totalisations personnalisées à l'équipe de l'IDD de StatCan : statcan.maddlidamidd.statcan@statcan.gc.ca
Comité consultatif de l'IDD
Le comité exécutif de l'IDD est heureux de présenter les représentants suivants :
- Coprésidente : Siobhan Hanratty de l'Université du Nouveau-Brunswick
- Coprésidente : Elizabeth Hill de l'Université Western.
- Région de l'Ouest : Sarah Rutley de l'Université de la Saskatchewan.
Le poste de l'Atlantique demeure vacant.
Comité de perfectionnement professionnel
En mars 2021, le Comité de perfectionnement professionnel (CPP) a lancé un appel sur le serveur de liste afin de trouver un bénévole qui représenterait la région du Québec. Ce poste demeure vacant.
Projets du CPP :
- Dépôt des documents de formation de l'IDD : Un sous-comité du CPP s'occupe de la transition pour passer du Dépôt des objets numériques (CUDO) au Scholars Portal Dataverse
- Formation : Des discussions sont en cours sur la forme que pourrait prendre la formation en 2022.
Formation offerte par Statistique Canada
StatCan offre de la formation à tous les utilisateurs de données au moyen de différentes plateformes et d'autres services de données tels que des produits personnalisés. La formation est offerte par les Centres de service de données. Au cours de la dernière année, la liste des formations offertes s'est beaucoup élargie. Vous trouverez ci-dessous les renseignements les plus récents :
- Série d'ateliers : Notre série d'ateliers vous permet d'accéder directement à la vaste expérience de Statistique Canada en matière de méthodologie et d'analyse d'enquête.
- Webinaires : La série de webinaires couvre un large éventail de sujets, allant du Programme du recensement à la navigation sur le site Web de StatCan.
- Littératie des données : Cette formation s'adresse aux personnes qui découvrent le domaine des données et à celles qui ont une certaine expérience, mais qui pourraient bénéficier d'une mise à niveau ou qui veulent approfondir leurs connaissances. Nous vous invitons à consulter notre catalogue d'apprentissage pour en apprendre davantage sur ce qui est offert, y compris une grande collection de courtes vidéos. Assurez-vous de revenir consulter le catalogue régulièrement, car la liste de formations offertes ne cesse de s'allonger.
- Les statistiques : le pouvoir des données! : Mis à jour le 2 septembre 2021, cet outil de formation destiné aux étudiants, aux enseignants et à la population générale permet de tirer le maximum des statistiques. Cette ressource permet aux utilisateurs de :
- utiliser les informations statistiques avec plus d'assurance;
- apprécier l'importance des informations statistiques dans la société d'aujourd'hui;
- faire preuve d'un esprit critique lors de l'utilisation des données qu'on leur présente.
Ces objectifs sont au cœur de la mission de Statistique Canada d'aider la population canadienne à prendre des décisions éclairées fondées sur les données.
La liste de tous les produits de l'IDD se trouve sur la page Web suivante : Initiative de démocratisation des données
Diffusions de données de l'IDD, de Janvier à Mars 2022 :
- Base de données et modèle de simulation de politique sociale (BD/MSPS), version 29.0
- Enquête nationale sur les voyages (ENV) de 2020
- Enquête canadienne sur le revenu (ECR) de 2018
- Enquête canadienne sur le revenu (ECR) de 2019
- Enquête sociale générale (ESG), cycle 34
- Enquête sociale générale (ESG), cycle 35
- Enquête sur la population active (EPA) (mensuelle)
Mises à jour du système d'accès à distance en temps réel
Statistique Canada continuera d'offrir un compte d'ADTR aux membres de l'IDD (une valeur de 5 000 $ par établissement). Le système d'ADTR est un outil d'accès en ligne en temps réel qui permet de créer des totalisations personnalisées. Les utilisateurs de l'ADTR peuvent calculer des fréquences, des moyennes, des percentiles, des répartitions en pourcentage, des proportions, des ratios et des parts sur des données sociales et administratives.
L'accès des chercheurs des CDR a été prolongé jusqu'au 31 mars 2023. De juillet à décembre 2021, 43 nouveaux utilisateurs se sont abonnés
Assistant SAS
La SALS poursuit son travail en ajoutant d'autres enquêtes et en créant des webinaires préenregistrés.
La liste intégrale des produits de l'ADTR se trouve sur la page Web suivante : Système d'accès à distance en temps réel
Centres de données de recherche
Mises à jour des centres de données de recherche
Afin d'assurer la sécurité du personnel et des chercheurs de Statistique Canada, les mesures sanitaires liées à la COVID-19 demeurent en vigueur dans les CDR.
Les travaux liés à la préparation de la conception et au déploiement du CDRv se poursuivent. En dépit des difficultés en matière d'approvisionnement, l'équipement a commencé à arriver et le reste est en route. L'équipe a accordé la priorité à la création d'un plan de travail et d'un calendrier pour déployer le projet dans chaque CDR. Elle a aussi envoyé un sondage aux directeurs universitaires pour recueillir des commentaires sur l'échéance et les préparatifs.
Le groupe de travail sur les entreprises du projet sur le CDRv a aussi travaillé très fort. Les discussions vont bon train pour établir un protocole d'entente qui permettrait d'accéder physiquement aux données de Statistique Canada dans un CDR et dans un lieu de travail autorisé à l'extérieur d'un CDR. Les travaux progressent également en ce qui concerne les lettres d'entente, la facturation dans l'environnement du CDRv, ainsi que les ententes nécessaires sur le partage des risques.
Nouvelles données disponibles dans les centres de données de recherche
Au cours du troisième trimestre de l'exercice 2021-2022, 30 produits en tout ont été ajoutés à la liste des données disponibles dans les CDR. Ils comprennent un nouveau fichier de données administratives, cinq nouvelles enquêtes, douze nouveaux fichiers de données intégrées et des mises à jour apportées à douze fichiers de données.
Fichiers de données ajoutés d'Octobre à Décembre 2021
- Enquête sur les inconduites sexuelles au travail (EIST) de 2020
- Base de données canadienne sur l'environnement alimentaire (Can-FED) de 2018
- Plateforme longitudinale entre l'éducation et le marché du travail (PLEMT) : données du Programme canadien pour l'épargneétudes couplées au FFT1, aux clés du Recensement de la population de 2016 et à la Banque de données administratives longitudinales
- Données de l'Enquête sociale générale (ESG) – Familles couplées au FFT1
- CEnquête sociale canadienne de 2021 – Bien-être, activités et perception du temps (ESC-BAPT)
Pour obtenir la liste complète des données accessibles dans les CDR et les centres d'accès du gouvernement, visitez la page Web: Données accessibles dans les Centres de données de recherche
Accès aux données sur les entreprises
L'accès aux données sur les entreprises dans les CDR suit son cours. Cet hiver, des analystes des CDR ont commencé à effectuer le contrôle de confidentialité des produits pour les projets de données sur les entreprises. Nous remercions nos collègues du Centre fédéral de données de recherche (CFDR) qui ont soutenu les CDR pendant la transition. Le personnel des CDR et du CFDR qui siègent au Comité de contrôle de la confidentialité a créé des ressources pour appuyer les chercheurs qui travaillent avec les données sur les entreprises dans les centres. Ces ressources comprennent un manuel détaillé sur les données sur les entreprises, une orientation révisée sur le contrôle de la confidentialité et une macro dont les chercheurs peuvent se servir pour effectuer des tests de confidentialité.
Nouvelles initiatives de formation
Le personnel des CDR a mis au point une série de vidéos de formation pour aider les chercheurs à préparer leurs résultats analytiques aux fins de publication. Ces vidéos font partie de la série intitulée Soutien au contrôle de la confidentialité et présentent des exemples de l'utilisation des différents logiciels statistiques pour effectuer des analyses. Ces vidéos s'adressent aux chercheurs qui travaillent avec des microdonnées confidentielles.
- Soutien au contrôle de la confidentialité : Dominance et homogénéité avec R
- Soutien au contrôle de la confidentialité : Arrondissement des proportions avec SAS
- Soutien au contrôle de la confidentialité : Arrondissement des proportions avec Stata
- Soutien au contrôle de la confidentialité : Dominance et homogénéité avec SAS
- Soutien au contrôle de la confidentialité : Dominance et homogénéité avec la fonction tcensus (Stata)
- Soutien au contrôle de la confidentialité : Arrondissement des proportions avec Rounder, une application R Shiny
- Soutien au contrôle de la confidentialité : Sorties d'histogramme avec Stata
Ces courtes vidéos sont d'une durée de 5 à 10 minutes et sont disponibles en français et en anglais. Elles seront bientôt accessibles sur le site Web de Statistique Canada dans la section de la formation et des événements : Formation et événements
Laboratoire virtuel de données
Le LvD a été lancé pour certains clients provinciaux et fédéraux du programme du CFDR ! Le LvD permet l'utilisation de « postes de travail autorisés », grâce auxquels il est possible d'accéder aux projets de microdonnées admissibles depuis l'extérieur de l'emplacement physique du CFDR. Le LvD améliore l'expérience des utilisateurs de microdonnées tout en assurant le contrôle de la confidentialité. Grâce à ce nouvel environnement virtuel, les chercheurs auront aussi accès à un grand nombre d'enquêtes-ménages et d'enquêtesentreprises de Statistique Canada, ainsi qu'à des données administratives.
La transition vers le LvD sera effectuée en trois vagues; les partenaires actuels qui ont des projets admissibles feront partie des deux premières vagues de la transition. StatCan travaille avec les ministères et les organismes fédéraux et provinciaux et les organismes non gouvernementaux pour intégrer tous les projets admissibles à cette nouvelle technologie. D'ici la fin de l'été 2022, tous les projets admissibles auront été transférés.
Pour accéder au LvD, chaque ministère ou organisme doit avoir conclu un protocole d'entente, un accord organisationnel ou un accord en vertu de l'article 10, en plus d'avoir reçu une accréditation pour leur organisation et leurs chercheurs. Les projets devront aussi disposer d'un contrat de recherche pour l'utilisation de microdonnées, et les ensembles de données concernés devront avoir une cote de 7 ou moins selon l'Outil de classification de la confidentialité (OCC).
Dès qu'un ministère ou organisme est intégré au LvD, il pourra aussi accéder à de nouveaux projets admissibles dans le LvD.
Au cours des prochains mois, nous communiquerons avec les ministères et les organismes fédéraux et provinciaux pour discuter de la transition vers le LvD.
Des questions ou des commentaires? Visitez Accès aux microdonnées.
Consultez le blogue de StatCan.
- Date de modification :