Apprentissage automatique : une introduction

Numéro de catalogue : 892000062021003

Date de diffusion : le 3 mai 2021 Mise à jour : le 30 décembre 2021

Cette vidéo est recommandée à ceux qui sont déjà familiers avec les concepts et techniques associés à la programmation informatique et à l'utilisation d'algorithmes pour analyser les données. Une distinction importante que nous établirons dans cette vidéo, c'est la différence entre la science des données, l'intelligence artificielle et l'apprentissage automatique.

Vous apprendrez à quoi peut servir l'apprentissage automatique, comment il fonctionne et différentes méthodes pour le mettre en œuvre. Vous apprendrez également à construire et à utiliser les processus d'apprentissage automatique de manière responsable.

Étape du parcours des données
Analyser, modéliser
Compétence des données
  • Collecte des données
  • Exploration des données
  • Interprétation des données
  • Modélisation des données
  • Prise de décision basée sur des preuves
Audience
Intermédiaire
Conditions préalables suggérées
s.o.
Durée
13:19
Coût
Gratuit

Voir la vidéo

Apprentissage automatique : une introduction - Transcription

Apprentissage automatique : une introduction - Transcription

(Le symbole et le mots-symbole de Statistique Canada apparaissent sur l'écran: "Apprentissage automatique: Une introduction")

Apprentissage automatique: Une introduction

Bienvenue à l'apprentissage automatique: une introduction. Nous expliquerons ici les concepts de base de l'apprentissage automatique et nous inclurons un cadre pour l'utilisation des processus d'apprentissage automatique de façon responsable.

Objectifs d'apprentissage

Cette vidéo est recommandée à ceux qui sont déjà familiers avec les concepts et techniques associés à la programmation informatique et à l'utilisation d'algorithmes pour analyser les données. Une distinction importante que nous établirons dans cette vidéo, c'est la différence entre la science des données, l'intelligence artificielle et l'apprentissage automatique. Vous apprendrez à quoi peut servir l'apprentissage automatique, comment il fonctionne et différentes méthodes pour les mettre en œuvre. Vous apprendrez également à construire et à utiliser les processus d'apprentissage automatique de manière responsable.

Étapes du cheminement des données

(Texte à l'écran: Les étapes du cheminement des données sont appuyées par une base d'intendance, de métadonnées, de normes et de qualité)

(Diagramme du Cheminement des données: Étape 1 - definir, chercher, recueillir; Étape 2 - explorer, nettoyer, décrire; Étape 3 - analyser, modéliser; Étape 4 - Raconter l'histoire. Le cheminement des données est supporté par une base d'intendance, de métadonnées, de normes et de qualité.)

Ce diagramme est une représentation visuelle du cheminement des données, soit d'abord la collecte, l'exploration, le nettoyage, la description et la compréhension des données, puis leur analyse, afin de pouvoir ultimement communiquer aux autres ce que révèlent ces données.

Étape 1,2 et 3: Definir, chercher et recueillir; Explorer, nettoyer et décrire; Analyser et Modéliser

(Diagramme du Cheminement des données avec un attention sur l'Étape 1 - Definir, chercher et recueillir; Étape 2 - Explorer, nettoyer et décrire; Étape 3 - Analyser et modéliser)

On peut se servir de l'apprentissage automatique aux étapes de recherche, de la collecte et de la protection des données dans le cheminement des données pour chercher des données et ne trouver que les parties qui sont nécessaires. On peut également s'en servir aux étapes d'exploration, de nettoyage et de description dans le cheminement des données pour révéler ce qu'elles contiennent. Enfin, l'apprentissage automatique permet, aux étapes de l'analyse et de la modélisation du cheminement des données, de trouver les relations entre les variables et de prévoir les résultats ou les événements futurs.

Qu'est-ce que la science des données?

(Diagramme contenant 3 cercles qui s'intersect au milieu. Les cercles du haut orange, vert gauche et bleu droit représentent l'Expertise du domaine, l'Informatique et Mathématique, respectivement. L'intersection des cercles orange-vert, vert-bleu et bleu-orange représentent le Traitement des données, l'Apprentissage automatique et Recherche statistique, respectivement. L'intersection des trois cercles représente les Science des données.)

Tout d'abord, qu'est ce que la science des données exactement? Elle représente l'intersection de trois éléments: l'expertise dans un domaine particulier, la programmation informatique ainsi que les mathématiques et les statistiques. Les spécialistes des données, les informaticiens, les statisticiens et d'autres types de scientifiques peuvent utiliser l'apprentissage automatique dans leur travail. Les techniques des sciences des données telles que l'intelligence artificielle et l'apprentissage automatique sont utilisées pour résoudre des problèmes analytiquement complexes.

Qu'est-ce que l'intelligence artificielle et l'apprentissage automatique?

L'intelligence artificielle ou IA est un domaine d'étude de l'informatique consacré à la résolution de problèmes communément associés à l'intelligence humaine, tels que la mémoire, la résolution de problèmes et la reconnaissance des formes. Un exemple d'intelligence artificielle serait un ordinateur qui a été programmé pour reconnaître toutes les séquences de coups possibles afin de jouer la partie d'échecs. L'apprentissage automatique, en revanche, est un sous-ensemble de l'intelligence artificielle où l'ordinateur apprend sans avoir été programmé pour des tâches particulières. Au lieu d'avoir des lignes de code indiquant à l'ordinateur quoi faire, dans l'apprentissage automatique, l'ordinateur apprend les modèles dans les données et applique ces modèles pour prédire un résultat. Ainsi, aux échecs, l'ordinateur ne choisit pas un coup au hasard. Après avoir évalué toutes les options possibles, mais il utilise plutôt les données recueillies dans des millions de parties jouées précédemment, non seulement pour s'assurer que son coup est valable, mais aussi pour s'assurer que la séquence est la plus susceptible d'aboutir à une victoire.

Pourquoi utiliser l'apprentissage automatique?

L'apprentissage automatique est un outil qui permet d'élaborer, d'ajuster et de peaufiner des modèles complexes afin de faire des prévisions plus précises à l'aide d'énormes volumes de données. Voyez le comme un cerveau humain: à mesure qu'il reçoit plus de données, le modèle s'améliore et peut tirer des meilleures conclusions menant à des prévisions plus solides. L'apprentissage automatique peut s'utiliser pour automatiser des tâches répétitives et fastidieuses qui, autrement, prendraient de nombreuses heures à réaliser, comme le tri et la catégorisation d'articles d'actualité en ligne.

Comment les algorithmes d'apprentissage automatique "apprennent"

Les algorithmes d'apprentissage automatique apprennent à prédire un résultat de deux manières: l'apprentissage supervisé et l'apprentissage non supervisé. Dans l'apprentissage supervisé. Nous donnons un algorithme, une mise en correspondance des entrées avec les résultats souhaités. Les algorithmes tentent de comprendre la relation entre eux, de sorte que pour les entrées ultérieures, il peut prédire les résultats en suivant la même logique que dans la mise en correspondance initiale. Une exigence importante de l'apprentissage supervisé est de disposer de données dont les entrées et les résultats sont connues. C'est ce qu'on appelle les données étiquetées. Dans l'apprentissage non supervisé, nous n'avons pas de données avec des entrées et des résultats souhaités. L'algorithme recherche ici les similitudes et les schémas dans les données et tente de déterminer une stratégie pour catégoriser les entrées. L'algorithme appliquera la même stratégie pour catégoriser les entrées ultérieures. Nous verrons un exemple de chacun d'entre eux aux deux prochaines diapositives. Nous voyons ici un exemple d'utilisation de l'apprentissage automatique supervisé pour prédire le type de culture sur des images satellites. Sur la droite de la diapositive, vous voyez une image satellite réelle des champs agricoles. C'est l'entrée. La première étape consiste à déterminer les parties de l'image qui sont des cultures par rapport à d'autres éléments comme les routes, l'eau, les clôtures ou les arbres, puis à déterminer chaque type de cultures différent. Il s'agit des résultats. Cette première étape doit être effectuée par une personne. La deuxième étape consiste à créer un algorithme d'apprentissage automatique qui lie les images satellite et l'etiquette correctement de ce qui se trouve à chaque endroit de l'image. L'algorithmique apprend ainsi à déterminer les cultures par leur apparence sur l'image, par exemple par la couleur et la densité d'images. Enfin, l'algorithme lit une image qu'il n'a jamais vue auparavant et tente de préciser quelle culture s'y trouve. En se fondant sur ce qu'il a appris lors de la deuxième étape.

Apprentissage supervisé: déterminer le type de culture sur des images satellites

(Image de satellite d'une région agricoles recouvert de fermes)

Dans cet exemple, nous voyons comment un algorithme d'apprentissage automatique non supervisé peut être utilisé pour distinguer les transactions frauduleuses de toutes les transactions légitimes. Dans un premier temps, toutes les transactions effectuées pendant un certain temps sont examinées par un algorithme. L'algorithme examine de nombreux attributs différents de chaque transaction, tels que la date, le montant, le lieu, le type de magasin et le type de produit ou le service acheté. Ensuite, l'algorithme est appelé à trier les transactions par groupes. Dans ce cas-ci, nous pensons que la fraude est un événement rare et nous nous attendons donc à ce qu'un très faible pourcentage de transactions soit séparé du reste. N'oubliez pas que, dans le cadre d'un apprentissage non supervisé, nous ne savons pas à l'avance quelles transactions sont légitimes et lesquelles sont frauduleuses. Les prochaines diapositives vous présenteront quelques méthodes d'apprentissage automatique. Nous ne couvrons pas tous ici dans cette courte vidéo.

Apprentissage non supervisé: Détecter la fraude par carte de crédit

Le traitement des images est une méthode d'apprentissage automatique. Nous avons déjà vu comment cela fonctionne dans l'exemple du type de culture à partir des images satellites. Cette méthode est utilisée pour extraire des informations, des images, dégager des schémas dans des images, segmenter une image ou compresser une image afin qu'elle occupe moins d'espace de stockage.

Méthodes d'apprentissage automatique: Traitement du langage naturel

Le traitement du langage naturel est une méthode visant à traduire le langage de l'ordinateur et le langage humain. Le traitement du langage naturel a pour objectif de faire en sorte qu'un ordinateur puisse lire une ligne de texte et en comprendre le sens, comme le ferait une personne. Un exemple est un agent conversationnel, lequel s'attend à ce que les gens tapent "comment faire" ou "je ne trouve pas" et des mots clés qui renvoient à des choses qu'ils devraient pouvoir faire ou trouver sur ce site web particulier, puis fournir la réponse appropriée. À chaque interaction, l'agent conversationnel apprend à être de plus en plus sophistiqué dans sa façon d'interpréter ce que les gens tapent et de formuler ses réponses.

Méthodes d'apprentissage automatique: Analyse de sentiments

L'analyse de sentiments est une méthode d'apprentissage automatique qui interprète les émotions contenues dans un texte afin de mesurer le penchant des opinions des gens, qu'elles soient positives, négatives ou neutres. Un exemple est la lecture et l'interprétation des sentiments des gens à partir de critiques d'expériences dans les restaurants.

Méthodes d'apprentissage automatique: Apprentissage profond

Vous a-t-on jamais montré une image qui est toute floue et qui vous êtes sensé à deviner? Puis, peu à peu, la résolution s'améliore, donc d'abord vous savez que c'est une personne, puis vous voyez que c'est une femme, et ensuite vous reconnaissez les caractéristiques physiques uniques qui différencient votre sœur d'un étranger, même si elles ont la même taille, la même couleur de cheveux et yeux. Voilà comment fonctionne l'apprentissage profond. L'algorithme effectue de nombreux passages sur les mêmes données, gagnants chaque fois en précision jusqu'à ce qu'il puisse prédire ce que l'image est réellement. Il fonctionne en utilisant des structures de neurones interconnectés qui imitent le fonctionnement d'un cerveau humain. Un exemple d'apprentissage profond est la conduite de véhicule autonome. Les caméras alimentent en permanence des algorithmes d'apprentissage profond dans l'ordinateur de bord de la voiture, qui analysent et interprètent les images de son environnement et ajuste la vitesse et la direction de déplacement de manière à éviter les collisions.

Mise en place responsable d'un processus d'apprentissage automatique

Les processus d'apprentissage automatique sont généralement élaborés à l'aide de code source ouvert et de code écrit à l'interne. Tous les processus d'apprentissage automatique doivent satisfaire à certaines normes de qualité, indépendamment des processus qui les élaborent ou de l'usage qui en est fait. Les normes de qualité doivent comprendre les caractéristiques suivantes: Rigueur, tant au niveau des méthodes scientifiques utilisées que des tests auxquels les processus sont soumis. Imputabilité, quant à leur mode d'utilisation et à leur finalité. Fiabilité, aux termes d'application rigoureuse. Éthique, en ce qui concerne les données que les algorithmes eux-mêmes. Pour que les processus d'apprentissage automatique de Statistique Canada satisfasse à ses attentes, nous avons élaboré un cadre pour l'utilisation des processus d'apprentissage automatique de façon responsable.

Cadre pour l'utilisation des processus d'apprentissage automatique de façon responsable

(Texte à l'écran: Auto-évaluation et examen par les pairs, liste de vérification et production d'un rapport ou d'un tableau de bord)

(Diagramme circulaire sur l'éthique de l'apprentissage automatique responsable. Dans la direction d'une aiguille d'une montre, débutant dans la haute gauche, est intituler: Respect des personnes; Application rigoureuse; Méthodes éprouvées; Respect des données)

Il s'agit d'une représentation visuelle du cadre pour l'utilisation des processus d'apprentissage automatique de façon responsable à Statistique Canada. Le cadre s'articule autour de quatre thèmes: le respect des personnes, le respect des données, l'application rigoureuse et les méthodes éprouvées. Chaque thème a plusieurs attributs. Les attributs associés aux thèmes du respect des personnes sont la valeur pour les Canadiens, la prévention des préjudices, l'équité et la responsabilité. Les attributs associés au thème du respect des données sont la vie privée, la sécurité et la confidentialité. Les attributs associés au thème de l'application rigoureuse sont la transparence et la reproductibilité du processus et des résultats. Les attributs associés aux thèmes des méthodes éprouvées sont des données d'apprentissage de qualité, des inférences valides, une modélisation rigoureuse et l'explicabilité.

Comment mettre en place des processus d'apprentissage automatique responsables

(Texte à l'écran: Un aperçu fiable des processus d'apprentissage automatique responsables)

Passons les thèmes en revue l'un après l'autre. Un processus d'apprentissage automatique assure le respect des personnes en veillant à ce qu'il n'y ait pas de préjugés ou de discrimination dans les données d'apprentissage. Tout le monde est traité de manière équitable. Un processus d'apprentissage automatique qui garantit le respect des personnes est un processus qui protège la vie privée des personnes et des entreprises, assure la sécurité des données à toutes les étapes du traitement et protège les renseignements confidentiels pour éviter leur divulgation. Un processus d'apprentissage automatique bien appliqué est un processus qui garantit la transparence et la reproductibilité du processus et des résultats. Un processus d'apprentissage automatisé qui comprend des méthodes solides est un processus dont les méthodes sont conformes aux directives de qualité qui utilisent des mesures appropriées pour mesurer l'exactitude et le rendement.

Comment utiliser les processus d'apprentissage automatique de façon responsable

Il ne suffit pas de mettre en place des processus d'apprentissage automatique responsable. Il faut aussi les utiliser de manière responsable. Cela signifie qu'il faut faire le suivi de la mesure de rendement dans le temps. Les données traitées par l'algorithmique peuvent évoluer, il est donc important de surveiller son rendement et de réajuster l'algorithmique au besoin. Il devrait y avoir une surveillance humaine et une responsabilité à toutes les étapes. Les gens sont en fin de compte responsables de toutes les prévisions et décisions qui sont les résultats d'un algorithme d'apprentissage automatique pour toutes les systèmes qui utilisent des processus d'apprentissage automatique et surtout pour ceux qui soutiennent directement ou prennent des décisions administratives. Il est essentiel de mettre en œuvre et appliquer des protocoles sur leur utilisation pour les processus d'apprentissage automatique au sein du gouvernement du Canada, cela signifie qu'il faut s'assurer que la conformité avec la directive sur la prise de décision automatique du Secrétariat du Conseil du Trésor.

Principaux points à retenir

Dans cette vidéo, vous avez appris que la science des données à l'intersection de l'expertise dans la matière de la programmation informatique, des mathématiques et des statistiques. L'apprentissage automatique est un sous ensemble de l'intelligence artificielle qui vise à apprendre aux ordinateurs comment apprendre sans avoir besoin d'être programmé pour des tâches particulières. L'apprentissage supervisé et l'apprentissage non supervisé sont deux types d'apprentissage automatique utilisés pour prédire un résultat. Nous avons également présenté un cadre pour la construction et l'utilisation responsable des algorithmes d'apprentissage automatique.

Formation complémentaire

Si vous souhaitez en savoir plus sur l'utilisation de l'intelligence artificielle et l'apprentissage automatique au sein du gouvernement du Canada, entrez "directives sur la prise de décision automatisée du Secrétariat du Conseil du Trésor" dans le champ de recherche de votre navigateur préféré.

(Le mot-symbole « Canada » s'affiche.)

Qu'avez-vous pensé?

S'il vous plaît nous donner vos commentaires afin que nous puissions mieux fournir des produits qui répondent aux besoins de nos utilisateurs.

Intendance des données : Introduction aux normes en matière de données et aux métadonnées

Numéro de catalogue : 892000062021006

Date de diffusion : le 3 mai 2021 Mise à jour : le 5 novembre 2021

Que vous recueilliez de nouvelles données ou que vous utilisiez des données existantes, appliquer des normes en matière de données vous facilitera la vie. Et documenter vos données sous forme de métadonnées permettra à d'autres de les trouver, de les comprendre et de les utiliser.

Dans cette vidéo, vous apprendrez ce que nous pouvons faire aux données mêmes pour qu'il soit plus facile de les utiliser. Tel est le rôle des normes en matière de données. Et vous apprendrez quels sont les renseignements supplémentaires que nous pouvons fournir pour faciliter l'utilisation des données. Tel est le rôle des métadonnées.

Étape du parcours des données
Fondation
Compétence des données
  • Analyse des données
  • Création et utilisation de métadonnées
  • Gestion et organisation des données
  • Intendance des données
  • Interprétation des données
Audience
Essentiel
Conditions préalables suggérées
s.o.
Durée
14:52
Coût
Gratuit

Voir la vidéo

Intendance des données : Introduction aux normes en matière de données et aux métadonnées - Transcription

Intendance des données : Introduction aux normes en matière de données et aux métadonnées - Transcription

(Le symbole et le mots-symbole de Statistique Canada apparaissent sur l'écran: "Intendance des données: Introduction aux normes en matière de données et aux métadonnées".)

Intendance des données: Introduction aux normes en matière de données et aux métadonnées

Que vous recueilliez de nouvelles données ou que vous utilisiez des données existantes, appliquer des normes en matière de données vous facilitera la vie. Et documenter vos données sous forme de métadonnées, permettra à d'autres de les trouver, de les comprendre et de les utiliser.

Objectifs d'apprentissage

Dans cette vidéo, vous apprendrez ce que nous pouvons faire aux données mêmes pour qu'il soit plus facile de les utiliser. Tel est le rôle des normes en matière de données Et vous apprendrez quels sont les renseignements supplémentaires que nous pouvons fournir pour faciliter l'utilisation des données. Tel est le rôle des métadonnées.

Étapes du cheminement des données

(Text à l'écran: Étapes du cheminemnt des données est appuyé par une base d'intendance, de métadonnées, de normes et de qualité)

(Diagramme du Cheminement des données: Étape 1 - définir, trouver, recueillir; Étape 2 - explorer, nettoyerm, décrire; Étape 3 - analyser, modéliser; Étape 4 - Raconter l'histoire. Le cheminement des données est supporté par une base d'intendance, de métadonnées, de normes et qualité.)

Ce diagramme est une représentation visuelle du cheminement des données, depuis leur collecte jusqu'au moment d'en raconter l'histoire à d'autres en passant par leur exploration, leur nettoyage, leur description, leur compréhension et leur analyse. Les normes en matière de données et les métadonnées les portent tout au long de leur cheminement.

Normes en matière de données

Les normes en matière de données peuvent être appliquées aux données pour qu'il soit plus facile de les utiliser. Il peut s'agir d'utiliser une terminologie commune pour décrire les données, comme dire que les données font partie d'un ensemble de données ou, encore, que les données comportent des variables catégoriques ou des variables numériques. Il peut aussi s'agir d'utiliser des moyens familiers pour représenter des choses courantes, comme les dates, les adresses et la température. Suivre une norme en matière de données peut aussi consister à rendre les données reconnaissables en les conservant dans une base de données ou en utilisant un format de fichier courant. En bref, les normes en matière de données sont les règles utilisées pour normaliser la façon de décrire, de représenter et de structurer les données.

Métadonnées

Les métadonnées sont des renseignements qui sont fournis avec les données pour faciliter l'utilisation de celles-ci. Il peut s'agir de renseignements sur la source des données: d'où elles viennent, qui les a créés, ce à quoi elles servent, la date de leur création, etc. Il peut aussi s'agir de renseignements sur ce qu'on a déjà fait aux données, comment elles ont été nettoyées et traitées et la façon dont les choses ont été calculés. Les métadonnées peuvent aussi inclure une description de la qualité des données, par exemple ce qui manque à celles-ci ou la façon dont elles ont été validées. Si les normes en matière de données ont été respectées lors de la création et du traitement des données, une description de celles-ci peut également être incluse dans les métadonnées. En bref, les métadonnées sont des données qui fournissent de l'information sur d'autres données, ce qui en facilite la recherche, l'interprétation et l'utilisation et permet de s'y fier davantage.

Normes en matière de données et métadonnées

(Diagramme du cycle de vie des données symbolisé comme une route commençant au producteur de données où il est pour une analyse plus approfondie à chaque jonction, aussi longtemps que la règle derrière les normes de données et les métadonnées sont suivies. Si des normes de données et des métadonnées sont utilisées, le cycle de vie des données est infini.)

Nous recueillons et nous manipulons des données parce que nous voulons qu'elles révèlent quelque chose. D'habitude, nous ne recueillons, ne manipulons et n'interprétons pas les données en une seule étape. C'est ce que les données évoluent en cheminant, mais sans pour autant s'arrêter, arrivant à destination pour reprendre la route! Votre travail pourrait consister à créer un tableau de données pour votre patron, qui pourrait le joindre à d'autres tableaux pour créer un tableau de bord que son patron pourrait examiner afin de recommander une décision et ainsi de suite. Les données ne cessent d'avancer, comme un vélo. Mais qu'est-ce qui fait avancer les données? Quelqu'un doit pédaler! Bref, quelqu'un doit pouvoir trouver, comprendre et manipuler ces données pour que les choses continuent à rouler. C'est là qu'interviennent les normes en matière de données. Tout comme il faut mettre les pieds sur les pédales pour faire tourner les roues d'un vélo dans le sens des aiguilles d'une montre, l'utilisation des données répond à des normes. Et tout comme une fiche technique décrit les caractéristiques d'un vélo, les métadonnées expliquent le contenu et le fonctionnement des données. Tant que les normes en matière de données sont respectées et que les métadonnées sont tenues à jour, les données peuvent continuer d'avancer. Mais dès qu'on arrête de suivre les normes en matière de données et qu'il n'y a pas de métadonnées, les données cessent leur cheminement. Plus personne ne les comprend ou ne peut les utiliser.

Pourquoi les normes en matière de données et les métadonnées sont-elles importantes?

Mais pourquoi devons nous utiliser des normes en matière de données et des métadonnées? Pour en retenir l'importance, il suffit de penser au sigle F-A-I-R. Les normes en matière de données et les métadonnées rendent les données faciles à trouver. Elles rendent les données accessibles ou faciles à utiliser. Elles rendent les données interopérables, ce qui signifie simplement qu'elles sont faciles à combiner avec d'autres données. Elles facilitent l'utilisation, le partage et la réutilisation des données.

Types de normes en matière de données

Il y a différents types de normes en matière de données. Nous n'en mentionnerons que quelques-unes. Les normes relatives au format des données sont une façon normalisée de représenter des choses telles que les dates, les nombres négatifs, la devise et, comme c'est le cas au Canada, les codes à deux lettres des noms de provinces. Les normes relatives au format des fichiers de données font en sorte que les fichiers sont faciles à partager et à ouvrir. Le format des variables séparées par des virgules, ou CSV, est un bon format parce qu'il permet à divers logiciels d'ouvrir les fichiers. Les normes relatives aux variables sont un moyen de normaliser les catégories concernant des variables qui ne peuvent prendre que certaines valeurs, comme la situation vis-à-vis de l'activité, les groupes d'âge, l'industrie et la profession. Nous en parlerons davantage à la prochaine diapositive.

Classifications types

Une classification est une façon de regrouper les catégories d'une norme relative aux variables de façon significative et cohérente. Prenons l'exemple des groupes d'âge. Si un chercheur utilise des catégories d'âge s'échelonnant sur quatre ans et qu'un autre utilise des catégories d'âge s'échelonnant sur dix ans, il serait difficile de comparer leurs résultats. Mais si tous deux conviennent que les catégories d'âge devraient s'échelonner sur cinq ans et s'y conforment, cela s'appelle une classification. Les groupes d'une classification devraient être exhaustifs et s'exclure mutuellement. Avant de créer vos propres groupes, il serait bon que vous vérifiiez s'il existe une classification type que vous pourriez utiliser. Il y en a beaucoup sur le site Web de Statistique Canada.

Types de métadonnées

Il y a différents types de métadonnées, mais nous ne parlerons que de quelques unes d'entre elles. Les métadonnées de référence fournissent des renseignements sur la source des données, par exemple qui les a recueilli, quand et à quelles fins. Les métadonnées de référence comprennent également une description des méthodes qui ont été utilisées pour traiter ou analyser les données et une évaluation de la qualité des données. Cela pourrait prendre la forme d'un paragraphe. Les métadonnées descriptives sont des choses telles que les titres, les notes de bas de page et les étiquettes. Elles peuvent apparaître directement dans des tableaux, des graphiques et d'autres produits de visualisation de données. Les métadonnées structurelles sont celles qui renferment la liste des variables figurant dans les données, les identificateurs, les valeurs valides, la plage des valeurs ou la liste des codes, qui est une liste de toutes les valeurs possibles pour les variables catégoriques. Si des classifications ont été utilisées, les métadonnées structurelles les décriront.

Exemple: Normales climatiques, 1981-2010, Saskatoon

(Image du résultat de la recherche « Normales et moyennes climatiques de 1981 - 2010 » sur le site Web du Gouvernement du Canada en mettant l'accent sur l'hyperlien de "Saskatoon Water TP".)

Examinons les normes en matière de données et les métadonnées à l'aide d'un exemple. Pour le consulter, vous pouvez vous rendre sur le site Web du gouvernement du Canada et y chercher un nom de station contenant le mot "Saskatoon". Nous avons choisi la station météorologique, "Saskatoon Water TP".

(Image du résultat de la recherche « 1981 - 2010 climate normals and averages for the Saskatoon Water TP » sur le site Web du Gouvernement du Canada en mettant l'accent sur le titre, les axes et la légende du graphique. Une attention supplémentaire est portée à l'onglet Métadonnées Station/Élément.)

Cliquer sur "Saskatoon Water TP" mène à cette page. Ce graphique a un titre informatif et une légende et ses axes sont étiquetés. Ce sont des exemples de métadonnées descriptives. Trois onglets surmontent le graphique. Nous avons cliqué sur celui intitulé "Métadonnées pour les stations et les éléments".

(Image du résultat de la recherche « 1981 - 2010 climate normals and averages for the Saskatoon Water TP » sur le site Web du Gouvernement du Canada en mettant l'accent sur le lien hypertexte Latitude (dd mm).)

Cliquer sur l'onglet "Métadonnées pour les stations et les éléments" mène à cette page. Le paragraphe sous les onglets est un exemple de métadonnées de référence, qui explique comment déterminer la qualité des statistiques dans les tableaux. Le producteur des données a fourni ces renseignements pour aider l'utilisateur des données à décider si les données conviennent à l'utilisation prévue. Nous avons ensuite cliqué sur l'hyperlien "Latitude".

(Image de la définition des métadonnées de latitude)

Cliquer sur l'hyperlien "Latitude" mène à ce renseignement. Il s'agit d'autres métadonnées de référence pour aider l'utilisateur à comprendre la façon dont la latitude a été mesurée et pour l'informer de la qualité des données de localisation. La latitude et la longitude sont une classification type pour l'indication d'emplacements.

(Image du résultat de la recherche « 1981 - 2010 climate normals and averages for the Saskatoon Water TP » sur le site Web du Gouvernement du Canada en mettant l'accent sur l'onglet "Données sur les normales".)

Ensuite, nous sommes revenus à cette page web et nous avons cliqué sur l'onglet "Données sur les normales".

(Image du résultat de la recherche « 1981 - 2010 climate normals and averages for the Saskatoon Water TP » sur le site Web du Gouvernement du Canada, en mettant l'accent sur les sous-sections de l'onglet Données sur les normales intitulée « Télécharger des données » et « Données connexes ».)

Cliquer sur l'onglet "Données sur les normales" mène à cette page. Le paragraphe sous les onglets contient d'autres métadonnées de référence, qui décrivent la façon dont les calculs ont été effectués et qui renferme d'autres renseignements sur la qualité des données. Les données sont offertes gratuitement dans les formats CSV et XML, qui sont tous deux des normes courantes relatives au format des fichiers de données. Cette page Web contient également des hyperliens vers d'autres métadonnées connexes.

(Image du fichier CSV du « 1981 - 2010 climate normals and averages for the Saskatoon Water TP » du site Web du gouvernement du Canada mettant l'accent sur les titres de table de la CSV, les abréviations normalisées des provinces, les méthodes de numérotation et la nomenclature des dates.)

Nous avons téléchargé les données en format CSV (ou variables séparées par des virgules). Nous en voyons ici un petit segment. La colonne de gauche affiche explicitement des métadonnées dont le but est d'aider les utilisateurs à comprendre et à utiliser ces microdonnées. La province est SK, l'abréviation normalisée de Saskatchewan. Les valeurs négatives sont indiquées par le signe moins, ce qui est une norme de données courante. Le format des dates est en "aaaa/jj", ce qui est une norme de données assez courante pour les dates.

Exemple: récapitulatif

Revoyons l'exemple. Le producteur de données a recueilli les microdonnées climatiques les a traitées, a appliqué des normes en matière de données pour les dates et les nombres négatifs et a utilisé une classification type pour la latitude et la longitude. Il a utilisé les microdonnées pour créer des produits de données. Dans cet exemple, nous avons vu un diagramme, un graphique et un ensemble de données téléchargeables. Le producteur de données a également créé des métadonnées décrivant tout ce qu'il a fait et il a choisi stratégiquement l'endroit où afficher les métadonnées dans les produits de données afin que l'utilisateur de données sache de façon intuitive et transparente où trouver l'information dont il a besoin. Dans cet exemple, l'utilisateur de données parcourt les produits de données. Les métadonnées lui font découvrir des renseignements sur la qualité des données, les méthodes qui ont été utilisées et les normes en matière de données qui ont été appliquées.

Vérification des connaissances

(Image des immatriculations de véhicules automobiles neufs au Canada dans les site web du Gouvernement du Canada. En mettant l'accent sur les titres des colonnes, les superscripts et les références.)

L'exemple nous a montré à repérer les métadonnées et les normes en matière de données. À vous de jouer maintenant. Ce que vous voyez à l'écran est un tableau de données sur les immatriculations des véhicules automobiles neufs. Maintenant, arrêtez la vidéo et voyez combien d'exemples de métadonnées vous pouvez trouver à l'écran. Repartez la vidéo pour voir nos réponses. Il a des étiquettes sur les lignes et les colonnes du tableau. Il s'agit d'un exemple de métadonnées descriptives. La police est assez petite, mais on voit après les mots "Autres types de carburant" un hyperlien sous forme d'exposant. Si vous pouviez appuyer dessus, vous verriez apparaître un message contextuel indiquant quels sont les autres types de carburant. Il s'agit d'un autre exemple de métadonnées descriptives. Sous le tableau se trouve une mine d'or de renseignements connexes. Si vous pouviez cliquer sur l'un des hyperliens, vous y trouveriez des métadonnées de référence sur la source, les méthodes et la qualité des données.

Récapitulatif des points clés

Les normes en matière de données sont les règles utilisées pour normaliser la façon de décrire, de représenter et de structurer les données. Les normes en matière de données permettent d'utiliser plus facilement les données. Les métadonnées sont des données qui fournissent des renseignements sur d'autres données. Les métadonnées facilitent l'utilisation des données. L'utilisation et le partage des normes en matière de données et des métadonnées facilitent l'utilisation et le partage des données.

(Le mot-symbole « Canada » s'affiche.)

Qu'avez-vous pensé?

S'il vous plaît nous donner vos commentaires afin que nous puissions mieux fournir des produits qui répondent aux besoins de nos utilisateurs.

Soutien au contrôle de la confidentialité: Dominance et homogénéité avec SAS

ISBN : 978-0-660-69423-8

Date de diffusion : 29 avril 2022

Soutien au contrôle de la confidentialité: Dominance et homogénéité avec SAS

(Le symbole de Statistique Canada, le mot-symbole « Soutien au contrôle de la confidentialité: Dominance et homogénéité avec SAS » apparaissent à l'écran.)

Bienvenue à la série de formation de l'accès aux données de Statistique Canada. Cette vidéo fait partie de la série de soutien au contrôle de la confidentialité et présente des exemples d'utilisation de différents logiciels statistiques pour effectuer les analyses requises pour les chercheurs travaillant avec des données confidentielles.

Aujourd'hui, nous allons vous montrer un exemple permettant d'utiliser les tests d'homogénéité et de dominance, incluant des tests de NK et P-pourcent pour la variable de revenu en dollar avec SAS. Nous utiliserons un échantillon factice du recensement de 2016 qui ne contient aucun cas réel.

La dominance, c'est lorsque la majeure partie de la contribution à la statistique provient d'une ou de quelques observations (sur la base d'observations non pondérées). Les règles de N, K et P% font partie des règles de dominance. Quant à la règle d'homogénéité, elle vise à éviter la divulgation de statistiques lorsque les répondants occupent une étendue étroite de valeurs (peut-être parce qu'elles ont été imputées du même répondant).

Nous avons choisi le recensement pour cet exemple, mais d'autres enquêtes de Statistique Canada les exigent également. Pour les chercheurs des CDR, Il peut être important de savoir comment réaliser ces tests. En effet, la sortie de résultats de statistiques descriptives ou de modèles impliquant la variable de revenu continue en dollar exige du chercheur qu'il joigne à sa demande de confidentialité des documents de soutien.

Mentionnons qu'il s'agit d'un exemple de tests pour faciliter la vie aux chercheurs. Il existe d'autres exemples de ces programmes en ligne. Cette version-ci est facilement accessible aux chercheurs des CDR. Si vous n'êtes pas sûrs de leur emplacement, demandez-le à votre analyste. La présente version se présente comme un programme SAS où il suffit essentiellement d'entrer les variables d'intérêt dans la macro, incluant la variable de revenu, et de l'exécuter.

D'entrée de jeu, sachez qu'il est possible d'importer une base de données dans un autre langage informatique que SAS dont SPSS et de le transformer en base de données SAS. De plus, il faut savoir qu'il existe d'autres outils pour réaliser les tests avec les logiciels STATA et R disponibles dans les CDR. Ensuite, il suffit de déterminer quelles variables seront introduites dans la macro SAS. Pour les fins de l'exercice, nous pouvons prendre l'exemple d'un chercheur qui demande la sortie d'un tableau croisé de de la moyenne du revenu (qui est une variable continue) par province et par sexe (deux variables catégorielles). Ensuite, on introduit sur la deuxième ligne notre variable de revenu.

Nous utilisons ici la variable totinc. Enfin, il faut donner une instruction à SAS quant à l'emplacement du fichier de données qui nous intéresse. Le reste de la procédure suit. Pour la démonstration, je vais soumettre la partie du test de dominance et d'homogénéité. Vous obtiendrai alors un tableau de sortie de résultats. On retrouve certains indicateurs permettant de voir si chacune des catégories passent ou non les tests. Ici on voit qu'aucun des tests n'a échoué par la mention 0. Aucun problème d'homogénéité et de dominance n'a été détecté. Une valeur de 1 aurait indiqué qu'une catégorie a échoué le test. Le chercheur devrait regrouper les variables pour augmenter les effectifs dans la catégorie en question.

Ce document peut être joint aux résultats qui font l'objet d'une demande de divulgation, sous forme de feuille Excel, par exemple. Le code a exécuté l'envoi d'un fichier Excel à l'emplacement que nous avons indiqué. Il se retrouve sur le Bureau, dans un Dossier, mais vous pouvez choisir l'emplacement de votre choix. Maintenant, on revient au programme pour exécuter le code des tests de N, K, et P-pourcent. Encore une fois, on sélectionne le code à exécuter. Le code génère des fichiers de données nécessaires au calcul des tests. Comme avec le test précédent, le tableau qui se trouve dans la fenêtre de sortie de données indiquent zéro.

On peut conclure qu'aucun problème de N, K et P-pourcent n'a été détecté, et qu'il n'est donc pas nécessaire de regrouper de catégories. Ces résultats peuvent être joints comme document de soutien à la demande de confidentialité. Merci de votre attention! Si vous avez des questions, veuillez contacter le personnel local du CDR ou envoyez un courriel à statcan.maddatadevteam-damequdevdonnees.statcan@canada.ca.

(Le mot-symbole « Canada » s'affiche.)

Soutien au contrôle de la confidentialité: Arrondissement des proportions avec Rounder - une application R Shiny

ISBN : 978-0-660-69431-3

Date de diffusion : 27 avril 2022

Soutien au contrôle de la confidentialité: Arrondissement des proportions avec Rounder - une application R Shiny

(Le symbole de Statistique Canada, le mot-symbole « Canada » et le titre : « Soutien au contrôle de la confidentialité: Arrondissement des proportions avec Rounder - une application R Shiny » apparaissent à l'écran.)

Bienvenue à la série de formation sur l'accès aux données de Statistique Canada. Cette vidéo fait partie de la série de soutien au contrôle de confidentialité et présente des exemples d'utilisation de différents logiciels statistiques pour effectuer les analyses requises pour les chercheurs travaillant avec des données confidentielles. Le code qui prend en charge l'application de Rounder est disponible. Demandez à votre analyste si vous n'êtes pas sûr de savoir où le trouver. Dans cette vidéo, je vais utiliser un fichier de microdonnées à grande diffusion pour montrer les différentes fonctionnalités de l'outil d'arrondissement L'application sera utile pour ceux qui ont besoin de valeurs arrondies, de valeurs pondérées, de fréquences randomisées et pour vérifier si les fréquences atteignent la taille de cellule minimum. Avant de montrer l'application, nous allons configurer l'outil dans nos dossiers et dans R. L'étape 1 est la localisation et l'extraction du module d'application Rounder, qui peut être placé dans le même répertoire que le dossier zippé, dans ce cas-ci, Documents. Après l'extraction, nous allons aller dans le dossier et ouvrir le fichier R appelé Rounder App. Maintenant, nous devons changer le chemin afin qu'il puisse trouver les fichiers requis. Donc, de retour dans l'explorateur de fichiers, nous devons cliquer à droite sur le dossier extrait, sélectionner et copier le chemin que nous allons coller dans l'objet chemin entre les guillemets en s'assurant de modifier les barres obliques inversées par des barres obliques avant et se débarrasser de la partie Rounder du chemin, parce que celle-ci est déjà incluse dans la fonction « libpaths » en dessous. Enfin, nous devons mettre en surbrillance et exécuter tout le code pour que l'application s'ouvre. Ceci est l'application Rounder, c'est l'extrémité avant du module Vetter pour studio R. Rounder est un outil interactif pointer-cliquer qui permet de préparer les documents de soutien pour les proportions, les fréquences, et les moyennes. Cette application R Shiny peut être utilisée pour générer des fréquences pondérés et effectuer des arrondissements aléatoires. Dans cette vidéo, je vais vous montrer comment il fonctionne. En ce moment, j'ai l'application ouverte dans mon navigateur, mais elle fonctionne complètement hors ligne. La première chose que nous allons faire est d'importer un fichier de données. Les types pris en charge sont Stata, SPSS, SAS et csv. Nous allons utiliser l'ESG qui est le fichier à grande diffusion de l'enquête sociale générale. Nous pouvons charger le tout, mais afin de gagner du temps, nous recommandons fortement de sélectionner les variables dont vous avez besoin. Pour cet exemple, j'utiliserai le lieu de naissance canadien, l'achat de plats à emporter, le revenu familial et l'âge du père du répondant, puis nous allons cliquer ici. Nous voyons un résumé de nos données, ce qui signifie qu'il est chargé avec succès. Toutes les fonctions que nous allons voir sont ici. Pour vérifier les proportions, nous allons mettre deux variables. Nous allons passer en revue certaines de ces colonnes. D'abord, nous verrons nos deux variables et ensuite nous verrons une colonne d'avertissement ici. Cet avertissement apparaîtra si votre numérateur est en dessous du seuil de taille de cellule minimale ou si la différence entre votre numérateur et votre dénominateur est inférieure à ce même seuil. Cela est très utile, car il peut être adapté aux seuils minimaux spécifiques des différentes enquêtes. Ici, nous voyons l'arrondissement aléatoire ainsi que le nombre aléatoire ici, nous voyons le numérateur, le numérateur arrondi, la différence entre les deux, le dénominateur le dénominateur arrondi et la différence entre les deux. Et si je fais défiler… nous avons la proportion et la proportion arrondie qui seront utiles aux chercheurs. Et maintenant, ici, nous avons de nombreux paramètres que nous pouvons modifier. Nous pouvons ajouter la pondération et maintenant nous allons voir une nouvelle colonne qui a été ajoutée qui a nos valeurs non pondérées ainsi que nos valeurs pondérées, y compris les proportions pondérées. Ici, nous pouvons basculer entre l'arrondissement conventionnel et aléatoire ainsi que changer le nombre aléatoire. Ici, nous pouvons adapter notre seuil de taille de cellule minimale spécifique à l'enquête et nous verrons que si nous abaissons la valeur, notre avertissement disparaîtra car maintenant il y a suffisamment de répondants dans notre catégorie, et si on le remet à 5 on verra l'avertissement revenir. Ici, nous pouvons changer notre base d'arrondissement et cela affectera nos sorties arrondies, nous pouvons changer le nombre de chiffres à afficher. Nous pouvons garder nos valeurs manquantes ou nous pouvons les supprimer et nos proportions changeront en conséquence. Les fonctionnalités suivantes sont disponibles pour tous les onglets et sont affiché en mode Exportation. Vous pouvez copier ce qui est montré dans le tableau dans votre presse-papier ou vous pouvez télécharger des sorties complètes qui incluront même les sections qui ne sont pas affichées sur le tableau et cela vous donnera la possibilité d'enregistrer le fichier. Voici à quoi ressemble le fichier une fois que vous l'ouvrez et nous verrons que c'est un tableau bien ficelé avec toutes nos colonnes et l'avertissement que nous avons vu précédemment. Ensuite, nous pouvons vérifier les fréquences ce qui est très similaire à vérifier les proportions. Cela nous donnera essentiellement les fréquences de chaque catégorie ainsi que le nombre arrondi que nous pouvons changer et nous verrons nos données dans le tableau ici. Vérifier les valeurs continues nous permettra de vérifier nos variables continues. Supposons que nous sélectionnons une variable continue il nous donnera notre N total, nos N manquants, nos N valides, donc c'est le total moins les valeurs manquantes et notre N valide arrondi qui est déterminé à partir de la base d'arrondissement ici. Les paramètres sont similaires à ce que nous avions dans les sections précédentes et la dernière caractéristique est l'arrondissement aléatoire, ce qui est idéal pour les tailles d'échantillon de modèle. Nous pouvons entrer des valeurs ici et ensuite, lorsque nous cliquons sur arrondissement aléatoire, nous verrons que nous obtenons nos valeurs arrondies ici, ainsi que la différence entre nos valeurs arrondies et la valeur réelle nous avons le nombre aléatoire généré pour l'arrondissement et si vous voulez reproduire vos résultats, vous pouvez entrer manuellement le nombre aléatoire. Ceci était une brève démonstration de l'application Rounder et nous espérons cela rendra le processus de contrôle de la confidentialité un peu plus facile. Merci de votre attention et passez une excellente journée.

(Le mot-symbole « Canada » s'affiche.)

Soutien au contrôle de la confidentialité : Dominance et homogénéité avec la fonction tcensus (Stata)

ISBN : 978-0-660-69429-0

Date de diffusion : 27 avril 2022

Soutien au contrôle de la confidentialité : Dominance et homogénéité avec la fonction tcensus (Stata)

(Le symbole de Statistique Canada, le mot-symbole « Canada » et le titre : « Soutien au contrôle de la confidentialité : Dominance et homogénéité avec la fonction tcensus (Stata) » apparaissent à l'écran.)

Bienvenue à la série de formation sur l'accès aux données de Statistique Canada. Cette vidéo fait partie de la série de soutien au contrôle de confidentialité et présente des exemples d'utilisation de différents logiciels statistiques pour effectuer les analyses requises pour les chercheurs travaillant avec des données confidentielles.

Aujourd'hui, nous allons vous montrer un exemple permettant d'utiliser les tests d'homogénéité et de dominance, de même que des tests de NK et P-pourcent pour la variable de revenu continue en dollar du recensement à l'aide du logiciel STATA et de la fonction « tcensus ».

Pour les fins de l'exercice, nous utilisons un échantillon de données du recensement de 2016. Ce fichier est factice et ne contient aucun cas réel. La dominance, c'est lorsque la majeure partie de la contribution à la statistique provient d'une ou de quelques observations (sur la base d'observations non pondérées). Les règles de N, K et P pourcent font partie des règles de dominance. Quant à la règle d'homogénéité, elle vise à éviter la diffusion de statistiques lorsque les répondants occupent une étendue étroite de valeurs. « Tcensus » est une fonction STATA qui permet d'effectuer l'ensemble des tests et produit automatiquement l'ensemble des documents de soutien requis pour une demande de divulgation. Il a été développé pour faciliter les demandes de divulgation autant pour les chercheurs que les analystes.

Pour utiliser « tcensus » il suffit, premièrement, d'importer la fonction dans STATA. Ensuite la commande « tcensus » peut être utilisée comme n'importe quelle autre commande STATA.

La commande « tcensus » est simple à utiliser. La première variable après la commande est la variable d'intérêt mesurée en dollar.

« Household(frame_id) » et « weight(compw2) » identifient respectivement l'identifiant des ménages et la variable de pondération. L'option « groupe » permet d'identifier les variables catégorielles ou ordinales servant à définir les populations d'intérêts.

Finalement, il est nécessaire d'identifier l'emplacement du document de soutien en remplaçant « path » par le dossier approprié sur votre session informatique.

Notez que le chemin ne doit pas être placé entre guillemets.

Voici un exemple de commande « tcensus ». Cet exemple simule une demande où un chercheur est intéressé par le revenu individuel moyen groupé par province et par sexe.

Nous commencerons cet exemple en important notre recensement fictif.

Dans un premier temps nous allons importer la fonction « tcensus ».

Ensuite nous pouvons simplement utiliser la commande.

Les résultats seront enregistrés dans le dossier indiqué.

Les premières colonnes indiquent les variables utilisées pour définir les sous-populations d'intérêt. Les colonnes nommées « test » sont des indicateurs pour les différents tests effectués. La valeur « Fail » sera indiquée si l'un des tests a échoué. Je vous invite à vous référer aux règles de confidentialité du recensement pour de plus amples renseignements sur chacun des tests ou toute autre ligne directrice relative à l'enquête.

Merci de votre attention! Si vous avez des questions. veuillez contacter le personnel de votre CDR ou envoyez un courriel à statcan.maddatadevteam-damequdevdonnees.statcan@canada.ca.

(Le mot-symbole « Canada » s'affiche.)

Soutien au contrôle de la confidentialité : Arrondissement des proportions avec SAS

ISBN : 978-0-660-69425-2

Date de diffusion : 27 avril 2022

Soutien au contrôle de la confidentialité : Arrondissement des proportions avec SAS

(Le symbole de Statistique Canada, le mot-symbole « Canada » et le titre : « Soutien au contrôle de la confidentialité : Arrondissement des proportions avec SAS » apparaissent à l'écran.)

Bonjour et bienvenue à la série de formation de l'accès aux données. Cette série de vidéos présente des exemples d'utilisation de différents logiciels statistiques pour effectuer les analyses requises pour les chercheurs travaillant avec des données confidentielles. Dans cette vidéo, je vais vous montrer un programme SAS qui génère des proportions arrondies avec des documents de soutien pour le contrôle de la confidentialité.

Nous utiliserons un fichier fictif du recensement de 2016, il n'y a donc pas de cas réel dans l'un des exemples de cette vidéo. Voici les principales caractéristiques du code. 1) Il vérifie les tailles des cellules non pondérées, ce qui est une exigence de confidentialité courante. 2) Il arrondira au hasard les numérateurs et les dénominateurs avant de calculer les proportions pondérées, ce qui est une exigence de confidentialité pour certains ensembles de données et 3) Il produira les proportions pondérées que les chercheurs peuvent utiliser pour leur analyse. Les fichiers générés par le code incluent un fichier «fails», qui contient toutes les entrées qui ont échoué au contrôle de la taille de la cellule, la sortie de soutien qui montre les fréquences non pondérées qui viennent avec le fichier pour publication, et le fichier «pour publication» qui est celui que les chercheurs voudront demander à sortir du CDR.

Avant d'aborder le code, voici un exemple de table avec nos variables d'intérêt. Le programme suivant est conçu pour faciliter la vie des chercheurs. D'autres exemples de tels programmes sont disponibles en ligne. Cette version est facilement accessible aux chercheurs des CDR. Si vous n'êtes pas sûr de leur emplacement, demandez le à votre analyste. Cette version se présente comme un programme SAS, où vous entrez essentiellement les variables d'intérêt dans la macro, puis l'exécutez. Voici le code en SAS et cette section supérieure est l'endroit où nous devons inscrire nos variables. La première variable datafid, qui signifie data file id, correspond au chemin vers notre fichier SAS. Pour cette démonstration, nous allons utiliser l'ESG, le fichier à grande diffusion de l'enquête sociale générale. La première variable sera le sexe, la seconde sera la province, donc ce sera prv. La troisième variable sera marstat, qui est l'état matrimonial et ce sera le numérateur dans les calculs à venir. Nous allons créer une taille de cellule minimale en fonction des exigences de confidentialité. Cinq est la norme, mais je vais la changer pour 10, à des fins de démonstration. Ensuite, nous avons nos variables de poids et de poids bootstrap. Celles-ci, nous les trouvons dans notre ensemble de données. Les variables suivantes affecteront l'arrondissement. le dénominateur pondéré et les proportions dans les tableaux de sortie. Pour nos chemins de sortie, nous allons placer le chemin où nous voulons que nos fichiers de sortie apparaissent.

Alors maintenant, nous allons exécuter le code, section par section, pour nous assurer que tout fonctionne. La partie supérieure du code définit nos variables et dans la section suivante, en dessous, nous sélectionnons les variables dont nous avons besoin. Donc, cela prendra un instant. Dans la section suivante, nous avons produit nos tableaux de fréquences.

Nous aurons donc deux tableaux basés sur la variable de contrôle, l'un où le sexe est masculin, et l'autre où le sexe est féminin. En allant de gauche à droite dans notre tableau, nous avons notre province, notre état matrimonial, leur fréquence, la fréquence pondérée, les erreurs-types et les intervalles de confiance. Pour ces derniers, la méthode de réplication Bootstrap de l'enquête a été utilisée pour l'estimation de la variance. Ensuite, nous avons des pourcentages de ligne, donc la ligne pour cette catégorie et ses proportions. Nous voyons que nous l'avons pour toutes les variables, nous allons donc revenir à l'original et continuer à exécuter le fichier. La section suivante divise le fichier croisé en numérateurs et dénominateurs, qui est la variable 3 et nous obtenons ces résultats, puis nous reviendrons et exécuterons la section suivante ci-dessous, qui va créer un fichier de soutien avec les fréquences et les pourcentages.

Dans le fichier des « fails », nous pouvons voir que l'une de nos variables avait une taille de cellule inférieure à la taille de cellule minimale, qui était de 10, et nous pouvons obtenir des informations à ce sujet par les colonnes connectées. Ce que nous allons faire, est de recoder nos variables pour que cela ne se produise pas. Par exemple, nous savons que c'est l'Île-du-Prince-Édouard, alors nous devrons recoder nos variables pour n'avoir que les provinces maritimes. Mais pour cette démonstration, je vais simplement revenir en arrière et changer notre taille de cellule minimale à 5.

Une autre chose à noter est que la différence entre le numérateur et le dénominateur doit également être supérieure à la taille minimale de la cellule pour réussir le test.

Ensuite, nous allons exécuter le programme jusqu'ici. Lorsque nous rouvrirons notre fichier de « fails », nous verrons qu'il est vide et nous pouvons continuer. Nous allons exécuter la section suivante, vers le bas du fichier, et celle-ci crée le fichier de soutien. La ligne juste en dessous exportera le fichier, et vous pouvez voir qu'il est créé dans la barre latérale. Nous l'ouvrirons à partir de l'explorateur de fichiers.

À partir du fichier Excel, nous avons nos trois variables, et en allant de gauche à droite, le dénominateur, le dénominateur pondéré, le numérateur, le numérateur pondéré, le pourcentage de la ligne, l'erreur-type, les limites supérieures et inférieures, la différence, qui est le dénominateur moins le numérateur, s'il a échoué ou non à l'exigence de taille de cellule minimale, toutes les valeurs arrondies. Nous aurons la proportion réelle, la proportion arrondie et la proportion arrondie avec le seuil.

La section finale va découper notre fichier de soutien pour créer le fichier pour publication. Nous verrons qu'il est créé dans la barre latérale. Quand nous l'ouvrirons, nous verrons qu'il contient seulement les variables que nous voulons pour la publication. Avec ces fichiers, vous êtes maintenant prêt pour la prochaine étape du processus de contrôle de confidentialité. Bonne chance dans vos recherches et passez une excellente journée!

(Le mot-symbole « Canada » s'affiche.)

Soutien au contrôle de la confidentialité : Arrondissement des proportions avec Stata

ISBN : 978-0-660-69427-6

Date de diffusion : 27 avril 2022

Soutien au contrôle de la confidentialité : Arrondissement des proportions avec Stata

Bonjour et bienvenue à la série de formation sur l'accès aux données. Cette vidéo de vidéos présente des exemples d’utilisation de différents logiciels statistiques pour effectuer les analyses requises pour les chercheurs travaillant avec des données confidentielles.

Aujourd'hui, nous allons vous montrer un exemple de programme permettant d'arrondir des proportions avec Stata. L'arrondissement des fréquences et des proportions font partie des exigences de certaines enquêtes de Statistique Canada. Le programme produira des proportions arrondies et des documents justificatifs pour faciliter le contrôle de la confidentialité, autant pour les chercheurs que les analystes. De plus, il génèrera un document de soutien séparé contenant les fréquences requises, et signalera si l'une d'elles n'atteint pas le seuil de cellule minimale de l'enquête.

Nous utiliserons un échantillon de données de l'Enquête sociale générale (ESG). Veuillez noter qu'il s'agit d'une version à usage public de l'ESG. Ce fichier do est conçu pour être utilisé avec votre fichier de données une fois la structuration effectuée et qu'il est prêt pour l'analyse. Si vous ne connaissez pas l'emplacement de ce programme, demandez-le à votre analyste. Le seul endroit où des ajustements doivent être faits par l'utilisateur se trouve ici, dans les « globals ».

Tout ce que nous avons à faire est de spécifier le répertoire dans lequel se trouvent nos données, l'ensemble de données structurées à utiliser. Nous devons spécifier notre numérateur et notre dénominateur. Dans cet exemple, notre numérateur est le statut d'emploi et le dénominateur est le sexe. Notre proportion correspond donc au nombre d'hommes et de femmes dans différents types d'emplois. Nous spécifions notre poids d'enquête. Nous spécifions notre base d'arrondissement et nous spécifions notre taille minimale de cellule. J'ai déjà exécuté les « globals » dans STATA, il ne nous reste donc plus qu'à exécuter l'outil, de la ligne 25 à 55. Veuillez noter que cet outil utilise la commande de réduction (« collapse »), ce qui signifie qu'il y aura plusieurs ensembles de données intermédiaires créés qui apparaîtront dans notre répertoire. Ainsi, lorsque j'ouvre le répertoire, je peux voir un ensemble de données pour notre numérateur, notre dénominateur et la façon dont nous les avons fusionnés. Maintenant, la seule chose qui reste à faire est de prendre connaissance des fichiers à publier et des documents de soutien. Regardons d'abord notre fichier Excel pour la publication. Nous pouvons voir que nous avons le sexe, le statut d'emploi et la proportion d'hommes et de femmes dans chacun des statuts d'emploi. Tout semble bon et il suffit de vérifier les pièces justificatives. La documentation justificative montre tout ce dont nous avons besoin : la fréquence de notre dénominateur non pondéré, la fréquence de notre numérateur non pondéré. Nous avons même une variable qui montre la différence entre le numérateur et le dénominateur. Celle-ci garantit que nos résidus sont supérieurs à la taille de cellule minimale. La colonne « L » indique un « échec » s'il y a des fréquences inférieures à 5, notre taille de cellule minimale. Nous voyons les proportions pondérées et non pondérées. Les proportions pondérées et non pondérées arrondies. Et nous nous assurons que tout va bien. Il y a une dernière chose à noter. Si vous souhaitez créer plus de proportions et plus de sorties, tout ce que vous avez à faire est de changer votre numérateur et votre dénominateur et d'exécuter l'outil à nouveau. Il générera des documents supplémentaires avec des noms basés sur le numérateur. Vous pouvez créer autant de proportions que vous le souhaitez.

Merci d'avoir visionné cette vidéo aujourd'hui. J'espère que vous passerez une excellente journée.

(Le mot-symbole « Canada » s'affiche.)

Soutien au contrôle de la confidentialité: Dominance et homogénéité avec R

ISBN : 978-0-660-69433-7

Date de diffusion : 27 avril 2022

Soutien au contrôle de la confidentialité: Dominance et homogénéité avec R

(Le symbole de Statistique Canada, le mot-symbole « Canada » et le titre : « Soutien au contrôle de la confidentialité: Dominance et homogénéité avec R » apparaissent à l'écran.)

Bienvenue à la série de formation sur l'accès aux données de Statistique Canada. Cette vidéo fait partie de la série de soutien au contrôle de confidentialité et présente des exemples d'utilisation de différents logiciels statistiques pour effectuer les analyses requises pour les chercheurs travaillant avec des données confidentielles. Les modèles de codage sont disponibles avec Stata, SAS et R.

Dans cette vidéo, je vais vous montrer comment réaliser des tests de dominance et d'homogénéité dans R. Nous utiliserons un fichier fictif du recensement de 2016, il n'y a donc pas de cas réels dans l'un des exemples de cette vidéo. Les tests de dominance et d'homogénéité peuvent être nécessaires pour les variables de revenu continues en dollars. Ces tests sont conçus pour empêcher la diffusion d'information dans deux situations. La première est la dominance. Ce sont des cas où la majeure partie de la contribution à la statistique provient d'une ou quelques unités.

La seconde est l'homogénéité. Cela fait référence aux situations où les répondants occupent une étendue étroite de valeurs. Les tests N, K et P-% font partie des tests de dominance. Vous devez toujours vous référer aux documents officiels des règles de divulgation pour connaître les exigences détaillées. La vidéo montrera trois exemples d'utilisation de la fonction cd_test dans R pour exécuter des tests pour la variable de revenu en dollar.

Commençons par le premier sujet - comment configurer le code R. La première étape consiste à exécuter le Fichier "recensement_dollar_test.R". Cela importera la fonction cd_test. Avec la fonction importée, nous sommes prêts à effectuer les tests.

L'instruction de base de la fonction de test est cd_test. Les chercheurs devront adapter les paramètres des fonctions à la spécificité des tests. Regardons les paramètres. Les trois principaux sont: data, dollar_value et groupe. Ces données font référence au nom de l'objet de données.

Avant d'exécuter le code, vous devrez importer d'abord votre ensemble de données et l'attribuer à un objet de données. Le nom de l'objet de données que nous verrons dans l'exemple est fake_census. Dollar_value fait référence à la variable continue en dollars. Group est le nom de la variable catégorielle. Il existe d'autres paramètres que les utilisateurs peuvent spécifier. Les trois points permettent aux utilisateurs de réaliser plusieurs tests avec la même variable monétaire. L'instruction By permet aux utilisateurs de mener les mêmes tests sur différents sous-échantillons. Les chercheurs peuvent également spécifier la variable de poids. Enfin, Path permet aux utilisateurs de spécifier où les sorties des tests finaux seront enregistrées. Regardons trois exemples de différentes façons d'appliquer la fonction cd_test. Le premier exemple est un test simple impliquant une variable en dollar et une variable catégorielle. Les deux variables impliquées sont le revenu du ménage (hhinc) et le sexe. Voici le code R pour mener ces tests. Comme vous pouvez le voir, le code spécifie l'ensemble de données, la variable de revenu en dollar, la variable groupe, la variable By est égale à NULL, la variable de poids et le chemin.

Bien entendu, les paramètres d'une fonction peuvent être appariés en position. Exécutons le code dans R. L'objet fake_census est un jeu de données importé dans R. Il comporte 7 428 lignes et 482 colonnes.

A la prochaine étape, nous exécuterons recensement_dollar_test.R en arrière-plan en introduisant la commande source. La fonction cd_test est alors prête à être utilisée. Spécifions les paramètres du cd_test. Les données sont égales à fake_census, la variable de revenu en dollar est hhinc, la variable de groupe est le sexe, By est égal à NULL, la variable de pondération et le chemin.

Les chercheurs peuvent alors suivre le chemin indiqué à l'écran pour trouver les résultats des tests. Les fichiers de résultats sont automatiquement enregistrés avec le nom de la variable de revenu en dollar et la date où les tests ont été effectués. Le fichier peut être écrasé si la même variable de revenu en dollar est utilisée la même journée. Vous devrez peut-être renommer le dossier de résultats. Vous pouvez consulter les fichiers Excel et les utiliser comme document de soutien pour votre demande de divulgation. Dans notre prochain exemple, nous effectuerons quatre différents tests à la fois avec la même variable monétaire.

Les quatre tests sont: revenu du ménage et sexe, revenu du ménage et province, revenu du ménage et état matrimonial, et revenu du ménage et groupe d'âge. La configuration du code cd_test est similaire à celle de tests entre deux variables, sauf que les chercheurs devront spécifier les quatre variables. Ainsi, après la variable de revenu en dollar, vous entrez sexe, pr, marst et agegrp5. Vous pouvez remplir le reste des paramètres de la fonction. Appuyez sur Entrée. Le résultat indique "Succès!" Dans ce cas, les quatre combinaisons de tests sont enregistrés sous différentes feuilles du même fichier Excel. Notre dernier exemple montre comment réaliser les mêmes tests sur différentes sous-populations. Dans cet exemple, si nous voulons effectuer deux combinaisons de tests pour les citoyens et les non- citoyens, nous pouvons utiliser l'instruction By. Pour les deux variables catégoriques sexe et marst (état matrimonial), cela signifie que nous aurons besoin d'un total de quatre tests différents.

Les résultats des tests sont enregistrés dans deux fichiers Excel - l'un pour les citoyens et l'autre pour les non-citoyens. Nous avons ajouté la variable citoyen dans la commande cd_test pour afficher clairement qu'une seule catégorie de la variable est incluse dans les résultats pour un sous-échantillon.

Comme prévu, le fichier Excel contient les combinaisons de tests que nous recherchons. Vous avez vu comment personnaliser la fonction à différents scénarios de test, la dernière partie de la vidéo abordera brièvement la question d'interprétation des fichiers Excel.

Il est important de se rappeler que le code couvre la plupart des règles du recensement, sauf le test pour la taille de la population. Les chercheurs devront examiner les règles de divulgation pour l'interprétation des résultats des tests.

Les fichiers Excel produits par le code R affichent les résultats du test dans deux blocs de colonnes. Le premier est un résumé des résultats du test. C'est ici que vous pouvez voir si la catégorie spécifique de vos variables passe le test ou non. Ok indique que la cellule réussit le test, alors que "FAIL" montre que la cellule échoue le test. Avoir un "FAIL" indique que les résultats ne peuvent pas être publiés.

Bien sûr, il existe d'autres scénarios de données qui mènent à un "Ok" ou à un "FAIL". Lorsque cela se produit, les chercheurs peuvent avoir besoin de fournir des pièces justificatives supplémentaires ou de revoir leur analyse. En plus des résultats sommaires, les fichiers Excel fournissent également une ventilation détaillée de toutes les valeurs des tests. Ces colonnes supplémentaires sont affichées vers les dernières colonnes du fichier Excel. Ces valeurs sont utiles si les chercheurs veulent avoir une compréhension plus nuancée des tests.

J'espère maintenant que vous savez comment réaliser des tests de dominance et d'homogénéité avec R. Merci de votre attention. Si vous avez des questions, veuillez contacter votre analyste local ou envoyez-nous un courriel à l'adresse affichée à l'écran.

(Le mot-symbole « Canada » s'affiche.)

Tableaux de renseignements supplémentaires

Les tableaux de renseignements supplémentaires ci-dessous sont accessibles sur le site Web de Statistique Canada :

Analyse comparative entre les sexes plus

Renseignements généraux

Capacité institutionnelle de l'ACS Plus

Statistique Canada continue de se faire le champion de l'analyse comparative entre les sexes plus (ACS Plus) en diffusant des données désagrégées de même que des analyses intersectionnelles et comparatives entre les sexes, en procurant un leadership en matière de statistiques et une expertise analytique pour l'élaboration de cadres conceptuels et d'indicateurs, de mesures de progrès et de normes statistiques pertinentes, en développant les connaissances et les capacités en matière d'ACS Plus, ainsi qu'en surveillant les besoins émergents en matière de données et en y répondant.

L'organisme reconnaît depuis longtemps l'importance d'inclure l'ACS Plus dans ses activités, y compris, mais sans s'y limiter, ses efforts de mobilisation et de communication, l'élaboration de données, la diffusion de données, de produits analytiques et de renseignements améliorés et les processus de ressources humaines. Le Centre des statistiques sur le genre, la diversité et l'inclusion de Statistique Canada (le Centre), qui a été créé en 2018, continue d'orienter la mise en œuvre de l'ACS Plus dans l'ensemble de l'organisme et de veiller à ce que les Canadiens et Canadiennes disposent des renseignements statistiques détaillés et des données désagrégées dont ils ont besoin. Le Centre favorise également la mise en œuvre du Plan d'action sur les données désagrégées (PADD), qui cerne et comble les lacunes en matière de données et de connaissances dans l'ensemble des programmes de l'organisme et qui mène à une collecte de données plus représentatives et à l'amélioration des statistiques sur diverses populations. Plus précisément, le PADD accorde la priorité à la collecte et à la diffusion de données selon le sexe ou le genre, ainsi que de données sur les peuples autochtones, les groupes racisés et les personnes handicapées de tous les groupes d'âge et à tous les niveaux géographiques. Ainsi, le PADD est un catalyseur essentiel pour l'ACS Plus et l'analyse intersectionnelle. Le Centre assure également la mise en œuvre des efforts déployés par le PADD pour établir des normes ou un contenu harmonisé pour un certain nombre de concepts, afin de mesurer les caractéristiques de la population. Il s'agit notamment de l'orientation sexuelle, de la diversité ethnoculturelle, du statut d'immigrant, des aînés, des langues officielles, du faible revenu et des vétérans.

Le Centre continue de produire des produits analytiques et des renseignements pertinents pour l'ACS Plus et d'améliorer et de maintenir le Carrefour de statistiques sur le genre, la diversité et l'inclusion, la principale plateforme de Statistique Canada pour toutes les données et tous les renseignements liés au genre, à la diversité et à l'inclusion.

Par ailleurs, le Centre continue d'améliorer de nombreuses façons la capacité et la sensibilisation dans le domaine de l'ACS Plus à l'interne, en gérant la communauté de pratique interne de l'ACS Plus, en conseillant d'autres intervenants sur la façon d'inclure l'ACS Plus dans leurs programmes, leurs projets et les documents du Cabinet, en intégrant l'ACS Plus dans ses documents de formation, en participant aux activités et aux initiatives de sensibilisation pertinentes pour l'ACS Plus, et en établissant des partenariats avec l'École de la fonction publique du Canada et Femmes et Égalité des genres Canada, en vue d'élaborer des documents pour accroître la capacité dans l'ensemble du gouvernement du Canada.

En outre, de concert avec le champion de l'ACS Plus de Statistique Canada, le Centre dirige le Réseau de responsabilité de l'ACS Plus de Statistique Canada, qui travaille en collaboration pour faire progresser la mise en œuvre et la communication de l'ACS Plus à l'échelle de l'organisme. Le Réseau de responsabilité de l'ACS Plus comprend des représentants de tous les secteurs de Statistique Canada : Secteur des stratégies et de la gestion intégrées; Secteur de l'engagement stratégique; Secteur de la statistique économique; Secteur du recensement, des services régionaux et des opérations; Secteur de la statistique sociale, de la santé et du travail; Secteur de la gestion stratégique des données, des méthodes et de l'analyse; Secteur des solutions numériques. Ce réseau établira un ensemble de pratiques exemplaires pour mieux inclure les considérations liées à l'ACS Plus au début de l'étape de planification des programmes, des projets et des autres initiatives.

Pour ce qui est des ressources humaines, Statistique Canada poursuit ses efforts pour bâtir un effectif diversifié, inclusif et représentatif de la population canadienne. Depuis 2020-2021, le Cadre de responsabilisation pour le leadership en matière d'équité, de diversité et d'inclusion a permis d'accroître sa responsabilité envers les comités d'équité en matière d'emploi et de mieux servir ses employés, grâce à des rôles et des responsabilités clairement définis.

De plus, l'organisme continue de mettre en œuvre deux plans d'action en matière de ressources humaines, soit le Plan d'action en matière d'équité, de diversité et d'inclusion de 2021 à 2025 : Aller de l'avant ensemble, et le Plan d'action pour l'intégrité et le respect. Ces deux mesures visent à améliorer et à promouvoir la diversité et l'inclusion en milieu de travail, à éliminer les obstacles systémiques dans les processus de nomination et à accroître la représentation à tous les échelons de l'organisme.

Aperçu de la capacité de faire état des résultats de l'ACS Plus par programme

Statistique économique et environnementale

Le programme de la Statistique économique et environnementale produit une vaste gamme de statistiques économiques et environnementales, sur des sujets comme les comptes nationaux et internationaux, la fabrication, le commerce de gros, le commerce de détail, la recherche et le développement, les indices de prix, les finances, le tourisme, les transports, l'agriculture et l'environnement. Le programme surveille l'inclusion des caractéristiques liées au genre et à la diversité (ACS Plus) dans les produits statistiques qu'il diffuse. Plus précisément, il fait le suivi de ce qui suit :

  1. le nombre* de produits statistiques (p. ex. tableaux de données, articles de recherche, études, feuillets d'information) publiés par la Statistique économique et environnementale, diffusés dans Le Quotidien et accessibles sur le site Web de Statistique Canada.

*Au moins un des facteurs suivants de l'ACS Plus est inclus, soit le sexe, le genre, l'identité autochtone, la diversité ethnoculturelle, la situation vis-à-vis de l'incapacité, l'orientation sexuelle et le statut d'immigrant.


Statistique socioéconomique

Le programme de la Statistique socioéconomique fournit de l'information intégrée et des analyses pertinentes sur les caractéristiques démographiques et socioéconomiques des particuliers, des familles et des ménages, de même que sur les principaux facteurs ayant des répercussions sur leur bien-être.

La grande majorité, sinon la totalité, des travaux entrepris dans le cadre du programme de la Statistique socioéconomique tiennent compte de l'ACS Plus. Ainsi, le programme permet de surveiller l'inclusion des caractéristiques liées au genre et à la diversité (ACS Plus) par les moyens suivants :

  1. le nombre de visites du Carrefour de statistiques sur le genre, la diversité et l'inclusion;
  2. le nombre d'activités de sensibilisation à l'ACS Plus (p. ex. consultations, séances de formation, présentations) menées par le Centre des statistiques sur le genre, la diversité et l'inclusion auprès des intervenants internes (p. ex. Statistique Canada) ou externes (p. ex. autres ministères ou organismes, milieu universitaire, organisations non gouvernementales);
  3. le nombre* de produits statistiques liés à l'ACS Plus (p. ex. tableaux de données, articles de recherche, études, feuillets d'information) publiés par la Statistique socioéconomique, diffusés dans Le Quotidien et accessibles sur le site Web de Statistique Canada;
  4. le nombre d'indicateurs du Cadre des résultats relatifs aux genres diffusés selon le sexe ou le genre;
  5. le nombre d'indicateurs du Cadre des résultats relatifs aux genres diffusés selon le sexe ou le genre et selon d'autres facteurs d'identité.

*Au moins un des facteurs suivants de l'ACS Plus est inclus, soit le sexe, le genre, l'identité autochtone, la diversité ethnoculturelle, la situation vis-à-vis de l'incapacité, l'orientation sexuelle et le statut d'immigrant.


Services statistiques à frais recouvrables

Dans le cadre du programme des Services statistiques à frais recouvrables, Statistique Canada mène des enquêtes spéciales afin de recueillir de nouvelles données, produit des statistiques de grande qualité qui ne font actuellement pas partie des fonds de données de l'organisme, et mène des projets d'analyse spéciaux sur demande afin de répondre aux besoins particuliers des institutions fédérales, provinciales et territoriales et d'autres clients.

Des projets et des services statistiques à frais recouvrables sont entrepris dans l'ensemble des programmes de l'organisme.

Par exemple, sur la base du recouvrement des coûts, Femmes et Égalité des genres Canada a financé et continue de financer des projets de recherche et d'autres projets qui ont permis de combler d'importantes lacunes en matière de données et de connaissances liées au genre, à la diversité et à l'inclusion.


Recensements

Le Programme du recensement du Canada est cyclique et comprend un éventail d'activités (p. ex. consultation et mobilisation, élaboration de questionnaires, collecte de données et traitement et diffusion des données) essentielles à son succès. Du début à la fin, chaque cycle du recensement s'étend sur environ sept ans, les cycles se chevauchant (c.-à-d. lorsqu'un cycle tire à sa fin, le cycle suivant commence déjà). Par exemple, le Programme du Recensement de la population de 2021 se terminera en 2024-2025 par une évaluation des résultats de la diffusion, tandis que le Programme du Recensement de 2026 commencera en 2023-2024.

Les résultats observés, dans le contexte du tableau de renseignements supplémentaires de l'ACS Plus, reflètent l'étape actuelle du cycle du recensement. Les diffusions des données du recensement ont tendance à avoir lieu sur une période d'un à deux exercices, ce qui signifie qu'on ne fera état d'aucun résultat observé pour les années où il n'y a pas eu une ou plusieurs diffusions du recensement.

Le Programme du recensement permet de surveiller l'inclusion des caractéristiques liées au genre et à la diversité (ACS Plus) dans les produits statistiques qu'il diffuse et dans les programmes de recherche qui font appel aux données du recensement. Plus précisément, il fait le suivi de ce qui suit :

  1. au cours des exercices 2022-2023 et 2023-2024, le nombre* de produits statistiques du Recensement de la population (p. ex. tableaux de données, profils du recensement, faits saillants en tableaux, articles de recherche, études, feuillets d'information, fichiers de microdonnées à grande diffusion) pertinents à l'ACS Plus diffusés dans Le Quotidien et accessibles sur le site Web de Statistique Canada;
  2. le nombre de demandes liées à l'ACS Plus par des chercheurs internes ou externes (p. ex. pour l'utilisation des microdonnées du recensement, l'analyse de base des enquêtes sociales, la certification des données administratives, l'intégration des données) auxquelles Statistique Canada a donné suite au cours du cycle quinquennal du recensement.

Centres d'expertise

Les centres d'expertise mènent des activités novatrices en matière d'élaboration de données, de recherche et d'analyse et sont continuellement à la recherche de nouvelles sources de données, de systèmes et de méthodes de pointe, d'opérations rentables et de nouveaux produits statistiques pouvant répondre aux besoins en information actuels et futurs de la population canadienne.

Les centres d'expertise surveillent l'inclusion des caractéristiques liées au genre et à la diversité (ACS Plus) dans les produits statistiques qu'ils diffusent. Plus précisément, ils font le suivi de ce qui suit :

  1. le nombre* de produits statistiques (p. ex. tableaux de données, articles de recherche, études, feuillets d'information) publiés par les centres d'expertise, diffusés dans Le Quotidien et accessibles sur le site Web de Statistique Canada.

*Au moins un des facteurs suivants de l'ACS Plus est inclus, soit le sexe, le genre, l'identité autochtone, la diversité ethnoculturelle, la situation vis-à-vis de l'incapacité, l'orientation sexuelle et le statut d'immigrant.

Programme de développement durable à l'horizon 2030 et objectifs de développement durable des Nations Unies

Statistique Canada
Objectifs de développement durable (ODD) des Nations Unies Initiatives prévues Ambitions ou cibles nationales associées ou cibles mondiales
Ensemble des 17 ODD
Cadre mondial d'indicateurs et Cadre d'indicateurs canadien pour les 17 ODD
Statistique Canada a créé un carrefour de données sur les ODD pour rendre compte des données et des statistiques du Canada sur le Cadre mondial d'indicateurs, et mettra à jour les données chaque année pour le Cadre mondial d'indicateurs et le Cadre d'indicateurs canadien (dans la mesure du possible). Rendre compte des indicateurs pour les cibles et les ambitions précises à l'échelle mondiale (lorsque des données sont disponibles) et à l'échelle du Canada
Ensemble des 17 ODD
Cadre mondial d'indicateurs pour les 17 ODD
Statistique Canada continuera de coprésider le Groupe d'experts des Nations Unies et de l'extérieur chargé des indicateurs relatifs aux objectifs de développement durable jusqu'à la fin de son mandat. Statistique Canada continuera également de diriger les travaux du sous-groupe de l'examen des métadonnées, pour s'assurer que les métadonnées relatives aux indicateurs mondiaux des ODD sont robustes. Continuer d'appuyer la mise en œuvre du Cadre mondial d'indicateurs pour les ODD, et veiller à ce que le Canada contribue à l'amélioration du système statistique international
Ensemble des 17 ODD
Cadre mondial d'indicateurs et Cadre d'indicateurs canadien
Statistique Canada élabore actuellement des mesures des progrès réalisés pour les indicateurs, ce qui permettra aux utilisateurs de mieux comprendre les progrès globaux vers l'atteinte des cibles et des ambitions. Continuer de faciliter la compréhension des progrès du Canada à l'égard des objectifs, des ambitions et des cibles des ODD
Ensemble des 17 ODD Statistique Canada aidera à préparer l'examen national volontaire du Canada, en fournissant des données et un soutien à l'interprétation statistique, dans le cadre du Forum politique de haut niveau des Nations Unies en juillet. Contribuer aux rapports mondiaux présentés aux Nations Unies sur la mise en œuvre par les États membres du Programme pour 2030 et les mesures prises à cet égard
ODD 8 : Promouvoir une croissance économique soutenue, partagée et durable, le plein emploi productif et un travail décent pour tous
  • Cible des ODD à l'échelle mondiale 8.9 : D'ici 2030, élaborer et mettre en œuvre des politiques visant à développer un tourisme durable qui crée des emplois et met en valeur la culture et les produits locaux
Statistique Canada présidera le Groupe de travail des Nations Unies sur le tourisme durable, qui travaille avec la communauté mondiale pour définir des indicateurs du tourisme durable qui peuvent être prêts à être pris en considération par le Groupe d'experts des Nations Unies et de l'extérieur chargé des indicateurs relatifs aux objectifs de développement durable, dans le cadre de l'examen exhaustif de 2025. Contribuer à l'avancement de l'élaboration de mesures robustes du tourisme durable et donner suite à la décision de 2022 de la Commission de statistique des Nations Unies ordonnant au Groupe d'experts des Nations Unies et de l'extérieur chargé des indicateurs relatifs aux objectifs de développement durable de travailler à l'élaboration d'un indicateur pour l'examen exhaustif de 2025

Tableaux de renseignements supplémentaires

Les tableaux de renseignements supplémentaires ci-dessous sont accessibles sur le site Web de Statistique Canada :

Stratégie ministérielle de développement durable/Rapport sur les achats écologiques

Résumé de la Stratégie ministérielle de développement durable de 2020 à 2023

Nom du ministère

Statistique Canada


Date

Janvier 2022


Contexte

Bien que Statistique Canada ne soit pas assujetti à la Loi fédérale sur le développement durable et ne soit pas tenu d'élaborer une stratégie ministérielle complète de développement durable, il adhère aux principes de la Stratégie fédérale de développement durable (SFDD) en se conformant à la Politique d'achats écologiques.

La Politique d'achats écologiques appuie les efforts déployés par le gouvernement du Canada pour promouvoir la gérance de l'environnement. Conformément aux objectifs de la politique, Statistique Canada appuie le développement durable en intégrant des facteurs de performance environnementale dans le processus décisionnel en matière d'approvisionnement, grâce aux mesures décrites dans l'objectif d'« écologisation du gouvernement » de la SFDD pour la période allant de 2019 à 2022.


Engagements

Veuillez consulter le tableau ci-dessous.


Intégration du développement durable

Statistique Canada continuera de veiller à ce que le processus décisionnel tienne compte des objectifs et des cibles de la SFDD dans le cadre de son processus d'évaluation environnementale stratégique (EES). Une EES relative aux propositions de politiques, de plans et de programmes comprend une analyse des répercussions de la proposition sur l'environnement, notamment sur les objectifs et les cibles de la SFDD.

Les déclarations concernant les résultats des évaluations de Statistique Canada sont rendues publiques lorsqu'une initiative qui a fait l'objet d'une EES détaillée est annoncée sur la page Web de l'organisme.L'objectif de la déclaration publique est de démontrer que les effets environnementaux de la politique, du plan ou du programme approuvé, y compris les répercussions sur l'atteinte des objectifs et des cibles de la SFDD, ont été pris en compte au moment de l'élaboration de la proposition et de la prise de décisions.

Écologisation du gouvernement :
Le gouvernement du Canada fera la transition vers des opérations écologiques, à faibles émissions de carbone et résilientes au climat.
Cible de la Stratégie fédérale de développement durable (SFDD) Mesures de la SFDD Mesures ministérielles correspondantes Contribution de chaque mesure ministérielle à l'atteinte de l'objectif et de la cible de la SFDD Points de départ Indicateurs de rendement Cibles Programmes dans le cadre desquels les mesures ministérielles seront prises
Mesures à l'appui de l'objectif d'écologisation du gouvernement et de la Politique d'achats écologiques Les ministères utiliseront des critères environnementaux pour réduire leurs répercussions environnementales et assurer l'optimisation des décisions d'approvisionnement du gouvernement.
  • Tenir compte des facteurs environnementaux dans les processus et les contrôles de gestion des achats.
  • S'assurer que le papier acheté par Statistique Canada est fait de matières recyclées.
Inciter les fournisseurs à réduire les répercussions environnementales de leurs biens, leurs services et leurs chaînes d'approvisionnement.
  • Afin de réduire les déchets produits et de minimiser les répercussions des biens sur l'environnement, tout au long de leur cycle de vie, Statistique Canada continuera de tenir compte des facteurs environnementaux dans les achats gouvernementaux, conformément à la Politique d'achats écologiques.
  • Le papier acheté par Statistique Canada est fait d'au moins 30 % de matières recyclées et il est conforme aux normes de certification forestière, à la norme ÉcoLogo ou à une norme équivalente.
  • Statistique économique et environnementale
  • Statistique socioéconomique
  • Recensements
  • Centres d'expertise
  • Services statistiques à frais recouvrables
  • Services internes
Le soutien aux achats écologiques sera renforcé, y compris en fournissant aux employés de la fonction publique une orientation, des outils et de la formation.
  • Veiller à ce que les décideurs et les spécialistes de la gestion du matériel et de l'approvisionnement aient la formation et la sensibilisation nécessaires pour appuyer les achats écologiques.
  • Veiller à ce que les principaux responsables incluent les contributions et le soutien aux objectifs de la Politique d'achats écologiques du gouvernement du Canada.
Inciter les fournisseurs à écologiser leurs biens, leurs services et leurs chaînes d'approvisionnement.
  • 100 % des spécialistes de l'approvisionnement et de la gestion du matériel ont suivi la formation sur les achats écologiques.
  • Selon les modèles internes obligatoires, les considérations relatives aux achats écologiques doivent être abordées pour chaque fichier. Les modèles font l'objet d'un examen par les pairs et d'une vérification de la section, sous la surveillance et la supervision du principal responsable.
 

Analyse comparative entre les sexes plus

Capacité d'ACS Plus institutionnelle

Le gouvernement du Canada s'est engagé à l'égard de l'analyse comparative entre les sexes plus (ACS Plus) pour veiller à ce que les perspectives relatives au genre, à la diversité et à l'inclusion soient prises en compte dans l'élaboration, la mise en œuvre et l'évaluation des programmes, des politiques et d'autres initiatives dans l'ensemble des ministères et organismes fédéraux.

Statistique Canada appuie dans une large mesure l'initiative d'ACS Plus, qui est dirigée par Femmes et Égalité des genres Canada. Le rôle de Statistique Canada en ce qui a trait au soutien d'autres ministères gouvernementaux relativement à l'ACS Plus comprend la diffusion de données désagrégées selon le sexe, le genre et d'autres facteurs d'identité qui se recoupent, ainsi que d'analyses fondées sur le genre et d'analyses intersectionnelles; un leadership statistique et une expertise analytique pour élaborer des mesures des progrès et des normes statistiques pertinentes; l'acquisition de connaissances et d'une capacité en ACS Plus, ainsi que le contrôle et le suivi des besoins de données émergents.

Par suite de cet engagement à l'égard de l'ACS Plus et au besoin croissant de renseignements statistiques plus détaillés, Statistique Canada a créé le Centre des statistiques sur le genre, la diversité et l'inclusion en 2018.

Il s'agit du centre de connaissances de Statistique Canada concernant l'ACS Plus, ainsi que le genre, la diversité et l'inclusion au Canada. Ses principales activités comprennent l'élaboration et le maintien du Carrefour de statistiques sur le genre, la diversité et l'inclusion; la production de produits analytiques et de renseignements pertinents sur le genre, la diversité et l'inclusion au Canada; le renforcement de la capacité et de la sensibilisation en matière d'ACS Plus à l'interne à Statistique Canada et à l'externe pour d'autres ministères et intervenants du gouvernement. De plus, le Centre examine les mémoires au Cabinet, les présentations au Conseil du Trésor et les propositions budgétaires de Statistique Canada du point de vue de l'ACS Plus et conformément aux directives et aux exigences du gouvernement, et il fournit des conseils.

Statistique Canada continue de déterminer les lacunes dans les données et les connaissances et d'y donner suite dans l'ensemble de ses programmes statistiques, grâce à l'ajout d'indicateurs aux enquêtes existantes, à l'élaboration de nouvelles questions d'enquête, ainsi qu'à l'augmentation de la taille des échantillons de groupes de population clés pour certaines enquêtes, afin de permettre la désagrégation et l'intégration de sources de données pour favoriser la production de rapports sur ces groupes de population.

Statistique Canada a récemment reçu l'approbation pour mettre en œuvre le Plan d'action sur les données désagrégées (PADD). Le PADD permettra de combler certaines lacunes en matière de données et de connaissances; d'appuyer la collecte de données plus représentatives (c.-à-d. à divers niveaux géographiques); de bonifier les statistiques sur les populations d'identités diverses au sein de tous les groupes d'âge; d'appuyer les efforts déployés par le gouvernement et la société pour éliminer les inégalités et promouvoir l'équité et l'inclusion dans la prise de décisions.

Plus précisément, le PADD accordera la priorité à la collecte de données selon le sexe ou le genre, ainsi que pour les Autochtones, les personnes ayant une incapacité et les personnes appartenant à des groupes désignés comme minorités visibles. Les autres priorités de désagrégation comprennent les personnes LGBTQ2+, les enfants et les jeunes, les aînés, les immigrants, les anciens combattants, les membres des communautés de langue officielle en situation minoritaire et les personnes vivant en situation de faible revenu.

Étant donné que son principal objectif est d'accroître le nombre de données sur la diversité, le PADD est un outil clé pour l'ACS Plus et l'analyse intersectionnelle. Ces analyses aideront à comprendre les expériences et les résultats de la population canadienne au chapitre de la santé, de la société, de l'économie et de l'environnement; à mieux éclairer la prise de décisions pour appuyer une prestation plus équitable des programmes et des services, et à suivre les progrès réalisés vers une société plus juste et plus inclusive.

Statistique Canada a récemment établi un réseau de responsabilités de l'ACS Plus, qui est dirigé par la championne de l'ACS Plus de l'organisme et appuyé par le Centre. Ce réseau est une étape importante vers la mise en œuvre de l'ACS Plus dans l'ensemble de l'organisme, relativement à ses données, ses personnes et ses processus internes, et au profit de ses utilisateurs, grâce aux services qui seront fournis et aux renseignements qui seront produits.

Statistique Canada poursuit ses efforts pour bâtir un effectif talentueux, diversifié et inclusif, qui est représentatif de la population canadienne. Par exemple, l'organisme a mis en place le Cadre de responsabilisation pour le leadership en matière d'équité, de diversité et d'inclusion en 2020-2021 afin d'accroître sa responsabilité envers les comités d'équité en matière d'emploi et de mieux servir ses employés et la collectivité, grâce à des rôles et des responsabilités clairement définis.

De plus, l'organisme continue de mettre en œuvre deux plans d'action en matière de ressources humaines, soit le Plan d'action en matière d'équité, de diversité et d'inclusion de 2021 à 2025 : Aller de l'avant ensemble, et le Plan d'action pour l'intégrité et le respect. Ces deux mesures visent à améliorer et à promouvoir la diversité et l'inclusion en milieu de travail, à éliminer les obstacles systémiques dans les processus de nomination et à accroître la représentation à tous les niveaux de l'organisme.


Faits saillants en matière de capacité de déclaration des résultats de l'analyse comparative entre les sexes plus selon le programme

Statistique économique et environnementale

Le programme de la Statistique économique et environnementale produit une vaste gamme de statistiques économiques et environnementales, sur des sujets comme les comptes nationaux et internationaux, la fabrication, le commerce de gros, le commerce de détail, la recherche et le développement, les indices de prix, les finances, le tourisme, les transports, l'agriculture et l'environnement.

Le programme surveille l'inclusion des caractéristiques liées au genre et à la diversité (ACS Plus) dans les produits statistiques qu'il diffuse. Plus précisément, il fait le suivi de ce qui suit :

  1. le nombre de produits statistiques (p. ex. tableaux de données, articles de recherche, études, feuillets d'information) publiés par la Statistique économique et environnementale, diffusés dans Le Quotidien et accessibles sur le site Web de Statistique Canada.

Au moins un des facteurs suivants de l'ACS Plus est inclus, soit le sexe, le genre, les Autochtones, les personnes appartenant à des groupes désignés comme minorités visibles, les personnes ayant une incapacité, les personnes LGBTQ2+ et les immigrants.

Le réseau de responsabilités de l'ACS Plus déterminera la faisabilité d'élaborer une série d'indicateurs de rendement selon les facteurs de l'ACS Plus (c.-à-d. chaque facteur de l'ACS Plus aura un indicateur de rendement correspondant) pour les produits statistiques diffusés par le programme de la Statistique économique et environnementale.


Statistique socioéconomique

Le programme de la Statistique socioéconomique fournit de l'information intégrée et des analyses pertinentes sur les caractéristiques démographiques et socioéconomiques des particuliers, des familles et des ménages, de même que sur les principaux facteurs qui ont des répercussions sur leur bien-être.

Compte tenu de la nature de la statistique socioéconomique, la grande majorité, sinon la totalité, des travaux entrepris dans le cadre de ce programme tiennent compte de l'ACS Plus. Le programme surveille l'inclusion des caractéristiques liées au genre et à la diversité (ACS Plus) par les moyens suivants :

  1. le nombre de visites du Carrefour de statistiques sur le genre, la diversité et l'inclusion;
  2. le nombre d'activités de sensibilisation à l'ACS Plus (p. ex. consultations, séances de formation, présentations) menées par le Centre des statistiques sur le genre, la diversité et l'inclusion auprès des intervenants internes (p. ex. Statistique Canada) ou externes (p. ex. autres ministères ou organismes, milieu universitaire, organisations non gouvernementales);
  3. le nombre de produits statistiques liés à l'ACS Plus (p. ex. tableaux de données, articles de recherche, études, feuillets d'information) publiés par la Statistique socioéconomique, diffusés dans Le Quotidien et accessibles sur le site Web de Statistique Canada;
  4. la proportion de produits statistiques liés à l'ACS Plus (p. ex. tableaux de données, articles de recherche, études, feuillets d'information) publiés par la Statistique socioéconomique, diffusés dans Le Quotidien et accessibles sur le site Web de Statistique Canada;
  5. le nombre d'indicateurs du Cadre des résultats relatifs aux genres diffusés selon le sexe ou le genre;
  6. la proportion d'indicateurs du Cadre des résultats relatifs aux genres diffusés selon le sexe ou le genre;
  7. le nombre d'indicateurs du Cadre des résultats relatifs aux genres diffusés selon le sexe ou le genre et selon d'autres facteurs d'identité;
  8. la proportion d'indicateurs du Cadre des résultats relatifs aux genres diffusés selon le sexe ou le genre et selon d'autres facteurs d'identité.

Au moins un des facteurs suivants de l'ACS Plus est inclus, soit le sexe, le genre, les Autochtones, les personnes appartenant à des groupes désignés comme minorités visibles, les personnes ayant une incapacité, les personnes LGBTQ2+ et les immigrants.

Le réseau de responsabilités de l'ACS Plus déterminera la faisabilité d'élaborer une série d'indicateurs de rendement selon les facteurs de l'ACS Plus (c.-à-d. chaque facteur de l'ACS Plus aura un indicateur de rendement correspondant) pour les produits statistiques diffusés par le programme de la Statistique socioéconomique.


Services statistiques à frais recouvrables

Dans le cadre du programme des Services statistiques à frais recouvrables, Statistique Canada mène des enquêtes spéciales afin de recueillir de nouvelles données, produit des statistiques de grande qualité qui ne font actuellement pas partie des fonds de données de l'organisme et mène des projets d'analyse spéciaux sur demande, afin de répondre aux besoins particuliers des institutions fédérales, provinciales et territoriales et d'autres clients.

Des projets et des services statistiques à frais recouvrables sont entrepris dans l'ensemble des programmes de l'organisme.

Par exemple, une partie du travail effectué en collaboration avec Femmes et Égalité des genres Canada en vue de combler d'importantes lacunes statistiques est un projet à frais recouvrables.


Recensements

Le Programme du recensement fournit des renseignements et des analyses statistiques qui permettent de mesurer les changements qui touchent la population du Canada et ses caractéristiques démographiques, de même que le secteur agricole. Le programme comprend le Recensement de la population et le Recensement de l'agriculture.

Le programme surveille l'inclusion des caractéristiques liées au genre et à la diversité (ACS Plus) dans les produits statistiques qu'il diffuse. Plus précisément, il fait le suivi de ce qui suit :

  1. le nombre de produits statistiques du Recensement de la population (p. ex. tableaux de données, profils du recensement, faits saillants en tableaux, articles de recherche, études, feuillets d'information) pertinents à l'ACS Plus diffusés dans Le Quotidien et accessibles sur le site Web de Statistique Canada;
  2. la proportion de produits statistiques du Recensement de la population (p. ex. tableaux de données, profils du recensement, faits saillants en tableaux, articles de recherche, études, feuillets d'information) pertinents à l'ACS Plus diffusés dans Le Quotidien et accessibles sur le site Web de Statistique Canada;
  3. le nombre de produits statistiques du Recensement de l'agriculture (p. ex. tableaux de données, profils du recensement, faits saillants en tableaux, articles de recherche, études, feuillets d'information) pertinents à l'ACS Plus diffusés dans Le Quotidien et accessibles sur le site Web de Statistique Canada.

Au moins un des facteurs suivants de l'ACS Plus est inclus, soit le sexe, le genre, l'identité autochtone, l'appartenance à une minorité visible et le statut d'immigrant.

Le réseau de responsabilités de l'ACS Plus déterminera la faisabilité d'élaborer une série d'indicateurs de rendement selon les facteurs de l'ACS Plus (c.-à-d. chaque facteur de l'ACS Plus aura un indicateur de rendement correspondant) pour les produits statistiques diffusés par le Programme du recensement.


Centres d'expertise

Les centres d'expertise mènent des activités novatrices en matière d'élaboration de données, de recherche et d'analyse et sont continuellement à la recherche de nouvelles sources de données, de systèmes et de méthodes de pointe, d'opérations rentables et de nouveaux produits statistiques pouvant répondre aux besoins en information actuels et futurs de la population canadienne.

Ils surveillent l'inclusion des caractéristiques liées au genre et à la diversité (ACS Plus) dans les produits statistiques qu'ils diffusent. Plus précisément, ils font le suivi de ce qui suit :

  1. le nombre de produits statistiques (p. ex. tableaux de données, articles de recherche, études, feuillets d'information) publiés par les centres d'expertise, diffusés dans Le Quotidien et accessibles sur le site Web de Statistique Canada.

Au moins un des facteurs suivants de l'ACS Plus est inclus, soit le sexe, le genre, l'identité autochtone, l'appartenance à une minorité visible et le statut d'immigrant.

Le réseau de responsabilités de l'ACS Plus déterminera la faisabilité d'élaborer une série d'indicateurs de rendement selon les facteurs de l'ACS Plus (c.-à-d. chaque facteur de l'ACS Plus aura un indicateur de rendement correspondant) pour les produits statistiques diffusés par les centres d'expertise.

Programme à l'horizon 2030 et objectifs de développement durable des Nations Unies

Programme à l'horizon 2030 et objectifs de développement durable des Nations Unies
Objectifs de développement durable (ODD) des Nations Unies Initiatives prévues Cibles nationales connexes ou ambitions ou cibles mondiales
Cadre mondial d'indicateurs pour les 17 ODD Statistique Canada a créé un carrefour de données sur les ODD pour rendre compte des données et des statistiques du Canada sur le Cadre mondial d'indicateurs (le contenu de cette page est en anglais) et fera une mise à jour des données pour les indicateurs (dans la mesure du possible) annuellement Rendre compte des indicateurs pour les cibles mondiales lorsque les données sont accessibles
Cadre mondial d'indicateurs pour les 17 ODD Statistique Canada continuera de coprésider le Groupe d'experts interinstitutionnel sur les indicateurs relatifs aux ODD jusqu'à la fin de son mandat (mai 2023) Continuer d'appuyer la mise en œuvre mondiale du Cadre mondial d'indicateurs pour les ODD
Cadre mondial d'indicateurs pour les 17 ODD Statistique Canada a élaboré le Cadre d'indicateurs canadien, rend compte des données et des statistiques du Canada pour ce cadre et fera une mise à jour des données pour les indicateurs (dans la mesure du possible) annuellement Rendre compte de l'ensemble des ambitions et cibles nationales