Visualisation des données : une introduction

Numéro de catalogue : 892000062020014

Date de diffusion : le 23 septembre 2020 Mise à jour : le 21 décembre 2022

Cette vidéo traite des compétences en matière de visualisation des données. À la fin de cette vidéo, vous devriez avoir une compréhension plus approfondie de ce qu'est la visualisation des données et de la façon dont elle peut être utilisée pour présenter les données d'une manière intéressante et esthétique.

Nous vous indiquerons quand elle devrait être utilisée et vous donnerons des exemples des différents types de techniques de visualisation des données qui existent.

Étape du parcours des données
Raconter l'histoire
Compétence des données
  • Raconter une histoire
  • Visualisation des données
Audience
Essentiel
Conditions préalables suggérées
s.o.
Durée
11:42
Coût
Gratuit

Voir la vidéo

Visualisation des données : une introduction - Transcription

(Le symbole et le mots-symbole de Statistique Canada apparaissent sur l'écran : « Visualisation des données : une introduction »)

Visualisation des données

Bienvenue à la première partie d'une série sur la visualisation des données. Cette vidéo donne un aperçu de la visualisation des données et de la façon de l'utiliser pour raconter votre histoire.

Objectifs d'apprentissage

Cette vidéo traite des compétences en matière de visualisation des données. À la fin de cette vidéo, vous devriez avoir une compréhension plus approfondie de ce qu'est la visualisation des données et de la façon dont elle peut être utilisée pour présenter les données d'une manière intéressante et esthétique.

Nous vous indiquerons quand elle devrait être utilisée et vous donnerons des exemples des différents types de techniques de visualisation des données qui existent.

Étapes du cheminement des données

Ce diagramme est une représentation visuelle du cheminement des données, de la collecte des données à l'exploration, au nettoyage, à la description et à la compréhension des données, à l'analyse des données et, enfin, à la communication avec les autres de l'histoire que racontent les données.

Étape 4 : Raconter l'histoire

La visualisation des données peut se produire à différentes étapes du cheminement des données, en fonction de l'utilisation que vous en faites. Dans cette vidéo, nous nous concentrerons principalement sur la façon de présenter les données d'une manière qui aide à raconter l'histoire.

Visualisation des données

(Diagramme du Cheminement des données : Étape 1 - définir, chercher, recueillir; Étape 2 - explorer, nettoyer, décrire; Étape 3 - analyser, modéliser; Étape 4 - Raconter l'histoire. Le cheminement des données est supporté par une base d'intendance, de métadonnées, de normes et qualité).

La visualisation des données est la représentation graphique de l'information et des données.

Il s'agit d'une combinaison entre l'art et la science, car elle utilise des outils comme des tableaux, des graphiques et des cartes pour souligner des tendances et des modèles qui pourraient être cachés dans un grand ensemble de données et les rendre beaucoup plus faciles à comprendre.

Pourquoi utiliser la visualisation des données?

Mais comment la visualisation des données facilite-t-elle la compréhension des tendances et des modèles?

La vision est un élément très important de notre expérience du monde. C'est peut-être grâce à elle que nous avons toujours survécu, que nous trouvons de la nourriture, que nous évitons des menaces, que nous créons de l'art qui préserve notre culture et notre histoire.

Puisque le cerveau absorbe et traite l'information visuelle plus rapidement que tout autre stimulus, la présentation de l'information au moyen de graphiques peut être incroyablement efficace.

Comme la technologie évolue, il est logique que la façon dont nous présentons l'information que nous essayons de partager avec le monde évolue elle aussi.

Présentation des données

(Une série d'image où, débutant de la gauche, une tarte aux pommes, tarte aux cerises, tarte aux bleuets, tarte d'une autre saveur et une tarte avec le visage d'émojie qui louche avec la langue sortie).

Par exemple, pensez à la question suivante: quelle est la saveur de tarte la plus populaire? Si vous vouliez vraiment connaître la saveur de tarte la plus populaire dans votre ville natale, vous pourriez décider de mener un sondage. Dans le cadre de ce sondage, On demanderait à tous les habitants de la ville quelle saveur de tarte ils préfèrent: pommes? Cerises? Bleuets? Une autre saveur? Et enfin, une option pour les personnes qui n'aiment tout simplement pas la tarte. Une fois que vous avez recueilli vos données, il y a plusieurs façons de communiquer les résultats.

Option 1 : Texte

La première option est le texte. Vous pourriez envisager de rédiger un rapport qui décrit les chiffres et qui se lirait à peu près comme suit: « Parmi les 100 personnes interrogées, 40 préfèrent la tarte aux pommes, 30 la tarte aux Bleuets et 20 la tarte aux cerises. De plus, 5 personnes ont choisi une saveur autre que celles qui figuraient sur la liste et 5 ont dit ne pas aimer la tarte. »

Option 2 : Tableau

(Image d’un tableau où la colonne de gauche contient les différentes saveurs de tarte et où la colonne de droite contient le nombre de répondants de chaque saveur respective : pommes = 40, bleuets = 30, cerises = 20, autre = 5, je n’aime pas la tarte = 5, total = 100).

Dans cette situation, où nous essayons simplement de découvrir la saveur de tarte la plus populaire, nous pourrions décider que la lecture d'une analyse complète des résultats n'est pas nécessaire. Il pourrait donc être préférable de privilégier l'option de recevoir exactement les mêmes résultats dans un tableau. Quand on lit un tableau, on se concentre sur les chiffres. Ici, on voit bien que la plupart des gens préfèrent la tarte aux pommes, sans avoir à prendre le temps de lire beaucoup de texte. Donc, il est bon de noter que lorsque vous essayez de comparer plus de 2 nombres, vous voudrez probablement envisager de présenter vos données d'une manière plus visuelle que textuelle.

Option 3 : Visualisation

(Une série d'image avec 4 tartes aux pommes, 3 tartes aux bleuets, 2 tartes aux cerises, la moitié d'une tarte pour ceux qui aime une autre saveur et l'autre moitié pour ceux qui n'aime pas la tarte). 

Une 3e façon de présenter les résultats de notre sondage sur les saveurs de tarte est de ne pas utiliser beaucoup de mots ou de chiffres. La 3e option est la visualisation des données. À partir de cette image, on constate immédiatement que la tarte aux pommes est la plus populaire.

Types de visualisation des données

(Série d'images simplifiés des différents types de visualisation des données : (Gauche) Diagrammes, Graphiques, Cartes, Tableaux, Graphiques figuratif, Infographies, Tableaux de bord (Droite)).

Il existe de nombreuses façons de présenter visuellement les données, comme des diagrammes, des graphiques, des cartes, des tableaux, des graphiques figuratifs, des infographies et des tableaux de bord. Dans les prochaines diapositives, nous verrons les éléments de chacune de ces options.

Nuage de points

(Texte à l’écran : Démontrer la relation entre deux valeurs).

(Image d'un nuage de point avec le titre suivant : « Revenu total des ventes de crème glacée, 2019 ($CAN) ». L'axe verticale(y) représente les revenus ($) et l’axe horizontale(x) représente la température (Celsius)).

Un nuage de points est excellent pour illustrer la relation entre 2 choses. Dans ce diagramme, on peut manifestement voir la relation entre la température, sur l'axe horizontal, et les ventes de crème glacée, sur l'axe vertical. On peut constater que les revenus liés à la vente de crème glacée augmentent, avec l'augmentation de la température.

Graphique linéaire

(Texte à l'écran : Montrer les tendances au fil du temps).

(Image d'un graphique linéaire avec le titre suivant : « Le seuil officiel de pauvreté au Canada ». L'axe verticale(y) et horizontale(x) représentent la proportion de la population (%) et l'année respectivement).

Un graphique linéaire est une bonne façon de montrer les fluctuations d'une chose au fil du temps. Celui-ci montré comment le taux de pauvreté au Canada a diminué au cours des dernières années, passant de 12,1% en 2015 à 8,7% en 2019.

Graphique à barres

(Texte à l'écran : Faire une comparaison entre plusieurs choses).

(Image d'un graphique à barres avec le titre suivant : « La consommation de cannabis au cours des trois derniers mois selon l'âge, Canada - Quatrième trimestre de 2019 ». L'axe verticale (y) représente la proportion de la population de consommateurs de cannabis (%) et l’axe horizontale (x) représente le groupe d'âge. De la bande à gauche à la bande à droite, elles représentent les groupes d'âges : « 15 à 24 », « 25 à 34 », « 35 à 44 », « 45 à 54 », « 55 à 64 » et « 65 et plus »).

Un graphique à barres est préférable lorsque vous voulez comparer différents groupes de valeurs. On compare ici la consommation de cannabis chez les Canadiens selon la tranche d'âge. Le graphique montre clairement que la consommation de cannabis est plus élevée chez les plus jeunes que chez les plus âgés.

Graphique circulaire

(Texte à l'écran : Montrer la composition d'un tout).

(Image d'un graphique circulaire avec le titre suivant : « Six provinces ont cultivé des raisins « vinifera et hybride français » pour la vinification en 2018 – 69% de la production totale provient de l’Ontario ». Le graphique circulaire est composé de 3 tranches asymétriques).

Un graphique circulaire est l'outil idéal pour montrer la composition d'un tout, ou la répartition d'une chose. Ici, on constate qu'en 2018, l'Ontario a produit plus de raisins destinés à la vinification que toutes les autres provinces réunies.

Cartes

(Texte à l'écran : Placer les données dans un contexte géographique).

(Image de la carte du Canada où chaque province possèdent un gradient de bleu différent représentant le taux de chômage où le bleu foncé représente un taux élevé. Les régions noires n'ont pas de collecte de données).

Voici un exemple de carte utilisée aux fins de la visualisation de données. Elle montre comment les taux de postes vacants diffèrent d'une province à l'autre. Le taux de postes vacants pour chaque province au Canada est indiqué sur la carte à l'aide de dégradé de couleurs.

Tableaux

(Texte à l'écran : Tableaux : Utilisés pour montrer plusieurs catégories et fournir plus de détails et de précision que de nombreuses autres méthodes de visualisation des données).

(Image d'un tableau où sur la colonne de gauche est la liste de groupes d'âge des enfants. La colonne du milieu et la colonne de droite représentent « Toutes les familles avec des enfants » et « Total des enfants dans toutes  les familles » respectivement. Ces deux dernières colonnes possèdent des sous-colonnes représentant les années 2015, 2016 et 2017).

Les tableaux sont utilisés pour montrer plusieurs catégories et fournissent plus de détails et de précision que de nombreuses autres méthodes de visualisation des données. Dans ce tableau, on voit le nombre de familles avec enfants par rapport au nombre total d'enfants dans l'ensemble des familles, pour différentes tranches d'âge d'enfants.

Graphiques figuratifs

(Texte à l'écran : Graphiques figuratifs : Simples, mais possibilité d'interprétation immédiate).

((Même images que l'exemple des tartes) Une série d'image avec 4 tartes aux pommes, 3 tartes aux bleuets, 2 tartes aux cerises, la moitié d'une tarte pour ceux qui aime une autre saveur et l'autre moitié pour ceux qui n'aime pas la tarte).

La méthode de visualisation des données utilisée dans l'exemple des saveurs de tarte est un graphique figuratif. Un graphique figuratif est la représentation de données à l'aide d'images. C'est l'une des façons les plus simples de représenter les données statistiques. La popularité de différentes saveurs de tarte est représentée par le nombre de tartes. Dans ce graphique figuratif, chaque tarte représente 10 individus. Bien que le niveau de précision d'un graphique figuratif soit très faible, notre cerveau en interprète instantanément le message.

Infographies

(Texte à l'écran : Infographies : Utilisées pour raconter une histoire de données complète).

(Une image d’une infographie intitulée : « Histoire de famille - Partage des tâches domestiques - qui fait quoi? » L'infographie contient des données et des conclusions sur le sujet en question).

Une infographie est un regroupement de plusieurs visualisations de données visant à raconter une histoire de données plus complète. De façon générale, un infographie décrit l'état de quelque chose à un moment précis, comme une affiche. Dans cet exemple, plusieurs points de données sont regroupés pour raconter une histoire au sujet des membres de la famille qui font les corvées. À partir de cette infographie, nous apprenons que certaines corvées sont réparties également entre les hommes et les femmes, comme la vaisselle, le magasinage et l'organisation de la vie sociale, alors que la lessive et la préparation des repas sont plus souvent faites chez les femmes et les tâches extérieures par des hommes. Enfin, l'infographie révèle que la répartition des tâches dépend des personnes qui font partie de la population active.

Tableaux de bord

(Texte à l'écran : Tableaux de bord : Servent à éclairer les décisions d'affaires et sont mis à jour à intervalles réguliers.)

(Image d’un tableau de bord contenant des tableaux, des graphiques et des diagrammes pour afficher plusieurs faits liés aux ressources humaines).

Un tableau de bord est un regroupement de plusieurs visualisations de données qui est souvent utilisé pour éclairer les décisions d'affaires. Les tableaux de bord sont habituellement mis à jour régulièrement et montrent les changements au fil du temps. La couleur, la taille et la position des graphiques individuels sont utilisées de façon stratégique pour attirer l'attention sur différents aspects. Ce tableau de bord, par exemple, utilise des tableaux et des graphiques pour afficher l'information nécessaires à la gestion des ressources humaines.

Comment choisir la bonne visualisation

La bonne visualisation dépend de plusieurs facteurs, de quel type de données disposez-vous? Y a-t-il des relations entre les données ou changent-elles au fil du temps? Faites-vous des comparaisons ou montrez-vous la composition de quelque chose? Qui est votre public cible? Quelle histoire voulez-vous lui raconter? Les différences entre les régions géographiques sont-elles importantes pour lui? Quel est le degré de précision souhaité ou exigé? Votre public prend-il des décisions d'affaires en fonction de l'information que vous partagez, ou s'agit-il simplement de l'informer? Sur les diapositives précédentes, vous avez vu différents types de visualisations des données et l'utilisation possible de chacune.

Résumé des principaux points

Dans cette vidéo, vous avez appris que la visualisation des données est la représentation graphique de l'information et des données.

Il est vrai qu'une image vaut 1000 mots, mais assurez-vous de choisir la bonne image pour représenter fidèlement vos données afin de bien faire passer votre message. Surveillez les autres vidéos de cette série présentant les pratiques exemplaires en matière de visualisation des données.

(Le mot-symbole « Canada » s'affiche).

Qu'avez-vous pensé?

S'il vous plaît nous donner vos commentaires afin que nous puissions mieux fournir des produits qui répondent aux besoins de nos utilisateurs.

Intendance des données : introduction

Numéro de catalogue : 892000062020013

Date de diffusion : le 23 septembre 2020 Mise à jour : le 2 november 2021

À la fin de cette vidéo, vous devriez comprendre comment déterminer les données dont vous avez besoin, où trouver les données, comment recueillir les données (qu'elles proviennent de sources existantes ou d'une enquête à mener) et comment assurer la sécurité des données.

Prenez note que le fait de recueillir des données dans le cadre d'une enquête est habituellement appelé la collecte des données.

Étape du parcours des données
Base
Compétence des données
Collecte des données
Audience
Essentiel
Conditions préalables suggérées
s.o.
Durée
10:27
Coût
Gratuit

Voir la vidéo

Intendance des données : introduction - Transcription

(Le symbol de Statistics Canada et le mot-symbol du Canada est présent avec le titre suivant: « Intendance des données : introduction »)

Intendance des données: La gouvernance des données en action

L'intendance des données est souvent décrite comme étant la gouvernance des données en action. Cette vidéo vous présente les aspects fondamentaux relatifs à l'intendance des données.

Objectifs d'apprentissage

Cette vidéo s'adresse aux personnes qui souhaitent acquérir une compréhension de base de l'intendance des données. Aucune connaissance préalable n'est requise. À la fin de cette vidéo, vous pourrez répondre aux questions suivantes. Qu'est-ce que l'intendance des données? Quelle est la différence entre la gouvernance des données et l'intendance des données? Pourquoi l'intendance des données est-elle importante? Quels sont les principaux rôles des intendants des données? Quels sont les résultats attendus d'un programme d'intendance des données?

Étapes de cheminement des données

(Text à l'écran: Étapes du cheminemnt des données est appuyé par une base d'intendance, de métadonnées, de normes et de qualité)

(Diagramme du Cheminement des données: Étape 1 - définir, trouver, recueillir; Étape 2 - explorer, nettoyer, décrire; Étape 3 - analyser, modéliser; Étape 4 - Raconter l'histoire. Le cheminement des données est supporté par une base d'intendance, de métadonnées, de normes et qualité.)

Ce diagramme est une représentation visuelle du cheminement des données, de la collecte à la communication avec les autres, de l'histoire que racontent les données en passant par le nettoyage, l'exploration, la description, la compréhension des données et l'analyse des données, La gouvernance des données et la gouvernance des données exploitables, prenant la forme de principe d'intendance des données couvre toutes les étapes relatives aux cheminements des données, aussi appelé le cycle de vie des données.

Qu'est-ce que l'intendance des données?

Avant d'aborder l'intendance des données, il est important de présenter brièvement la gouvernance des données et d'expliquer le lien existant entre les deux. La gouvernance des données est souvent présentée comme étant l'exercice de la prise de décision et l'exercice de l'autorité en ce qui a trait aux données. Elle englobe les politiques, les directives et les règlements qui concerne les données; La protection des renseignements personnels et la sécurité des données, ainsi que l'affectation des rôles et des responsabilités en vue d'améliorer continuellement la qualité et la gestion des données; L'intendance des données est souvent décrite comme étant la gouvernance de données en action. Elle comprend la gestion et la surveillance des données pour assurer l'adéquation des données à leur utilisation et leur conformité aux politiques, aux directives et aux règlements.

Quelle est la différence entre la gouvernance des données et l'intendance des données? La gouvernance des données

La gouvernance des données stratégiques et comprends: La création d'une structure organisationnelle responsable de la gestion de la prise de décision, de gouvernance; La formation d'une équipe multidisciplinaire et coordonnées d'intendant pour régir les données; La définition des utilisations et de l'objectif des données ainsi que des principes selon, lesquels elles seront traitées; L'élaboration d'un plan visant à communiquer les politiques qui régissent les données; L'attribution des rôles et des responsabilités des personnes qui supervise la gouvernance des données.

Quelle est la différence entre la gouvernance des données et l'intendance des données? l'intendance des données

L'intendance des données est opérationnel et comprend: l'identification des données essentielles et la consignation de leurs valeurs admissibles; La définition de procédures opérationnelles pour satisfaire aux exigences établies par les politiques de l'organisme concernant la création, la collecte, le stockage et l'utilisation ou le refus de l'accès aux données; La consignation des sources de données qui nécessitent l'utilisation d'un système enregistre en leur provenance; La mise en place de seuils ou de niveau acceptable pour la qualité et l'exploitabilité des données de l'organisme; La vérification de la conformité ayant trait à la gestion et aux normes d'interopérabilité des données qui permettent le couplage de données et la transmission des informations entre les systèmes informatiques; L'ajout la gestion des métadonnées qui décrivent les données; La résolution de problèmes relatifs aux données de l'organisation qui surviennent;

Pourquoi l'intendance des données est-elle si importante?

L'augmentation rapide de la quantité de données et de fournisseurs de données est souvent appelée la révolution des données, où l'explosion des données; Cette augmentation du volume et de la variété des données présente de nombreuses occasions pour les organisations de produire davantage de renseignements, notamment sous forme de données, d'information et d'observation; Toutefois, la protection des renseignements personnels et la sécurité des données suscite de plus en plus de préoccupations. Puisque certaines de ces données contiennent des renseignements identificatoires; En raison de l'augmentation du volume et de la variété des données ainsi que de la vitesse à laquelle elles peuvent être créés, les utilisateurs s'attendent à recevoir davantage de données de plus en plus précises, et ce en temps réel ou presque; Il y a un besoin croissant dans plusieurs organisations d'augmenter le partage et l'interopérabilité des données afin de les utiliser à leur plein potentiel. La gestion et intendance approprié des données n'ont jamais été aussi importantes.

Quel est le rôle d'un intendant des données?

Un intendant des données est responsable des données d'une organisation. Il doit connaître leur emplacement tout au long de leur cycle de vie, la mesure de leur qualité et la façon dont elles sont protégés contre les risques connexes. Les intendants des données sont responsables de la définition et de la mise en œuvre de politiques et de procédures de gestion opérationnelle et administrative quotidienne des systèmes et des données. Y compris la réception, le stockage, le traitement et la transmission des données aux systèmes internes et externes.

Tâches des intendants des données

Les tâches principales des intendants des données varient d'une organisation à l'autre, mais la plupart d'entre eux participent directement aux activités suivantes: La gestion du cycle de vie des données. Ceci va de l'obtention à la suppression des données. Ceci inclut les protocoles, les processus et les règles pour le stockage, l'accès, l'archivage et là suppression des données; La protection des données et des renseignements personnels. Ceci comprend l'utilisation de techniques de masquage ou de dépersonnalisation pour protéger les renseignements identificatoires; La qualité des données. Ceci comprend la conformité au cadre de qualité des données pour assurer la satisfaction des besoins des utilisateurs; Les normes d'interopérabilité. Ceci est l'application de normes, de vocabulaire, de taxonomie et déontologie relatifs aux données pour rendre possible la réutilisation et le partage des données; La formation. Ceci permet à tous les membres d'une organisation de connaître le rôle de l'intendant des données; La communication. Ceci comprend la production de rapports sur l'état, de la gestion des données; La mise en œuvre d'un instrument de politique. Ceci consiste à veiller à ce que les données soient conformes à l'ensemble des politiques, des directives et des lignes directrices de l'organisation, et ce, tout au long de leur cycle de vie; La gestion des accès et la sécurité des données. Ceci comprend la conformité aux privilèges et aux protocoles en matière d'accès qui sont fondées sur les rôles et le droit de savoir.

À quoi ressemble une bonne intendance des données?

Lorsqu'elle est réalisée de façon adéquate, l'intendance des données permet de veiller à ce que la gestion globale des données se harmonise parfaitement avec la stratégie intégrée de l'organisation et soutiennent le rendement organisationnel; Une saine intendance des données comprend également des processus opérationnels reproductible et automatisée, ainsi que des rôles et des responsabilités bien établie pour les personnes chargées des données; Elle permet aussi de veiller à ce que les règles opérationnelles soient respectés et que les mesures et les audits soient réalisés pour continuellement améliorer la qualité des données et rendre leur intendance efficace.

Résultats attendus

Voici les résultats attendus d'un programme d'intendance des données: Plus grande confiance dans les renseignements; Meilleure compréhension des données nécessaires à la prise de décisions opérationnelles crucial en raison de l'exactitude des termes et des définitions; Application des pratiques exemplaires et conformité au protocole, aux règles et aux normes, ce qui accroît l'efficacité; Résultat cohérent au sein de l'ensemble des secteurs d'activité et moins de temps consacré à la recherche de donner, à la production de rapport, à la vérification des résultats, aux enquêtes sur les anomalies dans les données et à l'explication des incohérences; Données et renseignements plus cohérent, facile à trouver il a justifié ce qui permet de maintenir la confiance du public.

Objectifs de l'intendance des données

Voici les objectifs de l'intendance des données et d'un programme d'intendance des données: Favoriser une utilisation des données optimale et de haute qualité; Faciliter la recherche de données et l'accessibilité des données; Permettre d'établir des définitions de donner, des normes et des politiques communes aux fins d'interopérabilité; Réduire le temps consacré à la recherche de donner à la vérification de résultats ou au repérage des incohérences; Permettre d'éliminer les doublons au moment de l'obtention et du stockage des données; Favoriser une gouvernance et des stratégies efficaces en matière de données.

Résumé des principaux points

La gouvernance des données est stratégique, qui comprend la création d'une infrastructure permettant de s'occuper des données d'une manière responsable. L'intendance des données est la gouvernance des données en action. C'est-à-dire qu'elle concerne les activités quotidiennes de collecte, de stockage, de traitement et de partage des données. L'intendance des données est importante étant donné que le volume de données que nous utilisons et que nous devons protéger ne cessent de croître.

(Le mot-symbole « Canada » s'affiche.)

Qu'avez-vous pensé?

S'il vous plaît nous donner vos commentaires afin que nous puissions mieux fournir des produits qui répondent aux besoins de nos utilisateurs.

Analyse 101, partie 4 : étude de cas

Numéro de catalogue : 892000062020012

Date de diffusion : le 23 septembre 2020

Dans cette vidéo, nous allons revoir les étapes du processus analytique.

Vous aurez une meilleure compréhension de la façon dont les analystes font chaque étape du processus analytique par un exemple que nous allons vous montrer. L'exemple que nous allons présenter est un projet qui a examiné la relation entre le potentiel piétonnier des quartiers, c'est-à-dire la façon dont les quartiers favorisent l'activité physique, et l'activité physique réelle des Canadiens.

Étape du parcours des données
Analyser, modéliser
Compétence des données
Analyse des données
Audience
Essentiel
Conditions préalables suggérées
Durée
10:01
Coût
Gratuit

Voir la vidéo

Analyse 101, partie 4 : étude de cas - Transcription

(Le symbole et le mots-symbole de Statistique Canada apparaissent sur l'écran: "Analyse 101, partie 4 : étude de cas")

Analyse 101: Partie 4 - Étude de cas

Bonjour et bienvenue à notre étude de cas du cours analyse 101. Avant de regarder cette vidéo, assurez vous d'avoir visionné les vidéos 1 à 3 afin de vous familiariser avec les 3 étapes du processus d'analyse.

Objectifs d'apprentissage

Dans cette vidéo, nous allons revoir les étapes du processus analytique et vous aurez une meilleure compréhension de la façon dont les analystes font chaque étape du processus analytique par un exemple que nous allons vous montrer, l'exemple que nous allons présenter, est un projet qui a examiné la relation entre le potentiel piétonnier des quartiers, c'est-à-dire la façon dont les quartiers favorisent l'activité physique et l'activité physique réelle des canadiens.

Étapes du processus d'analyse

(Série de 6 images représentant les étapes de la phase d'analyse dans le cheminement des données où les premières étapes sont l'élaboration d'un plan d'analyse, les étapes intermédiaire sont de mettre en oeuvre ce plan et les dernières étapes sont de communiquer ses conclusions.)

Au cours de cette vidéo, nous ferons référence au 6 étapes du processus analytique et nous illustrerons ces étapes au moyen de l'exemple de potentiel piétonnier.

Que savons-nous déjà?

Pour créer notre plan d'analyse, commençons par comprendre le contexte général, que savons nous déjà sur le sujet? Et bien nous savons déjà que l'obésité est un problème au Canada. L'enquête canadienne sur les mesures de la santé révèle que au Canada, 29 pour 100 des enfants et des jeunes font de l'embonpoint ou sont obèses et 60 pour 100 des adultes font de l'embonpoint ou sont obèses. Nous savons également que de nombreux adultes et enfants canadiens ne sont pas assez actifs. Les données de l'enquête canadienne sur les mesures de la santé montre que 33 pour 100 des enfants et des jeunes au Canada respectent les directives canadiennes en matière d'activité physique, ce qui signifie qu'environ 66 pour 100 d'entre eux ne les respecte pas. De même, 18 pour 100 des adultes canadiens respectent ces directives. En réponse à ces défis, nous avons porter davantage attention à l'idée de changer le milieu dans lequel nous vivons pour aider les canadiens à faire des choix de vie plus sain.

(Texte: "Sans que l'on s'en rende compte, nos quartiers et la façon donts ils sont construits ont une incidence sur notre état de santé")

Cette idée a été au cœur du rapport de l'administrateur en chef de la santé publique de 2017 sur l'état de la santé publique au Canada. Ce rapport indique qu'il est difficile de modifier les comportements. Que peut-on faire pour aider les canadiens à devenir actifs, créer plus de parcs, s'assurer d'avoir de meilleurs chemins piétonniers ou de rues plus sûres? Les décideurs devraient-il se pencher sur les taux de criminalité? La liste des possibilités est infinie.

Que savons-nous déjà? Les milieux façonnent notre santé

Notre milieu peut façonner de plusieurs façons nos comportements liés à la santé. Par exemple, notre milieu, bâti comme le potentiel piétonnier d'un quartier et nous comportements liés à la santé comme le temps qu'il faut pour se rendre au travail ou le nombre d'activités sportives que nous pratiquons peuvent avoir des répercussions sur notre santé mentale et physique. Pensez à votre propre quartier. Sa conception vous facilite-t-elle la tâche ou la rend-elle plus difficile lorsqu'il s'agit de se rendre à pied à certains endroits ou de sortir faire de l'exercice ou jouer avec vos enfants?

Que savons-nous déjà? Lacunes dans les connaissances

Maintenant que nous comprenons le sujet général, nous allons déterminer certaines lacunes dans les connaissances. Des études antérieures ont démontré que les adultes du Canada qui vivent dans des quartiers ayant un bon potentiel piétonnier sont plus actifs. Toutefois, des conclusions récentes ne portaient que sur quelques villes canadiennes et ne fournissaient pas d'estimation nationale. De même, des travaux antérieurs ont examiné les moyens d'aider les adultes à devenir plus actifs, mais leurs analyses en ce qui concernent les enfants étaient limitées.

Quelle est la question d'analyse?

Il est important de formuler une question d'analyse pertinente pour définir la portée de votre travail. La question principale de cette étude était le lien entre le potentiel piétonnier et l'activité physique au Canada diffère-t-il selon l'âge? Elle est clair, bien définie et rédigée dans un langage simple.

Préparer et vérifier les données: Base de données sur l'accessibilité à la vie active dans les milieux de vie au Canada

Il est maintenant temps de mettre notre plan en œuvre. La première étape consiste à préparer et à vérifier nos données. Comme nous avions accès à un nouvel ensemble de données sur le potentiel piétonnier au Canada, nous voulions tirer parti de cette nouvelle source de données. Avant d'aller plus loin, laissez-moi vous donner un peu plus de contexte sur le potentiel piétonnier. Essentiellement, le potentiel piétonnier signifie la mesure dans laquelle un quartier favorise l'activité physique. Le potentiel piétonnier est plus élevé dans les quartiers plus dense comme ceux ou plus de personnes vivent sur un îlot. Il est également plus élevé dans les quartiers qui comptent plus de services comme l'accès aux transports en commun, aux épiceries, aux écoles et dans les quartiers où les rues sont bien connectées. Chaque quartier s'est vu attribuer un score de potentiel piétonnier de 1 à 5. Si vous vivez dans une banlieue à l'extérieur du centre-ville, le score de potentiel piétonnier de votre quartier sera probablement de 3. Les quartiers du centre ville auront probablement un score de 4 ou 5.

Effectuer l'analyse

(Texte: Base de données sur l'accessibilité à la vie active dans les milieux de vie au Canada; Enquête sur la santé dans les collectivités canadiennes (Personnes âgées de 12 ans ou plus); Enquête canadienne sur les mesures de la santé (Personnes âgées de 3 à 79 ans).)

Pour les besoins de notre analyse, nous avons couplé des données externes sur le potentiel piétonnier à deux importantes enquêtes de statistique Canada sur la santé. nous avons utilisé les deux enquêtes parce qu'elles mesurent l'activité physique différemment. L'une demandait aux répondants d'auto déclaré leur exercice quotidien, tandis que l'autre avait recours à des accéléromètre. Un accéléromètre enregistrent les données relatives aux mouvements minute par minute. C'est un peu comme un podomètre de luxe.

Résumer et interpréter les résultats

Après avoir nettoyé les données, défini les concepts et documenter de façon détaillée nos décisions analytiques, nous pouvons commencer à raconter une histoire basée sur nos conclusions. Notre principale conclusion à révélé que les adultes des quartiers ou le potentiel piétonnier est plus élevé sont plus actifs. Cependant, les enfants et les jeunes ont démontré des tendances différentes. Leurs activités physiques étaient assez uniforme, peu importe le niveau de potentiel piétonnier du quartier. Lorsque nous avons commencé cette analyse, beaucoup de données probantes établissaient un lien entre le potentiel piétonnier d'un quartier et l'activité physique chez les adultes, mais seulement un petit nombre de documents examinés ces mêmes éléments chez les enfants. Certaines études ont révélé que les enfants étaient plus actifs physiquement dans les quartiers ou le potentiel piétonnier est plus élevée, tandis que d'autres ont constaté le contraire. Nous avons effectué une analyse selon l'âge pour examiner cette question de manière plus approfondie. Nos résultats ont indiqué que les enfants de moins de 12 ans étaient plus actifs dans les quartiers où le potentiel piétonnier est plus faible, comme les banlieues où l'on circule davantage en voiture et, où les arrière-cours, les cours d'école et les parcs qui permettent de courir et jouer en toute sécurité peuvent être plus grands Pourtant, la relation entre l'activité physique et le potentiel piétonnier du quartier chez les enfants de 12 ans ou plus étaient semblables à celles des adultes. Ils étaient plus actifs physiquement dans les quartiers ou le potentiel piétonnier était plus élevé. Résumé, vos résultats en termes simples est la meilleure façon de transmettre votre message à divers publics. Comme vous l'avez appris dans des vidéos précédentes, il est important de traduire une analyse complexe en histoire cohérente. Vous êtes responsable d'assimiler l'information et de guider votre lecteur tout au long du récit.

Résumer et interpréter les résultats: Et alors?

L'interprétation de vos résultats impliquent également d'aider votre public cible à comprendre le facteur, et alors? Pour nous, cela signifiait mettre en évidence le fait que le potentiel piétonnier est un concept pertinent chez les adultes, mais qu'il faut penser différemment lorsqu'il s'agit de favoriser l'activité physique chez les enfants. Par exemple, que dire des parcs, de la sécurité, du voisinage et des taux de criminalité? Expliquez à votre lecteur comment vos conclusions cadrent avec la documentation existante. Il est aussi idéal de préciser ce qui doit être fait à l'avenir pour approfondir nos connaissances et de signaler toute limites de l'étude.

Diffuser votre travail

Ce projet a donné lieu à des analyses très intéressantes et nous les avons diffusées de différentes façons auprès des intervenants, des décideurs et des canadiens. deux documents de recherche importants ont été publiés pour nos publics plus spécialisés et nous avons également créé une infographie sur des points clés pour des publics plus vaste.

Résumé des points clés

(Série de 6 images représentant les étapes de la phase d'analyse dans le cheminement des données où les premières étapes sont l'élaboration d'un plan d'analyse, les étapes intermédiaire sont de mettre en oeuvre ce plan et les dernières étapes sont de communiquer ses conclusions.)

Le processus analytique est un cheminement, il est souvent beaucoup plus long que prévu. Vous devez comprendre votre sujet, prendre votre temps pour formuler une question analytique, claire et pertinente. Vérifier et examiner vos données tout au long du processus et veiller à ce que vos conclusions se traduise en un récit significatif et intéressant. De cette façon, les gens se souviendront de votre travail.

(Le mot-symbole « Canada » s'affiche.)

Qu'avez-vous pensé?

S'il vous plaît nous donner vos commentaires afin que nous puissions mieux fournir des produits qui répondent aux besoins de nos utilisateurs.

Analyse 101, partie 3 : communiquer ses conclusions

Numéro de catalogue : 892000062020011

Date de diffusion : le 23 septembre 2020

Cette vidéo va vous apprendre comment résumer et interpréter vos données et comment communiquer vos conclusions. Les éléments clés de la communication de vos conclusions sont les suivants :

  • choisir les conclusions essentielles,
  • résumer et interpréter les résultats,
  • organiser et évaluer les revues et
  • préparer la diffusion
Étape du parcours des données
Analyser, modéliser
Compétence des données
Analyse des données
Audience
Essentiel
Conditions préalables suggérées
Durée
12:40
Coût
Gratuit

Voir la vidéo

Analyse 101, partie 3 : communiquer ses conclusions - Transcription

(Le symbole et le mots-symbole de Statistique Canada apparaissent sur l'écran: "Analyse 101, partie 3 : communiquer ses conclusions")

Analyse 101: Partie 3 - Communiquer ses conclusions

Bienvenue à la vidéo 3 d'analyse 101. Maintenant, vous avez appris à planifier un projet d'analyse et à analyser vos données, nous discuterons des pratiques exemplaires en ce qui concerne l'interprétation de vos résultats et la communication de vos conclusions.

Objectifs d'apprentissage

Cette vidéo va vous apprendre comment résumer et interprétez vos données et comment communiquer vos conclusions. Les éléments clés de la communication de vos conclusions sont les suivantes. Choisir les conclusions essentielles résumé et interpréter les résultats.

Étapes du processus d'analyse

(Série de 6 images représentant les étapes de la phase d'analyse dans le cheminement des données où les premières étapes sont l'élaboration d'un plan d'analyse, les étapes intermédiaire sont de mettre en oeuvre ce plan et les dernières étapes sont de communiquer ses conclusions.)

Organiser et évaluer les revues et préparer la diffusion. Retournons au 6 étapes du plan d'analyse, nous nous concentrons maintenant sur la communication de vos conclusions. Si vous avez regardé les vidéos de statistique Canada sur la littéracie en matière de données, vous constaterez que ce travail fait partie de la 3e étape du cheminement des données, La phase d'analyse.

Étapes 5: Résumer et interpréter ses résultats

Voyons d'abord la façon de résumer et d'interpréter vos résultats.

Racontez votre cheminement

(Texte représentant les 4 partie de l'étape 5: Contexte - Données probantes provenant d'autres pays ou renseignements anecdotiques; Méthodes - Comparaison entre les milléniaux (âgés de 25 à 34 ans) et les générations précédentes; Conclusions - Les milléniaux ont une valeur nette et un niveau d'endettement plus élevés que la génération X; Interprétation - Les prêts hypothécaires sont le principal facteur à l'origine de l'endettement des milléniaux.)

L'un des aspect les plus difficiles du processus d'analyse, consiste à communiquer vos conclusions de façon claire à vos lecteurs. Prenons l'étude sur les milléniaux, à titre d'exemple. D'abord, nous avons commencé par le contexte. Nous avons souligné les constatations antérieures au sujet des milléniaux américains qui nous ont motivé à étudier les milléniaux canadiens. Ensuite, nous avons discuté des données et de la méthodologie utilisée en définissant les milléniaux et en expliquant notre comparaison de leur situation financière avec celle des générations précédentes. Par la suite, nous avons effectué une revue générale des principales conclusions, la structure. Par exemple, nous avons indiqué que même si les milléniaux présentaient une valeur nette plus élevée que les membres de la génération x lorsqu'ils étaient plus jeunes, les milléniaux étaient également plus endettés. Finalement, nous avons interprété nos conclusions en creusant davantage le pourquoi. Nous avons constaté que la dette hypothécaire, qui reflète l'augmentation de la valeur des logements a contribué au niveau d'endettement plus élevé des milléniaux.

Choisissez soigneusement les conclusions essentielles à votre histoire

Vous produirez probablement un certain nombre de tableaux de données ou d'estimations tout au long de votre analyse. Choisissez soigneusement les conclusions qui sont essentiels à votre histoire. Passez en revue vos questions analytiques et sélectionnez des éléments visuels qui contribuent clairement à répondre à ces questions. N'oubliez pas que vos résultats ne constituent pas l'histoire en soi, mais bien les preuves qui appuient votre histoire.

Résumez vos conclusions et suivez une structure logique

Une fois que vous avez sélectionné vos résultats clés, résumé vos conclusions et présentez les selon une structure logique. Déterminez vos messages clés souvent, ces messages serviront de sous-titres dans un rapport ou une étude. De plus, assurez-vous de toujours présenter vos conclusions dans le contexte élargi du sujet. Vous avez fait un excellent travail, vous voulez que les personnes se souviennent de ce que votre analyse apporte à la littérature. En créant une structure claire vous ferez en sorte que les personnes se souviendront de votre travail.

Définissez les concepts

(Texte: On entend par "milléniaux" toutes les personnes de notre ensemble de données qui étaient âgées de 25 à 34 ans en 2016.)

Comme nous l'avons vu dans la vidéo 2, des définitions de concepts clés propre au projet ont peut être été établies avant que vous amorcez votre analyse. Incluez toutes les définitions pertinentes dans votre document d'analyse, par exemple, notre définition des milléniaux pour aider vos lecteurs à mieux comprendre vos conclusions.

Évitez le jargon et expliquez les abréviations

Dans votre document d'analyse, éviter le jargon et expliquer clairement les abréviations. Par exemple, au lieu d'utiliser un terme statistique comme cohorte de naissance synthétique, expliquer vos résultats en langage clair et simple. Définissez toutes les abréviations que vous utilisez à la première occurrence, comme SDR qui signifie subdivision de recensement. Assurez vous de garder un ton neutre en utilisant un langage clair et simple et en évitant d'exagérer vos résultats ou de faire des suppositions en les interprétants.

Utilisez un langage neutre

(Texte: Subjectif - Important ou minime, élevé ou bas, seulement ou beaucoup; Neutre - a augmenté ou diminué de X %, est X fois plus grand ou plus petit que.)

Éviter des termes comme important, élevé ou seulement qui peuvent être subjectif et appliquez vous à employer un langage neutre lorsque vous donner des explications.

Attendez-vous à faire des erreurs

Voici quelques exemples de phrases qui n'étaient pas neutre et qui ont été améliorés une fois que nous avons laissé les données parler d'elles-mêmes. Au lieu de dire la croissance de l'emploi, a chuté de 2 pour 100. Vous pouvez dire, l'emploi a reculé de 2 pour 100 au dernier trimestre, ce qui représente la baisse la plus marquée au cours des 2 dernières années. Le 2e énoncé, permet de conserver un langage neutre. Au lieu de dire les milléniaux, sont aux prises avec un marché de l'habitation beaucoup plus précaire et sont beaucoup plus endettés. Vous pouvez dire la dette hypothécaire médiane des milléniaux âgés de 30 à 34 ans étaient plus de 2,5 fois supérieur à leur revenu médian après impôts. Ne recourez pas à des exagérations pour faire valoir votre point. Rester neutre. Ces énoncés sont claires et appuyés par des données. Attendez vous à faire des erreurs? L'erreur est inhérente à tout travail d'analyse. N'oubliez pas que vous êtes la personne qui connaît le mieux votre projet, ce qui vous place dans une position idéale pour repérer vos erreurs. Lorsque vous terminez votre premier jet, laissez le de côté pendant plusieurs jours puis, relisez le avec un regard neuf. N'ayez pas peur de demander de l'aide à d'autres personnes pour corriger vos erreurs. N'oubliez pas non plus qu'en apprenant de vos erreurs, vous renforcerez vos compétences en analyse.

Étape 6: Diffuser ses résultats

Passons maintenant en revue la dernière étape. Qui est la façon de préparer votre travail en vue de sa diffusion et de communiquer vos conclusions avec succès.

Faites revoir votre travail par d'autres personnes

Une partie importante de la préparation de votre travail en vue de sa diffusion consiste à le faire revoir par d'autres personnes. Vous pouvez demander à différentes personnes de vous fournir leurs commentaires, notamment à des collègues, à des gestionnaires, à des spécialistes du domaine, à des experts en données ou en méthodologie.

Obtenez des commentaires sur différents aspects de votre travail

Demander aux personnes qui relieront votre travail de vous fournir des commentaires sur différents aspects de votre travail, comme, la clarté des objectifs analytiques, la pertinence des données utilisées, la définition des concepts et la revue de la littérature. L'approche méthodologique, l'interprétation des résultats, la clarté et la neutralité de la rédaction.

Organisez et évaluez les commentaires reçus

Après avoir reçu les commentaires des personnes qui ont relu votre travail, organisez les et évaluez les. Cerner les préoccupations communes et déterminer celle qui nécessiteront une analyse supplémentaire. Assurez vous de clarifier tous les points que les personnes qui ont relu votre travail ont eu de la difficulté à comprendre.

Consignez votre réponse aux commentaires reçus

Consignez votre réponse à chacun des commentaires reçus. Si vous n'êtes pas en mesure de répondre à certaines préoccupations, il est important d'en préciser la raison. Dans certains cas, votre organisme peut exiger que vous répondiez officiellement aux commentaires reçus. Toutefois, même si ce n'est pas nécessaire, le fait de consigner les décisions que vous prenez lorsque vous révisez votre travail est une pratique exemplaire à suivre.

Bon nombre de personnes et de processus sont mis à contribution dans la préparation de votre produit en vue de sa diffusion

Habituellement, bon nombre de processus et de personnes sont mis à contribution dans la préparation de votre produit analytique en vue de sa diffusion. A Statistique Canada les produits analytiques font l'objet d'une révision d'un formatage, d'une traduction, d'une évaluation de l'accessibilité, d'un processus d'approbation et d'une préparation pour un communiqué de presse. Vous avez tout intérêt à tenir compte des exigences associées à votre produit, qu'il s'agisse d'une note d'information, d'une infographie ou de renseignements sur le site web de votre organisme.

La façon dont votre produit est diffusé dépend de votre public cible

La façon dont votre produit sera diffusé dépendra de votre public cible. Tenez compte de votre public cible. Que sait-il déjà? Que cherche t-il à savoir? Par exemple, grand public voudra des messages clés de nature générale, tandis que les médias où là collectivité des analystes des politiques, voudront plus d'informations, plus d'éléments visuels ou de graphiques. Les chercheurs, les universitaires ou les experts voudront des détails au sujet de vos données, de votre méthodologie et des limites de votre travail.

La façon dont votre produit est diffusé dépend de votre public cible: Médias et grand public

Par exemple, nous recourons souvent à des graphiques et à des infographies pour représenter visuellement les faits saillants lorsque nous communiquer les conclusions au grand public. Dans le cadre de notre étude sur le bien-être économique des milléniaux, les conclusions ont été diffusées sur Twitter dans une infographie et dans un communiqué de presse qui résumait les messages clés de l'analyse.

La façon dont votre produit est diffusé dépend de votre public cible: Décideurs

D'autres publics, comme les décideurs, pourraient vouloir des conclusions plus détaillées ou un moyen de communication qui leur permettrait d'obtenir rapidement des réponses à leurs questions. Nous avons communiqué les résultats de l'étude sur les milléniaux aux analystes et aux décideurs au moyen d'un webinaire de la publication d'une étude présentant des résultats détaillés et sous forme d'autres présentations.

La façon dont votre produit est diffusé dépend de votre public cible: Chercheurs, universitaires et experts

Les conclusions sont communiquées aux chercheurs, aux universitaires et aux experts sous forme de document de recherche détaillée où d'articles dans des publications évaluées par des pairs ainsi qu'au cours de conférences. Ce public, s'intéressera davantage au détail précis de votre travail et à la façon dont vos conclusions s'inscrivent dans le domaine de recherche plus vaste et la base de connaissances connexes.

Préparez-vous à communiquer vos conclusions aux médias

En dernier lieu, il est essentiel de bien communiquer vos conclusions aux médias. Vérifiez si votre organisme offre de la formation sur les médias avant de communiquer vos conclusions, prenez le temps de résumer vos principaux résultats et de déterminer vos messages clés. Réfléchissez à la façon de communiquer vos conclusions en termes simples. Prévoyez les questions possibles et créer un document des questions et réponses possibles.

Résumé des points clés

Voilà un aperçu de la façon de réviser et de diffuser votre travail. Premièrement, racontez votre cheminement, Deuxièmement, interprétez vos conclusions en utilisant un langage clair et neutre. Troisièmement, faites revoir votre travail par d'autres personnes. Finalement, la préparation est essentielle à la communication de vos conclusions. Et rappelez-vous de demeurer fidèle à votre question analytique tout en racontant une histoire claire. Nous vous invitons à visionner notre étude de cas où nous vous donnons un exemple du processus analytique sous l'angle d'une étude sur le potentiel piétonnier des quartiers et l'activité physique.

(Le mot-symbole « Canada » s'affiche.)

Qu'avez-vous pensé?

S'il vous plaît nous donner vos commentaires afin que nous puissions mieux fournir des produits qui répondent aux besoins de nos utilisateurs.

Analyse 101, partie 2 : mettre en œuvre le plan d'analyse

Numéro de catalogue : 892000062020010

Date de diffusion : le 23 septembre 2020

À la fin de cette vidéo, vous serez familiarisés avec les concepts de base du processus analytique :

  • les principes directeurs de l’analyse,
  • les étapes du processus analytique et
  • la planification de votre analyse.
Étape du parcours des données
Analyser, modéliser
Compétence des données
Analyse des données
Audience
Essentiel
Conditions préalables suggérées
Analyse 101, partie 1 : Élaborer un plan d'analyse
Durée
6:35
Coût
Gratuit

Voir la vidéo

Analyse 101, partie 2 : mettre en œuvre le plan d'analyse - Transcription

(Le symbole et le mots-symbole de Statistique Canada apparaissent sur l'écran: "Analyse 101, partie 2 : mettre en œuvre le plan d'analyse")

Mettre en oeuvre le plan d'analyse (Analysis 101: Part 2)

Bonjour et bienvenue à la vidéo de la formation analyse 101, partie 2. Assurez vous d'avoir regardé la vidéo de la partie 1 avant de commencer puisque nous reprenons exactement là où nous vous avons laissé à la fin de la première vidéo. Maintenant que vous avez appris à planifier un projet d'analyse, nous discuterons des pratiques exemplaires pour la mise en œuvre de votre plan.

Objectifs d'apprentissage

Cette vidéo va vous permettre d'apprendre comment mettre en œuvre votre plan d'analyse. Les étapes clés de la mise en œuvre de votre plan comprennent la préparation et la vérification de vos données, la réalisation de votre analyse et la documentation des décisions relatives à votre analyse.

Les étapes du processus d'analyse

(Série de 6 images représentant les étapes de la phase d'analyse dans le cheminement des données où les premières étapes sont l'élaboration d'un plan d'analyse, les étapes intermédiaire sont de mettre en oeuvre ce plan et les dernières étapes sont de communiquer ses conclusions.)

Dans la première vidéo, vous avez appris à planifier votre analyse. Dans cette vidéo, vous verrez comment mettre en œuvre votre plan d'analyse. Si vous avez regardé les vidéos de statistique Canada sur la littéracie des données, vous constaterez que ce travail fait partie de la 3e étape du cheminement des données, la phase d'analyse.

Étape 3: Préparer et vérifier ses données

La première étape de la mise en œuvre de votre plan consiste à préparer et à vérifier vos données. En préparant et en vérifiant vos données, vous vous assurez que votre analyse sera simple et rigoureuse.

Définissez vos concepts

Commencer par définir vos concepts. Dans notre exemple précédent qui portait sur la situation financière des milléniaux, nous avons eu besoin de définir les milléniaux. En consultant la littérature, on s'est aperçu qu'il n'y avait pas de définition officielle pour cette génération, mais plutôt un certain nombre de recommandations différentes. Il est important de prendre une décision fondée sur une analyse qui soit significative et défendable et de l'appliquer de façon uniforme. Puis de consigner votre décision. Dans l'étude en question, les milléniaux ont été définis comme étant les personnes âgées de 25 à 34 ans en 2016, soit un groupe d'âge qui correspond à notre définition habituelle des jeunes travailleurs.

Nettoyez les variables et l'ensemble de données

Maintenant que les concepts sont clairs, nous pouvons commencer à approfondir notre analyse des données. Commencez par nettoyer et préparer votre ensemble de données. Nous vous recommandons de renommer les variables pour qu'elles soient significatives et qu'elles aient un format uniforme, par exemple, plutôt que d'utiliser le nom Var 3, qui porte à confusion, nous allons renommer notre variable plus haut grade, ce qui est beaucoup plus clair. Les efforts que vous investirez à cette étape vous faciliteront la vie au fil de votre analyse, surtout si vous consignez, bien vos décisions.

Vérifiez vos données

(Tableau présentant l'étude sur le bien-être économique par génération où la colonne de gauche présente le groupe générationnelle. La colonne du milieu et droite présente l'âge moyen en 1999 ( Génération X = 26 ans et Milléniaux = 14 ans) et en 2016 ( Génération X = 26 ans et Milléniaux = 14 ans), respectivement.)

À cette étape, vérifiez vos données pour vous assurer qu'elles sont de la plus haute qualité. Dans notre exemple, nous devrions vérifier l'âge moyen par génération pour nous assurer qu'il n'y aura pas de problème en ce qui concerne le calcul de l'âge. L'âge moyen des membres de la génération x et de 26 ans en 1999 et de 43 ans en 2016. Cela est logique. Cependant, bien que l'âge moyen des milléniaux et de 14 ans en 1999, il passe à 66 ans en moyenne en 2016. Dans ce cas, il nous faudrait vérifier notre code de programmation, examiné les données, corriger l'erreur et consigné la raison de cette erreur.

Vérifiez les données tout au long de l'analyse

Pour accroître la rigueur de votre analyse, vous devriez effectuer certaines vérifications des données à différentes étapes de votre travail. Au début, vous pouvez vérifier les données brutes pour vous assurer qu'elles sont nettoyées et prêtes pour l'analyse. Vous pouvez également vérifier les distributions de fréquence des variables pour vous assurer que les données concordent avec les ensembles de données antérieures. Ensuite, à mesure que vous vérifiez les résultats de votre analyse, vous pouvez vérifier si vos résultats concordent avec la littérature. Veillez à effectuer toutes les vérifications dans un code de programmation que vous consignerai et conserverai pour vous y reporter plus tard.

Étape 4: Effectuer l'analyse

La 2e étape de la mise en œuvre de votre plan d'analyse est, d'effectuer l'analyse. Comme nous l'avons vu dans la première vidéo, vous devriez avoir planifié votre analyse au moment de la création de votre plan d'analyse, donc une fois que vous avez nettoyé et préparé vos données, vous êtes prêt à effectuer l'analyse.

Mettez en oeuvre votre plan

Vous ne devriez pas avoir de difficulté à effectuer votre analyse si vous avez créé un plan d'analyse et si vous avez nettoyé et préparé correctement vos données. Vous devriez effectuer votre analyse comme vous l'avez prévu et comme nous en avons discuté précédemment, vous devriez vérifier vos résultats au fil de votre analyse pour vous assurer que les données et les méthodes que vous utilisez produisent des résultats valides. Le fait de vérifier vos résultats au fil de votre analyse vous permettra aussi de consigner tout résultat inattendu.

Faites preuve de souplesse

Si vous Obtenez des résultats inattendus, ceux-ci peuvent être attribuables à une erreur dans les données ou il peut s'agir d'un résultat inattendu de la recherche. Faites preuve de souplesse et ajuster votre plan d'analyse pour examiner plus à fond les résultats qui ne concordent pas avec vos attentes, ou avec la théorie. Nous verrons dans la vidéo sur l'étude de cas un exemple de situation où il a fallu mener une analyse supplémentaire pour décortiquer une relation complexe.

Résumé des points clés

Voilà un résumé de la façon de vous y prendre pour mettre en œuvre votre plan analytique. Vous devez préparer et vérifier vos données, puis en effectuer l'analyse. Tout au long de ce travail, n'oubliez pas de consigner vos décisions. Dans la prochaine vidéo, vous apprendrez à interpréter et à communiquer les résultats de votre travail.

(Le mot-symbole « Canada » s'affiche.)

Qu'avez-vous pensé?

S'il vous plaît nous donner vos commentaires afin que nous puissions mieux fournir des produits qui répondent aux besoins de nos utilisateurs.

Analyse 101, partie 1 : élaborer un plan d'analyse

Numéro de catalogue : 892000062020009

Date de diffusion : le 23 septembre 2020

À la fin de cette vidéo, vous serez familiarisés avec les concepts de base du processus analytique :

  • les principes directeurs de l'analyse,
  • les étapes du processus analytique et
  • la planification de votre analyse.
Étape du parcours des données
Analyser, modéliser
Compétence des données
Analyse des données
Audience
Essentiel
Conditions préalables suggérées
s.o.
Durée
8:24
Coût
Gratuit

Voir la vidéo

Analyse 101, partie 1 : élaborer un plan d'analyse - Transcription

(Le symbole et le mots-symbole de Statistique Canada apparaissent sur l'écran: "Analyse 101, partie 1 : élaborer un plan d'analyse")

Analyse 101: Partie 1 - Élaborer un plan d'analyse

Bonjour et bienvenue à analyse 101, vidéo un élaborer un plan d'analyse.

Objectifs d'apprentissage

À la fin de cette vidéo, vous serez familiarisé avec les concepts de base du processus analytique, soit les principes directeurs de l'analyse, les étapes du processus analytique et là planification de votre analyse. Cette vidéo s'adresse aux apprenants qui veulent acquérir une compréhension de ase de l'analyse. Aucune connaissance préalable n'est requise.

L'analyse dans votre organisation

Arrêtez vous un instant pour réfléchir à l'analyse dans votre organisation. Quel rôle l'analyse joue t-elle? Est-ce que vos collègues et vous produisez des notes d'information à l'intention de la haute direction? Rédigez-vous des rapports pour des clients ou pour votre site web? Accomplissez vous des taches plus techniques ou plus descriptives? Votre organisation a-t-elle des principes directeurs que vous devriez connaître? Vous devrez tenir compte de ces questions lorsque vous planifierez vos analyses.

Étapes du processus d'analyse

(Série de 6 images représentant les étapes de la phase d'analyse dans le cheminement des données où les premières étapes sont l'élaboration d'un plan d'analyse, les étapes intermédiaire sont de mettre en oeuvre ce plan et les dernières étapes sont de communiquer ses conclusions.)

Sur cette diapositive, vous pouvez voir qu'il y a 6 étapes principales dans le processus d'analyse et chacune est lié à l'élaboration d'un plan à sa mise en œuvre ou à la communication de ses conclusions. Nous vous expliquerons les principales activités que vous devrez entreprendre à chaque étape. Si vous avez regardé les vidéos de statistique Canada sur la littéracie des données, vous constaterez que ce travail fait partie de la 3e étape. La phase d'analyse du cheminement des données. Ce diagramme est le pilier de notre processus d'analyse, nous y reviendrons dans chacune des vidéos de cette série.

Étape 1: Que savons-nous déjà?

Dans cette vidéo à propos de la planification de votre analyse, nous commencerons par nous assurer de saisir le contexte et par vérifier ce que nous savons déjà sur le sujet donné. Commencez par vous assurer de bien comprendre le sujet en général et le contexte qui l'entoure. Puis réfléchissez aux questions suivantes, que savons nous déjà sur ce sujet? Est-ce qu'un de vos collègues a déjà fait un exercice semblable? Commencer par passer en revue la littérature ou tout travail antérieures effectuées sur le sujet? Une fois que vous avez parcouru les connaissances sur le sujet, vous serez en mesure de cerner les lacunes. Que manque t-il dans les travaux précédents? Cette démarche vous aidera à concevoir la valeur ajoutée qui apporteront vos projets.

Exemple

Pour que vous compreniez bien ces étapes, examinons ensemble un exemple. Nous avons ici une étude sur le bien-être économique des milléniaux. L'étude a été motivée par le constat d'un manque de renseignements sur les résultats financiers des milléniaux canadiens.

Les milléniaux: mise en contexte

Lorsque nous avons entamé cette étude, nous savions que les milléniaux était souvent réduits à des stéréotypes dans les médias, on pense qu'ils vivent encore dans le sous-sol de leur parents qui consomme trop de plats pour emporter et ainsi de suite. Nous savions aussi qu'une étude du Federal Reserve Board des Etats-Unis avaient montré que les milléniaux américains avaient des revenus et des actifs inférieurs à ceux que les membres des générations précédentes avaient au même âge. Quels étaient les lacunes en matière de connaissances? Malgré les informations anecdotiques diffusées dans les médias sur les milléniaux, nous savions qu'il n'existait pas d'étude détaillée sur le bien-être économique des milléniaux canadiens.

Les milléniaux: pertinence

Pourquoi notre analyse est-elle pertinente? L'accessibilité au logement et l'endettement élevé deviennent des questions préoccupantes plus tôt dans la vie des jeunes générations. Dès lors, nous savions que le sujet était pertinent pour les décideurs, les journalistes et la population canadienne. Nous reviendrons à cet exemple.

Étape 2: Que savons-nous déjà?

Revenons à notre processus d'analyse. La prochaine étape consiste à définir votre question analytique.

Quelle est votre question analytique?

Comment énoncer vous votre question analytique? Énoncé de manière très claire, la question à laquelle vous tentez de répondre. Formuler là en utilisant un langage simple. Autrement dit, utiliser un vocabulaire qu'un élèves de 2e secondaire ou de 8e année pourrait comprendre. Vous pourriez avoir une question analytique principal et quelques questions complémentaires. Pourquoi votre question est-elle pertinente? Pourquoi devrions-nous nous intéresser à votre travail? Établissez la valeur ajoutée qu'apportera votre analyse, soit à votre organisation, à votre client ou à notre compréhension du sujet.

planifiez votre analyse

Maintenant que vous avez une question pertinente, comment allez-vous y répondre? C'est le moment parfait pour concevoir un plan d'analyse qui fournit une feuille de route pour vous permettre de répondre à votre question d'analyse. Vous devez réfléchir au contexte de votre sujet, à la façon dont vous répondrai à votre question d'analyse ainsi que aux données et à la méthodologie dont vous avez besoin pour répondre à votre question. Vous devrez également réfléchir à la manière dont vous communiquerez vos résultats au moyen d'une note d'information, d'un document analytique, d'une infographie ou d'une présentation.

Déterminez vos ressources

Maintenant que vous avez votre plan d'analyse, vous pouvez penser à vos ressources. La rétroaction est un élément essentiel de votre cheminement analytique et vous devriez exploiter les contributions de vos collègues à chaque étape. Ordinairement, nous développons un cours plan à être vu par vos collègues et les membres de la gestions. Peut-être que certains de vos collègues possède une expertise en rapport avec le sujet sur lequel vous travaillez. Vos collègues ont peut être également une expertise relative aux données que vous utilisez ou votre méthodologie. Nos collègues sont souvent les mieux placés pour nous donner des conseils et de la rétroaction, et pour nous aider à résoudre des problèmes.

Les milléniaux: question analytique

Dans notre exemple à propos du bien-être économique de la population canadienne, notre question analytique principal est la suivante. Les milléniaux sont-ils en meilleure ou en moins bonne situation que les générations précédentes au même âge, du point de vue du revenu de l'endettement des actifs et de la valeur nette. Étant donné le niveau d'intérêt pour les milléniaux et les seuils d'endettement, nous avons rédigé un court document d'analyse qui a répondu à cette question.

Votre cheminement analytique

Souvenez vous de cette façon l'analyse, c'est comme faire une expédition en canoe. Vous avez besoin d'un bon plan. Vous devez savoir où vous vous dirigez et comment vous allez vous y rendre. Ça, c'est votre plan d'analyse. Vous aurez également besoin d'une question analytique claire et précise, des données solides et une bonne méthodologie. Ça, c'est votre canoe.

N'oubliez pas de définir votre question analytique

L'essentiel à retenir de cette vidéo est de se rappeler d'établir, une question analytique bien défini. Même si votre sujet est excellent et que vous donnez sont de haute qualité, vous n'obtiendrez pas de bons résultats, si votre question de départ n'est pas bien définie.

Résumé des points clés

En résumé, le processus analytique peut être considérée comme une série d'étapes destinées à répondre à une question bien défini. Une fois que le sujet est bien défini, la prochaine étape est celle de créer un plan analytique. Et toujours intégrer la rétroaction reçue au cours de l'étape de planification de votre produit analytique. Avant la prochaine vidéo, prenez quelques minutes pour formuler deux questions analytiques, puis penser aux raisons pour lesquelles ces questions sont pertinentes à votre organisation. Demeurer à l'écoute. Dans la prochaine vidéo, nous allons partager des conseils sur la façon de mettre en œuvre votre plan analytique.

(Le mot-symbole « Canada » s'affiche.)

Qu'avez-vous pensé?

S'il vous plaît nous donner vos commentaires afin que nous puissions mieux fournir des produits qui répondent aux besoins de nos utilisateurs.

Exactitude et validation des données : méthodes pour assurer la qualité des données

Numéro de catalogue : 892000062020008

Date de diffusion : le 23 septembre 2020 Mise à jour : le 25 november 2021

L'exactitude est l'une des six dimensions de la qualité des données qui sont prises en compte à Statistique Canada. Les données sont exactes lorsqu'elles décrivent adéquatement les phénomènes qu’elles sont conçues pour mesurer ou représenter.

Avant d'utiliser des données, nous devrions les explorer pour en apprendre davantage sur les variables et les concepts, et aussi pour découvrir si elles comportent des erreurs, des incohérences ou des lacunes. Cette vidéo examine différentes façons d’explorer l'exactitude des données.

Étape du parcours des données
Explorer, nettoyer, décrire
Compétence des données
  • Découverte des données
  • Évaluation de la qualité des données
  • Nettoyage des données
Audience
Essentiel
Conditions préalables suggérées
s.o.
Durée
12:10
Coût
Gratuit

Voir la vidéo

Exactitude et validation des données : méthodes pour assurer la qualité des données - Transcription

(Le symbol de Statistics Canada et le mot-symbol du Canada est présent avec le titre suivant: « Exactitude et validation des données : méthodes pour assurer la qualité des données »)

Exactitude et validation des données : Méthodes pour assurer la qualité des données

L'évaluation de l'exactitude des données, est un aspect important du processus d'analyse.

Objectifs d'apprentissage

L'exactitude est l'une des 6 dimensions de la qualité des données qui sont pris en compte à statistique Canada. L'exactitude s'entend de la mesure dans laquelle les données rendent compte de la vérité ou de ce qui s'est réellement produit. Dans cette vidéo, nous présenterons des méthodes pour mettre en lumière le concept d'exactitude sur le plan de la validité et de la précision. Nous discutons également des méthodes de validation et de vérification de l'exactitude des valeurs de données.

Étapes du cheminement des données

(Text à l'écran: Étapes du cheminemnt des données est appuyé par une base d'intendance, de métadonnées, de normes et de qualité)

(Diagramme du Cheminement des données: Étape 1 - définir, trouver, recueillir; Étape 2 - explorer, nettoyer, décrire; Étape 3 - analyser, modéliser; Étape 4 - Raconter l'histoire. Le cheminement des données est supporté par une base d'intendance, de métadonnées, de normes et qualité.)

Ce diagramme est une représentation visuelle des étapes permettant de transformer les données en connaissances.

Étape 2: Explorer, nettoyer et décrire

(Diagramme du Cheminement des données avec un attention sur l'Étape 2 - explorer, nettoyer, décrire.)

Les données sont exactes lorsqu'elle décrit adéquatement les phénomènes qu'elles sont conçues pour mesurer ou représentés. Avant d'utiliser des données, nous devrions les explorer pour en apprendre davantage sur les variables et les concepts et aussi pour découvrir si elle comporte des erreurs, des incohérences ou des lacunes. Cette vidéo examine différentes façons d'explorer l'exactitude des données.

Qu'entend-on par des données « exactes »?

Qu'entend t-on par des données exactes? Des données exactes reflètent la réalité, autrement dit, leurs valeurs sont valides, ne sont ni absentes ni manquantes et se trouvent dans une fourchette valide. Des données exactes sont également correctes. Examinons d'abord le concept de données valides. L'une des méthodes pour explorer la validité de données est d'effectuer ce qu'on appelle une analyse VIMA. Cet acronyme signifie Valides, Invalides, Manquantes et Aberrantes.

Valeurs invalide

(Tableau contenant une liste de numéro d'identification du ménage. Des détails sur les dépenses totales pour la nourriture et les dépenses totales pour le logement sont révéller pour chaque ménage. Une des céllules contienne le nom d'une couleur au lieu d'une valeur monétaire.)

Sur la diapositive précédente, nous avons défini qu'une donnée valide n'est ni absente ni manquante et qu'elle se situe à l'intérieur d'une fourchette valide de valeur. Inversement, une donnée invalide affiche des valeurs qui paraissent impossible. Un exemple serait une variable qui devrait afficher un montant en dollars comme pour des dépenses liées au logement, mais qui indique plutôt la valeur bleu. Cette réponse n'a aucun sens.

Valeurs manquantes

(Tableau similaire à la dernière diapositives. La seule différence est qu'au lieu d'un nom d'une couleur, il y a maintenant une cellule vide.)

Les valeurs sont manquantes lorsqu'une cellule est laissée vide. Par exemple, on s'attend à ce qu'il y ait un 0 ou un chiffre quelconque pour la valeur des dépenses totales.

Valeurs aberrantes

(Tableau qui liste le nom d'un groupe d'individues. Associer à chaque noms sont les profession et l'âge. Dans la colonnes des âges, on y retrouve un individue avec l'âge de 103 ans et un autre avec un âge de 301 ans.)

Les valeurs aberrantes sont extrêmement basses ou extrêmement haute par rapport à ce à quoi on s'attendrait. Certaines valeurs aberrantes peuvent être véritable. Une personne peut être âgée de 103 ans, bien que ce soit assez rare. Dans d'autres cas, les valeurs aberrantes sont également Invalides comme une valeur de 301 pour indiquer l'âge d'un individu vivant.

Analyse VIMA

L'une des façons d'effectuer une analyse VIMA consiste à produire une distribution de fréquence des variables clés et à examiner les proportions de valeurs valides invalides, manquantes et aberrantes. Quelle proportion des valeurs valides est acceptable? Est ce 100 pour 100 ou plus bas? Examiner la fourchette de valeur pour les variables clés. En attenant pas compte des valeurs manquantes Invalides pour un instant, la fourchette et la distribution des valeurs sont-elles réalistes? Lorsque les valeurs sont invalides, où manquantes est-il facile de déterminer si elles devraient indiquer 0 sans objet ou sinon une autre valeur? Une autre façon d'explorer la validité des données consiste à faire appel à des techniques de visualisation de données comme celles de les examiner sous forme de graphiques. C'est là une façon simple et rapide de détecter les tendances ou les anomalies dans les données. Il existe des outils logiciels pour détecter les valeurs aberrantes et visualiser les données. N'oubliez pas une valeur inhabituelle n'est pas nécessairement erronée.

Example: Détecter des valeurs invalides

(Diagramme à barre présentant les différent types de chaussures et les nombre de vente associer à chaqu'une. De la gauche, les types sont: Bottes d'hiver; Bottes en caoutchouc; Sandales; Chaussures de course; Parapluies.)

Dans cet exemple fictif, nous utilisons un diagramme à barres, une méthode de visualisation toute simple pour examiner la distribution de fréquence de différents types de chaussures vendues en ligne. Les hauteur des barres semblent toutes se situer à l'intérieur de la même fourchette. Toutefois, nous remarquons sur l'axe horizontal que l'une des barres concerne des parapluies. Un parapluie n'a rien à voir avec des articles de chaussure. C'est une donnée invalide. Une enquête plus poussée est nécessaire pour déterminer si la donnée indiquée par la barre représente effectivement un autre type de chaussures et que le terme parapluie a été attribué par erreur. Ou si cette donnée sur des parapluies s'est retrouvée par erreur dans le tableau des ventes de chaussures.

Exemple: Détecter des valeurs manquantes

(Tableu présentant la dsitribution des pommes (A), Orange (O) et Bananes (B). Les colonnes qui suivent représente la fréquence des valeurs = 0 (A=0; O=0; B=1), 3 (A=1; O=0; B=0), 5 (A=0; O=2; B=0), 8 (A=0; O=0; B=2). La dernière colonne représente la fréquence des valeurs manquantes (A=5; O=7; B=6).)

Dans cet exemple, nous avons créé un tableau de distribution des fréquences de valeur pour 3 variables, pommes, oranges et bananes. La colonne à l'extrême droite montre combien de fois il manquait des valeurs pour chacune de ces 3 variables. N'oubliez pas que des valeurs manquantes ne sont pas la même chose que des valeurs égales à 0. Dans cet exemple, il y a beaucoup de valeur manquante par rapport au nombre de valeur non manquante. Nous tenterions probablement de remplir ces trous avant d'utiliser ces données.

Exemple: Correction des valeurs manquantes

(Texte sur l'écran: Il y a de nombreuses valeurs manquantes dans ce tableau. Certaines sont faciles à entrer, par simple addition ou soustraction. Pour d'autre par contre, il est nécessaire de formuler certaines hypothèses ou de trouver des renseignements supplémentaires.)

(Tableau présenter sur l'écran est un réarangement du dernier tableau ou chaque colonne représente la ligne du dernier tableau, les Pommes, les Oranges et le total de fruits (TF). Les valeur sont présenter comme suit: Ligne 1 (A=3; O=5; TF=-); Ligne 2 (A=-; O=5; TF=8); Ligne 3 (A=-; O=-; TF=0); Ligne 4 (A=-; O=-; TF=8).)

Voici comment corriger les valeurs aberrantes relevées à la diapositive précédente. Dans ce tableau des données réelles des valeurs, on voit où se situe les valeurs manquantes. À la première ligne, il est facile de déterminer que la valeur manquante du nombre total de fruits devrait être 8 étant donné qu'il y a 3 pommes et 5 orange. De la même façon, il n'est pas difficile de comprendre que la valeur manquante à la 2e ligne pour les pommes et de 3. Cependant, à la 3e ligne, la valeur 0 pourrait être correcte. Au quel cas les valeurs manquantes pour les pommes et les oranges devrait également être 0. Toutefois, si 0 n'est pas la bonne valeur, on n'est pas en mesure de déterminer quelle serait la valeur des 3 variables. À la 4e ligne si 8, est effectivement la valeur du total, alors on a pas assez d'informations pour connaître la valeur des pommes et celle des oranges. On sait seulement qu'elle se situe entre 0 et 8.

Exemple: Détection des valeurs aberrantes

(Un nuage de point se retrouve dans un graphique où tout les points, à l'exception d'un point rouge, produisent une tendance linéaire. Ce dernier est représenter par 2 ligne de tendance.)

(Texte sur l'écran: Cette valeur est plus éloignée de toutes les autres valeurs de données que ce à quoi l'on pourrait s'attendre.)

Dans cet exemple inventé les points de données représentées par des points verts et rouges ont été tracées sur un axe horizontal et un axe vertical. Deux méthodes différentes ont été utilisées pour estimer la tendance centrale des valeurs des données. Ces tendances sont représentées par la droite rouge et la droite bleu. La plupart des valeurs de données se trouvent sur les 2 droite d'ajustement ou à proximité de celles-ci. Par contre, le point rouge trouve vraiment loin des droites. Il s'agit d'une valeur aberrante. Il est nécessaire de mener une enquête plus approfondie pour déterminer ce qui distingue tellement ce point de données et décider ce qu'il convient d'en faire. Certaines valeurs aberrantes sont corrects, même si elles sont inhabituelles.

Explorer l'exactitudes des données

(Texte sur l'écran: Microdonnées: Par exemple, une liste de personnes comprenant leur profession et leur date de naissance. Macrodonnées: Ces données sont moins détaillées, un peu comme lorsque l'on fait un zoom arrière avec un appareil photo. Par exemple, les microdonnées générées à partire d'une liste de personnes, de leur profession et de laeur date de naissance pourraient être un dénombrement de personnes classées selon leurs âges et leurs catégories professionnelles. Les microdonnées sont plus granulaires que les macrodonnées, elles sont à une échelle plus détaillée.)

Comme cela a été mentionné précédemment, les données exactes sont à la fois valide et correctes. Nous avons parlé de l'analyse VIMA comme façon d'explorer la validités des données. Il s'agit maintenant de mettre l'accent sur l'exactitude des données. Mais tout d'abord, il faut distinguer le fait d'examiner des valeurs de données individuelles ou microdonnées et celui d'étudier ces mêmes valeurs, résumer à un niveau plus élevé, soit les macrodonnées. Les microdonnées sont plus granulaire que les macrodonnées. Elles sont à une échelle plus détaillées.

Explorer l'exactitude des données

(Exemple 2: Une personne âgée de 12 ans possède une maîtrise en biologie, est mariée et traville à l'Université du Manitoba. Ext-ce plausible?)

L'une des façons d'explorer l'exactitude des données consiste à comparer les données avec d'autres renseignements connexes. On pourrait examiner le caractère raisonnable des valeurs d'un seul enregistrement de données. Certaines variables devraient-elles, être logique si on les combinent? Par exemple, si on a un total, et les parties qui constituent ce total. La somme de ces parties est-elle exacte? Un autre exemple consiste à considérer l'âge actuel d'une personne et à le comparer au plus haut niveau de scolarité atteint à l'état matrimonial ou la situation d'emploi. Est-ce plausible?

Il est également possible d'examiner la concordance avec les normes. Au Canada par exemple, le premier caractère des codes postaux dépend de la province. Tous les codes postaux de Terre-Neuve et labrador commencent par la lettre A tous ceux de la nouvelle-écosse commence par la lettre B et ainsi de suite. Si ce n'est pas le cas, l'un des éléments d'informations et inexacte.

(Pour répondre à ces questions, il faut disposer de données fiables sur le monde réel.)

Une autre façon d'explorer l'exactitude des données consiste à comparer le contenu des données avec la situation dans le monde réel. Vous pourriez calculer des statistiques sommaires comme les totaux et les moyennes relatives aux ventes d'automobiles au Canada et établir des comparaisons entre les provinces ou au fil du temps. Les chiffres sont-ils plausibles? L'industrie automobile surveille t-elle ces chiffres? Et comment vos chiffres se comparent t-ils aux siens?

Conseils pour explorer l'exactitude des données: Partie 1

Voici quelques conseils pour faciliter les comparaisons. Avant d'essayer de comparer des valeurs de données, exprimez-les dans un format commun. La date du 12/6/2018 semblera différente si dans un cas, le mois est inscrit en premier et que dans un autre, c'est le jour qui l'est. En plus des formats normalisés utilisez des abréviations, des notions et des définitions conventionnelles dans la mesure du possible, au Canada par exemple, il existe un sigle à 2 lettres normalisés pour le nom des provinces et des territoires.

Conseils pour explorer l'exactitude des données: Partie 2

La visualisation des données est une excellente façon de repérer les anomalies dans les données. Avant de commencer, penser au degré d'inexactitude que vous pouvez tolérer dans les données. Qu'est-ce qui est considéré comme suffisant pour ce que vous voulez faire? Après avoir repérer les écarts, servez-vous de l'automatisation pour corriger les erreurs de façon efficace, uniforme et objective.

Description de l'exactitude des données

(Text on screen: Documentez clairement: Accroître la validité et l'exactitude des données constitue un moyen de nettoyer les données. Cette documentation pourrait présenter un intérêt pour: Les utilisateurs de données et les personnes qui devront explorer, nettoyer et décrire des données similaires.)

Avant d'utiliser les données ou de les transmettre aux intervenants qui le feront, assurez-vous de décrire l'exactitude des données. La documentation décrivant les données est parfois appelé métadonnées. Documenter la façon dont vous avez exploré la validité et l'exactitude des données et celles dont vous avez nettoyé ou amélioré les données. Les utilisateurs de données utiliserons ces renseignements pour savoir comment se servir des données de façon responsable.

Recap of key points

Cette vidéo présentait les concepts de base de l'exactitude et de la validation des données. L'analyse VIMA recommande l'utilisation de la distribution de fréquence pour des variables clés afin d'évaluer les proportions de valeurs valides invalides, manquantes et aberrantes. Les techniques de visualisation des données, l'utilisation de formats communs et l'automatisation permettent d'obtenir des résultats efficaces et correctes. De plus, une documentation claire est essentielle pour mieux comprendre les méthodes utilisées afin d'explorer et valider les données.

(Le mot-symbole « Canada » s'affiche.)

Qu'avez-vous pensé?

S'il vous plaît nous donner vos commentaires afin que nous puissions mieux fournir des produits qui répondent aux besoins de nos utilisateurs.

Le cheminement des données : éléments d'une navigation réussie

Numéro de catalogue : 892000062020007

Date de diffusion : le 23 septembre 2020 Mise à jour : le 22 octobre 2021

Dans cette vidéo, vous apprendrez les étapes et les activités liées au cheminement des données, ainsi que les bases sur lesquelles il repose. Aucune connaissance préalable n'est requise.

Le cheminement des données représente les principales étapes du traitement des données. Le cheminement n'est pas nécessairement linéaire; il vise à représenter les différentes étapes et activités qui pourraient être entreprises en vue de convertir les données en renseignements utiles. Toutes les personnes qui utilisent les données n'exécuteront pas nécessairement toutes ces étapes.

Aucune connaissance préalable n'est requise.

Étape du parcours des données
Base
Compétence des données
  • Découverte des données
  • Gestion et organisation des données
Audience
Essentiel
Conditions préalables suggérées
s.o.
Durée
6:12
Coût
Gratuit

Voir la vidéo

Le cheminement des données : éléments d'une navigation réussie - Transcription

(Le symbole et le mots-symbole de Statistique Canada apparaissent sur l'écran: "Le cheminement des données : éléments d'une navigation réussie")

Le cheminement des données: Éléments d'une navigation réussie

Les vidéos de formation de cette série s'articulent autour du cheminement des données. Cette vidéo décrit les éléments d'une navigation réussie.

Objectifs d'apprentissage

(Text à l'écran: Étapes et activités du cheminement des données; Base du cheminement des données)

Dans cette vidéo, vous apprendrez quelles sont les étapes et les activités liées au cheminement des données, ainsi que les bases sur lesquelles il repose. Aucune connaissance préalable n'est requise.

Étapes du cheminement des données

(Text à l'écran: Étapes du cheminemnt des données est appuyé par une base d'intendance, de métadonnées, de normes et de qualité)

(Diagramme du Cheminement des données: Étape 1 - définir, trouver, recueillir; Étape 2 - explorer, nettoyer, décrire; Étape 3 - analyser, modéliser; Étape 4 - raconter l'histoire. Le cheminement des données est appuyé par une base d'intendance, de métadonnées, de normes et de qualité.)

Le cheminement des données représente les principales étapes du traitement des données. Ce cheminement n'est pas nécessairement linéaire, il vise à représenter les différentes étapes et activités qui pourraient être entreprises en vue de convertir les données en renseignements utiles.

Toutes les personnes qui utilisent des données ne exécuteront pas nécessairement toutes ces étapes. Par exemple, les données sur lesquelles vous travaillez ont peut-être déjà été recueillies et nettoyées. Elles sont donc prêtes à être analysées. Dans ce cas, vous n'auriez qu'à suivre les deux dernières étapes.

Étape 1 : Définir, trouver et recueillir

(Diagramme du Cheminement des données avec un attention sur « Définir, trouver, recueillir ».)

La première étape consiste à définir la question à laquelle vous devez répondre, ou la lacune statistique que vous devez combler. Vous devez ensuite trouver les données requises pour répondre à la question ou pour combler cette lacune. Si les données en question n'existent pas, vous devrez cherché un moyen de les recueillir. Cela pourrait être fait, par exemple, au moyen d'une nouvelle enquête.

Lors de cette première étape, vous mettrez à profit une ou plusieurs des compétences suivantes, découverte de données, collecte de données, gestion et organisation des données.

Étape 2 : Explorer, nettoyer et décrire

(Diagramme du Cheminement des données avec un attention sur « Explorer, nettoyer, décrire ».)

Une fois vos données en main, la prochaine étape consiste à mieux les connaître. Si vous avez déjà une certaine connaissance des données requises, vous saurez mieux à quoi vous attendre. Par contre, s'il s'agit de données qui sont nouvelles pour vous, prenez le temps d'étudier leur format et les variables et de repérer les éventuelles erreurs et valeurs manquantes. Il pourrait être nécessaire de nettoyer les données avant de les utiliser à des fins d'analyse. Il est important de documenter vos constatations ainsi que les mesures que vous avez prises pour nettoyer vos données.

À la fin de cette étape, les données seront prêtes à être analysées. À cette étape, vous utiliserez l'une des compétences suivantes ou les deux: nettoyage de données et exploration de données.

Étape 3 : Analyser et modéliser

(Diagramme du Cheminement des données avec un attention sur « Analyser, modéliser ».)

Si vous procédez à une analyse pour décrire un phénomène, tirer des conclusions au sujet d'une population, ou formuler des prédictions au sujet des événements futurs, le cheminement des données se poursuit. Le but de l'analyse et de la modélisation est d'utiliser des techniques statistiques pour transformer les données en renseignements afin d'en tirer des observations utiles qui permettent de combler les besoins en information tels que définis précédemment. À cette étape, vous utiliserez une ou plusieurs des compétences suivantes: analyse de données, modélisation de données et évaluation des décisions à prendre en fonction des données.

Étape 4 : Raconter l'histoire

(Diagramme du Cheminement des données avec un attention sur « Raconter l'histoire ».)

Les renseignements statistiques obtenus à la suite des travaux d'analyse et de modélisation sont plus faciles à assimiler s'ils sont présentés sous forme d'histoire ou de narration. Il peut s'agir d'un document de recherche, d'une infographie, d'un document d'information à l'intention de la direction ou d'une combinaison de ces méthodes et d'autres méthodes de présentation de données. À cette étape, vous utiliserez une ou plusieurs des compétences suivantes: interprétation de données, visualisation de données et narration.

Bâtissez votre cheminement des données sur des bases solides

(Diagramme simplifiée du cheminement des données supporté par 4 colonnes, représentant les 4 bases: intendance, métadonnées, normes, qualité.)

Pour suivre avec succès les étapes du cheminement des données, il est essentiel de bâtir votre travail sur des bases solides d'intendance, de métadonnées, de normes et de qualité.

L'intendance englobe toutes les activités visant à régir et à protéger les données.

Les métadonnées doivent décrire l'ensemble du traitement et des manipulations dont les données ont fait l'objet.

Les méthodes, les pratiques et les classifications standard doivent être appliquées tout au long du processus.

Et la qualité doit être gérée de façon proactive tout au long du processus et tous les produits livrables doivent être assortis d'indicateurs de qualité pertinent.

Résumé des points principaux

En résumé, voici les étapes du cheminement des données: Définir, trouver, recueillir; Explorez, nettoyer, décrire; Analyser et modéliser; puis Raconter l'histoire.

Les utilisateurs des données n'exécuteront pas nécessairement eux-mêmes toutes ces étapes. Par exemple, vous pourriez être en mesure d'obtenir des données qui ont déjà été recueillies et nettoyé et qui se prête immédiatement à une analyse. L'intendance, les métadonnées, les normes et la qualité représente autant de piliers qui sous-tendent l'ensemble du cheminement des données.

En apprendre davantage

Pour en apprendre davantage, vous pouvez visionner les autres vidéos de cette série dans l'ordre de votre choix. Si vous hésitez dans votre choix de la prochaine vidéo, nous vous recommendons de visionner celles portant sur les types de données et comment recueillir des données.

(Le mot-symbole « Canada » s'affiche.)

Qu'avez-vous pensé?

S'il vous plaît nous donner vos commentaires afin que nous puissions mieux fournir des produits qui répondent aux besoins de nos utilisateurs.

Que sont les données? Introduction à la terminologie et aux concepts relatifs aux données

Numéro de catalogue : 892000062020006

Date de diffusion : le 23 septembre 2020 Mise à jour : le 25 octobre 2021

Cette vidéo aborde des termes et des concepts relatifs aux données, comme les ensembles de données, les bases de données, la protection des données, les variables de données, les microdonnées et les macrodonnées, ainsi que les renseignements statistiques.

Aucune connaissance préalable n'est requise.

Étape du parcours des données
  • Base
Compétence des données
Sensibilisation aux données
Audience
Essentiel
Conditions préalables suggérées
s.o.
Durée
8:08
Coût
Gratuit

Voir la vidéo

Que sont les données? Introduction à la terminologie et aux concepts relatifs aux données - Transcription

(Le symbole et le mots-symbole de Statistique Canada apparaissent sur l'écran: "Que sont les données? Introduction à la terminologie et aux concepts relatifs aux données")

Que sont les données? Introduction à la terminologie at aux concepts relatifs aux données

Cette vidéo présentera certains concepts et termes de base relatifs aux données.

Objectifs d'apprentissage

Cette vidéo aborde des termes et des concepts relatifs aux données comme les ensembles de données, les bases de données, la protection des données, les variables de données, les microdonnées et les macrodonnées, ainsi que les renseignements statistiques. Aucune connaissance préalable n'est requise.

Étapes du cheminement des données

(Text à l'écran: Étapes du cheminemnt des données est appuyé par une base d'intendance, de métadonnées, de normes et de qualité)

(Diagramme du Cheminement des données: Étape 1 - définir, trouver, recueillir; Étape 2 - explorer, nettoyer, décrire; Étape 3 - analyser, modéliser; Étape 4 - Raconter l'histoire. Le cheminement des données est supporté par une base d'intendance, de métadonnées, de normes et qualité.)

Le cheminement des données représentent les étapes que les données doivent franchir pour que nous puissions raconter une histoire. Nous tenterons de répondre à la question, que sont les données en tenant compte de ces différentes étapes? Tout d'abord, examinons les données dans le contexte de la recherche, de la collecte et de la protection des données.

Que sont les données?

Les données sont des faits ou des chiffres qui portent sur un objet ou un phénomène. Les objets existent et les phénomènes se produisent tout simplement. Ce sont les gens qui créent des données. Nous mesurons, comptons,observons et décrivons les éléments qui nous entourent. Nous consignons ce que nous trouvons au moyen de symboles et d'images. Voilà ce que sont les données.

D'où viennent les données?

D'où viennent les données? Les données viennent de partout. Par exemple, les médecins recueillent des données sur notre santé et notre bien-être. Les commerces recueillent des données sur nos achats. Les enquêtes permettent de recueillir des données sur nos habitudes. Les scientifiques recueillent des données sur les conditions climatiques telles que la température et la vitesse du vent. Ces données sont parfois appelées données d'observation de la terre. Ce ne sont là que quelques exemples. En cette ère numérique, les données sont littéralement littéralement partout autour de nous.

Comment les données sont-elles organisées?

Les données peuvent être organisées de façon structurées, notamment au moyen de tableaux, graphiques, cartes. Les données peuvent aussi être organisées de façon non structurées, c'est-à-dire lorsqu'elles sont dans des textes ou des documents.

Protection des données

Les administrateurs de données ont la responsabilité d'être de bons intendants et d'assurer la protection, la confidentialité, et la sécurité des renseignements personnels identificatoires. Les renseignements personnels identificatoires comprennent notamment tout renseignement qui permettraient d'identifier directement ou indirectement une personne, une entreprise ou une organisation.

Étapes 2: Explorer, nettoyer et décrire

(Diagramme du Cheminement des données avec un attention sur l'Étape 2 - explorer, nettoyer, décrire.)

Maintenant, examinons les données dans la prochaine étape de leur cheminement. Quand nous avons des données, nous voulons les explorer. Si nous trouvons des erreurs dans les données, nous essayons de les corriger.

Ensemble de données et bases de données

À quoi ressemble les données dans ces cas? Les données sont souvent organisées en tableau, composées de lignes et de colonnes. Lorsqu'ils sont en format électronique, ils sont appelés "ensembles de données". Un ensemble de données organisé à une fin particulière est parfois appelé "base de données". Il existe des progiciels pour gérer les bases de données comme Oracle, SQL et Microsoft Access.

Bases de données relationnelles

Une base de données relationnelle, est une collection organisée de ensemble de données qui sont liés les un aux autres en fonction de valeurs clés. Par exemple, une base de données relationnelle sur un système scolaire pourrait contenir un ensemble de données répertoriant des listes d'école, un autre comprenant les classes dans les écoles et un autre portant sur les élèves dans les classes. Il existe une façon de relier tous les ensembles de données dans une base de données relationnelle. Dans cet exemple, il pourrait y avoir une variable d'identification pour une école dans les 3 ensembles de données afin qu'il soit possible de trouver l'ensemble des classes et des élèves associé à une école particulière.

Que contient un ensemble de données?

Les données réelles dans un ensemble ou une base de données sont organisées en variable. Certaines des variables représentent les mesures, les chiffres, les observations ou les descriptions dont nous avons parlé plustôt. D'autres variables permettent d'identifier ce qui a été mesuré, compté, observé, ou décrit. Les données ou un enregistrement ou une ligne représente une unité d'observation sont appelés microdonnées. Il est fortement recommandé d'explorer et de nettoyer le microdonnées avant de les analyser ou de les utiliser à d'autres fins. Pour ce faire, il faut appliquer des méthodes statistiques de base aux variables de microdonnées. Pour obtenir de plus amples renseignements, regarder les vidéos sur la tendance centrale et là dispersion.

Étape 3: Analyser et modéliser

(Diagramme du Cheminement des données avec un attention sur l'Étape 3 - analyser, modéliser.)

Pour découvrir les relations entre les variables où trouver des tendances au fil du temps, nous devons analyser les microdonnées nettoyées. L'étape d'analyse est aussi appelé modélisation, établissement d'inférence et analyse des données.

Pour en savoir plus sur l'analyse des données, regarder la série de vidéos analyse 101.

Différents états des données

Voici une façon pratique de résumer les différents états des données. Les microdonnées désignent des ensembles de données dans lesquelles un enregistrement représente une unité d'observation.

Les microdonnées sont des unités élémentaires, qu'il s'agisse d'utiliser des données pour fournir des services, faire respecter des règlements, répondre à des questions de recherche ou créer des politiques.

Les macrosdonnées désignent des ensembles de données dans lesquelles des enregistrements ont été regroupés ou agrégés. L'analyse statistique, ou l'analyse des données peut être réalisée à partir de microdonnées ou de macrodonnées nettoyées.

Les métadonnées comprennent la documentation ou les renseignements contextuels et facilitent l'utilisation appropriée des données.

Étape 4: Raconter l'histoire

(Diagramme du Cheminement des données avec un attention sur l'Étape 4 - Raconter l'histoire.)

L'analyse statistique ou l'analyse des données est une façon de produire des renseignements statistiques. La dernière étape du cheminement des données consiste à raconter l'histoire qui se forme à partir des renseignements statistiques.

Renseignements statistiques

Les renseignements statistiques sont bien différents des données originales sur lesquels ils sont fondées. Les données ont été synthétisées et transformées pour mettre en lumière des renseignements difficile à discerner dans les microdonnées. Les renseignements statistiques qui proviennent de l'analyse et de la modélisation sont plus faciles à comprendre s'ils sont présentés sous forme d'histoire. Elle peut être racontée sous forme de document de recherche, d'infographie, d'articles dans les médias, de produits de visualisation des données, ou d'une combinaison de ces méthodes et d'autres méthodes de présentation des données.

Résumé des principaux points

Les données sont des faits ou des chiffres sur un objet ou un phénomène. Les variables des données sont stockées dans un ensemble de données. Les administrateurs de données ont la responsabilité d'assurer la protection, la confidentialité et la sécurité des renseignements identificatoires. L'analyse statistique ou l'analyse des données est réalisée à partir de microcrodonnées, ou de macrodonnées nettoyées aux fins de production de renseignements statistiques. Les renseignements statistiques permettent de raconter l'histoire des données.

En apprendre davantage

Pour en apprendre davantage sur les données, jeter un coup d’œil aux vidéos portant sur le cheminement des données, les types de données et la collecte des données.

(Le mot-symbole « Canada » s'affiche.)

Qu'avez-vous pensé?

S'il vous plaît nous donner vos commentaires afin que nous puissions mieux fournir des produits qui répondent aux besoins de nos utilisateurs.

Recueillir des données : éléments à prendre en considération avant de recueillir des données

Numéro de catalogue : 892000062020005

Date de diffusion : le 23 septembre 2020 Mise à jour : le 25 november 2021

À la fin de cette vidéo, vous devriez comprendre comment déterminer les données dont vous avez besoin, où trouver les données, comment recueillir les données (qu'elles proviennent de sources existantes ou d'une enquête à mener) et comment assurer la sécurité des données.

Prenez note que le fait de recueillir des données dans le cadre d'une enquête est habituellement appelé la collecte des données.

Étape du parcours des données
Définir, trouver, recueillir
Compétence des données
Collecte des données
Audience
Essentiel
Conditions préalables suggérées
s.o.
Durée
7:39
Coût
Gratuit

Voir la vidéo

Recueillir des données : éléments à prendre en considération avant de recueillir des données - Transcription

(Le symbol de Statistics Canada et le mot-symbol du Canada est présent avec le titre suivant: "Recueillir des données : éléments à prendre en considération avant de recueillir des données")

Recueillir des données: Éléments à prendre en considération avant de recueillir des données

La collecte de données consiste d'abord à déterminer les données dont vous avez besoin, puis à savoir où les trouver, comment les obtenir et comment assurer leur sécurité. Cette vidéo vous présente les éléments dont vous devriez tenir compte au moment de recueillir des données.

Objectifs d'apprentissage

À la fin de cette vidéo, vous devriez comprendre comment déterminer les données dont vous avez besoin, où trouver les données, comment recueillir les données qu'elles proviennent de sources existantes, ou d'une enquête à mener et comment assurer la sécurité des données. Prenez note que le fait de recueillir des données dans le cadre d'une enquête est habituellement appelé la collecte des données.

Étapes du cheminement des données

(Text à l'écran: Étapes du cheminemnt des données est appuyé par une base d'intendance, de métadonnées, de normes et de qualité)

(Diagramme du Cheminement des données: Étape 1 - définir, trouver, recueillir; Étape 2 - explorer, nettoyer, décrire; Étape 3 - analyser, modéliser; Étape 4 - Raconter l'histoire. Le cheminement des données est supporté par une base d'intendance, de métadonnées, de normes et qualité.)

Ce diagramme est une représentation visuelle du cheminement des données, de la collecte des données à l'exploration, au nettoyage, à la description et à la compréhension des données, à l'analyse des données et enfin à la communication avec les autres de l'histoire que racontent les données.

Étapes 1: Chercher, recueillir et protéger

(Diagramme du Cheminement des données avec un attention sur l'Étape 1 - Chercher, Receuillir, Protéger.)

Le fait d'examiner la façon de recueillir des données fait partie de l'étape de la recherche, de la collecte et de la protection des données au cours du cheminement des données. Certaines données sont recueillies à des fins statistiques ou de recherche. Dans d'autres cas, les données sont recueillies à des fins réglementaires, ou pour fournir un service personnalisé aux canadiens et canadiennes. Quel que soit le but de la collecte des données, les aspects à prendre en considération sont semblables.

Déterminer les données dont vous avez besoin

La première chose à prendre en considération avant de recueillir des données, c'est de bien articuler les questions auxquelles vous essayer de essayez de répondre. A propos de qui voulez-vous tirer des conclusions? S'agit il de toute la population canadienne ou de toutes les entreprises d'un certain secteur de l'économie? Il s'agit de la population cible.

Ensuite, quelle est l'unité individuelle que vous voulez examiner? S'agit il d'une personne, d'une famille, d'un ménage ou d'une entreprise? C'est ce que l'on appelle l'unité d'observation. Quelle est la période que vous voulez examiner? Voulez-vous examiner une seule période? Ou voulez-vous avoir des données pour plusieurs périodes? Ensuite, de quel niveau de qualité avez-vous besoin dans les données?

Lorsqu'on examine différentes sources, il faut tenir compte de la façon dont les données ont été créés et de la raison pour laquelle elles ont été. Cela va-t-il appuyer le niveau d'analyse que vous voulez faire? Quelles sont les caractéristiques ou les attributs qui vous intéressent? Sont-ils tous disponibles dans une seule source de données? Ou allez-vous devoir utiliser deux ou plusieurs sources de données différentes? Il est important de savoir dès le départ ce que vous cherchez, puis d'évaluer toutes les sources de données potentielles en fonction de ces critères lorsque vous décidez lesquelles utiliser.

Où trouver les données

Les sources ouvertes sont le premier endroit où chercher des données. Le gouvernement du Canada met à la disposition de tous les canadiens et toutes les canadiennes des données en abondance dans le portail de données ouvertes. Statistique Canada a des fichiers de microdonnées à grande diffusion des produits de données agrégées et de nombreux produits de de données gratuit à télécharger. Les sources en ligne sont également une option. D'autres sources de données sont également disponibles, mais avec certaines restrictions quant aux personnes qui peuvent les utiliser, ou moyennant un coût. Statistique Canada offre aux chercheurs l'accès aux données par l'entremise des centres de données de recherche.

Statistique Canada offre également un accès à distance aux données sous certaines conditions. Sous certaines conditions, les fournisseurs de services comme les compagnies d'internet et d'électricité offrent des produits de données, parfois contre rémunération. Si aucune données existantes ne répond à vos besoins, vous pouvez faire une enquête pour recueillir de nouvelles données.

En dernier recours, nous voulons insister sur le fait que la réalisation d'une enquête devrait être un dernier recours. C'est de loin l'option la plus coûteuse et la plus complexe pour recueillir des données. Pour en savoir plus sur la façon de mener une enquête, veuillez consulter le cours les enquêtes de A à Z code 10H0085 sur le site web de Statistique Canada.

Comment recueillir les données

La première étape de la collecte des données consiste à préparer un plan. Le plan doit préciser là où les sources de données qui sont utilisées et toutes les étapes à suivre pour obtenir les données, par exemple, quelles sont les étapes si un protocole doit être suivie? Est-il nécessaire de négocier avec le propriétaire des données? Estimer le temps qu'il faudra pour obtenir les données et le coût en ce qui concerne les frais, s'il y a lieu et les coûts d'entreposage. Tenez compte des compétences requises pour recueillir les données. Le plan pourrait comprendre une analyse de rentabilisation pour expliquer une demande de financement. Les données peuvent être structurées, c'est-à-dire qu'elles sont déjà dans une base de données quelconque ou dans un format ou les variables sont séparées. Ou elles peuvent être non structurées comme des données de capteurs ou des données de moissonnage du web, qui nécessiteront une certaine manipulation pour être converti en un format utilisable.

soient repérés. Une fois les données recueillies, les prochaines étapes cheminement des données.

Assurer la sécurité des données

indirectement, des sources d'information. La transparence de vos processus. assurer que vous respectez les exigences en matière de protection des exigences en matière de protection des renseignements personnels et de sécurité.

Consultez les ainsi que les politiques et lignes directrices de votre organisme en matière de protection des renseignements personnels et de sécurité dans le cadre de votre exercice de collecte des données.

Résumé des principaux points

En dernier recours faites une enquête pour recueillir de nouvelles données. Établissez un plan pour toutes les étapes de la collecte des données, assurez-vous de protéger les renseignements personnels et d'assurer la sécurité des données.

(Le mot-symbole « Canada » s'affiche.)

Qu'avez-vous pensé?

S'il vous plaît nous donner vos commentaires afin que nous puissions mieux fournir des produits qui répondent aux besoins de nos utilisateurs.