Qualité des données en six dimensions

Numéro de catalogue : 892000062020001

Date de diffusion : le 23 septembre 2020 Mise à jour : le 2 november 2021

Nous sommes exposés aux données tous les jours, par exemple, dans les bulletins de nouvelles, les bulletins météorologiques et la publicité, mais comment savons-nous si ces données sont de bonne qualité?

Dans cette vidéo, on vous présentera les fondements de la qualité des données, qui peuvent se résumer en six dimensions, ou six façons différentes de penser à la qualité. Vous apprendrez également comment chaque dimension peut être utilisée pour évaluer la qualité des données.

Vous en apprendrez davantage sur les concepts de qualité de base, la qualité des données exprimée en six dimensions et les interactions entre ces dimensions.

Cette vidéo s'adresse aux personnes apprenantes qui veulent acquérir une compréhension de base de la qualité des données. Aucune connaissance préalable n'est requise.

Étape du parcours des données
Fondation
Compétence des données
Évaluation de la qualité des données
Audience
Essentiel
Conditions préalables suggérées
s.o.
Durée
9:59
Coût
Gratuit

Voir la vidéo

Qualité des données en six dimensions - Transcription

(Le symbol de Statistics Canada et le mot-symbol du Canada est présent avec le titre suivant: "Qualité des données en six dimensions")

Qualité des données en 6 dimensions: Évoluer les données et en assurer la qualité

Nous sommes exposés aux données tous les jours, par exemple dans les bulletins de nouvelles, les bulletins météorologiques et la publicité. Mais comment savons nous si ces données sont de bonne qualité? Dans cette vidéo, on vous présentera les aspect fondamentaux de la qualité des données qui peuvent se résumer en 6 dimensions ou en 6 façons distinctes de penser à la qualité. Vous apprendrez également comment chaque dimension peut être utilisé pour évaluer la qualité des données.

Objectifs d'apprentissage

À la fin de cette vidéo, vous en saurez davantage sur le concept de qualité de base, la qualité des données exprimées en 6 dimensions et les interactions entre celles-ci. Cette vidéo s'adresse aux personnes qui souhaitent acquérir une compréhension de base de la qualité des données. Aucune connaissance préalable n'est requise.

Étapes du cheminement des données

(Text à l'écran: Étapes du cheminemnt des données est appuyé par une base d'intendance, de métadonnées, de normes et de qualité)

(Diagramme du Cheminement des données: Étape 1 - définir, trouver, recueillir; Étape 2 - explorer, nettoyer, décrire; Étape 3 - analyser, modéliser; Étape 4 - Raconter l'histoire. Le cheminement des données est supporté par une base d'intendance, de métadonnées, de normes et qualité.)

Ce diagramme est une représentation visuelle du cheminement des données, de la collecte des données à l'exploration  au nettoyage, à la description et à la compréhension des données, à l'analyse des données et enfin à la communication avec les autres de l'histoire que racontent les données. Vous remarquerez que la qualité des données n'est pas comprise dans une étape précise du processus. C'est plutôt un élément qui est important tout au long du cheminement des données.

Qualité

(Diagramme des six dimensions des données: Pertinence, Exactitude, Actualité, Intelligibilité, Cohérence, Accessibilité)

Les 6 dimensions de la qualité des données. La pertinence, l'exactitude, l'actualité l'intelligibilité, la cohérence, l'accessibilité. Chaque dimension sera examinée séparément dans les prochaines diapositives.

Pertinence

La pertinence des données ou des renseignements statistiques représentent la mesure dans laquelle ils répondent aux besoins des utilisateurs de données et des intervenants. Pour vérifier la pertinence d'un produit de données, vous devriez vous demander si cette information est importante? A Statistique Canada, il nous incombe de fournir aux canadiens et canadiennes des renseignements qui comptent. Autrement dit, les renseignements sont-ils utiles pour élaborer des politiques? Facilitent-ils la planification à long terme? Comblent-il une lacune statistique? Permettent-ils de promouvoir de nouvelles initiatives qui profiteraient à la population canadienne? Est-il à améliorer les services? Quelle question poseriez vous pour vérifier la pertinence de vos données?

Exactitude

Des données exactes reflètent fidèlement la réalité.

Demandez-vous si ce qui est mesuré correspond vraiment à la vérité.

Actualité

L'actualité désigne l'intervalle entre le moment où les données sont utiles et celui où elles sont disponibles. Par exemple, les administrations responsables des autobus scolaires ont besoin de prévisions météorologiques à jour très tôt le matin pour prendre de bonnes décisions quant à l'annulation des autobus scolaires. De même, les parents doivent être au courant des annulations d'autobus scolaire avant de se rendre au travail. L'actualité est étroitement liée à l'exactitude et à la pertinence.

Intelligibilité

Les renseignements que les gens ne peuvent pas comprendre, ou qui peuvent facilement mal interprété, n'ont aucune valeur et pourrait même induire en erreur. Pour éviter de tels malentendus, des renseignements ou des documents supplémentaires, appeler métadonnées, doivent toujours accompagner n'importe quel ensemble de données, car il permet aux utilisateurs de interpréter les données correctement.

Cohérence

La cohérence peut être divisée en deux concepts, la correspondance et la similarité. La correspondance signifie l'utilisation des mêmes concepts, définitions et méthodes au fil du temps. La similarité signifie l'utilisation dans différents programmes statistiques de concept de définitions et de méthodes identiques ou semblables. S'il y a une bonne correspondance et une bonne similarité, il est plus facile de comparer les résultats de différentes études. Ou d'en faire le suivi? En ce qui concerne la qualité des données, la cohérence et la capacité à établir des comparaisons entre les villes, les régions, les périodes, et cetera.

Accessibilité

La dernière dimension de la qualité est l'accessibilité, ce qui signifie que les gens connaissent l'existence des données et y ont accès. Lorsque vous vérifiez si les données sont accessibles, assurez vous qu'elles sont organisées. Un système ou un catalogue permet aux utilisateurs de trouver toutes les données disponibles. Disponible une fois que l'emplacement d'une source de données, a été déterminé, un moyen uniforme d'accéder à ses données doit également être fournies.

Imputable, un producteur de données est tenu d'aider les utilisateurs qui éprouvent des difficultés ou de l'insatisfaction à l'égard de tout aspect de l'accès aux données. Abordable, à quoi servent les données les plus fiables si, vous n'avez pas les moyens de les utiliser?

Application des dimensions de la qualité

Imaginez que vous êtes propriétaire d'une pizzeria et que vous envisagez d'agrandir votre entreprise en ouvrant un 2e commerce dans la région de Toronto. Quels genres de données pourraient vous aider à prendre votre décision et où pourriez-vous les trouver?

(Text à l'écran: Les types de question pour fonder un restaurant à Toronto. 1) Quels genres de données pourraient voud aider à prednre votre décision? Où pourriez-vous trouver ces renseignements à un coût relativement faible? Comment pourriez-vous vérifier l'exactitude, l'actualité, l'intelligibilité et la cohérence des données?

Pertinence des données

Pour ouvrir un 2e commerce à Toronto, il vous faudrait consulter des renseignements sociaux et économiques sur la ville, notamment ceux portant sur les profils de quartiers, le développement commercial et l'aide à la localisation. L'emploi et les habitudes de dépenses des ménages, les subventions, les incitatifs et les remises. Les festivals, les événements, les parcs et les plages, les plans de développement municipaux.

Accessibilité des données

Le fait de pouvoir accéder à des données fiables vous permettra de prendre une décision éclairée au sujet de l'ouverture d'un 2e commerce et d'évaluer sa croissance potentielle au fil du temps. Dans l'idéal, ces données sont bien organisées, elles sont facilement accessibles. Elles sont gratuites, ou peu coûteuses et elles proviennent de sources fiables, comme le site de données ouvertes du gouvernement fédéral. Le site du ministère des Finances de l'Ontario. Le portail de données ouvertes de la ville de Toronto. Qu'est-ce qui rend ces sites si accessible?

Il possède de nombreuses caractéristiques. Ils sont souvent ouverts défaut. Ils sont à base de menu. Ils ont des galeries d'applications. Ils ont des licences du gouvernement ouvert. Ils ont des répertoires de données ouvertes. Ils ont une interface de programmation d'applications. Ils offrent leurs contenus dans les deux langues officielles. Cette dernière caractéristique concerne seulement les sites fédéraux et provinciaux.

(Texte à l'écran: accès au site mentionner dernièrement sont: le site de données ouvertes du gouvernement fédéral: https://open.canada.ca/fr/; le site du ministère des Finances de l'Ontario: https://www.fin.gov.ca/; le portail de données ouvertes de la ville de Toronto (en anglais seulement): https://www.toronto.ca/

Exactitude des données

Grâce à des données exactes, vous serez en mesure de faire des calculs précis pour prévoir les coûts, les revenus et le succès possible d'un nouveau restaurant. Le succès de votre nouveau restaurant dépendra de l'exactitude de vos projections financières, qui auront été bien planifié et établi à partir d'études crédibles et de données de qualité.

Actualité des données

(Tableau de données titulé: Population historique et projetée de l'Ontario par division de recensement, certaines années - scénario de référence)

Les données ont tendance à avoir une plus grande valeur lorsqu'elles sont diffusées de façon cohérentes à un moment propice ou utile. La diffusion des données sur la population projetée selon la région donne aux restaurateurs une idée des endroits susceptibles d'afficher une croissance démographique.

Intelligibilité des données

Les sites de données ouvertes facilitent l'interprétation des données en les rendant intelligible de plusieurs façons. Ils mettent en place un format normalisé ou une interface conviviale. Ils offrent aux utilisateurs une façon cohérente d'accéder aux données, de les consulter et de les interpréter. Ils intègrent une variété de données dans un seul outil de visualisation afin de les rendre faciles à interpréter. Ils facilitent l'accès à la documentation et aux données supplémentaires pour fournir aux utilisateurs le contexte lié aux ensembles de données. Les notes, les renvois et les sources figurent à même les tableaux. Les sites utilisent des outils de visualisation des données comme des tableaux, des infographies ou des graphiques, ce qui facilitent l'interprétation des données.

Cohérence des données

(Image des faits saillants socio-économiques du recenssement 2016 au centre Scarborough (Quartier de Toronto numéro 21)

Les mesures comparatives des taux d'emploi et des niveaux de revenus et de scolarité sont d'importants indicateurs de la situation économique et du succès possible d'un nouveau restaurant. Le portail de données ouvertes de la ville de Toronto présente des affichages prédéfinis qui intègrent une analyse de cohérence. Chaque affichage permet aux utilisateurs de comparer les données d'un quartier avec celle de l'ensemble de la ville et des autres quartiers, et ce, au moyen d'un seul outil de visualisation.

Résumé des principaux points

Les données peuvent être un outil décisionnel très puissant. Cependant, lorsqu'elles sont mal utilisées, elles peuvent s'avérer trompeuses. En appliquant les 6 dimensions de la qualité, vous pourrez choisir une source de données de haute qualité qui répondra à vos besoins.

Il est possible d'atteindre un niveau de qualité acceptable en assurant un bon équilibre entre les 6 dimensions, à savoir la pertinence, l'exactitude, l'actualité, le intelligibilité, la cohérence et l'accessibilité.

(Le mot-symbole « Canada » s'affiche.)

Qu'avez-vous pensé?

S'il vous plaît nous donner vos commentaires afin que nous puissions mieux fournir des produits qui répondent aux besoins de nos utilisateurs.