Étapes du cheminement des données
Le cheminement des données représente les étapes clés du processus appliqué aux données, allant de la recherche et de l'exploration des données jusqu'à la présentation de l'histoire des données.
Le cheminement des données représente les étapes clés du processus appliqué aux données. Le cheminement n'est pas nécessairement linéaire; il vise à représenter les différentes étapes et activités qui pourraient être entreprises en vue de produire de l'information significative à partir des données.
Étape 1 : Définir, trouver, recueillir
La première étape consiste à obtenir des données, qu'il s'agisse d'utiliser une base de données préétablie ou d'établir les variables nécessaires et de créer et mettre en œuvre une méthode de collecte. Des mesures de sécurité devraient être établies et mises en œuvre pour protéger l'intégrité des données une fois qu'elles ont été recueillies.
Les compétences suivantes s'appliquent à cette étape : la découverte, la collecte, la gestion et l'organisation des données.
Étape 2 : Explorer, nettoyer, décrire
Il faut explorer les données pour comprendre le format et les variables et les vérifier pour voir s'il y a des erreurs et des valeurs manquantes. Il peut être nécessaire de nettoyer les données avant de les utiliser à des fins d'analyse, ce qui comprend notamment la correction du formatage, le retrait ou la correction de données erronées, ou tout simplement le retrait d'espace supplémentaire. Il est important de documenter ce que vous avez trouvé et ce que vous avez fait pour nettoyer les données.
Les compétences suivantes s'appliquent à cette étape : le nettoyage et l'exploration des données.
Étape 3 : Analyser, modéliser
Le but de l'analyse et de la modélisation est d'utiliser des techniques statistiques pour transformer les données en information afin de fournir des observations utiles. L'analyse et la modélisation servent à décrire un phénomène, à tirer des conclusions au sujet d'une population ou à faire des prédictions au sujet d'événements futurs.
Les compétences suivantes s'appliquent à cette étape : l'analyse et la modélisation des données, et/ou l'évaluation de décisions en fonction des données.
Étape 4 : Raconter l'histoire
L'information statistique qui provient de l'analyse et de la modélisation est plus facile à assimiler si elle est présentée sous forme d'histoire. Il peut s'agir d'un document de recherche, d'une infographie, d'un article pour les médias ou d'une combinaison de ces méthodes et d'autres méthodes de présentation des données.
Les compétences suivantes s'appliquent à cette étape : l'interprétation et la visualisation des données, et/ou l'histoire des données.
Connaissance et compétences de base : intendance, métadonnées, normes et qualité
Pour suivre avec succès les étapes du cheminement des données, il est essentiel de bâtir votre travail sur une base solide d'intendance, de métadonnées, de normes et de qualité.
- L'intendance englobe toutes les activités visant à régir et à protéger les données.
- Les métadonnées devraient décrire l'ensemble du traitement et des manipulations dont les données ont fait l'objet.
- Les méthodes, les pratiques et les classifications standards devraient être appliquées tout au long du processus.
- La qualité devrait être gérée de façon proactive tout au long du processus et tous les produits livrables doivent être assortis d'indicateurs de qualité pertinents.