Visualisation des données : une introduction - Transcription
(Le symbole et le mots-symbole de Statistique Canada apparaissent sur l'écran : « Visualisation des données : une introduction »)
Visualisation des données
Bienvenue à la première partie d'une série sur la visualisation des données. Cette vidéo donne un aperçu de la visualisation des données et de la façon de l'utiliser pour raconter votre histoire.
Objectifs d'apprentissage
Cette vidéo traite des compétences en matière de visualisation des données. À la fin de cette vidéo, vous devriez avoir une compréhension plus approfondie de ce qu'est la visualisation des données et de la façon dont elle peut être utilisée pour présenter les données d'une manière intéressante et esthétique.
Nous vous indiquerons quand elle devrait être utilisée et vous donnerons des exemples des différents types de techniques de visualisation des données qui existent.
Étapes du cheminement des données
Ce diagramme est une représentation visuelle du cheminement des données, de la collecte des données à l'exploration, au nettoyage, à la description et à la compréhension des données, à l'analyse des données et, enfin, à la communication avec les autres de l'histoire que racontent les données.
Étape 4 : Raconter l'histoire
La visualisation des données peut se produire à différentes étapes du cheminement des données, en fonction de l'utilisation que vous en faites. Dans cette vidéo, nous nous concentrerons principalement sur la façon de présenter les données d'une manière qui aide à raconter l'histoire.
Visualisation des données
(Diagramme du Cheminement des données : Étape 1 - définir, chercher, recueillir; Étape 2 - explorer, nettoyer, décrire; Étape 3 - analyser, modéliser; Étape 4 - Raconter l'histoire. Le cheminement des données est supporté par une base d'intendance, de métadonnées, de normes et qualité).
La visualisation des données est la représentation graphique de l'information et des données.
Il s'agit d'une combinaison entre l'art et la science, car elle utilise des outils comme des tableaux, des graphiques et des cartes pour souligner des tendances et des modèles qui pourraient être cachés dans un grand ensemble de données et les rendre beaucoup plus faciles à comprendre.
Pourquoi utiliser la visualisation des données?
Mais comment la visualisation des données facilite-t-elle la compréhension des tendances et des modèles?
La vision est un élément très important de notre expérience du monde. C'est peut-être grâce à elle que nous avons toujours survécu, que nous trouvons de la nourriture, que nous évitons des menaces, que nous créons de l'art qui préserve notre culture et notre histoire.
Puisque le cerveau absorbe et traite l'information visuelle plus rapidement que tout autre stimulus, la présentation de l'information au moyen de graphiques peut être incroyablement efficace.
Comme la technologie évolue, il est logique que la façon dont nous présentons l'information que nous essayons de partager avec le monde évolue elle aussi.
Présentation des données
(Une série d'image où, débutant de la gauche, une tarte aux pommes, tarte aux cerises, tarte aux bleuets, tarte d'une autre saveur et une tarte avec le visage d'émojie qui louche avec la langue sortie).
Par exemple, pensez à la question suivante: quelle est la saveur de tarte la plus populaire? Si vous vouliez vraiment connaître la saveur de tarte la plus populaire dans votre ville natale, vous pourriez décider de mener un sondage. Dans le cadre de ce sondage, On demanderait à tous les habitants de la ville quelle saveur de tarte ils préfèrent: pommes? Cerises? Bleuets? Une autre saveur? Et enfin, une option pour les personnes qui n'aiment tout simplement pas la tarte. Une fois que vous avez recueilli vos données, il y a plusieurs façons de communiquer les résultats.
Option 1 : Texte
La première option est le texte. Vous pourriez envisager de rédiger un rapport qui décrit les chiffres et qui se lirait à peu près comme suit: « Parmi les 100 personnes interrogées, 40 préfèrent la tarte aux pommes, 30 la tarte aux Bleuets et 20 la tarte aux cerises. De plus, 5 personnes ont choisi une saveur autre que celles qui figuraient sur la liste et 5 ont dit ne pas aimer la tarte. »
Option 2 : Tableau
(Image d’un tableau où la colonne de gauche contient les différentes saveurs de tarte et où la colonne de droite contient le nombre de répondants de chaque saveur respective : pommes = 40, bleuets = 30, cerises = 20, autre = 5, je n’aime pas la tarte = 5, total = 100).
Dans cette situation, où nous essayons simplement de découvrir la saveur de tarte la plus populaire, nous pourrions décider que la lecture d'une analyse complète des résultats n'est pas nécessaire. Il pourrait donc être préférable de privilégier l'option de recevoir exactement les mêmes résultats dans un tableau. Quand on lit un tableau, on se concentre sur les chiffres. Ici, on voit bien que la plupart des gens préfèrent la tarte aux pommes, sans avoir à prendre le temps de lire beaucoup de texte. Donc, il est bon de noter que lorsque vous essayez de comparer plus de 2 nombres, vous voudrez probablement envisager de présenter vos données d'une manière plus visuelle que textuelle.
Option 3 : Visualisation
(Une série d'image avec 4 tartes aux pommes, 3 tartes aux bleuets, 2 tartes aux cerises, la moitié d'une tarte pour ceux qui aime une autre saveur et l'autre moitié pour ceux qui n'aime pas la tarte).
Une 3e façon de présenter les résultats de notre sondage sur les saveurs de tarte est de ne pas utiliser beaucoup de mots ou de chiffres. La 3e option est la visualisation des données. À partir de cette image, on constate immédiatement que la tarte aux pommes est la plus populaire.
Types de visualisation des données
(Série d'images simplifiés des différents types de visualisation des données : (Gauche) Diagrammes, Graphiques, Cartes, Tableaux, Graphiques figuratif, Infographies, Tableaux de bord (Droite)).
Il existe de nombreuses façons de présenter visuellement les données, comme des diagrammes, des graphiques, des cartes, des tableaux, des graphiques figuratifs, des infographies et des tableaux de bord. Dans les prochaines diapositives, nous verrons les éléments de chacune de ces options.
Nuage de points
(Texte à l’écran : Démontrer la relation entre deux valeurs).
(Image d'un nuage de point avec le titre suivant : « Revenu total des ventes de crème glacée, 2019 ($CAN) ». L'axe verticale(y) représente les revenus ($) et l’axe horizontale(x) représente la température (Celsius)).
Un nuage de points est excellent pour illustrer la relation entre 2 choses. Dans ce diagramme, on peut manifestement voir la relation entre la température, sur l'axe horizontal, et les ventes de crème glacée, sur l'axe vertical. On peut constater que les revenus liés à la vente de crème glacée augmentent, avec l'augmentation de la température.
Graphique linéaire
(Texte à l'écran : Montrer les tendances au fil du temps).
(Image d'un graphique linéaire avec le titre suivant : « Le seuil officiel de pauvreté au Canada ». L'axe verticale(y) et horizontale(x) représentent la proportion de la population (%) et l'année respectivement).
Un graphique linéaire est une bonne façon de montrer les fluctuations d'une chose au fil du temps. Celui-ci montré comment le taux de pauvreté au Canada a diminué au cours des dernières années, passant de 12,1% en 2015 à 8,7% en 2019.
Graphique à barres
(Texte à l'écran : Faire une comparaison entre plusieurs choses).
(Image d'un graphique à barres avec le titre suivant : « La consommation de cannabis au cours des trois derniers mois selon l'âge, Canada - Quatrième trimestre de 2019 ». L'axe verticale (y) représente la proportion de la population de consommateurs de cannabis (%) et l’axe horizontale (x) représente le groupe d'âge. De la bande à gauche à la bande à droite, elles représentent les groupes d'âges : « 15 à 24 », « 25 à 34 », « 35 à 44 », « 45 à 54 », « 55 à 64 » et « 65 et plus »).
Un graphique à barres est préférable lorsque vous voulez comparer différents groupes de valeurs. On compare ici la consommation de cannabis chez les Canadiens selon la tranche d'âge. Le graphique montre clairement que la consommation de cannabis est plus élevée chez les plus jeunes que chez les plus âgés.
Graphique circulaire
(Texte à l'écran : Montrer la composition d'un tout).
(Image d'un graphique circulaire avec le titre suivant : « Six provinces ont cultivé des raisins « vinifera et hybride français » pour la vinification en 2018 – 69% de la production totale provient de l’Ontario ». Le graphique circulaire est composé de 3 tranches asymétriques).
Un graphique circulaire est l'outil idéal pour montrer la composition d'un tout, ou la répartition d'une chose. Ici, on constate qu'en 2018, l'Ontario a produit plus de raisins destinés à la vinification que toutes les autres provinces réunies.
Cartes
(Texte à l'écran : Placer les données dans un contexte géographique).
(Image de la carte du Canada où chaque province possèdent un gradient de bleu différent représentant le taux de chômage où le bleu foncé représente un taux élevé. Les régions noires n'ont pas de collecte de données).
Voici un exemple de carte utilisée aux fins de la visualisation de données. Elle montre comment les taux de postes vacants diffèrent d'une province à l'autre. Le taux de postes vacants pour chaque province au Canada est indiqué sur la carte à l'aide de dégradé de couleurs.
Tableaux
(Texte à l'écran : Tableaux : Utilisés pour montrer plusieurs catégories et fournir plus de détails et de précision que de nombreuses autres méthodes de visualisation des données).
(Image d'un tableau où sur la colonne de gauche est la liste de groupes d'âge des enfants. La colonne du milieu et la colonne de droite représentent « Toutes les familles avec des enfants » et « Total des enfants dans toutes les familles » respectivement. Ces deux dernières colonnes possèdent des sous-colonnes représentant les années 2015, 2016 et 2017).
Les tableaux sont utilisés pour montrer plusieurs catégories et fournissent plus de détails et de précision que de nombreuses autres méthodes de visualisation des données. Dans ce tableau, on voit le nombre de familles avec enfants par rapport au nombre total d'enfants dans l'ensemble des familles, pour différentes tranches d'âge d'enfants.
Graphiques figuratifs
(Texte à l'écran : Graphiques figuratifs : Simples, mais possibilité d'interprétation immédiate).
((Même images que l'exemple des tartes) Une série d'image avec 4 tartes aux pommes, 3 tartes aux bleuets, 2 tartes aux cerises, la moitié d'une tarte pour ceux qui aime une autre saveur et l'autre moitié pour ceux qui n'aime pas la tarte).
La méthode de visualisation des données utilisée dans l'exemple des saveurs de tarte est un graphique figuratif. Un graphique figuratif est la représentation de données à l'aide d'images. C'est l'une des façons les plus simples de représenter les données statistiques. La popularité de différentes saveurs de tarte est représentée par le nombre de tartes. Dans ce graphique figuratif, chaque tarte représente 10 individus. Bien que le niveau de précision d'un graphique figuratif soit très faible, notre cerveau en interprète instantanément le message.
Infographies
(Texte à l'écran : Infographies : Utilisées pour raconter une histoire de données complète).
(Une image d’une infographie intitulée : « Histoire de famille - Partage des tâches domestiques - qui fait quoi? » L'infographie contient des données et des conclusions sur le sujet en question).
Une infographie est un regroupement de plusieurs visualisations de données visant à raconter une histoire de données plus complète. De façon générale, un infographie décrit l'état de quelque chose à un moment précis, comme une affiche. Dans cet exemple, plusieurs points de données sont regroupés pour raconter une histoire au sujet des membres de la famille qui font les corvées. À partir de cette infographie, nous apprenons que certaines corvées sont réparties également entre les hommes et les femmes, comme la vaisselle, le magasinage et l'organisation de la vie sociale, alors que la lessive et la préparation des repas sont plus souvent faites chez les femmes et les tâches extérieures par des hommes. Enfin, l'infographie révèle que la répartition des tâches dépend des personnes qui font partie de la population active.
Tableaux de bord
(Texte à l'écran : Tableaux de bord : Servent à éclairer les décisions d'affaires et sont mis à jour à intervalles réguliers.)
(Image d’un tableau de bord contenant des tableaux, des graphiques et des diagrammes pour afficher plusieurs faits liés aux ressources humaines).
Un tableau de bord est un regroupement de plusieurs visualisations de données qui est souvent utilisé pour éclairer les décisions d'affaires. Les tableaux de bord sont habituellement mis à jour régulièrement et montrent les changements au fil du temps. La couleur, la taille et la position des graphiques individuels sont utilisées de façon stratégique pour attirer l'attention sur différents aspects. Ce tableau de bord, par exemple, utilise des tableaux et des graphiques pour afficher l'information nécessaires à la gestion des ressources humaines.
Comment choisir la bonne visualisation
La bonne visualisation dépend de plusieurs facteurs, de quel type de données disposez-vous? Y a-t-il des relations entre les données ou changent-elles au fil du temps? Faites-vous des comparaisons ou montrez-vous la composition de quelque chose? Qui est votre public cible? Quelle histoire voulez-vous lui raconter? Les différences entre les régions géographiques sont-elles importantes pour lui? Quel est le degré de précision souhaité ou exigé? Votre public prend-il des décisions d'affaires en fonction de l'information que vous partagez, ou s'agit-il simplement de l'informer? Sur les diapositives précédentes, vous avez vu différents types de visualisations des données et l'utilisation possible de chacune.
Résumé des principaux points
Dans cette vidéo, vous avez appris que la visualisation des données est la représentation graphique de l'information et des données.
Il est vrai qu'une image vaut 1000 mots, mais assurez-vous de choisir la bonne image pour représenter fidèlement vos données afin de bien faire passer votre message. Surveillez les autres vidéos de cette série présentant les pratiques exemplaires en matière de visualisation des données.
(Le mot-symbole « Canada » s'affiche).