Que sont les données? Introduction à la terminologie et aux concepts relatifs aux données

Numéro de catalogue : 892000062020006

Date de diffusion : le 23 septembre 2020 Mise à jour : le 25 octobre 2021

Cette vidéo aborde des termes et des concepts relatifs aux données, comme les ensembles de données, les bases de données, la protection des données, les variables de données, les microdonnées et les macrodonnées, ainsi que les renseignements statistiques.

Aucune connaissance préalable n'est requise.

Étape du parcours des données
  • Base
Compétence des données
Sensibilisation aux données
Audience
Essentiel
Conditions préalables suggérées
s.o.
Durée
8:08
Coût
Gratuit

Voir la vidéo

Que sont les données? Introduction à la terminologie et aux concepts relatifs aux données - Transcription

(Le symbole et le mots-symbole de Statistique Canada apparaissent sur l'écran: "Que sont les données? Introduction à la terminologie et aux concepts relatifs aux données")

Que sont les données? Introduction à la terminologie at aux concepts relatifs aux données

Cette vidéo présentera certains concepts et termes de base relatifs aux données.

Objectifs d'apprentissage

Cette vidéo aborde des termes et des concepts relatifs aux données comme les ensembles de données, les bases de données, la protection des données, les variables de données, les microdonnées et les macrodonnées, ainsi que les renseignements statistiques. Aucune connaissance préalable n'est requise.

Étapes du cheminement des données

(Text à l'écran: Étapes du cheminemnt des données est appuyé par une base d'intendance, de métadonnées, de normes et de qualité)

(Diagramme du Cheminement des données: Étape 1 - définir, trouver, recueillir; Étape 2 - explorer, nettoyer, décrire; Étape 3 - analyser, modéliser; Étape 4 - Raconter l'histoire. Le cheminement des données est supporté par une base d'intendance, de métadonnées, de normes et qualité.)

Le cheminement des données représentent les étapes que les données doivent franchir pour que nous puissions raconter une histoire. Nous tenterons de répondre à la question, que sont les données en tenant compte de ces différentes étapes? Tout d'abord, examinons les données dans le contexte de la recherche, de la collecte et de la protection des données.

Que sont les données?

Les données sont des faits ou des chiffres qui portent sur un objet ou un phénomène. Les objets existent et les phénomènes se produisent tout simplement. Ce sont les gens qui créent des données. Nous mesurons, comptons,observons et décrivons les éléments qui nous entourent. Nous consignons ce que nous trouvons au moyen de symboles et d'images. Voilà ce que sont les données.

D'où viennent les données?

D'où viennent les données? Les données viennent de partout. Par exemple, les médecins recueillent des données sur notre santé et notre bien-être. Les commerces recueillent des données sur nos achats. Les enquêtes permettent de recueillir des données sur nos habitudes. Les scientifiques recueillent des données sur les conditions climatiques telles que la température et la vitesse du vent. Ces données sont parfois appelées données d'observation de la terre. Ce ne sont là que quelques exemples. En cette ère numérique, les données sont littéralement littéralement partout autour de nous.

Comment les données sont-elles organisées?

Les données peuvent être organisées de façon structurées, notamment au moyen de tableaux, graphiques, cartes. Les données peuvent aussi être organisées de façon non structurées, c'est-à-dire lorsqu'elles sont dans des textes ou des documents.

Protection des données

Les administrateurs de données ont la responsabilité d'être de bons intendants et d'assurer la protection, la confidentialité, et la sécurité des renseignements personnels identificatoires. Les renseignements personnels identificatoires comprennent notamment tout renseignement qui permettraient d'identifier directement ou indirectement une personne, une entreprise ou une organisation.

Étapes 2: Explorer, nettoyer et décrire

(Diagramme du Cheminement des données avec un attention sur l'Étape 2 - explorer, nettoyer, décrire.)

Maintenant, examinons les données dans la prochaine étape de leur cheminement. Quand nous avons des données, nous voulons les explorer. Si nous trouvons des erreurs dans les données, nous essayons de les corriger.

Ensemble de données et bases de données

À quoi ressemble les données dans ces cas? Les données sont souvent organisées en tableau, composées de lignes et de colonnes. Lorsqu'ils sont en format électronique, ils sont appelés "ensembles de données". Un ensemble de données organisé à une fin particulière est parfois appelé "base de données". Il existe des progiciels pour gérer les bases de données comme Oracle, SQL et Microsoft Access.

Bases de données relationnelles

Une base de données relationnelle, est une collection organisée de ensemble de données qui sont liés les un aux autres en fonction de valeurs clés. Par exemple, une base de données relationnelle sur un système scolaire pourrait contenir un ensemble de données répertoriant des listes d'école, un autre comprenant les classes dans les écoles et un autre portant sur les élèves dans les classes. Il existe une façon de relier tous les ensembles de données dans une base de données relationnelle. Dans cet exemple, il pourrait y avoir une variable d'identification pour une école dans les 3 ensembles de données afin qu'il soit possible de trouver l'ensemble des classes et des élèves associé à une école particulière.

Que contient un ensemble de données?

Les données réelles dans un ensemble ou une base de données sont organisées en variable. Certaines des variables représentent les mesures, les chiffres, les observations ou les descriptions dont nous avons parlé plustôt. D'autres variables permettent d'identifier ce qui a été mesuré, compté, observé, ou décrit. Les données ou un enregistrement ou une ligne représente une unité d'observation sont appelés microdonnées. Il est fortement recommandé d'explorer et de nettoyer le microdonnées avant de les analyser ou de les utiliser à d'autres fins. Pour ce faire, il faut appliquer des méthodes statistiques de base aux variables de microdonnées. Pour obtenir de plus amples renseignements, regarder les vidéos sur la tendance centrale et là dispersion.

Étape 3: Analyser et modéliser

(Diagramme du Cheminement des données avec un attention sur l'Étape 3 - analyser, modéliser.)

Pour découvrir les relations entre les variables où trouver des tendances au fil du temps, nous devons analyser les microdonnées nettoyées. L'étape d'analyse est aussi appelé modélisation, établissement d'inférence et analyse des données.

Pour en savoir plus sur l'analyse des données, regarder la série de vidéos analyse 101.

Différents états des données

Voici une façon pratique de résumer les différents états des données. Les microdonnées désignent des ensembles de données dans lesquelles un enregistrement représente une unité d'observation.

Les microdonnées sont des unités élémentaires, qu'il s'agisse d'utiliser des données pour fournir des services, faire respecter des règlements, répondre à des questions de recherche ou créer des politiques.

Les macrosdonnées désignent des ensembles de données dans lesquelles des enregistrements ont été regroupés ou agrégés. L'analyse statistique, ou l'analyse des données peut être réalisée à partir de microdonnées ou de macrodonnées nettoyées.

Les métadonnées comprennent la documentation ou les renseignements contextuels et facilitent l'utilisation appropriée des données.

Étape 4: Raconter l'histoire

(Diagramme du Cheminement des données avec un attention sur l'Étape 4 - Raconter l'histoire.)

L'analyse statistique ou l'analyse des données est une façon de produire des renseignements statistiques. La dernière étape du cheminement des données consiste à raconter l'histoire qui se forme à partir des renseignements statistiques.

Renseignements statistiques

Les renseignements statistiques sont bien différents des données originales sur lesquels ils sont fondées. Les données ont été synthétisées et transformées pour mettre en lumière des renseignements difficile à discerner dans les microdonnées. Les renseignements statistiques qui proviennent de l'analyse et de la modélisation sont plus faciles à comprendre s'ils sont présentés sous forme d'histoire. Elle peut être racontée sous forme de document de recherche, d'infographie, d'articles dans les médias, de produits de visualisation des données, ou d'une combinaison de ces méthodes et d'autres méthodes de présentation des données.

Résumé des principaux points

Les données sont des faits ou des chiffres sur un objet ou un phénomène. Les variables des données sont stockées dans un ensemble de données. Les administrateurs de données ont la responsabilité d'assurer la protection, la confidentialité et la sécurité des renseignements identificatoires. L'analyse statistique ou l'analyse des données est réalisée à partir de microcrodonnées, ou de macrodonnées nettoyées aux fins de production de renseignements statistiques. Les renseignements statistiques permettent de raconter l'histoire des données.

En apprendre davantage

Pour en apprendre davantage sur les données, jeter un coup d’œil aux vidéos portant sur le cheminement des données, les types de données et la collecte des données.

(Le mot-symbole « Canada » s'affiche.)

Qu'avez-vous pensé?

S'il vous plaît nous donner vos commentaires afin que nous puissions mieux fournir des produits qui répondent aux besoins de nos utilisateurs.