Principes des données FAIR : Qu'entend-on par FAIR?

Numéro de catalogue : 892000062022002

Date de diffusion : le 24 mai 2022

Cette vidéo expliquera ce que signifie être FAIR en ce qui concerne les données et les métadonnées, et comment chaque pilier de FAIR sert à guider les utilisateurs et les producteurs dans le cheminement des données, afin de leur permettre d'obtenir une valeur maximale à long terme.

Étape du parcours des données
Fondation
Compétence des données
  • Création et utilisation de métadonnées
  • Intendance des données
Audience
Essentiel
Conditions préalables suggérées
s.o.
Durée
9:04
Coût
Gratuit

Voir la vidéo

Principes des données FAIR : Qu'entend-on par FAIR? - Transcription

(Le symbol de Statistics Canada et le mot-symbol du Canada est présent avec le titre suivant: "Recueillir des données : éléments à prendre en considération avant de recueillir des données")

Cette vidéo expliquera ce que signifie être FAIR en ce qui concerne les données et les métadonnées, et comment chaque pilier de FAIR sert à guider les utilisateurs et les producteurs dans le cheminement des données, afin de leur permettre d'obtenir une valeur maximale à long terme.

Dans cette vidéo, vous obtiendrez les réponses aux questions suivantes :

  • Quels sont les principes des données FAIR?
  • Pourquoi les données FAIR sont-elles importantes?

Ce diagramme est une représentation visuelle du cheminement des données, de leur collecte jusqu'au moment d'en raconter l'histoire à d'autres en passant par leur exploration, leur nettoyage, leur description, leur compréhension et leur analyse.

Les principes des données FAIR sont pertinents à chaque étape du cheminement des données.

Les données FAIR sont des données qui sont : faciles à trouver, c'est-à-dire que des identificateurs et des métadonnées uniques sont utilisés pour aider à repérer les données rapidement et efficacement.

Cela signifie également que les données sont accessibles, qu'elles sont disponibles en fonction des autorisations pertinentes et que les métadonnées sont librement accessibles et peuvent être consultées de manière normalisée.

Les données FAIR sont interopérables, c'est-à-dire que grâce à des normes, les données lisibles par machine sont mises en commun et produisent des résultats utilisables dans un format lisible et utile. Tout cela pour s'assurer que les données sont réutilisables.

Les métadonnées existent pour décrire la source, l'origine et la destination des données et leurs utilisations d'une manière normalisée, permettant la réutilisation utile des données au fil du temps et entre les disciplines. Expliquons cela un peu plus en détail...

L'objectif ultime des principes des données FAIR est leur utilisation en tant qu'ensemble de lignes directrices pour toute personne souhaitant améliorer la réutilisation de ses données. Pour ce faire, il faut s'assurer que les données sont faciles à trouver, accessibles, interopérables et réutilisables.

Les données et les métadonnées qui comprennent des identificateurs uniques nous aident à rechercher des catalogues de données pour trouver des renseignements. Par exemple, si vous tapez simplement « météo actuelle à Whitehorse » dans un moteur de recherche sur Internet, vous obtiendrez de multiples URL.

Une fois que vous avez trouvé les données souhaitées grâce à cet identificateur unique, l'URL qui propose de vous montrer la météo à Whitehorse dans le cas qui nous occupe, vous devez y accéder. Parfois, les sources sont librement accessibles et d'autres fois, lorsque vous cliquez sur un lien, il se peut que l'on vous demande les autorisations pertinentes, telles qu'un nom d'utilisateur et un mot de passe. Si vous ne disposez pas des autorisations pertinentes, il devrait y avoir de l'information ou des métadonnées librement accessibles pour vous expliquer le contenu des données et la façon d'y accéder.

Ces URL, ou liens de pages Web, sont chacun constitués d'une série d'identificateurs uniques qui ont été enregistrés dans le catalogue de données du moteur de recherche.

Par conséquent, lorsque vous cliquez dessus, ces URL vous amènent là où il faut pour trouver les renseignements que vous recherchez.

Une fois que vous avez trouvé les données souhaitées grâce à cet identificateur unique, l'URL qui propose de vous montrer la météo à Whitehorse dans le cas qui nous occupe, vous devez y accéder.

Parfois, les sources sont librement accessibles et d'autres fois, lorsque vous cliquez sur un lien, il se peut que l'on vous demande les autorisations pertinentes, telles qu'un nom d'utilisateur et un mot de passe.

Si vous ne disposez pas des autorisations pertinentes, il devrait y avoir de l'information ou des métadonnées librement accessibles pour vous expliquer le contenu des données et la façon d'y accéder.

Une fois que vous aurez accès aux données, dans ce cas-ci, la météo actuelle à Whitehorse, vous pourriez vouloir savoir si la météo d'aujourd'hui est comparable à celle des années précédentes, ou s'il fait actuellement plus froid ou plus chaud que la moyenne.

Pour cela, vous pourriez vouloir accéder à un fichier qui présente des données historiques. La façon dont ce fichier, situé au point A, est formaté, doit être compris et lisible afin d'être utilisé par le point B, votre ordinateur personnel. Cela nécessite la mise en commun et l'interprétation de renseignements lisibles par machine.

Les renseignements lisibles par machine comprennent l'utilisation des éléments normalisés suivants :

  • vocabulaires, pour fournir un moyen cohérent de décrire les données, comme les noms géographiques ou les codes numériques;
  • formats et applications (HTML, CSV, JSON entre autres);
  • API (interfaces de programmation d'applications), qui permettent aux logiciels de communiquer des données les uns avec les autres de manière libre et ouverte.

Pour vous sentir à l'aise de réutiliser des données, vous devez en connaître l'origine, c'est-à-dire savoir d'où elles viennent, par où elles sont passées et comment elles ont été utilisées dans le passé. C'est ce qu'on appelle la provenance.

La provenance est un renseignement sur la source des données (il peut y en avoir plusieurs) en fonction de l'étape à laquelle vous êtes rendus au sein d'un processus particulier.

Par exemple, si vous êtes chargés d'une étape du processus, la provenance pourrait être la liste de toutes les personnes ou machines qui ont manipulé les données avant vous.

Ensuite, l'historique répertorie toutes les transformations qui ont eu lieu tout au long de ces processus, comme les enregistrements qui ont été modifiés et de quelle manière, les variables qui ont été renommées, etc. Ensemble, la provenance et l'historique permettent de comprendre comment les données en sont arrivées à leur forme actuelle.

Les riches descriptions de la provenance et de l'historique saisies dans les métadonnées permettent :

De connaître la provenance des données et les méthodes utilisées pour les produire.

De connaître la qualité du produit final ou la provenance de ses sources (p. ex. la pertinence, l'exhaustivité, l'exactitude, la réputation et l'intégrité).

Ensemble, la provenance et l'historique permettent d'assurer une traçabilité complète de l'endroit où les données ont été hébergées et des mesures qui y ont été appliquées au cours de leur vie, ce qui permet de les réutiliser plus facilement et de façon plus sécuritaire.

Donc, revenons à notre exemple de données météorologiques historiques pour Whitehorse. D'abord, vous avez trouvé les données, les avez consultées et les avez utilisées sur l'appareil de votre choix.

Les descriptions riches des données, qui comprennent des renseignements sur la façon dont les données ont été transformées et toute licence d'utilisation des données, vous fournissent désormais les renseignements nécessaires pour combiner ces données avec d'autres données afin de les réutiliser en fonction de vos besoins.

Cela signifie qu'après avoir accédé aux données historiques d'autres villes couvrant une certaine période, vous pouvez classer Whitehorse et la comparer avec un ensemble d'autres villes, à savoir si les températures sont plus froides ou plus chaudes que la moyenne cette année.

Maintenant que la vidéo est presque terminée, il est temps de vérifier vos connaissances! Qu'avez-vous retenu à propos des données FAIR? Je vais lire la question à haute voix. Ensuite, mettez la vidéo en pause pendant que vous effectuez votre sélection.

Les API (interfaces de programmation d'applications) qui permettent aux logiciels de communiquer des données les uns avec les autres de manière libre et ouverte sont un exemple de quel principe des données FAIR...

  • Facile à trouver
  • Accessibles
  • Interopérables
  • Réutilisables

La bonne réponse est 3 : l'interopérabilité. Les API sont un exemple d'interopérabilité dans la mesure où elles facilitent la mise en commun et l'interprétation de renseignements lisibles par machine d'un point A à un point B.

Les principes des données FAIR garantissent que les données sont :

  • Facile à trouver
  • Accessibles
  • Interopérables
  • Réutilisables

Les principes des données FAIR sont importants, car ils peuvent servir de ligne directrice à quiconque souhaite améliorer la réutilisation de ses données ou développer un nouveau produit de données réutilisables.

(Le mot-symbole « Canada » s'affiche.)

Qu'avez-vous pensé?

S'il vous plaît nous donner vos commentaires afin que nous puissions mieux fournir des produits qui répondent aux besoins de nos utilisateurs.