Cette vidéo expliquera ce que signifie être FAIR en ce qui concerne les données et les métadonnées, et comment chaque pilier de FAIR sert à guider les utilisateurs et les producteurs dans le cheminement des données, afin de leur permettre d'obtenir une valeur maximale à long terme.
Ce diagramme est une représentation visuelle du cheminement des données, de leur collecte jusqu'au moment d'en raconter l'histoire à d'autres en passant par leur exploration, leur nettoyage, leur description, leur compréhension et leur analyse.
Les données FAIR sont des données qui sont : faciles à trouver, c'est-à-dire que des identificateurs et des métadonnées uniques sont utilisés pour aider à repérer les données rapidement et efficacement.
Cela signifie également que les données sont accessibles, qu'elles sont disponibles en fonction des autorisations pertinentes et que les métadonnées sont librement accessibles et peuvent être consultées de manière normalisée.
Les données FAIR sont interopérables, c'est-à-dire que grâce à des normes, les données lisibles par machine sont mises en commun et produisent des résultats utilisables dans un format lisible et utile. Tout cela pour s'assurer que les données sont réutilisables.
Les métadonnées existent pour décrire la source, l'origine et la destination des données et leurs utilisations d'une manière normalisée, permettant la réutilisation utile des données au fil du temps et entre les disciplines. Expliquons cela un peu plus en détail...
L'objectif ultime des principes des données FAIR est leur utilisation en tant qu'ensemble de lignes directrices pour toute personne souhaitant améliorer la réutilisation de ses données. Pour ce faire, il faut s'assurer que les données sont faciles à trouver, accessibles, interopérables et réutilisables.
Les données et les métadonnées qui comprennent des identificateurs uniques nous aident à rechercher des catalogues de données pour trouver des renseignements. Par exemple, si vous tapez simplement « météo actuelle à Whitehorse » dans un moteur de recherche sur Internet, vous obtiendrez de multiples URL.
Une fois que vous avez trouvé les données souhaitées grâce à cet identificateur unique, l'URL qui propose de vous montrer la météo à Whitehorse dans le cas qui nous occupe, vous devez y accéder. Parfois, les sources sont librement accessibles et d'autres fois, lorsque vous cliquez sur un lien, il se peut que l'on vous demande les autorisations pertinentes, telles qu'un nom d'utilisateur et un mot de passe. Si vous ne disposez pas des autorisations pertinentes, il devrait y avoir de l'information ou des métadonnées librement accessibles pour vous expliquer le contenu des données et la façon d'y accéder.
Ces URL, ou liens de pages Web, sont chacun constitués d'une série d'identificateurs uniques qui ont été enregistrés dans le catalogue de données du moteur de recherche.
Par conséquent, lorsque vous cliquez dessus, ces URL vous amènent là où il faut pour trouver les renseignements que vous recherchez.
Une fois que vous avez trouvé les données souhaitées grâce à cet identificateur unique, l'URL qui propose de vous montrer la météo à Whitehorse dans le cas qui nous occupe, vous devez y accéder.
Parfois, les sources sont librement accessibles et d'autres fois, lorsque vous cliquez sur un lien, il se peut que l'on vous demande les autorisations pertinentes, telles qu'un nom d'utilisateur et un mot de passe.
Si vous ne disposez pas des autorisations pertinentes, il devrait y avoir de l'information ou des métadonnées librement accessibles pour vous expliquer le contenu des données et la façon d'y accéder.
Une fois que vous aurez accès aux données, dans ce cas-ci, la météo actuelle à Whitehorse, vous pourriez vouloir savoir si la météo d'aujourd'hui est comparable à celle des années précédentes, ou s'il fait actuellement plus froid ou plus chaud que la moyenne.
Pour cela, vous pourriez vouloir accéder à un fichier qui présente des données historiques. La façon dont ce fichier, situé au point A, est formaté, doit être compris et lisible afin d'être utilisé par le point B, votre ordinateur personnel. Cela nécessite la mise en commun et l'interprétation de renseignements lisibles par machine.
Les renseignements lisibles par machine comprennent l'utilisation des éléments normalisés suivants :
Pour vous sentir à l'aise de réutiliser des données, vous devez en connaître l'origine, c'est-à-dire savoir d'où elles viennent, par où elles sont passées et comment elles ont été utilisées dans le passé. C'est ce qu'on appelle la provenance.
La provenance est un renseignement sur la source des données (il peut y en avoir plusieurs) en fonction de l'étape à laquelle vous êtes rendus au sein d'un processus particulier.
Par exemple, si vous êtes chargés d'une étape du processus, la provenance pourrait être la liste de toutes les personnes ou machines qui ont manipulé les données avant vous.
Ensuite, l'historique répertorie toutes les transformations qui ont eu lieu tout au long de ces processus, comme les enregistrements qui ont été modifiés et de quelle manière, les variables qui ont été renommées, etc. Ensemble, la provenance et l'historique permettent de comprendre comment les données en sont arrivées à leur forme actuelle.
Les riches descriptions de la provenance et de l'historique saisies dans les métadonnées permettent :
De connaître la provenance des données et les méthodes utilisées pour les produire.
De connaître la qualité du produit final ou la provenance de ses sources (p. ex. la pertinence, l'exhaustivité, l'exactitude, la réputation et l'intégrité).
Ensemble, la provenance et l'historique permettent d'assurer une traçabilité complète de l'endroit où les données ont été hébergées et des mesures qui y ont été appliquées au cours de leur vie, ce qui permet de les réutiliser plus facilement et de façon plus sécuritaire.
Donc, revenons à notre exemple de données météorologiques historiques pour Whitehorse. D'abord, vous avez trouvé les données, les avez consultées et les avez utilisées sur l'appareil de votre choix.
Les descriptions riches des données, qui comprennent des renseignements sur la façon dont les données ont été transformées et toute licence d'utilisation des données, vous fournissent désormais les renseignements nécessaires pour combiner ces données avec d'autres données afin de les réutiliser en fonction de vos besoins.
Cela signifie qu'après avoir accédé aux données historiques d'autres villes couvrant une certaine période, vous pouvez classer Whitehorse et la comparer avec un ensemble d'autres villes, à savoir si les températures sont plus froides ou plus chaudes que la moyenne cette année.
Maintenant que la vidéo est presque terminée, il est temps de vérifier vos connaissances! Qu'avez-vous retenu à propos des données FAIR? Je vais lire la question à haute voix. Ensuite, mettez la vidéo en pause pendant que vous effectuez votre sélection.
Les API (interfaces de programmation d'applications) qui permettent aux logiciels de communiquer des données les uns avec les autres de manière libre et ouverte sont un exemple de quel principe des données FAIR...
La bonne réponse est 3 : l'interopérabilité. Les API sont un exemple d'interopérabilité dans la mesure où elles facilitent la mise en commun et l'interprétation de renseignements lisibles par machine d'un point A à un point B.
Les principes des données FAIR sont importants, car ils peuvent servir de ligne directrice à quiconque souhaite améliorer la réutilisation de ses données ou développer un nouveau produit de données réutilisables.
Cette vidéo expliquera ce qui
signifie d'être FAIR en ce qui concerne
les données et les métadonnées et
comment chaque pilier de FAIR sert à guider
les utilisateurs et les producteurs
dans le cheminement des données,
afin de leur permettre d'obtenir
une valeur maximale à long terme.
Dans cette vidéo, vous obtiendrez
les réponses aux questions suivantes:
Quels sont les principes des données FAIR?
Pourquoi les données FAIR sont-elles importantes ?
Ce diagramme est une représentation
visuelle du cheminement des données,
de leurs collecte jusqu'au moment
d'en raconter l'histoire à d'autres
en passant par leur exploration,
leur nettoyage, leur description,
leur compréhension et leur analyse.
Les principes des données FAIR
sont pertinents à chaque étape
du cheminement des données.
Les données FAIR sont des données
qui sont: faciles à trouver,
c'est à dire que des identificateurs
et des métadonnées uniques sont
utilisés pour aider à repérer les
données rapidement et efficacement.
Cela signifie également que
les données sont accessibles,
qu'elles sont disponibles en fonction
des autorisations pertinentes et
que les métadonnées sont librement
accessibles et peuvent être
consultées de manière normalisée.
Les données FAIR sont interopérables,
c'est-à-dire que grâce à des normes,
les données lisibles par machine
sont mises en commun et produisent
des résultats utilisables dans
un format lisible et utile.
Tout cela pour s'assurer que
les données sont réutilisables.
Les métadonnées existent pour
décrire la source,
l'origine et la destination des
données et leurs utilisations d'une
manière normalisée, permettant la
réutilisation utile des données au
fil du temps et entre les disciplines.
Expliquons cela un peu plus en détail...
L'objectif ultime des principes des
données FAIR est et leur utilisation en tant
qu'ensemble de lignes directrices
pour toute personne souhaitant
améliorer la réussite de ces données.
Pour ce faire, il faut s'assurer que
les données sont faciles à trouver,
accessibles, interopérables et réutilisables.
Les données et les métadonnées qui
comprennent des identificateurs uniques
nous aident à recherchez des catalogues de
données pour trouver des renseignements.
Par exemple, si vous tapez simplement
« météo actuelle à Whitehorse »
dans un moteur de recherche sur Internet,
vous obtiendrez de multiples URL.
Ces URL, ou liens pages Web, sont
chacun constitués d'une série
d'identificateurs uniques qui ont été
enregistrés dans le catalogue
de données du moteur de recherche.
Par conséquent,
lorsque vous cliquez dessus,
ces URL vous amènent là où il faut
pour trouver les renseignements
que vous recherchez.
Une fois que vous avez trouvé
les données souhaitées grâce
à cet identificateur unique,
l'URL qui propose de vous
montrer la météo à Whitehorse
dans le cas qui nous occupe,
vous devez y accéder.
Parfois, les sources sont librement
accessibles et d'autres fois,
lorsque vous cliquez sur un lien,
il se peut que l'on vous demande les
autorisations pertinentes, telles qu'un
nom d'utilisateur et un mot de passe.
Si vous ne disposez pas des
autorisations pertinentes,
il devrait y avoir de l'information ou
des métadonnées librement accessibles
pour vous expliquer le contenu des
données et la façon d'y accéder.
Une fois que vous aurez accès
aux données, dans ce cas-ci,
la météo actuelle à Whitehorse,
vous pourriez vouloir savoir si la
météo d'aujourd'hui est comparable
à celle des années précédentes, ou
s'il fait actuellement plus froid
ou plus chaud que la moyenne.
Pour cela, vous pourriez vouloir
accéder à un fichier qui
présente des données historiques.
La façon dont ce fichier,
situé au point A est formaté,
doit être compris et lisible
afin d'être utilisé par le point
B, votre ordinateur personnel.
Cela nécessité la mise en commun et
l'interprétation de renseignements
lisibles par machine.
Les renseignements lisibles par
machine comprennent l'utilisation
des éléments normalisées suivants:
Vocabulaires pour fournir un moyen
cohérent de décrire les données,
comme les noms géographiques
ou les codes numériques;
Formats et applications (HTML,
CSV, JSON entre autres.
API
(Interface de programmation
d'applications), qui permettent
aux logiciels de communiquer des
données les uns avec les autres
de manière libre et ouverte.
Pour vous sentir à l'aise
de réutiliser des données,
vous devez en connaître l'origine,
c'est-à-dire savoir d'où elles viennent,
par où elles sont passées et comment
elles ont été utilisées dans le passé.
C'est ce qu'on appelle la provenance.
La provenance est un renseignement
sur la source des données en fonction
de l'étape à laquelle vous êtes rendu
au sein d'un processus particulier.
Par exemple,
si vous êtes chargés d'une étape du processus,
la provenance pourrait être la liste
de toutes les personnes ou machines
qui ont manipulé les données avant vous.
Ensuite,
l'historique répertorie toutes
les transformations qui ont eu
lieu tout au long de ces processus,
comme les enregistrements qui ont
été modifiés et de quelle manière,
les variables qui ont été renommées, etc.
Ensemble, la provenance
et l'historique
permettent de comprendre comment
les données en sont arrivées à
leur forme actuelle. Les riches
Descriptions de la provenance de
et de l'historique saisies dans les
métadonnées permettent: de connaître
la provenance des données et les
méthodes utilisées pour les produire.
De connaître la qualité du produit
final ou la provenance de ses sources
(par exemple la pertinence,
l'exhaustivité, l'exactitude,
la réputation et l'intégrité).
Ensemble,
la provenance et l'historique permettent
d'assurer une traçabilité complète
de l'endroit où les données ont été
hébergées et des mesures qui y ont été
appliquées au cours de leur vie,
ce qui permet de les réutiliser plus
facilement et de façon plus sécuritaire.
Donc, revenons à notre exemple des données
météorologiques historiques pour Whitehorse.
D'abord, vous avez trouvé les données,
les avez consultées et les avez utilisées
sur l'appareil de votre choix.
Les descriptions riches des données,
qui comprennent les renseignements
sur la façon dont les données ont
été transformées et toutes les
licences utilisées des données vous
fournissent désormais les renseignements
nécessaires pour combiner ces données
avec d'autres données afin de les
réutiliser en fonction de vos besoins.
Cela signifie qu'après
avoir accédé aux données
historiques d'autres villes
couvrant une certaine période,
vous pouvez classer Whitehorse
et la comparer avec un ensemble
d'autres villes, à savoir si les
températures sont plus froides ou plus
chaudes que la moyenne cette année.
Maintenant que la vidéo est presque terminée,
il est temps de vérifier vos connaissances!
Qu'avez-vous retenu à propos des données FAIR ?
Je vais lire la question à
haute voix. Ensuite,
mettez la vidéo en pause pendant
que vous effectuez votre sélection.
Les API
(interfaces de programmation d'applications)
qui permettent aux logiciels de
communiquer des données les uns avec
les autres de manière libre et ouverte
sont un exemple de quel principe les données FAIR...
1. Faciles à trouver, 2. accessibles,
3. interopérables, 4. réutilisables.
La bonne réponse est 3:
l'interopérabilité.
Les API sont un exemple d'interopérabilité
dans la mesure où elles facilitent la
mise en commun de l'interprétation
de renseignements lisibles par
machine d'un point A à un point B.
Les principes des données
FAIR garantissent que les
données sont: faciles à trouver,
accessible,
interopérables et réutilisables.
Les principes des données FAIR
sont importants, car ils peuvent
servir de ligne directrice à
quiconque souhaite améliorer la
réutilisation de ses données ou
développer un nouveau produit
de données réutilisables.