L'éthique des données : une introduction

Numéro de catalogue : 892000062022001

Date de diffusion : le 24 mai 2022

Dans cette vidéo, nous vous exposerons en quoi consiste l'éthique des données, nous fournirons des explications sur son importance, et nous aborderons les six principes directeurs de l'éthique des données qui sont mis en œuvre par Statistique Canada tout au long du cheminement des données.

Étape du parcours des données
Fondation
Compétence des données
  • Intendance des données
  • Sécurité des données et gouvernance
Audience
Essentiel
Conditions préalables suggérées
s.o.
Durée
13:05
Coût
Gratuit

Voir la vidéo

L'éthique des données : une introduction - Transcription

(Le symbole et le mot-symbole de Statistique Canada apparaissent sur l'écran : « L'éthique des données : Une introduction ».)

Diapositive 0 : Éthique des données : Introduction

La collecte, l'exploration, l'analyse et l'interprétation des données sont des étapes essentielles du processus permettant de produire des renseignements qui sont utiles pour la société, l'économie et l'environnement. Pour mener à bien ces différentes étapes, il faut respecter les règles d'éthique des données, de manière à assurer l'utilisation appropriée des données.

Diapositive 1 : Objectifs d'apprentissage

(Texte à l'écran : À la fin de cette vidéo, vous devriez avoir une meilleure connaissance des points suivants :

  • Qu'est-ce que l'on entend par « éthique des données »?
  • Pourquoi l'éthique des données est-elle importante?
  • Comment Statistique Canada met-il en œuvre l'éthique des données tout au long du cheminement des données?

Dans cette vidéo, nous vous exposerons en quoi consiste l'éthique des données, nous fournirons des explications sur son importance, et nous aborderons les six principes directeurs de l'éthique des données qui sont mis en œuvre par Statistique Canada tout au long du cheminement des données.

Diapositive 2 : Étapes du cheminement des données

(Texte à l'écran : Étapes du cheminement des données est appuyé par une base d'intendance, de métadonnées, de normes et de qualité)

(Diagramme du Cheminement des données : Étape 1 - définir, trouver, recueillir; Étape 2 - explorer, nettoyer, décrire; Étape 3 - analyser, modéliser; Étape 4 - raconter l'histoire. Le cheminement des données est appuyé par une base d'intendance, de métadonnées, de normes et de qualité.)

Ce diagramme est une représentation visuelle du cheminement des données, de leur collecte jusqu'au moment d'en raconter l'histoire à d'autres en passant par leur exploration, leur nettoyage, leur description, leur compréhension et leur analyse.

Diapositive 3 : Étapes du cheminement des données (Partie 2)

L'éthique des données s'applique à chacune des étapes du cheminement des données.

Diapositive 4 : Qu'est-ce au juste que l'éthique des données?

Qu'est-ce que l'éthique des données? L'éthique des données permet aux utilisateurs d'apporter des réponses aux questions entourant l'utilisation appropriée des données à toutes les étapes de leur cheminement.

Ce domaine d'études a pour objet de s'assurer que les données recueillies servent toujours un but précis, et que chaque nouveau projet ou chaque acquisition de données vise à servir l'intérêt de la société et des personnes.

Diapositive 5 : Il existe de nombreuses façons de recueillir des données…

En parallèle avec la prolifération des données associées à l'ère numérique, il y a eu une évolution des approches de collecte de données. Outre la méthode plus traditionnelle fondée sur des enquêtes, différentes autres méthodes de collecte sont utilisées, par exemple :

  • les données d'observation de la Terre;
  • les données de lecteurs optiques;
  • les données administratives;
  • et le moissonnage du Web.

Diapositive 6 : … et de transformer les données en information

Ces données servent ensuite à créer des renseignements utiles, par exemple des statistiques, et à former des algorithmes dans les domaines de l'intelligence artificielle et de l'apprentissage automatique. Mais plus il y a de données, plus il y a de responsabilités…

Diapositive 7 : Responsabilité de relever des défis d'ordre éthique, par exemple :

À partir du moment où l'on décide d'adopter de nouvelles méthodes de collecte de données, comme le recours à des sources de données administratives, le moissonnage du Web, les applications et la collecte par approche participative, il faut garder à l'esprit différents enjeux éthiques persistants, par exemple :

  • Protéger la vie privée et la confidentialité
  • Assurer un juste équilibre entre les intrusions dans la vie privée et l'intérêt public
  • Être conscient des répercussions néfastes pouvant découler de l'utilisation de données comportant un biais
  • Assurer la qualité des données pour éviter toute désinformation.

Diapositive 8 : Les six principes directeurs de l'éthique des données à Statistique Canada

Il existe de nombreuses façons de relever ces défis d'ordre éthique; à Statistique Canada, nous nous conformons aux six principes directeurs suivants :

  • Les données sont utilisées à des fins qui bénéficient à la population canadienne
  • Les données sont utilisées de façon sécuritaire et confidentielle
  • Les acquisitions et les méthodes de traitement des données sont transparentes et responsables
  • Les acquisitions et les méthodes de traitement des données sont dignes de confiance et durables
  • Les données proprement dites sont de grande qualité
  • Tout renseignement tiré des données est présenté de manière équitable et ne cause aucun préjudice

Examinons ces principes plus en détail.

Diapositive 9 : Avantages pour la société

L'utilisation des données à des fins qui bénéficient à la population canadienne signifie que les activités statistiques doivent permettre aux gouvernements, aux entreprises et aux collectivités de prendre des décisions éclairées et de gérer leurs ressources efficacement, ce qui aura en principe des retombées positives sur le quotidien des Canadiens.

Diapositive 10 : Avantages pour la société – Exemple

Un recensement de la population est un élément fondamental de l'infrastructure statistique de tout pays. Au Canada, le recensement est actuellement la seule source de données offrant des comptes de population et de logements de grande qualité, fondés sur des normes communes et se situant à des niveaux de géographie détaillés, ainsi que des renseignements cohérents et comparables au sujet de divers groupes de population.

Diapositive 11 : Protection de la vie privée et sécurité

(Texte à l'écran :

Il est important de trouver un équilibre entre le respect de la vie privée et la production de renseignements

  • Il faut veiller à ce que les activités statistiques n'empiètent pas indûment sur la vie des Canadiens
  • Toute intrusion jugée nécessaire doit être justifiée
  • Il importe aussi de tenir compte des aspects pratiques entourant la sécurité ainsi que des répercussions que les atteintes potentielles à la sécurité pourraient avoir sur le bien-être des Canadiens)

Lorsque les activités statistiques exigent l'utilisation de renseignements personnels, il faut tenir compte à la fois de la protection des renseignements personnels et de la sécurité. Il faut toujours prendre des mesures appropriées afin de protéger les renseignements personnels tout en veillant à ce que les données puissent servir à produire des renseignements significatifs.

D'abord, il faut assurer un juste équilibre entre le respect de la vie privée et la production de renseignements. Lorsqu'un projet donne lieu à une intrusion dans la vie privée des Canadiens, il faut expliquer en quoi les données en question sont suffisamment importantes pour justifier une telle intrusion, et indiquer comment l'utilisation de ces données procurera des avantages. En d'autres termes, nous devons veiller à ce que nos activités statistiques n'empiètent pas indûment sur la vie des Canadiens, et nous devons toujours justifier toute intrusion que nous jugeons nécessaire.

De plus, lorsque nous concevons une approche de collecte de données, nous avons l'obligation morale de protéger la confidentialité et les données des Canadiens. L'éthique des données consiste entre autres à s'assurer que les projets prennent en compte les menaces éventuelles pour la sécurité, et qu'ils ont été conçus en conséquence.

Diapositive 12 : Protection de la vie privée et sécurité – Exemple

(Texte à l'écran : Étude sur l'orientation sexuelle des personnes occupant des postes de gestion.

Si nous menons une enquête sur ce sujet, les questions liées au genre, à l'état matrimonial et au sexe seront pertinentes, même si elles ont un caractère indiscret.

Par contre, des questions sur le salaire, les antécédents criminels et l'état de santé ont elles aussi un caractère indiscret, et elles ne sont pas directement liées au projet, donc elles devraient être justifiées.

Des mesures de TI et de gestion de l'information strictes doivent être prises à toutes les étapes du traitement des données, car il s'agit de données personnelles qui présentent un caractère délicat.)

Imaginons que nous voulons brosser un meilleur portrait de l'orientation sexuelle des personnes occupant des postes de gestion. Si nous menons une enquête, les questions liées au genre, à l'état matrimonial et au sexe seront pertinentes, même si elles ont un caractère indiscret. Si l'on posait des questions sur le salaire, l'âge et la nationalité, il faudrait justifier en quoi ces variables sont nécessaires.

Pour éviter toute atteinte à la confidentialité de renseignements personnels, des mesures de TI et de gestion de l'information strictes doivent être prises à toutes les étapes du traitement des données, de la collecte jusqu'à l'élimination, en passant par la conservation, l'utilisation et la divulgation, afin de protéger la confidentialité des renseignements de cette population vulnérable et de préserver l'intégrité du projet.

Diapositive 13 : Transparence et responsabilisation

Les activités statistiques entreprises dans l'intérêt de la société doivent être transparentes en ce qui touche la provenance des données, leur utilisation et les mesures prises pour assurer la confidentialité.

Diapositive 14 : Transparence et responsabilisation – Exemple

Par exemple, le Centre de confiance de Statistique Canada présente une liste de toutes les enquêtes et de tous les programmes statistiques actuels, en précisant leurs méthodologies, leurs objectifs et les sources de données. Il est important de fournir ces renseignements sur les projets, non seulement pour que les Canadiens puissent connaître la façon dont les activités statistiques sont menées aux fins de déterminer si un projet sert leurs intérêts, mais aussi pour que l'organisme rende compte de ses activités.

Diapositive 15 : Qualité des données

Le principe relatif à la qualité des données signifie que les données utilisées pour produire des renseignements statistiques doivent être aussi représentatives et aussi exactes que possible. Pour se conformer à cette attente, il faut s'assurer qu'il n'y a aucun biais ni aucune erreur pouvant remettre en question les avantages d'un projet ou induire en erreur les utilisateurs des données.

Diapositive 16 : Qualité des données – Exemple

(Texte à l'écran : Un faible taux de réponse peut donner lieu à des estimations biaisées ou à des échantillons de trop petite taille pour combler les besoins en information.

Statistique Canada décide de commencer à utiliser d'autres sources de données.

Si les sources sont biaisées, elles peuvent mener à des mesures et à des politiques mal étayées.)

Lorsqu'on mène une enquête, un faible taux de réponse peut donner lieu à des estimations biaisées ou à des échantillons de trop petite taille pour combler les besoins en information. Prenons l'exemple de données sur l'emploi chez les personnes handicapées. Si le taux de réponse à l'enquête a une incidence sur la qualité des estimations, Statistique Canada pourrait décider de commencer à utiliser des données d'autres sources, comme des données administratives obtenues auprès d'associations sectorielles ou de syndicats.

Or, si ces nouvelles sources sont biaisées, les renseignements qui en seront tirés ne seront pas fiables; cela peut conduire à des mesures et à des politiques mal étayées, ce qui risque de causer plus de tort que de bien.

Diapositive 17 : Équité et absence de préjudice

Dans le cadre d'activités statistiques, il est nécessaire de tenir compte de tous les risques qu'une activité statistique peut soulever pour le bien-être d'individus ou de groupes particuliers.

Diapositive 18 : Équité et absence de préjudice – Exemple

En cas d'acquisition et de couplage d'une grande quantité de données, des descriptions détaillées de sous-populations de la société pourraient être disponibles à des fins d'analyse. Toutefois, la présentation de grappes de données détaillées peut parfois avoir un effet amplificateur sur les observations au niveau de géographie le plus bas. Bien que cela puisse à première vue sembler sans conséquence, il est important de se rappeler que ces grappes de données peuvent révéler des renseignements sur des aspects comme l'appartenance ethnique et le statut socioéconomique. Si l'on place une sous-population sous un microscope, cela peut soulever des questions d'ordre éthique. Par exemple, les études sur la criminalité doivent être présentées avec prudence afin de ne pas renforcer les stéréotypes, et il faut aussi faire preuve de prudence lorsque l'on communique les résultats afin de s'assurer qu'ils sont informatifs et qu'ils ne peuvent être perçus comme étant un acte d'accusation à l'endroit d'un groupe de population particulier.

Diapositive 19 : Confiance et viabilité

Pour que l'on puisse conserver la confiance du public, l'utilisation des données dans l'intérêt de la société doit absolument être assortie de pratiques exemplaires, par exemple assurer la confidentialité de l'information, protéger les renseignements personnels, produire des données représentatives, et rendre compte des activités menées. En incorporant ces éléments à notre mandat, nous pouvons garantir que nos activités statistiques demeurent socialement acceptables aux yeux du public. Si nous jouissons d'une acceptabilité sociale adéquate, tout partenariat que nous concluons et toute approche que nous adoptons offrent l'occasion de démontrer que nous respectons notre mandat et que nous aidons l'organisme à promouvoir ses objectifs et à maintenir la confiance du public à long terme.

Diapositive 20 : Confiance et viabilité – Exemple

Pour bien réaliser toute l'importance de la confiance, imaginez que, dans le but de recueillir de l'information sur la consommation de cannabis à des fins récréatives par les jeunes Canadiens, nous avons recours à une approche de collecte par approche participative et volontaire, et que cette collecte a lieu avant la légalisation du cannabis. Les répondants fourniront des données exactes et fiables uniquement s'ils font confiance à l'institution responsable de la garde et de la protection de la confidentialité de leurs réponses. Dans ce genre de situation, les répondants doivent avoir confiance dans le fait que leurs données ne seront communiquées à personne, qu'il s'agisse de leurs pairs, de leurs parents ou même des autorités.

Diapositive 21 : Résumé des principaux points

(Figure 1 démontrant les 6 principes directeurs soit l'avantages pour la population canadienne, la confiance et viabilité, la protection de la vie privée et sécurité, la qualité des données, la transparence et responsabilisation et l'équité et absence de préjudice.)

En résumé, l'éthique des données est le domaine d'études qui traite des questions entourant l'utilisation appropriée des données.

Les progrès réalisés au chapitre des techniques de collecte de données soulèvent des défis éthiques liés à l'accès aux données et à leur utilisation.

À Statistique Canada, nous nous conformons aux six principes directeurs suivants :

  • Avantages pour la population canadienne
  • Protection des renseignements personnels et sécurité
  • Transparence et responsabilisation
  • Confiance et viabilité
  • Qualité des données
  • Équité et absence de préjudice

(Le mot-symbole « Canada » s'affiche.)

Qu'avez-vous pensé?

S'il vous plaît nous donner vos commentaires afin que nous puissions mieux fournir des produits qui répondent aux besoins de nos utilisateurs.