La collecte, l'exploration, l'analyse et l'interprétation des données sont des étapes essentielles du processus permettant de produire des renseignements qui sont utiles pour la société, l'économie et l'environnement. Pour mener à bien ces différentes étapes, il faut respecter les règles d'éthique des données, de manière à assurer l'utilisation appropriée des données.
Dans cette vidéo, nous vous exposerons en quoi consiste l'éthique des données, nous fournirons des explications sur son importance, et nous aborderons les six principes directeurs de l'éthique des données qui sont mis en œuvre par Statistique Canada tout au long du cheminement des données.
Ce diagramme est une représentation visuelle du cheminement des données, de leur collecte jusqu'au moment d'en raconter l'histoire à d'autres en passant par leur exploration, leur nettoyage, leur description, leur compréhension et leur analyse.
L'éthique des données s'applique à chacune des étapes du cheminement des données.
Qu'est-ce que l'éthique des données? L'éthique des données permet aux utilisateurs d'apporter des réponses aux questions entourant l'utilisation appropriée des données à toutes les étapes de leur cheminement.
Ce domaine d'études a pour objet de s'assurer que les données recueillies servent toujours un but précis, et que chaque nouveau projet ou chaque acquisition de données vise à servir l'intérêt de la société et des personnes.
En parallèle avec la prolifération des données associées à l'ère numérique, il y a eu une évolution des approches de collecte de données. Outre la méthode plus traditionnelle fondée sur des enquêtes, différentes autres méthodes de collecte sont utilisées, par exemple :
Ces données servent ensuite à créer des renseignements utiles, par exemple des statistiques, et à former des algorithmes dans les domaines de l'intelligence artificielle et de l'apprentissage automatique. Mais plus il y a de données, plus il y a de responsabilités…
À partir du moment où l'on décide d'adopter de nouvelles méthodes de collecte de données, comme le recours à des sources de données administratives, le moissonnage du Web, les applications et la collecte par approche participative, il faut garder à l'esprit différents enjeux éthiques persistants, par exemple :
Il existe de nombreuses façons de relever ces défis d'ordre éthique; à Statistique Canada, nous nous conformons aux six principes directeurs suivants :
Examinons ces principes plus en détail.
L'utilisation des données à des fins qui bénéficient à la population canadienne signifie que les activités statistiques doivent permettre aux gouvernements, aux entreprises et aux collectivités de prendre des décisions éclairées et de gérer leurs ressources efficacement, ce qui aura en principe des retombées positives sur le quotidien des Canadiens.
Un recensement de la population est un élément fondamental de l'infrastructure statistique de tout pays. Au Canada, le recensement est actuellement la seule source de données offrant des comptes de population et de logements de grande qualité, fondés sur des normes communes et se situant à des niveaux de géographie détaillés, ainsi que des renseignements cohérents et comparables au sujet de divers groupes de population.
Lorsque les activités statistiques exigent l'utilisation de renseignements personnels, il faut tenir compte à la fois de la protection des renseignements personnels et de la sécurité. Il faut toujours prendre des mesures appropriées afin de protéger les renseignements personnels tout en veillant à ce que les données puissent servir à produire des renseignements significatifs.
D'abord, il faut assurer un juste équilibre entre le respect de la vie privée et la production de renseignements. Lorsqu'un projet donne lieu à une intrusion dans la vie privée des Canadiens, il faut expliquer en quoi les données en question sont suffisamment importantes pour justifier une telle intrusion, et indiquer comment l'utilisation de ces données procurera des avantages. En d'autres termes, nous devons veiller à ce que nos activités statistiques n'empiètent pas indûment sur la vie des Canadiens, et nous devons toujours justifier toute intrusion que nous jugeons nécessaire.
De plus, lorsque nous concevons une approche de collecte de données, nous avons l'obligation morale de protéger la confidentialité et les données des Canadiens. L'éthique des données consiste entre autres à s'assurer que les projets prennent en compte les menaces éventuelles pour la sécurité, et qu'ils ont été conçus en conséquence.
Imaginons que nous voulons brosser un meilleur portrait de l'orientation sexuelle des personnes occupant des postes de gestion. Si nous menons une enquête, les questions liées au genre, à l'état matrimonial et au sexe seront pertinentes, même si elles ont un caractère indiscret. Si l'on posait des questions sur le salaire, l'âge et la nationalité, il faudrait justifier en quoi ces variables sont nécessaires.
Pour éviter toute atteinte à la confidentialité de renseignements personnels, des mesures de TI et de gestion de l'information strictes doivent être prises à toutes les étapes du traitement des données, de la collecte jusqu'à l'élimination, en passant par la conservation, l'utilisation et la divulgation, afin de protéger la confidentialité des renseignements de cette population vulnérable et de préserver l'intégrité du projet.
Les activités statistiques entreprises dans l'intérêt de la société doivent être transparentes en ce qui touche la provenance des données, leur utilisation et les mesures prises pour assurer la confidentialité.
Par exemple, le Centre de confiance de Statistique Canada présente une liste de toutes les enquêtes et de tous les programmes statistiques actuels, en précisant leurs méthodologies, leurs objectifs et les sources de données. Il est important de fournir ces renseignements sur les projets, non seulement pour que les Canadiens puissent connaître la façon dont les activités statistiques sont menées aux fins de déterminer si un projet sert leurs intérêts, mais aussi pour que l'organisme rende compte de ses activités.
Le principe relatif à la qualité des données signifie que les données utilisées pour produire des renseignements statistiques doivent être aussi représentatives et aussi exactes que possible. Pour se conformer à cette attente, il faut s'assurer qu'il n'y a aucun biais ni aucune erreur pouvant remettre en question les avantages d'un projet ou induire en erreur les utilisateurs des données.
Lorsqu'on mène une enquête, un faible taux de réponse peut donner lieu à des estimations biaisées ou à des échantillons de trop petite taille pour combler les besoins en information. Prenons l'exemple de données sur l'emploi chez les personnes handicapées. Si le taux de réponse à l'enquête a une incidence sur la qualité des estimations, Statistique Canada pourrait décider de commencer à utiliser des données d'autres sources, comme des données administratives obtenues auprès d'associations sectorielles ou de syndicats.
Or, si ces nouvelles sources sont biaisées, les renseignements qui en seront tirés ne seront pas fiables; cela peut conduire à des mesures et à des politiques mal étayées, ce qui risque de causer plus de tort que de bien.
Dans le cadre d'activités statistiques, il est nécessaire de tenir compte de tous les risques qu'une activité statistique peut soulever pour le bien-être d'individus ou de groupes particuliers.
En cas d'acquisition et de couplage d'une grande quantité de données, des descriptions détaillées de sous-populations de la société pourraient être disponibles à des fins d'analyse. Toutefois, la présentation de grappes de données détaillées peut parfois avoir un effet amplificateur sur les observations au niveau de géographie le plus bas. Bien que cela puisse à première vue sembler sans conséquence, il est important de se rappeler que ces grappes de données peuvent révéler des renseignements sur des aspects comme l'appartenance ethnique et le statut socioéconomique. Si l'on place une sous-population sous un microscope, cela peut soulever des questions d'ordre éthique. Par exemple, les études sur la criminalité doivent être présentées avec prudence afin de ne pas renforcer les stéréotypes, et il faut aussi faire preuve de prudence lorsque l'on communique les résultats afin de s'assurer qu'ils sont informatifs et qu'ils ne peuvent être perçus comme étant un acte d'accusation à l'endroit d'un groupe de population particulier.
Pour que l'on puisse conserver la confiance du public, l'utilisation des données dans l'intérêt de la société doit absolument être assortie de pratiques exemplaires, par exemple assurer la confidentialité de l'information, protéger les renseignements personnels, produire des données représentatives, et rendre compte des activités menées. En incorporant ces éléments à notre mandat, nous pouvons garantir que nos activités statistiques demeurent socialement acceptables aux yeux du public. Si nous jouissons d'une acceptabilité sociale adéquate, tout partenariat que nous concluons et toute approche que nous adoptons offrent l'occasion de démontrer que nous respectons notre mandat et que nous aidons l'organisme à promouvoir ses objectifs et à maintenir la confiance du public à long terme.
Pour bien réaliser toute l'importance de la confiance, imaginez que, dans le but de recueillir de l'information sur la consommation de cannabis à des fins récréatives par les jeunes Canadiens, nous avons recours à une approche de collecte par approche participative et volontaire, et que cette collecte a lieu avant la légalisation du cannabis. Les répondants fourniront des données exactes et fiables uniquement s'ils font confiance à l'institution responsable de la garde et de la protection de la confidentialité de leurs réponses. Dans ce genre de situation, les répondants doivent avoir confiance dans le fait que leurs données ne seront communiquées à personne, qu'il s'agisse de leurs pairs, de leurs parents ou même des autorités.
En résumé, l'éthique des données est le domaine d'études qui traite des questions entourant l'utilisation appropriée des données.
Les progrès réalisés au chapitre des techniques de collecte de données soulèvent des défis éthiques liés à l'accès aux données et à leur utilisation.
À Statistique Canada, nous nous conformons aux six principes directeurs suivants :
La collecte, l'exploration,
l'analyse et l'interprétation
des données sont des étapes
essentielles du processus permettant
de produire des renseignements
qui sont utiles pour la société,
l'économie et l'environnement.
Pour mener à bien ces différentes étapes,
il faut respecter les règles d'éthique
des données, de manière à assurer
l'utilisation appropriée des données.
Dans cette vidéo, nous vous exposerons
en quoi consiste l'éthique des données,
nous fourniront des explications sur
son importance, et nous aborderons les
6 principes directeurs de l'éthique
des données qui sont mis en œuvre
par Statistique Canada tout au
long du cheminement des données.
Ce diagramme est une représentation
visuelle du cheminement des données,
de leur collecte jusqu'au moment
d'en raconter l'histoire à d'autres
en passant par leur exploration,
leur nettoyage, leur description,
leur compréhension et leur analyse.
L'éthique des données s'applique à chacune
des étapes du cheminement des données.
Qu'est-ce que l'éthique des données ?
L'éthique des données permet aux
utilisateurs d'apporter des réponses
aux questions entourant l'utilisation
appropriée des données à toutes
les étapes de leur cheminement.
Ce domaine d'études a pour objet de
s'assurer que les données recueillies
servent toujours un but précis, et
que chaque nouveau projet ou chaque
acquisition de données vise à servir
l'intérêt de la société et des personnes.
En parallèle avec la prolifération des
données associées à l'ère numérique,
il y a eu une évolution des
approches de collecte de données.
Outre la méthode plus traditionnelle
fondée sur des enquêtes, différentes
autres méthodes de collectes sont utilisés,
par exemple:
les données d'observation de la Terre;
les données de lecteur optique;
les données administratives; et
le moissonnage du Web.
Ces données servent ensuite à
créer des renseignements utiles,
par exemple des statistiques,
et à former des algorithmes dans les
domaines de l'intelligence artificielle
et de l'apprentissage automatique.
Mais plus il y a de données,
plus il y a de responsabilités...
À partir du moment où l'on décide d'adopter
de nouvelles méthodes de collecte de données,
comme le recours à des sources
de données administratives,
le moissonnage du Web,
les applications et la collecte
par approche participative,
il faut garder à l'esprit différents
enjeux éthiques persistants,
par exemple:
Protéger la vie privée et là confidentialité.
Assurer un juste équilibre
entre les intrusions dans la
vie privée et l'intérêt public.
Être conscient des répercussions néfastes
pouvant découler de l'utilisation
des données comportant un biais.
Assurer la qualité des données pour
éviter toute désinformations.
Il existe de nombreuses façons de
relever ces défis d'ordre éthique;
à Statistique Canada nous nous conformons
aux 6 principes directeurs suivants:
les données sont utilisées à des fins qui
bénéficient à la population canadienne;
les données sont utilisées de façon
sécuritaire et confidentielle;
Les acquisitions et les méthodes
de traitement des données sont
transparentes et responsables;
les acquisitions et les méthodes
de traitement des données sont
dignes de confiance et durables;
les données proprement dites
sont de grande qualité;
tout renseignement tiré des données
est présenté de manière équitable
et ne cause aucun préjudice;
examinons ces principes plus en détail.
L'utilisation des données à des
fins qui bénéficient à la population
canadienne signifie que les
activités statistiques doivent
permettre au gouvernement,
aux entreprises et aux collectivités
de prendre des décisions éclairées et
de gérer leurs ressources efficacement,
ce qui aura en principe des retombées
positives sur le quotidien des Canadiens.
Un recensement de la population
est un élément fondamental de
l'infrastructure statistique de tout pays.
Au Canada,
le recensement est actuellement la
seule source de données offrant
des comptes de population et de
logements de grande qualité,
fondés sur des normes communes
et se situant à des niveaux de
géographie détaillés,
ainsi que des renseignements
cohérents et comparables au sujet
de divers groupes de population.
Lorsque les activités statistiques
exigent l'utilisation de
renseignements personnels,
il faut tenir compte à la fois de
la protection des renseignements
personnels et de la sécurité.
Il faut toujours prendre des mesures
appropriées afin de protéger les
renseignements personnels tout
en veillant à ce que les données
puissent servir à produire des
renseignements significatifs.
D'abord,
il faut assurer un juste équilibre
entre le respect de la vie privée
et la production de renseignements.
Lorsqu'un projet donne lieu à une
intrusion dans la vie privée des Canadiens,
il faut expliquer en quoi les
données en question sont
suffisamment importantes pour
justifier une telle intrusion, et
indiquer comment l'utilisation de
ces données procurera des avantages.
En d'autres termes,
nous devons veiller à ce que nos
activités statistiques n'empiètent pas
indûment sur la vie des Canadiens, et
nous devons toujours justifier toute
intrusion que nous jugeons nécessaires.
De plus, lorsque nous concevons une
approche de collecte de données,
nous avons l'obligation morale
de protéger la confidentialité
et les données des Canadiens.
L'éthique des données consiste entre
autres à s'assurer que les projets
prennent en compte les menaces
éventuelles pour la sécurité, et
qu'ils ont été conçus en conséquence.
Imaginons que nous voulons brosser un
meilleur portrait de l'orientation
sexuelle des personnes occupant
des postes de gestion.
Si nous menons une enquête,
les questions liées au genre,
à l'état matrimonial et au
sexe seront pertinentes,
même si elles ont un caractère indiscret.
Si l'on posait des questions sur le salaire,
l'âge et la nationalité,
il faudrait justifier en quoi
ces variables sont nécessaires.
Pour éviter toute atteinte à la
confidentialité de renseignements personnels,
des mesures de TI et de gestion
de l'information strictes doivent
être prises à toutes les étapes
du traitement des données, de la
collecte jusqu'à l'élimination,
en passant par la conservation,
l'utilisation et là divulgation,
afin de protéger la confidentialité
des renseignements de cette
population vulnérable et de
protéger l'intégrité du projet.
Les activités statistiques entreprises
dans l'intérêt de la société
doivent être transparentes en ce qui
touche la provenance des données,
leur utilisation et les mesures
prises pour assurer la confidentialité.
Par exemple, le Centre de confiance de
Statistique Canada présente une liste
de toutes les enquêtes et de tous
les programmes statistiques actuels,
en précisant leurs méthodologies,
leurs objectifs et les sources de données.
Il est important de fournir ces
renseignements sur les projets, non
seulement pour que les Canadiens
puissent connaître la façon dont
les activités statistiques sont
menées aux fins de déterminer si
un projet sert leurs intérêts,
mais aussi pour que l'organisme
rende compte de ses activités.
Le principe relatif à la qualité
des données signifie que les
données utilisées pour produire
des renseignements statistiques
doivent être aussi représentatives
et aussi exactes que possible.
Pour se conformer à cette attente,
il faut s'assurer qu'il n'y a aucun
biais ni aucune erreur pouvant
remettre en question les avantages
d'un projet ou induire en erreur
les utilisateurs des données.
Lorsqu'on mène une enquête,
un faible taux de réponse peut donner
lieu à des estimations biaisées ou à
des échantillons de trop petite taille
pour combler les besoins en information.
Prenons l'exemple de données sur
l'emploi chez les personnes handicapées.
Si le taux de réponse à l'enquête a une
incidence sur la qualité des estimations,
Statistiques Canada pourrait
décider de commencer à utiliser
des données d'autres sources,
comme des données administratives
obtenues auprès d'associations
sectorielles ou des syndicats.
Or, si ces nouvelles sources sont biaisées,
les renseignements qui en seront
tirés ne seront pas fiables;
Cela peut conduire à des mesures
et à des politiques mal étayées,
ce qui risque de causer plus
de tort que de bien.
Dans le cadre d'activités statistiques,
il est nécessaire de tenir compte
de tous les risques qu'une activité
statistique peut soulever pour le bien-être
d'individus ou de groupes particuliers.
En pas d'acquisition et de couplage
d'une grande quantité de données,
des descriptions détaillées de sous-populations
de la société pourraient être
disponibles à des fins d'analyse.
Toutefois, la présentation de grappes de
données détaillées peut parfois avoir un
effet amplificateur sur les observations
au niveau de géographie le plus bas.
Bien que cela puisse à première
vue sembler sans conséquence,
il est important de se rappeler
que ces grappes de données peuvent
révéler des renseignements sur des
aspects comme l'appartenance ethnique
et le statut socioéconomique.
Si l'on place une sous-population
sous un microscope,
cela peut soulever des questions
d'ordre éthique.
Par exemple,
les études sur la criminalité doivent
être présentées avec prudence afin
de ne pas renforcer les stéréotypes,
et il faut aussi faire preuve de
prudence lorsque l'on communique
les résultats afin de s'assurer
qu'ils sont informatifs et qu'ils ne
peuvent être perçus comme étant un
acte d'accusation à l'endroit d'un
groupe de population particulier.
Pour que l'on puisse conserver
la confiance du public,
l'utilisation des données dans l'intérêt de
la société doit absolument être assortie
de pratiques exemplaires, par exemple
assurer la confidentialité de l'information,
protéger les renseignements personnels,
produire des données représentatives, et
rendre compte des activités menées.
En incorporant ces éléments à notre mandat,
nous pouvons garantir que nos activités
statistiques demeurent socialement
acceptables aux yeux du public.
Si nous jouissons d'une
acceptabilité sociale adéquate,
tout partenariat que nous concluons
et toute approche que nous adoptons
offre l'occasion de démontrer que
nous respectons notre mandat et que
nous aidons l'organisme à promouvoir
ses objectifs et à maintenir la
confiance du public à long terme.
Pour bien réaliser toute
l'importance de la confiance,
imaginez que, dans le but de
recueillir de l'information sur la
consommation de cannabis à des fins
récréatives par les jeunes Canadiens,
nous avons recours à une approche de
collecte par approche participative
et volontaire, et que cette collecte a
lieu avant la légalisation du cannabis.
Les répondants fourniront des données
exactes et fiables uniquement
s'ils font confiance à l'institut
responsable de la garde et de la
protection de la confidentialité
de leur réponse. Dans ce genre de situation,
les répondants doivent avoir confiance
dans le fait que leurs données ne
seront communiquées à personne,
qu'il s'agisse de leurs pairs,
de leurs parents ou même des autorités.
En résumé, l'éthique des données
est le domaine d'étude qui
traite des questions entourant
l'utilisation appropriée des données.
Les progrès réalisés au chapitre des
techniques de collecte de données
soulèvent des défis éthiques liés à
l'accès aux données et à leur utilisation.
À statistique Canada nous nous conformons
aux 6 principes directeurs suivants:
l'avantage pour la population canadienne,
la protection des renseignements
personnels et la sécurité,
la transparence et là responsabilisation,
la confiance et la viabilité,
la qualité des données et l'équité
et l'absence de préjudice.