Ateliers 2024

Les ateliers se dérouleront en personne le 29 octobre, de 9 h 30 à 16 h 30.

Atelier 1

Modèles basés sur le lissage à l'aide de flux de travail reproductibles en R – En anglais seulement

Dr. Dave Campbell
Professeur, Université Carleton
https://people.math.carleton.ca/~davecampbell

Résumé :

Dans cet atelier, nous discuterons de l'utilisation des modèles additifs généralisés dans R en mettant l'accent sur des procédures modernes et reproductibles qui facilitent le partage et la réutilisation de ceux-ci pour une application sur de nouveaux jeux de données (ou ayant été mis à jour).  Les modèles additifs généralisés (MAG) forment un outil de régression flexible qui agit comme un intermédiaire entre la régression linéaire et l’estimation à partir de fonctions dérivées sans contraintes à partir d'outils tels que les réseaux de neurones.  Les MAG font d’ailleurs partie de la boîte à outils inférentielle des sciences des données, qui permettent de trouver un juste équilibre entre « laisser les données » déterminer le modèle et laisser les experts utiliser leurs connaissances pour ce faire.

Les participants à cet atelier apprendront les bases pour créer des procédures R modernes et reproductibles donnant la possibilité de partager les résultats et de générer automatiquement des rapports. En particulier, la théorie mathématique sous-tendant les MAG, en s'appuyant sur des outils couramment utilisés pour la régression linéaire, sera présentée. On y donnera aussi un aperçu de comment faire entrer ces outils dans notre boîte à outils analytique et de la manière dont on peut les combiner pour former de puissantes machines prédictives.

Il est possible de suivre cet atelier avec un minimum d’expérience en R (ou autre langage relié à la science des données).

L’atelier sera offert en anglais. Le matériel sera disponible pour les participants dans les deux langues officielles.

Biographie :

Dave Campbell est professeur titulaire à l'École de mathématiques et de statistiques et à l'École d'informatique de l'Université Carleton à Ottawa. Sur le plan académique, il dirige une équipe collaborative qui étudie les algorithmes inférentiels à l'intersection de la statistique et de l'apprentissage automatisé, l'informatique et les mathématiques appliquées, afin de résoudre des problèmes inspirés de diverses collaborations avec l'industrie et les gouvernements. Il est co-auteur d’articles scientifiques dans le Bayesian Analysis et le Journal of the Royal Statistical Society (série B) et a reçu plus de 3,5 millions de dollars en subventions de recherche.

Le parcours professionnel de Dave s'articule autour de collaborations avec l’industrie. Il a passé la période de 2021 à 2023 à diriger l'équipe de science des données inférentielles à la Banque du Canada, qui menait des projets visant à s’occuper de la cybersécurité, prédire la demande pour les billets de banque, comprendre les facteurs à l’origine de l'inflation et assurer la confidentialité des données des utilisateurs. Avant de s'installer à Ottawa en 2019, Dave était professeur à l'Université Simon Fraser, où il y a dirigé la mise en place d’un baccalauréat en science des données. Il a été le premier président du Groupe de science des données et analytique de la Société statistique du Canada et a été l'un des coorganisateurs du populaire événement Vancouver Learn Data Science Meetup, qui avait pour but de mettre en contact les gens provenant de l'industrie avec ceux provenant du milieu académique. 

Nous sommes ravis que Dr Dave Campbell ait accepté notre invitation de partager ses connaissances à un des ateliers du Symposium! Vous pouvez d’ailleurs le retrouver sur LinkedIn :https://www.linkedin.com/in/drdavecampbell/

Atelier 2

Protection de la confidentialité de données statistiques – offert en français

Dr Anne-Sophie Charest
Professeure, Université Laval
https://www.fsg.ulaval.ca/corps-professoral/anne-sophie-charest

Résumé :

Dans cet atelier, nous explorerons comment collecter, analyser et partager des données confidentielles sans divulguer d’informations personnelles. Nous étudierons les différents risques associés à l’utilisation de données personnelles, ainsi que différentes façons de mesurer ces risques. Nous regarderons notamment la confidentialité différentielle, une approche qui fait l'objet de nombreuses recherches et est maintenant utilisée en pratique par certaines agences statistiques et entreprises privées. Nous expliquerons l'origine de cette mesure formelle de confidentialité, examinerons en détail sa définition mathématique et son interprétation, et parlerons des avantages et limites de cette approche. Nous aborderons également l'utilisation de jeux de données synthétiques à des fins de protection de la vie privée : comment générer de tels jeux de données et évaluer leur qualité en termes de risque et d'utilité. Le contenu sera illustré par du code R et une partie du temps sera réservée pour que les participants puissent tester les méthodes présentées.

L’atelier sera offert en français. Le matériel sera disponible pour les participants dans les deux langues officielles.

Biographie :

Anne-Sophie Charest est professeure agrégée à l’Université Laval. Elle a obtenu un doctorat en Statistique de l’Université Carnegie Mellon. Ses intérêts de recherche portent sur la protection de la confidentialité de données statistiques, notamment en contexte d’enquête ou de recensement sur une population. Elle s’intéresse particulièrement à la génération et l’analyse de jeux de données synthétiques ainsi qu’à la mesure du risque de divulgation, notamment par le biais de la confidentialité différentielle. 

Nous sommes ravis que Anne-Sophie Charest ait accepté notre invitation de partager ses connaissances à un des ateliers du Symposium ! Vous pouvez d’ailleurs la retrouver sur LinkedIn: https://www.linkedin.com/in/anne-sophie-charest-900a585b/