Participez au RSD!
- Devenez membre
- Présentez votre projet
- Rencontre avec le scientifique des données
- Sondage
- Ressources en science des données
Plus de renseignements
Les renseignement contenus dans ces articles sont fournis « tel quel » et Statistique Canada n'offre aucune garantie explicite ou implicite, ce qui comprend, sans s'y limiter, les garanties de qualité marchande et d'adaptation à un usage particulier. En aucun cas Statistique Canada ne sera tenu responsable des dommages directs, particuliers, indirects, consécutifs ou autres, quelle qu'en soit la cause.
Articles récents
Des données aux décisions : Visualisations et modélisation d'apprentissage automatique des données de propriétés locatives
Sujets abordés dans cet article : Traitement et ingénierie des données Vision par ordinateur
Selon le recensement de 2021, il y avait 5 millions de ménages locataires au Canada, ce qui signifie qu'environ un tiers des ménages canadiens sont locataires. Une grande partie de cette activité de location se fait toutefois dans le secteur privé, ce qui entraîne des données limitées et incohérentes. Pour combler ces lacunes dans les connaissances, NorQuest College a acquis, traité, analysé et représenté visuellement les annonces immobilières de la partie prenante, le Community Data Program, pour l'Ontario.
Adoption d'une pratique de MLOps générale pour les applications de production de l'apprentissage automatique dans l'Indice des prix à la consommation canadien
Sujets abordés dans cet article : Traitement et ingénierie des données Analyse et production de texte Éthique et apprentissage automatique responsable
L'utilisation responsable de l'apprentissage automatique (AA) dans les statistiques officielles requiert divers processus pour veiller à ce que l'AA soit élaboré de manière fiable et axé sur les mesures, et qu'il soit directement lié à la satisfaction des besoins en matière de traitement d'un programme statistique précis. Ces processus peuvent être opérationnalisés dans un cadre connu sous le nom d'opérations d'apprentissage automatique (ML Operations ou MLOps). Se concentrant sur le cas d'utilisation de l'Indice des prix à la consommation (IPC) canadien, le présent article donne un aperçu de la manière dont divers processus de MLOps peuvent être créés pour garantir que les modèles d'AA qui classent des produits uniques dans les catégories du système de classification de l'IPC respectent des pratiques exemplaires en matière d'assurance de la qualité, de transparence, de gouvernance et de provenance, assurant ainsi la résolution du problème de détérioration du modèle et la fiabilité des statistiques de prix calculées à partir de données administratives. L'article décrit également comment le cadre des MLOps pourrait être mis en œuvre en offrant une vue d'ensemble d'un modèle de maturité, et se concentre sur plusieurs composantes clés importantes pour les statistiques de prix.
Détection des renseignements identificatoires personnels dans les données non structurées à l'aide de Microsoft Presidio
Sujets abordés dans cet article : Éthique et utilisation responsable de l'apprentissage automatique
À l'ère numérique, les organisations recueillent et stockent de grandes quantités de données sur leurs clients, leurs employés et leurs partenaires. Ces données contiennent souvent des renseignements identificatoires personnels (RIP). Avec la multiplication des violations de données et des cyberattaques, la protection des RIP est devenue une préoccupation majeure pour les entreprises et les organismes gouvernementaux. Dans le présent article, Statistique Canada présente en détail Microsoft Presidio et la façon dont cet outil aide les organisations au Canada à se conformer aux lois en matière de protection de la vie privée.
Autres articles récents
Parcourir les articles par sujet
Vision par ordinateur
- Apprentissage auto-supervisé en vision par ordinateur : classification d'images
- Collecte par approche participative des données des reçus d'épicerie dans les communautés autochtones à l'aide de la reconnaissance optique de caractères
- Comparaison des outils de reconnaissance optique de caractères pour les documents à forte densité de texte et les textes provenant de scènes
- Des données aux décisions : Visualisations et modélisation d'apprentissage automatique des données de propriétés locatives
- Détection des serres à l'aide de la télédétection et de l'apprentissage automatique : étape un
- Extraction de tendances temporelles à partir d'images satellitaires
- Le raisonnement qui sous-tend les décisions prises par un réseau de neurones profond
- Modèles de vision par ordinateur : projet de classification des semences
- Modélisation du contexte à l'aide de transformateurs : reconnaissance des aliments
- Pallier les lacunes dans les données pour l'entraînement d'un algorithme d'apprentissage automatique à l'aide d'une application fondée sur l'approche participative généralisée
- S'attaquer à la surcharge de renseignements : l'application d'intelligence artificielle « Document Cracker » d'Affaires mondiales Canada rationalise les efforts de réponse aux crises
- Segmentation d'image en imagerie médicale
Traitement et ingénierie des données
- Adoption d'une pratique de MLOps générale pour les applications de production de l'apprentissage automatique dans l'Indice des prix à la consommation canadien
- Conception d'un système d'alerte et de surveillance des mesures
- Création d'une Application Web tout-en-un pour la science des données à l'aide de Python : évaluation de l'outil en source ouverte Django
- Créer des visualisations de données convaincantes
- Déploiement de votre projet d'apprentissage automatique en tant que servicee
- Des données aux décisions : Visualisations et modélisation d'apprentissage automatique des données de propriétés locatives
- Écrire un pipeline d'imagerie satellite, deux fois : un véritable succès
- Ingénierie des données en Rust
- Interventions non pharmaceutiques et apprentissage par renforcement
- La plateforme infonuagique d'analyse avancée liée à la COVID-19
- Mise en œuvre des pratiques MLOps avec Azure
- MLflow Tracking : Une façon efficace de suivre les essais de modélisation
- Rendre la visualisation de données accessible aux personnes aveugles et malvoyantes
- Tirer des avantages pour le public à partir des données administratives : une méthode d'amélioration de l'analyse à l'aide de données couplées
- Un nouvel indicateur des mouvements hebdomadaires d'aéronefs
- Une image vaut mille mots : laissez votre tableau de bord parler en votre nom!
Analyses prédictives
- De l'exploration à l'élaboration de modèles d'apprentissage automatique interprétables et précis pour la prise de décision : privilégiez la simplicité et non la complexité
- L'Accélérateur numérique de RNCan – Révolutionner la façon dont Ressources Naturelles Canada (RNCan) sert les Canadiens grâce à l'innovation numérique
- Modélisation de la dynamique du SRAS-CoV-2 pour prévoir la demande d'EPI
- Prévisions en matière de consommation d'énergie dans les collectivités éloignées du Nord canadien
- Tirer le maximum de la synthèse de données grâce au guide d'utilisation des données synthétiques pour les statistiques officielles
- Utilisation de l'apprentissage automatique pour prédire le rendement des cultures
Analyse et génération de texte
- Adoption d'une pratique de MLOps générale pour les applications de production de l'apprentissage automatique dans l'Indice des prix à la consommation canadien
- Cas d'utilisation sur la gestion des métadonnées
- Classification de texte des offres d'emploi dans la fonction publique
- Classification des commentaires sur le Recensement de 2021
- Collecte par approche participative des données des reçus d'épicerie dans les communautés autochtones à l'aide de la reconnaissance optique de caractères
- Considérations sur les biais dans le traitement bilingue des langues naturelles
- Communauté de pratique (CdP) de l'apprentissage automatique appliqué à l'analyse de texte : Bilan de l'année 2021
- Contrôle de version avec Git pour les professionnels de l'analyse
- Conversation sur les agents conversationnels – Compte rendu de l'atelier sur les agents conversationnels
- Intelligence documentaire : l'art de l'extraction d'information à partir des PDF
- Langues officielles et traitement du langage naturel
- Modélisation thématique et modélisation thématique dynamique : Une revue technique
- Utiliser la science des données et les outils infonuagiques pour évaluer les répercussions économiques de la COVID-19
Éthique et utilisation responsable de l'apprentissage automatique
- Adoption d'une pratique de MLOps générale pour les applications de production de l'apprentissage automatique dans l'Indice des prix à la consommation canadien
- Apprentissage automatique explicable, théorie des jeux et valeurs de Shapley : un examen technique
- Charges de travail protégées dans le nuage public
- Détection des renseignements identificatoires personnels dans les données non structurées à l'aide de Microsoft Presidio
- Introduction aux techniques cryptographiques d'amélioration de la confidentialité
- Introduction aux techniques cryptographiques — Environnement d'exécution fiable
- Introduction aux techniques cryptographiques : Calcul multiparties sécurisé
- Technologies d'amélioration de la protection de la vie privée : un survol de l'apprentissage fédéré
- Technologies liées à la protection de la vie privée partie deux : introduction au chiffrement homomorphe
- Technologies liées à la protection de la vie privée, partie trois : Analyse statistique confidentielle et classification de texte confidentiel fondées sur le chiffrement homomorphe
- Une brève enquête sur les technologies liées à la protection de la vie privée
- Utilisation responsable de l'apprentissage automatique à Statistique Canada
- Utilisation responsable des systèmes décisionnels automatisés du gouvernement fédéral
Autre
- Code de niveau de production dans le domaine de la science des données
- Célébrer les femmes et les filles dans le domaine des sciences : entrevue avec Mme Sevgui Erman (PH. D.)
- Élaboration de profils de compétences pour encadrer la science des données dans la fonction publique
- Interface utilisateur à programmation schématisée avec Plotly Dash
- Le bulletin d'information du Réseau de la science des données a un an!
- Ottawa accueille le Congrès mondial de la statistique en juillet 2023
- Première rencontre du comité des directeurs du Réseau de la science des données
- Série sur les développements en matière d'apprentissage automatique : numéro deux
- Série sur les développements en matière d'apprentissage automatique – premier numéro
- Série sur les développements en matière d'apprentissage automatique : troisième numéro
- Sondage sur le bulletin d'information du Réseau de la science des données
- Un étudiant coop explore la puissance des mégadonnées