Base de données ouverte des serres (BDOS)
Document de métadonnées : concepts, méthodologie et qualité des données
No 32260005-au catalogue
No d'exemplaire 2023001
Version 1.0
Laboratoire d'exploration et d'intégration des données (LEID)
Centre des projets spéciaux sur les entreprises (CPSE)
en partenariat avec
Division de l'agriculture (AGRI)
Date de diffusion : 2 février 2023
Table des matières
- 1. Aperçu
- 2. Sources de données
- 3. Période de référence
- 4. Geography
- 5. Population cible
- 6. Méthodologie de compilation
- 7. Dictionnaire de données
- 8. Exactitude des données
- 9. Contactez-nous
Remerciements
La production d'une première version de la base de données a été rendue possible grâce à la disponibilité des données ouvertes, aux ententes de partages de données et aux partenariats dans de nombreuses municipalités et provinces à l'étendue du Canada. Nous aimerions plus particulièrement remercier le ministère des Richesses naturelles et des Forêts de l'Ontario pour son soutien à notre projet et ses partenariats continus en matière de données avec Statistique Canada. Nous aimerions en outre remercier la Ville de Surrey pour la disponibilité des données ouvertes de leurs orthophotographies de très haute résolution.
1. Aperçu
En vue d'explorer l'utilisation des données ouvertes pour établir des statistiques officielles et de soutenir la recherche géospatiale dans divers domaines, la Division de l'agriculture et la Division de la science des données ont entrepris un projet en vue d'utiliser les données d'observation de la Terre pour moderniser les enquêtes traditionnelles menées à Statistique Canada avec un ensemble de sources d'observation de la Terre à haute résolution diffusées sous forme de données ouvertes par plusieurs ordres de gouvernement au CanadaNote de bas de page 1. Ces données ont été créées en réponse aux initiatives de modernisation de Statistique Canada visant à améliorer ou à supprimer les enquêtes; en réponse, la Base de données ouvertes sur les serres (BDOS) est utilisée à des fins d'entraînement de modèles d'apprentissage automatique visant à automatiser la cueillette de renseignements sur les serres à l'étendue du Canada. Cela vise à réduire le fardeau de réponse des exploitants de serres au Canada. Le présent document décrit en détail le processus de collecte, de traitement et d'uniformisation de l'observation de la Terre et du produit dérivé des imageries des serres numérisées à l'aide de la première version de la BDOS, disponible en vertu de la Licence du gouvernement ouvert – CanadaNote de bas de page 2.
Dans la première version (version 1.0), la BDOS contient 2 476 enregistrements dans dix municipalités et quatre provinces. On prévoit mettre à jour périodiquement la base de données, à mesure que de nouveaux ensembles de données ouvertes seront rendus disponibles. La BDOS est fournie en fichier géographique de format shapefile.
Cet ensemble de données figure parmi plusieurs ensembles de données créés dans le cadre de l'Environnement de couplage de données ouvertes (ECDO). L'ECDO est une initiative qui vise à accroître l'utilisation et l'harmonisation des données ouvertes provenant de sources faisant autorité en fournissant une série d'ensembles de données diffusés en vertu d'une licence unique, ainsi que du code source libre pour relier ces ensembles de données. On peut accéder aux ensembles de données et au code de l'ECDO sur le site Web de Statistique Canada à l'adresse suivante
L'Environnement de couplage de données ouvertes
2. Sources de données
De nombreuses sources de données ont été recueillies pour créer la BDOS. Les fournisseurs de données comprennent divers ordres de gouvernement ou ont reçu les données d'entreprises existantes qui ont signé une offre à commande nationaleNote de bas de page 3 avec le gouvernement fédéral, y compris l'attribution à chaque source conformément aux exigences de la licence.
Les détails sur les sources de données sont fournis dans le Tableau 1 ci-dessous. Il y a un total de 10 municipalités couvertes dans 4 provinces.
Pour en savoir plus sur les licences individuelles, les utilisateurs peuvent consulter directement les portails de données ouvertes des fournisseurs de données en question.
Tableau 1 : Sources de données
Sources de données | Remerciements : | Entente de licence |
---|---|---|
MDA Geospatial Services |
York (Ontario) : Laval (Québec) : St-Eustache (Québec) : Medicine Hat (Alberta) : |
L'OCPN pour MDA a pour numéro de contrat W1786-180002/001/Offre à commandes E60SQ-120001/003/SS |
Canton de Langley | Canton de Langley – GIS. 2017 Orthophotos | Contient des informations sous licence Open Government License – Canton de Langley Open Data Licence – Township of Langley (le contenu de cette page est en anglais) |
Ville de Burnaby | Ville de Burnaby - SIG Orthophotographies de 2020. | Licence de gouvernement ouvert - Colombie-Britannique Open Government Licence - City of Burnaby (le contenu de cette page est en anglais) |
Ville de Surrey | Ville de Surrey, orthophotographies de 2018 | Licence de gouvernement ouvert – Ville de Surrey. Open Government Licence - Surrey (le contenu de cette page est en anglais) |
Ministère des Richesses naturelles et des Forêts de l'Ontario | Ministère des Richesses naturelles et des Forêts de l'Ontario | Orthophotographie sous licence avec le ministère des Richesses naturelles et des Forêts de l'Ontario et Forestry© King's Printer for Ontario, 2018 et 2020. |
Ville de Chilliwack - SIG | Ville de Chilliwack - SIG Orthophotographies de 2021 | Les données sont fournies en tant que service public par la ville de Chilliwack. Terms of Use - City of Chilliwack (le contenu de cette page est en anglais) |
3. Période de référence
Les sources de données dans le Tableau 1 indiquent la date la plus récente à laquelle la source était disponible au moment de l'accès ou fournie par l'intermédiaire d'autres partenariats ou ententes et utilisée pour numériser les serres ou utilisée à l'intérieur des modèles d'apprentissage automatique pour automatiser les serres. Les données sont fournies pour les années 2017 à 2021 à travers diverses sources et divers emplacements. Les données ont été consultées ou téléchargées entre 2019 et 2022.
4. Géographie
Le cadre géographique de la BDOS est cité en référence par régions fournies par les portails de données ouvertes pour les villes de Burnaby, Surrey, et Chilliwack, et le Canton de Langley, comme il est précisé dans la section Sources de données. Les régions identifiées dans le Tableau 1 et la BDOS citent en référence la géographie de la région agricole de recensement (RAR) de Statistique Canada (découpage géographique de Statistique Canada - RAR : Recensement de 2021 - Fichiers des limites). Ces sources ne se limitent pas uniquement à leurs limites régionales pour une région particulière et peuvent s'étendre aux régions/municipalités voisines. Il se pourrait que le produit ne soit pas complet pour une région en particulier indiquée dans le Tableau 1 ou limité aux frontières en fonction des régions géographiques de Statistique Canada.
Représentation géographique
La Base de données ouvertes sur les serres est disponible sur le site Web de Statistique Canada, dans la représentation géographique suivante :
- Projection : conique conforme de Lambert
- Abscisse fictive : 6200000,000000
- Ordonnée fictive : 3000000,000000
- Méridien central : -91,866667
- Parallèle standard 1 : 49,000000
- Parallèle standard 2 : 77,000000
- Latitude d'origine : 63,390675
- Unité linéaire : mètre (1,000000)
- Système de référence géodésique : nord-américain 1983 (NAD83)
- Méridien d'origine : Greenwich
- Mesure angulaire : degré
- Sphéroïde : GRS 1980
Le Système de référence géodésique nord-américain de 1983 (NAD83) est une correction du Système de référence géodésique nord-américain de 1927 (NAD27) qui reflète plus de précision de l'arpentage géodésique.
5. Population cible
Statistique Canada définit une serre et les produits de serreNote de bas de page 4 comme un espace pour faire pousser des semis, des plantes en pots, des plantes à massif, des boutures et autre matériel de multiplication, des fruits et légumes cultivés pour la vente dans une structure fermée chauffée artificiellement et faite de plastique, de plexiglass, de polyfilm ou de verre. Toutes les plantes qui commencent à cultiver dans une serre, mais dont la pousse est terminée avant la vente dans une pépinière devraient être considérées comme un produit de pépinière.
De plus, une pépinière et les produits de pépinière sont définis comme une gamme variée de plantes vivantes non comestibles qui poussent « dans le champ » ou dans des conteneurs à l'extérieur et qui sont vendues alors que leur système racinaire est intact. Les plantes vont de semis d'arbres à des arbres adultes. Comprennent les plantes annuelles et vivaces.
Par suite de cette définition, d'autres bâtiments qui ne correspondent pas à la définition de serre, telle que soulignée ci-dessus, peuvent être inclus dans l'ensemble de données en fonction de leurs caractéristiques visuelles communes. La base de données ne comprend pas de couplages avec les renseignements des entreprises, qui différencieraient les installations agricoles de celles qui n'ont aucun usage agricole.
La base de données a été créée en numérisant les serres dans l'imagerie d'observation de la Terre fournie, en citant en référence les serres étiquetées dans Google Earth Pro. Un travail minimal de montage et de validation de la forme des bâtiments numérisés est effectué, et de validation des bâtiments saisis dans la base de données qui ont des caractéristiques visuelles similaires. Les serres détectées à l'intérieur de l'ensemble de données ne précisent pas le type de serre, ce que l'on y fait pousser, et elles ne sont pas étiquetées différemment en fonction de toute caractéristique qui pourrait contribuer à les classer.
La base de données ne comprend pas de couplages avec les renseignements d'entreprise ni ne renvoie aux enquêtes de Statistique Canada, aux registres des entreprises, ou à d'autres sources. Cela permet à la base de données de maintenir une composante de base de données ouverte.
6. Méthodologie de compilation
La création de la BDOS comprenait deux étapes principales de traitement de l'information : Premièrement, le traitement des données d'observation de la Terre et deuxièmement, la création et le formatage de l'ensemble de données superposant les données d'observation de la Terre et mettant en correspondance les attributs de l'ensemble de données original avec les noms des variables standards (colonne). Un dictionnaire de données des variables utilisées est présenté à la section 7. Pour compiler les données dans la base de données géographiques en format shapefile finale :
- Les données d'observation de la Terre ont été extraites, décompressées et converties en format TIF si elles n'étaient pas déjà dans ce format lors de l'acquisition.
- Les sources d'imagerie satellitaire ont fait l'objet d'affinage panchromatique pour passer d'une résolution en pixels de 1,5 mètre à 50 cm en utilisant PCI Geomatica, la boîte à outils d'affinage panchromatique, et la bande d'affinage panchromatique incluse dans l'ensemble de données au moment de l'acquisition.
- L'imagerie a été visualisée dans le logiciel du SIG et un nouveau fichier géographique de format shapefile a été créé pour chaque ensemble de données d'observation de la Terre. Les serres visuellement comparables aux serres connues ont été identifiées dans l'observation de la Terre, et un nouvel enregistrement a été créé à l'intérieur du fichier de format shapefile.
- Des ensembles de données géographiques chaînés qui ont été créés pour représenter chaque ensemble de données utilisé à l'intérieur de chaque municipalité où les données ont été acquises.
Les champs de données originaux étaient l'identificateur et la forme uniques indiqués automatiquement à partir du logiciel. De nouveaux champs ont été créés pour fournir de l'information sur la source des données d'imagerie, l'emplacement centroïde et la province. Bien que des efforts aient été déployés pour s'assurer que toutes les serres étaient identifiées et que d'autres types de bâtiments n'étaient pas inclus, certains bâtiments pourraient être identifiés par erreur, ou il se pourrait que des serres aient été omises de l'image source. Si de telles erreurs sont soulignées, elles seront corrigées dans les versions futures de la BDOS.
En général, les données incluses dans la BDOS sont attribuables à une inspection visuelle seulement, et elles ne sont pas couplées à des bases de données, des enquêtes ou des sources privées officielles.
Géocodage
Les enregistrements dans la BDOS v1.0 comprennent la latitude, la longitude, la province ou le territoire et dans certains cas, des renseignements municipaux, le cas échéant. Les enregistrements ne comprennent aucun autre renseignement sur l'emplacement, comme l'adresse ou le code postal.
Standardisation des données
En raison des différentes normes adoptées dans les données originales, les mesures prises pour normaliser les données ont pu donner lieu à des erreurs. Les principes clés de la méthodologie utilisée étaient d'éviter les faux positifs et les modifications importantes des données. La méthodologie et les limites de chaque technique sont décrites ci-dessous. Les techniques de nettoyage banales, comme la suppression des espaces et de la ponctuation, ne sont pas décrites.
Comparaisons avec l'Enquête sur les cultures de serre, les pépinières et les gazonnières
L'Enquête annuelle sur les cultures de serre, les pépinières et les gazonnières (ECSPG) de Statistique Canada est un recueil d'information sur les productions des serres, les stocks des pépinières et les gazonnières produits au Canada et elle est fréquemment utilisée pour mener des analyses sur les tendances du marché. Puisque l'ECSPG n'utilise pas les renseignements de cette source de données, et que la BDOS n'utilise pas non plus les données de l'ECSPG, il n'est pas probable que les renseignements et la superficie totale pour une province ou une région sont équivalents. Les données demeurent séparées les unes des autres afin de permettre à la BDOS d'être publiée et utilisée par le public par l'entremise de la licence de données ouvertes.
Suppression des doublons
Pour la BDOS, seules les entrées qui semblaient être des doublons évidents, chevauchant les formes de serres, ont été choisies pour être supprimées.
7. Dictionnaire de données
Le dictionnaire de données ci-dessous décrit les variables contenues dans la BDOS exploratoire.
Variable – Record ID
- Nom
- FID
- Format
- Chaîne de caractères
- Source
- Générée à l'interne lors du traitement des données
- Description
- Identification unique d'objet ou de champ générée automatiquement lors du traitement des données
Variable – Forme
- Nom
- Shape
- Format
- Géométrie (spécifique à ArcGIS)
- Source
- Générée automatiquement à partir des propriétés géométriques des ensembles de données polygonales
- Description
- Décrit le type de données vectorielles dans l'ensemble de données
Variable – Date de l'image
- Nom
- ImageDate
- Format
- Long
- Source
- Fourni dans la source d'imagerie
- Description
- Année d'acquisition de l'imagerie
Variable – Province/territoire
- Nom
- PROV_TERR
- Format
- Chaîne de caractères
- Source
- Province ou du territoire
- Description
- Nom de la province ou du territoire
Variable – Identificateur unique de province
- Nom
- PRUID
- Format
- Nombre entier
- Source
- Converti du code de province
- Description
- Identificateur unique de la province
Variable - Longitude
- Nom
- Longitude
- Format
- Double
- Source
- Générée d'après le centre du polygone de l'immeuble en degrés décimaux
- Description
- Longitude
Variable - Latitude
- Nom
- Latitude
- Format
- Double
- Source
- Générée d'après le centre du polygone de l'immeuble en degrés décimaux
- Description
- Latitude
Variable – Source des données
- Nom
- Sources
- Format
- Chaîne de caractères
- Source
- Créée à partir des origines des données d'observation de la Terre.
- Description
- Nom de l'entité qui a fourni les données d'observation de la Terre.
8. Exactitude des données
Toutes les serres numérisées dans la BDOS étaient en référence à l'imagerie à l'intérieur d'un certain intervalle de dates, fourni par le gouvernement ou des portails de source ouverte sur des pages Web publiques. En général, outre le traitement et la numérisation des caractéristiques dans l'ensemble de données, l'imagerie a été utilisée telle quelle et elle peut ainsi créer des erreurs dans la base de données finale, où les caractéristiques n'ont pu être déterminées correctement dans certains cas. Compte tenu de la nature de l'acquisition des données et de la création de la base de données, il est possible que certaines erreurs soient détectées dans le produit géographique final.
9. Contactez-nous
Les projets de Statistique Canada sur les données ouvertes sont conçus pour être améliorés de façon continue. Pour fournir des informations sur les ajouts, les mises à jour, les corrections ou les omissions, ou pour plus d'informations, veuillez nous contacter à l'adresse suivante : statcan.lode-ecdo.statcan@statcan.gc.ca. Veuillez inclure le titre de la base de données ouvertes dans le sujet du courriel.
- Date de modification :