Vidéo - Joindre par Attributs (Partie 1) : jointures un à un

Numéro de catalogue : 89200005

Numéro d'exemplaire : 2020012

Date de diffusion : le 20 novembre 2020

QGIS Démo 12

Joindre par Attributs (Partie 1) - jointures un à un - Transcription vidéo

(Le symbole de Statistique Canada, le mot-symbole « Canada » et le titre : « Joindre par Attributs (Partie 1) – jointures un à un » apparaissent à l'écran.)

Dans le tutoriel d'aujourd'hui, je vais vous donner un aperçu de la jointure d'ensembles de données par attributs, en particulier la liaison de tableaux aux ensembles de données vectorielles pour leur analyse et leur visualisation. Pour examiner les variables tabulaires, il est très efficace de les relier à la géométrie vectorielle par des identifiants communs; dans ce casci, une colonne dans le tableau et un champ de couplage dans le fichier vectoriel. Il existe deux types de jointures d'attributs, et les procédures qui s'y rattachent diffèrent légèrement. Aujourd'hui, nous nous intéresserons au premier type:

La jointure un à un, qui consiste à faire correspondre une seule ligne dans le tableau pour chaque entité ou géométrie dans le fichier vectoriel. Pour que la jointure soit réussie, les identifiants doivent correspondre parfaitement. Par conséquent, les identificateurs numériques sont idéaux compte tenu des complications liées au texte; par exemple, les caractères spéciaux, l'espacement et de la sensibilité à la casse. Vous pouvez également copier et mettre en correspondance les entrées entre les ensembles de données pour accroître la probabilité que la jointure soit réussie.

Pour le tutoriel, nous allons utiliser les Chiffres de population et des logements qui ont été téléchargés précédemment. Leur mise en forme est idéale, puisq+ue les données de la jointure sont disponibles et que les modifications des limites entre les collectes des données du recensement ont été prises en compte; par conséquent, aucune mise en forme externe n'est nécessaire.

Vous pouvez charger les ensembles de données de tableaux dans QGIS en suivant les procédures établies, en cliquant deux fois avec le bouton gauche de la souris ou en utilisant la fonction glisserdéplacer dans le panneau Couches. Donc, avec les tableaux et les limites correspondantes qui ont été chargés, ouvrons la boîte Propriétés de la couche Division de recensement, que nous utiliserons pour faire la démonstration des procédures à suivre. Vous pouvez utiliser l'onglet Jointures pour réaliser des jointures un à un. Pour créer notre jointure, nous allons cliquer sur l'icône Plus.

La couche Jointure est l'ensemble de données que nous souhaitons joindre. Le champ Jointure est la colonne ou le champ utilisé pour lier les ensembles de données. Le champ dans la couche cible est le champ correspondant, dans le fichier vectoriel, aux identifiants uniques. Dans le cas présent, il s'agit de l'identifiant unique des divisions de recensement. Nous allons également vérifier les boîtes suivantes et préciser les champs à joindre; autrement, tous les champs sont joints par défaut.

Plus précisément, nous allons ajouter les champs « Chiffres de population et total des logements privés », « Variation en pourcentage », ainsi que « Superficie des terres », « Densité de la population » et les deux champs « Rang selon la population ». Nous allons supprimer le préfixe personnalisé pour conserver les noms initiaux des colonnes.

Maintenant, dans l'onglet Champs source, nous pouvons voir que les colonnes ont été jointes temporairement et qu'elles sont présentées sous forme de zones de texte simple, ce qu'elles ne sont pas. Il s'agit d'un paramètre par défaut de QGIS. De plus, les noms des champs qui ont été joints dépassent les limites du format de fichier que nous utilisons. Pour joindre les ensembles de données de façon permanente, nous devons exporter l'ensemble de données vers une nouvelle couche. Pour accomplir les trois tâches en même temps, nous nous servirons de l'outil de refactorisation des champs.

Nous pouvons rechercher l'outil dans la boîte à outils Traitement et cliquer deux fois sur le bouton gauche de la souris pour l'ouvrir. Fermons la description de l'outil. À l'aide des menus déroulants, nous pouvons changer les types de champs pour les colonnes jointes. Plus précisément, nous allons utiliser un Entier pour les variables sur le dénombrement tandis que pour les champs de la variation en pourcentage, de la superficie des terres et de la densité de la population, nous allons utiliser un Double, soit l'équivalent des types de champs en nombres décimaux. Nous devons ensuite préciser les paramètres : nous allons fixer la longueur à 12, et pour les colonnes des « nombres doubles », la précision sera de 2. Enfin, nous allons renommer nos champs sous forme d'entêtes abrégés de moins de dix caractères, soit la limite du format de fichier cartographique que nous utilisons. N'hésitez pas à utiliser les abréviations qui sont les plus intelligibles pour vous.

Nous allons sauvegarder le fichier en fournissant un répertoire de sortie et un nom. Je le sauvegarde dans le répertoire de la démonstration sur les jointures et je le nomme JDRPop, pour « jointure des populations de la Division de recensement ». Une fois cette étape terminée, rafraîchissez le panneau Navigation et chargez l'ensemble de données joint dans le panneau Couches.

Nos champs étant maintenant correctement attribués, nous pouvons visualiser les variables jointes et appliquer une symbologie graduée aux types de champs numériques, en particulier les variations de la population en pourcentage. Nous allons sélectionner une rampe de couleurs appropriée pour la visualisation. En ce qui concerne la couche Division de recensement, nous pouvons utiliser les Jolies ruptures pour établir les plages de valeurs pour la visualisation. Cliquez sur OK.

Nous pouvons maintenant examiner les variations spatiales dans les variables jointes pour l'ensemble des divisions au Canada.

Nous vous recommandons de vous exercer en reproduisant ces procédures avec la couche Subdivisions de recensement afin de vous familiariser avec la méthodologie. Là encore, vous devez spécifier la couche et l'information à joindre, dans ce casci, à l'aide de l'identifiant unique des subdivisions de recensement.

Pour la démonstration, j'ai chargé une couche des subdivisions jointes que j'ai créée précédemment. Compte tenu de la répartition des données de ce niveau, le mode quantile (nombre égal) a été utilisé pour établir les valeurs de rupture pour la visualisation. En basculant d'une fenêtre à l'autre, nous pouvons voir comment ces procédures permettent d'évaluer les variables à de multiples échelles assez rapidement et facilement.

À ce propos, si nous voulons dégager les tendances de façon plus générale, nous pouvons utiliser l'outil Agrégation. Nous devons préciser la couche à regrouper, puis le menu déroulant Grouper par Expression pour permet de sélectionner le champ utilisé pour regrouper les géométries et les attributs. Étant donné que nous utilisons l'identificateur unique provincial, les trois premiers champs de la Division de recensement sont redondants; nous allons donc les supprimer. Nous pouvons spécifier l'opérateur à appliquer dans le regroupement des champs à partir du menu déroulant. Nous allons utiliser First Value pour les deux premières zones de texte, et pour la variation en pourcentage, nous allons utiliser l'opérateur Moyenne, que nous recalculerons une fois le champ créé. Enfin, nous allons supprimer les champs « Rang selon la population ». Nous allons sauvegarder cette couche dans le même répertoire et la nommer JAgPopPr pour « populations provinciales jointes et regroupées ». Une fois cette étape terminée, nous allons une fois de plus rafraîchir le panneau Navigation et charger la couche.

À présent, nous allons recalculer le champ de la variation de la population en pourcentage à l'aide de la Calculatrice de champ. Nous allons donc ouvrir les parenthèses, soustraire la population de 2016 de celle de 2011, fermer les parenthèses et diviser le tout par la population de référence dans ce casci, Pop11 et multiplier par 100. Là encore, nous pouvons utiliser l'onglet Symbologie pour visualiser la variable aux trois niveaux.

Le dernier sujet à aborder est le menu déroulant Graphiques de la boîte à outils Traitement. Il peut être utilisé pour évaluer rapidement la répartition des données, comme le dénombrement des entités dans différentes catégories à l'aide des histogrammes et des diagrammes de quartiles, ainsi que les liens entre les variables jointes à l'aide du diagramme de dispersion. Nous pourrions utiliser la population de 2016 comme variable indépendante et le nombre total de logements privés dans la même année comme variable dépendante. Une fois la requête exécutée, nous pouvons cliquer sur l'hyperlien dans Afficher les résultats pour examiner le lien. Il n'est pas étonnant de constater qu'il y a un lien positif très fort entre la population et le nombre de logements privés.

Ceci conclut la démonstration sur les jointures un à un, lorsqu'il y a une seule entrée pour chaque entité correspondante, à l'aide de l'onglet Jointures. Les procédures s'appliquent également à la jointure de tableaux ou à la liaison de deux ensembles de données vectorielles ou plus pour pouvoir visualiser les variables. Nous avons également appris comment utiliser l'outil de refactorisation des champs pour modifier les types de champs des données jointes, et comment utiliser l'outil Agréger pour examiner les tendances de façon plus générale. Nous pourrions répéter ces procédures pour combiner de multiples variables afin d'examiner l'évolution des liens entre les variables d'un emplacement à l'autre et au fil du temps. Dans la prochaine démonstration, nous allons nous intéresser à la façon d'effectuer une jointure un à plusieurs.

(Les mots « Si vous avez des commentaires ou des questions au sujet de cette video, des outils de SIG ou d'autres produits ou services de Statistiques Canada, veuillez communiquer avec nous : statcan.sisagrequestssrsrequetesag.statcan@canada.ca » apparaissent à l'écran.)

(Le mot-symbole « Canada » s'affiche.)