Centiles pour l'ADTR
centiles-adtr.pdf (PDF, 229.52 Ko)
Centiles de base pour l'ADTR
1. Un centile représente la valeur d'une variable en dessous de laquelle se retrouve un certain pourcentage d'observations. Par exemple, la procédure de centile de l'ADTR peut servir à trouver le revenu médian des hommes et des femmes. Pour calculer des statistiques de centile, utilisez la procédure suivante de l'ADTR :
%RTRAPercentile(
InputDataset=,
OutputName=,
ClassVarList=,
AnalysisVar=,
Percentiles=,
UserWeight=);
2. Définition des paramètres de %RTRAPercentile :
InputDataset = détermination de l'ensemble de données d'entrée de la librairie « WORK » de SAS à utiliser dans la procédure.
OutputName = détermination du nom des fichiers de sortie que vous voulez produire (maximum de 20 caractères, et le premier caractère doit être une lettre).
ClassVarList = détermination d'un maximum de cinq variables pour les dimensions du centile. Ces variables doivent être délimitées par des espaces ou des astérisques. Chaque variable doit contenir plus d'une valeur unique, mais pas plus de 500.
AnalysisVar = détermination d'une et une seule variable pour la statistique de centile. Cette variable doit être numérique.
Percentiles = détermination de trois centiles au maximum à partir de la liste suivante : 1, 5, 10, 20, 25, 30, 40, 50, 60, 70, 75, 80, 90, 95, 99. Les valeurs de centile doivent être délimitées par des espaces.
UserWeight = renvoi au document des paramètres de l'ADTR pour déterminer un poids d'enquête. La variable de pondération déterminée sera intégrée à l'ensemble de données d'entrée au moyen de la variable d'identification.
3. Exemple : Cette procédure peut être utilisée pour calculer des centiles de revenu. Supposons que vous exécutiez la procédure suivante de l'ADTR pour calculer le premier quartile, la médiane et le troisième quartile d'une variable appelée « Revenu » pour produire un tableau appelé « Tableau 1 ».
Vous aimeriez calculer cette statistique pour chaque sexe à partir d'une variable appelée « Sexe ».
%RTRAPercentile(
InputDataset=work.LFS,
OutputName=Tableau1,
ClassVarList=Sexe,
AnalysisVar=Revenu,
Percentiles=25 50 75,
UserWeight=Finalwt);
Le tableau suivant affiche les résultats pour l'exemple de la macro ci-dessus.
Sexe | Revenu_P25 | Revenu_P50 | Revenu_P75 | Revenu_
Count |
---|---|---|---|---|
20000 | 45000 | 110000 | 27268000 | |
Femmes | 28000 | 50000 | 100000 | 13448000 |
Hommes | 16000 | 38000 | 620000 | 13820000 |
Note : À noter que les produits des enquêtes comportant des poids bootstrap comprendront des renseignements additionnels sur des mesures de précision, par exemple, des indicateurs de qualité, des erreurs-types, des intervalles de confiance, etc. |
Centiles de niveau 5 dans le cadre de l'ADTR
1. Un centile est la valeur d'une variable en dessous de laquelle est compris un certain pourcentage d'observations. L'utilisation de la fonction de niveau 5 relative aux centiles permet à l'utilisateur de calculer la différence entre d'autres statistiques en cours d'exécution. Par exemple, la procédure d'ADTR permettant la production de tableaux de centiles de niveau 5 peut être utilisée pour trouver le revenu médian des hommes et des femmes, tout en déterminant une variation en pourcentage. Pour calculer les centiles de niveau 5, faites l'appel de procédure d'ADTR suivant :
%RTRAPercentileL5(
InputDataset=,
OutputName=,
ClassVarList=,
AnalysisVar=,
Percentiles=,
L5STAT=,
L5TYPE=,
L5BYVAR=,
USERWEIGHT=);
2. Définition du paramètre %RTRAPercentileL5 :
InputDataset = détermine l'ensemble de données d'entrée de la zone WORK qui sera utilisé dans le cadre de la procédure.
OutputName = détermine le nom des fichiers de sortie que vous voulez produire (maximum de 20 caractères et le premier caractère ne doit pas être un trait de soulignement).
ClassVarList = détermine un maximum de cinq variables pour établir les dimensions de la procédure de production de centiles. Ces variables doivent être séparées par des espaces ou des astérisques. Chaque variable doit contenir plus d'une, mais pas plus de 500 valeurs uniques.
AnalysisVar = détermine une seule variable aux fins de la procédure de production de centiles. Cette variable doit être de type numérique.
Percentiles = détermine jusqu'à trois centiles parmi les suivants : 1, 5, 10, 20, 25, 30, 40, 50, 60, 70, 75, 80, 90, 95 et 99. Les valeurs en centiles doivent être séparées par des espaces.
L5Stat = détermine quelle statistique d'ordre supérieur vous souhaitez utiliser. Cette statistique doit être l'une des suivantes : LC (variation de niveau), PC (variation en pourcentage) ou ST (test de signification).
L5ByVar = détermine la variable « BY ». La variable indiquée doit également être comprise dans <ClassVarList>.
L5BaseVal = détermine la manière dont les valeurs comprises dans les cellules du tableau se compareront. Cette manière doit être l'une des suivantes : « Sequential », « Base » ou « Global ».
UserWeight = consultez le document de paramètres d'ADTR pour déterminer un poids de sondage. La variable de pondération déterminée sera intégrée à l'ensemble de données d'entrée au moyen de la variable « ID ».
3. Exemple : La procédure suivante peut être utilisée pour calculer des centiles de revenu selon le sexe avec une variation en pourcentage. Supposons que vous exécutiez la procédure d'ADTR suivante pour calculer le premier quartile, la médiane et le troisième quartile d'une variable appelée « revenu » afin de générer un tableau nommé « Tableau2 ». Vous souhaitez calculer ces centiles pour chaque sexe à l'aide d'une variable appelée « sexe ».
Votre appel de procédure d'ADTR ressemblera à ceci :
%RTRAPercentileL5(
InputDataset=work.LFS,
OutputName=Table2,
ClassVarList=Sex,
AnalysisVar=Income,
Percentiles=25 50 75,
L5STAT=PC,
L5TYPE=global,
L5BYVAR=Sex,
USERWEIGHT=Finalwt);
Le tableau suivant présente les résultats de l'exemple de procédure ci-dessus.
Sexe | Revenu_P25 | Revenu_P50 | Revenu_P75 | Revenu_P25_PCG | Revenu_P50_PCG | Revenu_P75_PCG | Revenu_Count |
---|---|---|---|---|---|---|---|
1640 | 2200 | 2600 | 0 | 0 | 0 | 231750 | |
Féminin | 1510 | 2200 | 2550 | -0,08 | 0 | -0,0192 | 94250 |
Masculin | 1800 | 2250 | 2600 | 0,101 | 0,023 | 0 | 137500 |
Note : Les résultats des enquêtes comportant des poids bootstrap contiendront des renseignements supplémentaires sur les mesures de précision, à savoir les indicateurs de qualité, les erreurs types, les intervalles de confiance, etc. |
Centiles L5SOT dans le cadre de l'ADTR
1. Il s'agit de la macro de procédure d'ADTR permettant la production de tableaux de centiles comprenant une statistique de niveau 5 séquentielle dans le temps (L5SOT) donnée. Un centile est la valeur d'une variable en dessous de laquelle est compris un certain pourcentage d'observations. Par exemple, la procédure d'ADTR permettant la production de tableaux de centiles peut être utilisée pour trouver le revenu médian des hommes et des femmes. Pour calculer les centiles, faites l'appel de procédure d'ADTR suivant :
%RTRAPercentileL5SOT(
InputDataset=,
OutputName=,
ClassVarList=,
AnalysisVar=,
Percentiles=,
L5Stat=,
L5YrVar=,
L5MonVar=,
L5QtrVar=,
UserWeight=);
2. Définition du paramètre %RTRAPercentileL5SOT :
InputDataset = détermine l'ensemble de données d'entrée de la zone WORK qui sera utilisé dans le cadre de la procédure.
OutputName = détermine le nom donné aux fichiers de sortie définitifs correspondant à cet appel de la procédure RTRAPercentileL5SOT. L'ensemble de données de paramètres de post-traitement définit la correspondance entre le nom généré à l'interne et le nom des fichiers de sortie définitifs.
ClassVarList = détermine un maximum de cinq variables pour établir les dimensions de la procédure de production de centiles. Ces variables doivent être séparées par des espaces ou des astérisques.
AnalysisVar = détermine une seule variable aux fins de la procédure de production de centiles. Cette variable doit être de type numérique.
Centiles = détermine jusqu'à trois centiles parmi les suivants : 1, 5, 10, 20, 25, 30, 40, 50, 60, 70, 75, 80, 90, 95 et 99. Les valeurs en centiles doivent être séparées par des espaces.
L5Stat = Les valeurs valides sont « LC », « PC » et « ST » (insensibles à la casse).
L5YrVar = détermine le nom de la variable utilisée comme variable relative à l'année de niveau 5.
L5MonVar = (facultatif) détermine la variable relative au mois de niveau 5. On peut omettre ce paramètre ou le laisser vide. Si L5MonVar est indiqué, L5QtrVar doit être laissé vide ou omis.
L5QtrVar = (facultatif) détermine la variable relative au quart de niveau 5. On peut omettre ce paramètre ou le laisser vide. Si L5QtrVar est indiqué, L5MonVar doit être laissé vide ou omis.
L5TimeInt = (facultatif) détermine l'intervalle de temps de niveau 5. La valeur indiquée doit être un entier supérieur à 0. On peut omettre ce paramètre, mais l'entier par défaut doit alors être « 1 ».
UserWeight = consultez le document de paramètres d'ADTR pour déterminer un poids de sondage. La variable de pondération déterminée sera intégrée à l'ensemble de données d'entrée au moyen de la variable « ID ».
3. Exemple : La procédure suivante peut être utilisée pour analyser la variation en pourcentage de la rémunération hebdomadaire selon le sexe tout au long de l'année.
%RTRAPercentileL5SOT(
InputDataset=work.LFS,
OutputName=Table3,
ClassVarList=Sex,
AnalysisVar=NUM_WKLYEARN,
Percentiles = 25 50 75,
L5Stat=PC,
L5YrVar=NUM_SYEAR,
L5MonVar=NUM_MONTH,
L5TimeInt=1,
UserWeight=FINALWT);
Le tableau suivant présente les résultats de l'exemple de procédure ci-dessus. Veuillez noter qu'il s'agit d'une partie des données de la documentation et que certaines valeurs de la sortie réelle ont été extraites dans le but de générer des sorties plus petites. Dans le cadre de cet exemple, nous utiliserons uniquement les résultats pour le premier tiers de l'année 2016, avec une variation de 25 %.
NUM_MONTH | SEXE | NUM_WKLYEARN_P25 | NUM_WKLYEARN_P25_PCS | NUM_WKLYEARN_COUNT |
---|---|---|---|---|
Janvier | Masculin | 1500 | 0 | 6750 |
Janvier | Féminin | 1730 | 0 | 12250 |
Février | Masculin | 2100 | 0,4 | 9750 |
Février | Féminin | 1900 | 0,101 | 15500 |
Mars | Masculin | 2000 | -0,048 | 11750 |
Mars | Féminin | 1550 | -0,184 | 14000 |
Avril | Masculin | 2000 | 0 | 8500 |
Avril | Féminin | 1200 | -0,23 | 14750 |
Note : Les résultats des enquêtes comportant des poids bootstrap contiendront des renseignements supplémentaires sur les mesures de précision, à savoir les indicateurs de qualité, les erreurs types, les intervalles de confiance, etc. |
- Date de modification :