Part (Share) pour l'ADTR

part-adtr.pdf (PDF, 251.88 Ko)

Part (Share) de base pour l'ADTR

La procédure de part (SHARE) pour l'ADTR calcule la répartition de la population d'une variable continue. Par exemple, cette procédure peut être utilisée pour calculer la part du revenu total gagnée par province. Pour produire des totalisations de part, utilisez la procédure suivante de l'ADTR :

%RTRAShare(
InputDataset=,
OutputName=,
ClassVarList=,
ShareOfVar=,
ByVar=,
UserWeight=);

2. Définition des paramètres de %RTRAShare :

InputDataset = détermination de l'ensemble de données d'entrée de la librairie « WORK » de SAS à utiliser dans la procédure.

OutputName = détermination du nom des fichiers de sortie que vous voulez produire (maximum de 20 caractères, et le premier caractère doit être une lettre).

ClassVarList = détermination d'un maximum de quatre variables pour les dimensions de la part. Ces variables doivent être délimitées par des espaces ou des astérisques. Chaque variable doit contenir plus d'une valeur unique, mais pas plus de 500. Ce paramètre peut être vide si vous souhaitez calculer des parts pour l'ensemble de la population.

ShareOfVar = détermination d'une et une seule variable pour la statistique de part. Cette variable doit être numérique. La part sera calculée à l'égard de cette variable continue.

ByVar = détermination d'une et une seule variable pour la statistique de part. Cette variable doit comprendre plus d'une valeur unique, mais pas plus de 500.

UserWeight = renvoi au document des paramètres de l'ADTR pour déterminer un poids d'enquête. La variable de pondération déterminée sera intégrée à l'ensemble de données d'entrée au moyen de la variable d'identification.

3. Exemple : Cette procédure peut être utilisée pour calculer la part du revenu total par province. Supposons que vous exécutiez la procédure suivante de l'ADTR pour calculer une part d'une variable appelée « Revenu ». Vous aimeriez que cette part soit calculée pour une variable appelée « Province ».

%RTRAShare(
InputDataset=work.LFS,
OutputName=Table1,
ClassVarList=,
ShareOfVar=Income,
ByVar=Province,
UserWeight=Finalwt);

Le tableau suivant affiche les résultats pour l'exemple de la macro ci-dessus.

Tableau 1
Résultats pour l'exemple de la macro
Province _Part_ _Count_
    27268000
ONT. 0,0183 428000
QC 0,0041 115000
C.-B. 0,028 784000
SASK. 0,021 628000
MAN. 0,197 6420000
ALB. 0,4 10580000
N.-É. 0,036 955000
T.-N.-L. 0,034 806000
Î.-P.-É. 0,117 2839000
N.-B. 0,149 3713000
Note : À noter que les produits des enquêtes comportant des poids bootstrapcomprendront des renseignements additionnels sur des mesures de précision, par exemple, des indicateurs de qualité, des erreurs-types, des intervalles de confiance, etc.

Les résultats de ce tableau peuvent être interprétés de la façon suivante :

  • Le compte de population pondéré de ce tableau est égal à 27 268 000.
  • La part du revenu total au Canada qui provient de l'Ontario est égale à 1,83 %. Le compte de population pondéré ayant servi au calcul pour l'Ontario est égal à 428 000.
  • La part du revenu total au Canada qui provient du Québec est égale à 0,41 %. Le compte de population pondéré ayant servi au calcul pour le Québec est égal à 115 000.
  • .... etc.

Parts (Share) de niveau 5 dans le cadre de l'ADTR

1. Il s'agit de la macro de procédure d'accès à distance en temps réel (ADTR) permettant la production de tableaux de parts comprenant une statistique de niveau 5 donnée. Par exemple, cette procédure peut être utilisée pour calculer la part du revenu total gagné par province. Pour générer des tableaux de parts, faites l'appel de procédure d'ADTR suivant :

%RTRAShareL5(
InputDataset=,
OutputName=,
ClassVarList=,
ShareOfVar=,
ByVar=,
L5Stat=,
L5Type=,
L5ByVar=,
L5BaseVal=,
UserWeight=)

2. Définition du paramètre %RTRAShareL5 :

InputDataset = détermine l'ensemble de données d'entrée de la zone WORK qui sera utilisé dans le cadre de la procédure.

OutputName = détermine le nom donné aux fichiers de sortie définitifs correspondant à cet appel de la procédure RTRAShareL5. Les résultats tabulés se voient attribuer un nom généré à l'interne plutôt que le nom indiqué dans ce paramètre. L'ensemble de données de paramètres de post-traitement définit la correspondance entre le nom généré à l'interne et le nom des fichiers de sortie définitifs.

ClassVarList = détermine un maximum de quatre variables pour établir les dimensions de la procédure de production de parts. Dans le cas de RTRAShareL5, on peut omettre ce paramètre ou le laisser vide. Les variables de cette liste peuvent être séparées par un nombre quelconque d'espaces, d'astérisques ou de combinaisons d'espaces et d'astérisques.

ShareOfVar = détermine une seule variable aux fins de la procédure de production de parts. Cette variable doit être de type numérique. La part sera calculée selon cette variable continue.

ByVar = détermine une seule variable aux fins de la procédure de production de parts. Cette variable doit contenir plus d'une, mais pas plus de 500 valeurs uniques. Elle est également ajoutée à la liste de variables de classe dans CreateEngineXML

L5Stat = détermine le nom de la statistique de niveau 5. Les valeurs valides sont « LC » et « ST » (insensibles à la casse).

L5Type = détermine le type de statistique de niveau 5. Les valeurs valides sont « SEQUENTIAL », « BASE » et « GLOBAL » (insensibles à la casse).

L5ByVar = détermine la variable « BY » de niveau 5. La variable indiquée doit être comprise dans ClassVarList ou être la même que ByVar.

L5BaseVal = détermine la valeur de base de niveau 5. Ce paramètre est applicable uniquement si L5Type est « BASE », et il doit être laissé vide si L5Type est « SEQUENTIAL » ou « GLOBAL ». S'il y a lieu, la valeur indiquée doit être comprise dans la variable L5ByVar de l'ensemble de données d'entrée.

UserWeight = la variable de pondération de l'enquête (et les variables de pondération bootstrap s'il y en a) se trouve dans un ensemble de données de pondération de la bibliothèque de données d'ADTR. Le nom de l'ensemble de données de pondération est le même que celui de la variable de pondération de l'enquête qu'il contient.

3. Exemple : La procédure suivante peut être utilisée pour calculer la part des paiements hypothécaires selon le type de famille, calculée en fonction du revenu total. Supposons que vous exécutiez la procédure d'ADTR suivante pour calculer une part de la variable appelée « mtgpmts » qui fait référence aux paiements hypothécaires. Vous souhaitez que cette part soit calculée pour une variable appelée « revenu ».

%RTRAShareL5(
InputDataset=work.family1,
OutputName=Tableau2,
ClassVarList=,
ShareOfVar=mtgpmts,
ByVar=Revenu,
L5Stat=ST,
L5Type=Global,
L5ByVar=Revenu
UserWeight=weight);

Le tableau suivant présente les résultats de l'exemple de procédure ci-dessus.

Tableau 2
Résultats pour l'exemple de la macro
Revenu _Share_ Share_STG _Count_
Moins de 23 200 $ 0,029 -1 2920500
De 23 200 $ à 41 325 $ 0,082 -1 2872500
De 41 325 $ à 61 200 $ 0,165 -1 2896000
De 61 200 $ à 91 675 $ 0,31 -1 2948000
Plus de 91 675 $ 0,41 -1 2933000
Note : Les résultats des enquêtes comportant des poids bootstrap contiendront des renseignements supplémentaires sur les mesures de précision, à savoir les indicateurs de qualité, les erreurs types, les intervalles de confiance, etc.

Parts (Share) L5SOT dans le cadre de l'ADTR

1. Il s'agit de la macro de procédure d'accès à distance en temps réel (ADTR) permettant la production de tableaux de parts comprenant une statistique de niveau 5 séquentielle dans le temps (L5SOT) donnée. Par exemple, cette procédure peut être utilisée pour calculer la part du revenu total gagné par province. Pour générer des tableaux de parts, faites l'appel de procédure d'ADTR suivant :

%RTRAShareL5SOT(
InputDataset=,
OutputName=,
ClassVarList=,
ShareOfVar=,
ByVar=,
L5Stat=,
L5YrVar=,
L5MonVar=,
L5QtrVar=,
L5TimeInt=,
UserWeight=)

2. Définition du paramètre %RTRAShareL5SOT :

InputDataset = détermine l'ensemble de données d'entrée de la zone WORK qui sera utilisé dans le cadre de la procédure.

OutputName = détermine le nom donné aux fichiers de sortie définitifs correspondant à cet appel de la procédure RTRAShareL5SOT. Les résultats tabulés se voient attribuer un nom généré à l'interne plutôt que le nom indiqué dans ce paramètre. L'ensemble de données de paramètres de post-traitement définit la correspondance entre le nom généré à l'interne et le nom des fichiers de sortie définitifs.

ClassVarList = détermine un maximum de quatre variables pour établir les dimensions de la procédure de production de parts. Ces variables doivent être séparées par des espaces ou des astérisques. On peut omettre ce paramètre ou le laisser vide.

ShareOfVar = détermine une seule variable aux fins de la procédure de production de parts. Cette variable doit être de type numérique. La part sera calculée selon cette variable continue.

ByVar = détermine une seule variable aux fins de la procédure de production de parts. Cette variable doit contenir plus d'une, mais pas plus de 500 valeurs uniques. Elle est également ajoutée à la liste de variables de classe dans CreateEngineXML.

L5Stat = détermine le nom de la statistique de niveau 5. Les valeurs valides sont « LC » et « ST » (insensibles à la casse).

L5YrVar = détermine la variable relative à l'année de niveau 5.

L5MonVar = (facultatif) détermine la variable relative au mois de niveau 5. On peut omettre ce paramètre ou le laisser vide. Si L5MonVar est indiqué, L5QtrVar doit être laissé vide ou omis.

L5QtrVar = (facultatif) détermine la variable relative au quart de niveau 5. On peut omettre ce paramètre ou le laisser vide. Si L5QtrVar est indiqué, L5MonVar doit être laissé vide ou omis.

L5TimeInt = (facultatif) détermine l'intervalle de temps de niveau 5. La valeur indiquée doit être un entier supérieur à 0. On peut omettre ce paramètre, mais l'entier par défaut doit alors être « 1 ».

UserWeight = consultez le document de paramètres d'ADTR pour déterminer un poids de sondage. La variable de pondération déterminée sera intégrée à l'ensemble de données d'entrée au moyen de la variable « ID ».

3. Exemple : La procédure suivante peut être utilisée pour calculer la part des heures selon le niveau de scolarité, calculée par province. Supposons que vous exécutiez la procédure d'ADTR suivante pour calculer une part de la variable relative aux heures appelée « HEURES ». Vous souhaitez que cette part soit calculée pour une variable appelée « SCOLARITÉ ».

%RTRAShareL5SOT(
InputDataset=work.LFS,
OutputName=Tableau3,
ClassVarList=PROVINCE,
ShareOfVar=HEURES,
ByVar=SCOLARITÉ,
L5Stat=LC,
L5YrVar=YEAR,
L5ByVar=MONTH,
UserWeight=FINALWT);

Le tableau suivant présente les résultats de l'exemple de procédure ci-dessus.

Tableau 3
Résultats pour l'exemple de la macro
YEAR MONTH PROVINCE SCOLARITÉ _SHARE_ SHARE_LC HOURS_COUNT
2015 Janvier Ontario   1   6767750
2015 Janvier Ontario Collège 0,35   2291500
2015 Janvier Ontario École secondaire 0,25   1806000
2015 Janvier Ontario Moins que le secondaire 0,068   537750
2015 Janvier Ontario Université 0,33   2132500
2015 Février Ontario   1 0 6802000
2015 Février Ontario Collège 0,36 0,0048 2333000
2015 Février Ontario École secondaire 0,25 -0,0032 1788000
2015 Février Ontario Moins que le secondaire 0,066 -0,0023 529250
2015 Février Ontario Université 0,33 0,00076 2151750
2015 Mars Ontario   1 0 6781250
2015 Mars Ontario Collège 0,35 -0,0028 2305750
2015 Mars Ontario École secondaire 0,25 0,0034 1791500
2015 Mars Ontario Moins que le secondaire 0,065 -0,00062 528750
2015 Mars Ontario Université 0,33 9,00E-06 2155250
Note : Les résultats des enquêtes comportant des poids bootstrap contiendront des renseignements supplémentaires sur les mesures de précision, à savoir les indicateurs de qualité, les erreurs types, les intervalles de confiance, etc.
Date de modification :

Proportions pour l'ADTR

proportions-adtr.pdf (PDF, 238.28 Ko)

Proportions de base pour l'ADTR

1. La procédure de proportion pour l'ADTR calcule la répartition de la population d'une variable discrète. Par exemple, cette procédure peut être utilisée pour calculer la proportion de la population souffrant d'asthme. Pour produire des statistiques de proportion, utilisez la procédure suivante de l'ADTR :

%RTRAProportion(
InputDataset=,
OutputName=,
ClassVarList=,
ByVar=,
UserWeight=);

2. Définition des paramètres de %RTRAProportion :

InputDataset = détermination de l'ensemble de données d'entrée de la librairie « WORK » de SAS à utiliser dans la procédure.

OutputName = détermination du nom des fichiers de sortie que vous voulez produire (maximum de 20 caractères, et le premier caractère doit être une lettre).

ClassVarList = détermination d'un maximum de quatre variables pour les dimensions de la proportion. Ces variables doivent être délimitées par des espaces ou des astérisques. Chaque variable doit contenir plus d'une valeur unique, mais pas plus de 500. Ce paramètre peut être vide si vous souhaitez calculer une proportion pour l'ensemble de la population.

ByVar = détermination d'une et une seule variable pour la statistique de proportion. Cette variable doit comprendre plus d'une valeur unique, mais pas plus de 500. Votre répartition de la population sera calculée selon cette variable discrète.

UserWeight = renvoi au document des paramètres de l'ADTR pour déterminer un poids d'enquête. La variable de pondération déterminée sera intégrée à l'ensemble de données d'entrée au moyen de la variable d'identification.

3. Exemple : Cette procédure peut être utilisée pour calculer le revenu moyen. Supposons que vous exécutiez la procédure suivante de l'ADTR pour calculer la moyenne d'une variable appelée « Revenu » pour un tableau appelé « Tableau 1 ». Vous aimeriez calculer cette statistique pour différents niveaux de scolarité et selon le sexe à partir des variables appelées « Scolarité » et « Sexe ».

%RTRAProportion(
InputDataset=work.CCHS,
OutputName=Table1,
ClassVarList=Sex,
ByVar=Asthma,
UserWeight=Finalwt);

Le tableau suivant affiche les résultats pour l'exemple de la macro ci-dessus.

Tableau 1
Résultats pour l'exemple de la macro
Sexe Asthme _Proportion_ _Count_
      200
  Oui 0,10 20
  Non 0,90 180
Femmes     110
Femmes Oui 0,09 10
Femmes Non 0,91 100
Hommes     90
Hommes Oui 0,11 10
Hommes Non 0,89 80

Proportions de niveau 5 dans le cadre de l'ADTR

1. Il s'agit de la macro de procédure d'accès à distance en temps réel (ADTR) permettant la production de tableaux de proportions comprenant une statistique de niveau 5 donnée. La procédure d'ADTR de production de proportions calcule la répartition de la population d'une variable discrète. Par exemple, cette procédure peut être utilisée pour calculer la proportion de la population asthmatique. Pour générer une proportion, faites l'appel de procédure d'ADTR suivant :

%RTRAProportionL5(
InputDataset=,
OutputName=,
ClassVarList=,
ByVar=,
L5Stat=,
L5Type=,
L5ByVar=,
L5BaseVal=,
UserWeight=);

2. Définition du paramètre %RTRAProportionL5 :

InputDataset = détermine l'ensemble de données d'entrée de la zone WORK qui sera utilisé dans le cadre de la procédure.

OutputName = détermine le nom donné aux fichiers de sortie définitifs correspondant à cet appel de la procédure RTRAProportionL5. L'ensemble de données de sortie des résultats tabulés se voit attribuer un nom généré à l'interne plutôt que le nom indiqué dans ce paramètre. L'ensemble de données de paramètres de post-traitement définit la correspondance entre le nom généré à l'interne et le nom des fichiers de sortie définitifs.

ClassVarList = détermine un maximum de quatre variables pou
binaisons d'espaces et d'astérisques.

ByVar = détermine le nom de la variable « BY » et est utilisée comme variable de partage. Elle est également ajoutée à la liste de variables de classe dans CreateEngineXML.

L5Stat = détermine le nom de la statistique de niveau 5. Les valeurs valides sont « LC » et « ST » (insensibles à la casse).

L5Type = détermine le type de statistique de niveau 5. Les valeurs valides sont « SEQUENTIAL », « BASE » et « GLOBAL » (insensibles à la casse).

L5ByVar = détermine la variable « BY » de niveau 5. La variable indiquée doit être comprise dans ClassVarList ou être la même que ByVar.

L5BaseVal = détermine la valeur de base de niveau 5. Ce paramètre est applicable uniquement si L5Type est « BASE », et il doit être laissé vide si L5Type est « SEQUENTIAL » ou « GLOBAL ». S'il y a lieu, la valeur indiquée doit être comprise dans la variable L5ByVar de l'ensemble de données d'entrée.

UserWeight = la variable de pondération de l'enquête (et les variables de pondération bootstrap s'il y en a) se trouve dans un ensemble de données de pondération de la bibliothèque de données d'ADTR. Le nom de l'ensemble de données de pondération est le même que celui de la variable de pondération de l'enquête qu'il contient.

3. Exemple : La procédure suivante peut être utilisée pour calculer la proportion de la population ayant subi une intervention médicale donnée.

Votre appel de procédure d'ADTR ressemblera à ceci :

%RTRAProportionL5(
InputDataset=work.ccs_asy,
OutputName=Tableau2,
ClassVarList=DHH_SEX,
byVar=either_sc,
L5Stat=LC,
L5Type=sequential,
L5ByVar=either_sc,
UserWeight=wts_m);

Le tableau suivant présente les résultats de l'exemple de procédure de production de proportions de niveau 5 ci-dessus. Dans cet exemple, « sc » renvoie à une réponse « oui » ou « non » indiquant si une personne a subi ou non l'intervention médicale en question. Veuillez noter qu'il s'agit d'une partie des données de la documentation et que certaines valeurs de la sortie réelle ont été extraites dans le but de générer des sorties plus petites.

Tableau 2
Résultats pour l'exemple de la macro
DHH_SEX EITHER_SC PROPORTION PROPORTION_LCS COUNT
Masculin Oui 0,52 0,044 10500
Masculin Oui 0,4 -0,194 50500
Masculin Non 0,63 0 43000
Masculin Non 0,48 0 9750
Féminin Oui 0,27 -0,46 21250
Féminin Oui 0,48 -0,041 9750
Féminin Non 0,73 0 57250
Féminin Non 0,52 0 10750

Proportions L5SOT dans le cadre de l'ADTR

1. Il s'agit de la macro de procédure d'accès à distance en temps réel (ADTR) permettant la production de tableaux de proportions comprenant une statistique de niveau 5 séquentielle dans le temps (L5SOT) donnée. La procédure d'ADTR de production de proportions calcule la répartition de la population d'une variable discrète. Par exemple, cette procédure peut être utilisée pour calculer la proportion de la population asthmatique. Pour générer une proportion, faites l'appel de procédure d'ADTR suivant :

%RTRAProportionL5SOT(
InputDataset=,
OutputName=,
ClassVarList=,
ByVar=,
L5Stat=,
L5YrVar=,
L5MonVar=,
L5QtrVar=,
L5TimeInt=,
UserWeight=);

2. Définition du paramètre %RTRAProportionL5SOT :

InputDataset = détermine l'ensemble de données d'entrée de la zone WORK qui sera utilisé dans le cadre de la procédure.

OutputName = détermine le nom donné aux fichiers de sortie définitifs correspondant à cet appel de la procédure RTRAProportionL5SOT. L'ensemble de données de sortie des résultats tabulés se voit attribuer un nom généré à l'interne plutôt que le nom indiqué dans ce paramètre. L'ensemble de données de paramètres de post-traitement définit la correspondance entre le nom généré à l'interne et le nom des fichiers de sortie définitifs.

ClassVarList = détermine un maximum de quatre variables pour établir les dimensions de la procédure de production de proportions. Ces variables doivent être séparées par des espaces ou des astérisques. Chaque variable doit contenir plus d'une, mais pas plus de 500 valeurs uniques. On peut omettre ce paramètre ou le laisser vide.

ByVar = détermine le nom de la variable « BY » et est utilisée comme variable de partage. Elle est également ajoutée à la liste de variables de classe dans CreateEngineXML.

L5Stat = détermine le nom de la statistique de niveau 5. Les valeurs valides sont « LC », « PC » et « ST » (insensibles à la casse).

L5YrVar = détermine la variable relative à l'année de niveau 5.

L5MonVar = (facultatif) détermine la variable relative au mois de niveau 5. On peut omettre ce paramètre ou le laisser vide. Si L5MonVar est indiqué, L5QtrVar doit être laissé vide ou omis.

L5QtrVar = (facultatif) détermine la variable relative au quart de niveau 5. On peut omettre ce paramètre ou le laisser vide. Si L5QtrVar est indiqué, L5MonVar doit être laissé vide ou omis.

L5TimeInt = (facultatif) détermine l'intervalle de temps de niveau 5. La valeur indiquée doit être un entier supérieur à 0. On peut omettre ce paramètre, mais l'entier par défaut doit alors être « 1 ».

UserWeight = consultez le document de paramètres d'ADTR pour déterminer un poids de sondage. La variable de pondération déterminée sera intégrée à l'ensemble de données d'entrée au moyen de la variable « ID ».

3. Exemple : La procédure suivante peut être utilisée pour calculer la proportion de la population ayant subi une intervention médicale donnée.

Votre appel de procédure d'ADTR ressemblera à ceci :

%RTRAProportionL5SOT(
InputDataset=work.ccs_asy,
OutputName=Tableau3,
ClassVarList=DHH_SEX,
L5Stat=LC,
L5YrVar=ADM_YOI,
L5MonVar=ADM_MOI,
L5TimeInt=3,
UserWeight=wts_m);

Le tableau suivant présente les résultats de l'exemple de procédure ci-dessus. Nous sommes notamment en mesure de déterminer le changement de proportion « séquentiel dans le temps » d'un mois à l'autre selon le sexe. Veuillez noter qu'il s'agit d'une partie des données de la documentation et que certaines valeurs de la sortie réelle ont été extraites dans le but de générer des sorties plus petites.

Tableau 3
Résultats pour l'exemple de la macro
ADM_YOI ADM_MOI SEX _COUNT_ PROPORTION_LCS
2012 Mars Masculin 178250  
2012 Avril Masculin 319000 0,151
2012 Mai Masculin 235000 0,021
2012 Juin Masculin 164750 0,058
2012 Mars Féminin 220000  
2012 Avril Féminin 251250 0,061
2012 Mai Féminin 276500 -0,041
2012 Juin Féminin 144500 0,02
Date de modification :

Répartition en pourcentage de l'ADTR

repartition-pourcentage-adtr.pdf (PDF, 313.94 Ko)

Répartition en pourcentage de base pour l'ADTR

1. La répartition en pourcentage est une distribution de fréquences dans laquelle les fréquences de classes individuelles sont exprimées en pourcentage de la fréquence totale, égale à 100. Elle est également connue sous l'appellation de distribution de fréquences relatives ou de tableau de fréquences relatives.

La macro %RTRAPercentDist est utilisable pour produire des totalisations de répartition en pourcentage.

Afin de créer une répartition en pourcentage, faites appel à la procédure d'ADTR suivante :

%RTRAPercentDist(
InputDataset=,
OutputName=,
ClassVarList=,
UserWeight=);

2. Définition des paramètres de %RTRAPercentDist :

InputDataset = détermination de l'ensemble de données d'entrée de la librairie « WORK » de SAS à utiliser dans la procédure

OutputName = détermination du nom des fichiers de sortie que vous voulez produire (maximum de 20 caractères, et le premier caractère doit être une lettre).

ClassVarList = détermination d'un maximum de cinq variables pour les dimensions du centile. Ces variables doivent être délimitées par des espaces ou des astérisques. Chaque variable doit contenir plus d'une valeur unique, mais pas plus de 500.

UserWeight = renvoi au document des paramètres de l'ADTR pour déterminer un poids d'enquête. La variable de pondération déterminée sera intégrée à l'ensemble de données d'entrée au moyen de la variable d'identification.

3. L'application de la macro %RTRAPercentDist varie dépendamment du fait que les données comportent ou non des poids bootstrap.

Lorsque les données se voient appliquer des poids bootstrap, le fichier de sortie contiendra des indicateurs de qualité propres aux variables sélectionnées. Pour en savoir davantage au sujet des indicateurs de qualité, veuillez visiter la page des sorties d'ADTR.

Exemple d'application de la macro %RTRAPercentDist faisant appel à des données comportant des poids bootstrap :

Supposons que vous avez exécuté la procédure d'ADTR suivante pour créer un tableau de répartition en pourcentage intitulé « Tableau 1 », avec la variable appelée « Sexe » faisant appel à l'Enquête auprès des peuples autochtones (EPA) de 2012.

Votre procédure d'ADTR ressemblera à ce qui suit :

%RTRAPercentDist(
InputDataset=work.APS,
OutputName=Tableau1,
ClassVarList= Sexe,
UserWeight=WGHT);

Tableau 1
Résultats pour l'exemple de la macro
Sexe _PERCENTDIST_ PERCENTDIST_SE PERCENTDIST_CILB PERCENTDIST_CIUB PERCENTDIST_BSWCNT _COUNT_
Femmes et hommes 1 0 0,999865 1 1000 963100
Femmes 0,53 0,00523 0,52 0,54 1000 513640
Hommes 0,47 0,00523 0,46 0,48 1000 449460

Répartition en pourcentage de niveau 5 dans le cadre de l'ADTR

1. Il s'agit de la macro de procédure d'accès à distance en temps réel (ADTR) permettant la production de tableaux de répartition en pourcentage comprenant une statistique de niveau 5 donnée. RTRAPercentDistL5 est une macro enveloppante. Elle fait appel à la macro ProcessRequest, qui est la routine de traitement commune à toutes les macros de procédures d'ADTR. On peut l'utiliser pour produire des tableaux de répartition en pourcentage.

Pour générer une répartition en pourcentage de niveau 5, faites l'appel de procédure d'ADTR suivant :

%RTRAPercentDistL5(
InputDataset=,
OutputName=,
ClassVarList=,
L5Stat=,
L5Type=,
L5ByVar=,
L5BaseVal=,
UserWeight=);

2. Définition du paramètre %RTRAPercentDistL5 :

InputDataset = détermine l'ensemble de données d'entrée de la zone WORK qui sera utilisé dans le cadre de la procédure.

OutputName = détermine le nom donné aux fichiers de sortie correspondant à cet appel de la procédure %RTRAPercentDistL5. Les résultats tabulés se voient attribuer un nom généré à l'interne plutôt que le nom indiqué dans ce paramètre. L'ensemble de données de paramètres de post-traitement définit la correspondance entre le nom généré à l'interne et le nom des fichiers de sortie définitifs. La création du nom des fichiers de sortie définitifs est ensuite effectuée lors du post-traitement.

ClassVarList = détermine un maximum de cinq variables à inclure dans le tableau de répartition en pourcentage. Les variables de cette liste peuvent être séparées par un nombre quelconque d'espaces, d'astérisques ou de combinaisons d'espaces et d'astérisques.

L5Stat = détermine le nom de la statistique de niveau 5. Les valeurs valides sont « LC » et « ST » (insensibles à la casse).

L5Type = détermine le type de statistique de niveau 5. Les valeurs valides sont « SEQUENTIAL », « BASE » et « GLOBAL » (insensibles à la casse).

L5ByVar = détermine la variable « BY » de niveau 5. La variable indiquée doit être comprise dans ClassVarList.

L5BaseVal = détermine la valeur de base de niveau 5. Ce paramètre est applicable uniquement si L5Type est « BASE », et il doit être laissé vide si L5Type est « SEQUENTIAL » ou « GLOBAL ». S'il y a lieu, la valeur indiquée doit être comprise dans la variable L5ByVar de l'ensemble de données d'entrée.

UserWeight = la variable de pondération de l'enquête (et les variables de pondération bootstrap s'il y en a) se trouve dans un ensemble de données de pondération de la bibliothèque de données d'ADTR. Le nom de l'ensemble de données de pondération est le même que celui de la variable de pondération de l'enquête qu'il contient.

3. Exemple : supposons que vous exécutiez la procédure d'ADTR suivante pour générer un tableau de répartition en pourcentage nommé « Tableau2 » avec les variables « scolarité » et « province » à l'aide de l'Enquête sur la population active.

Votre appel de procédure d'ADTR ressemblera à ceci :

%RTRAPercentDistL5(
InputDataset=work.LFS,
OutputName=Table2,
ClassVarList= Education Province,
L5Stat=LC,
L5Type=sequential,
L5ByVar=education,
L5BaseVal=,
UserWeight=FINALWT);

Le tableau suivant présente les résultats de l'exemple de procédure de répartition en pourcentage de niveau 5 ci-dessus. Veuillez noter qu'il s'agit d'une partie des données de la documentation et que certaines valeurs de la sortie réelle ont été extraites dans le but de générer des sorties plus petites.

Tableau 2
Résultats de l'exemple de procédure
SCOLARITÉ PROVINCE PERCENTDIST PERCENTDIST_LCS COUNT
Collège Manitoba 0,0079 0 3321500
École secondaire Manitoba 0,0088 0,00091 3702250
Université Manitoba 0,003 -0,0057 2531750
Collège Ontario 0,096 0 40167000
École secondaire Ontario 0,093 -0,0031 38880000
Université Ontario 0,086 -0,028 36012500

Répartition en pourcentage L5SOT dans le cadre de l'ADTR

Il s'agit de la macro de procédure d'accès à distance en temps réel (ADTR) permettant la production de tableaux de répartition en pourcentage comprenant une statistique de niveau 5 séquentielle dans le temps (L5SOT) donnée. RTRAPercentDistL5SOT est une macro enveloppante. Elle fait appel à la macro ProcessRequest, qui est la routine de traitement commune à toutes les macros de procédures d'ADTR.

La macro %RTRAPercentDistL5SOT peut être utilisée pour produire des tableaux de répartition en pourcentage.

Pour générer une répartition en pourcentage de niveau 5, faites l'appel de procédure d'ADTR suivant :

%RTRAPercentDistL5SOT(
InputDataset=,
OutputName=,
ClassVarList=,
L5Stat=,
L5YrVar=,
L5MonVar=,
L5QtrVar=,
L5TimeInt=,
UserWeight=);

2. Définition du paramètre

%RTRAPercentDistL5SOT :

InputDataset = détermine l'ensemble de données d'entrée de la zone WORK qui sera utilisé dans le cadre de la procédure.

OutputName = détermine le nom donné aux fichiers de sortie correspondant à cet appel de la procédure RTRAPercentDistL5SOT. Les résultats tabulés se voient attribuer un nom généré à l'interne plutôt que le nom indiqué dans ce paramètre. L'ensemble de données de paramètres de post-traitement définit la correspondance entre le nom généré à l'interne et le nom des fichiers de sortie définitifs. La création du nom des fichiers de sortie définitifs est ensuite effectuée lors du post-traitement.

ClassVarList = détermine un maximum de cinq variables à inclure dans le tableau de répartition en pourcentage. Les variables de cette liste peuvent être séparées par un nombre quelconque d'espaces, d'astérisques ou de combinaisons d'espaces et d'astérisques.

L5Stat = détermine le nom de la statistique de niveau 5. Les valeurs valides sont « LC » et « ST » (insensibles à la casse).

L5YrVar = détermine la variable relative à l'année de niveau 5.

L5MonVar = (facultatif) détermine la variable relative au mois de niveau 5. On peut omettre ce paramètre ou le laisser vide. Si L5MonVar est indiqué, L5QtrVar doit être laissé vide ou omis.

L5QtrVar = (facultatif) détermine la variable relative au quart de niveau 5. On peut omettre ce paramètre ou le laisser vide. Si L5QtrVar est indiqué, L5MonVar doit être laissé vide ou omis.

L5TimeInt = (facultatif) détermine l'intervalle de temps de niveau 5. La valeur indiquée doit être un entier supérieur à 0. On peut omettre ce paramètre, mais l'entier par défaut doit alors être « 1 ».

UserWeight = consultez le document de paramètres d'ADTR pour déterminer un poids de sondage. La variable de pondération déterminée sera intégrée à l'ensemble de données d'entrée au moyen de la variable « ID ».

3. L'application de %RTRAPercentDistL5SOT varie selon que les données comportent des poids bootstrap. Lorsque des poids bootstrap sont appliqués aux données, les fichiers de sortie comprennent des indicateurs de qualité propres aux variables sélectionnées. Pour obtenir de plus amples renseignements sur les indicateurs de qualité, veuillez consulter la page sur les sorties de l'ADTR.

Voici un exemple de la procédure %RTRAPercentDistL5SOT utilisant des données comportant des poids bootstrap :

Supposons que vous exécutiez la procédure d'ADTR suivante pour générer un tableau de répartition en pourcentage nommé « Tableau3 » avec la variable « scolarité » à l'aide de l'Enquête sur la population active.

Votre appel de procédure d'ADTR ressemblera à ceci :

%RTRAPercentDistL5SOT(
InputDataset=work.LFS,
OutputName=Table3,
ClassVarList= Education,
L5Stat=LC,
L5YrVar=NUM_SYEAR,
L5MonVar=NUM_SMTH,
L5TimeInt=4,
UserWeight=FINALWT);

Le tableau suivant présente les résultats de l'exemple de procédure ci-dessus. Nous sommes notamment en mesure de déterminer la répartition en pourcentage « séquentielle dans le temps » d'un mois à l'autre selon divers niveaux de scolarité. Veuillez noter qu'il s'agit d'une partie des données de la documentation et que certaines valeurs de la sortie réelle ont été extraites dans le but de générer des sorties plus petites. Dans le cadre de cet exemple, nous obtiendrons uniquement des résultats pour les réponses « Université ».

Tableau 3
Résultats de l'exemple de procédure
NUM_SYEAR NUM_SMTH EDUCATION PERCENTDIST PERCENTDIST_LCS COUNT
2015 Avril Université 0,194   6773500
  Mai Université 0,195 0,00173 6799250
  Juin Université 0,198 0,0045 6908500
  Juillet Université 0,2 0,0076 7024250
  Août Université 0,2 0,009 7113250
Date de modification :

Centiles pour l'ADTR

centiles-adtr.pdf (PDF, 229.52 Ko)

Centiles de base pour l'ADTR

1. Un centile représente la valeur d'une variable en dessous de laquelle se retrouve un certain pourcentage d'observations. Par exemple, la procédure de centile de l'ADTR peut servir à trouver le revenu médian des hommes et des femmes. Pour calculer des statistiques de centile, utilisez la procédure suivante de l'ADTR :

%RTRAPercentile(
InputDataset=,
OutputName=,
ClassVarList=,
AnalysisVar=,
Percentiles=,
UserWeight=);

2. Définition des paramètres de %RTRAPercentile :

InputDataset = détermination de l'ensemble de données d'entrée de la librairie « WORK » de SAS à utiliser dans la procédure.

OutputName = détermination du nom des fichiers de sortie que vous voulez produire (maximum de 20 caractères, et le premier caractère doit être une lettre).

ClassVarList = détermination d'un maximum de cinq variables pour les dimensions du centile. Ces variables doivent être délimitées par des espaces ou des astérisques. Chaque variable doit contenir plus d'une valeur unique, mais pas plus de 500.

AnalysisVar = détermination d'une et une seule variable pour la statistique de centile. Cette variable doit être numérique.

Percentiles = détermination de trois centiles au maximum à partir de la liste suivante : 1, 5, 10, 20, 25, 30, 40, 50, 60, 70, 75, 80, 90, 95, 99. Les valeurs de centile doivent être délimitées par des espaces.

UserWeight = renvoi au document des paramètres de l'ADTR pour déterminer un poids d'enquête. La variable de pondération déterminée sera intégrée à l'ensemble de données d'entrée au moyen de la variable d'identification.

3. Exemple : Cette procédure peut être utilisée pour calculer des centiles de revenu. Supposons que vous exécutiez la procédure suivante de l'ADTR pour calculer le premier quartile, la médiane et le troisième quartile d'une variable appelée « Revenu » pour produire un tableau appelé « Tableau 1 ».

Vous aimeriez calculer cette statistique pour chaque sexe à partir d'une variable appelée « Sexe ».

%RTRAPercentile(
InputDataset=work.LFS,
OutputName=Tableau1,
ClassVarList=Sexe,
AnalysisVar=Revenu,
Percentiles=25 50 75,
UserWeight=Finalwt);

Le tableau suivant affiche les résultats pour l'exemple de la macro ci-dessus.

Tableau 1
Résultats pour l'exemple de la macro
Sexe Revenu_P25 Revenu_P50 Revenu_P75 Revenu_

Count

  20000 45000 110000 27268000
Femmes 28000 50000 100000 13448000
Hommes 16000 38000 620000 13820000
Note : À noter que les produits des enquêtes comportant des poids bootstrap comprendront des renseignements additionnels sur des mesures de précision, par exemple, des indicateurs de qualité, des erreurs-types, des intervalles de confiance, etc.

Centiles de niveau 5 dans le cadre de l'ADTR

1. Un centile est la valeur d'une variable en dessous de laquelle est compris un certain pourcentage d'observations. L'utilisation de la fonction de niveau 5 relative aux centiles permet à l'utilisateur de calculer la différence entre d'autres statistiques en cours d'exécution. Par exemple, la procédure d'ADTR permettant la production de tableaux de centiles de niveau 5 peut être utilisée pour trouver le revenu médian des hommes et des femmes, tout en déterminant une variation en pourcentage. Pour calculer les centiles de niveau 5, faites l'appel de procédure d'ADTR suivant :

%RTRAPercentileL5(
InputDataset=,
OutputName=,
ClassVarList=,
AnalysisVar=,
Percentiles=,
L5STAT=,
L5TYPE=,
L5BYVAR=,
USERWEIGHT=);

2. Définition du paramètre %RTRAPercentileL5 :

InputDataset = détermine l'ensemble de données d'entrée de la zone WORK qui sera utilisé dans le cadre de la procédure.

OutputName = détermine le nom des fichiers de sortie que vous voulez produire (maximum de 20 caractères et le premier caractère ne doit pas être un trait de soulignement).

ClassVarList = détermine un maximum de cinq variables pour établir les dimensions de la procédure de production de centiles. Ces variables doivent être séparées par des espaces ou des astérisques. Chaque variable doit contenir plus d'une, mais pas plus de 500 valeurs uniques.

AnalysisVar = détermine une seule variable aux fins de la procédure de production de centiles. Cette variable doit être de type numérique.

Percentiles = détermine jusqu'à trois centiles parmi les suivants : 1, 5, 10, 20, 25, 30, 40, 50, 60, 70, 75, 80, 90, 95 et 99. Les valeurs en centiles doivent être séparées par des espaces.

L5Stat = détermine quelle statistique d'ordre supérieur vous souhaitez utiliser. Cette statistique doit être l'une des suivantes : LC (variation de niveau), PC (variation en pourcentage) ou ST (test de signification).

L5ByVar = détermine la variable « BY ». La variable indiquée doit également être comprise dans <ClassVarList>.

L5BaseVal = détermine la manière dont les valeurs comprises dans les cellules du tableau se compareront. Cette manière doit être l'une des suivantes : « Sequential », « Base » ou « Global ».

UserWeight = consultez le document de paramètres d'ADTR pour déterminer un poids de sondage. La variable de pondération déterminée sera intégrée à l'ensemble de données d'entrée au moyen de la variable « ID ».

3. Exemple : La procédure suivante peut être utilisée pour calculer des centiles de revenu selon le sexe avec une variation en pourcentage. Supposons que vous exécutiez la procédure d'ADTR suivante pour calculer le premier quartile, la médiane et le troisième quartile d'une variable appelée « revenu » afin de générer un tableau nommé « Tableau2 ». Vous souhaitez calculer ces centiles pour chaque sexe à l'aide d'une variable appelée « sexe ».

Votre appel de procédure d'ADTR ressemblera à ceci :

%RTRAPercentileL5(
InputDataset=work.LFS,
OutputName=Table2,
ClassVarList=Sex,
AnalysisVar=Income,
Percentiles=25 50 75,
L5STAT=PC,
L5TYPE=global,
L5BYVAR=Sex,
USERWEIGHT=Finalwt);

Le tableau suivant présente les résultats de l'exemple de procédure ci-dessus.

Tableau 2
Résultats de l'exemple de procédure
Sexe Revenu_P25 Revenu_P50 Revenu_P75 Revenu_P25_PCG Revenu_P50_PCG Revenu_P75_PCG Revenu_Count
  1640 2200 2600 0 0 0 231750
Féminin 1510 2200 2550 -0,08 0 -0,0192 94250
Masculin 1800 2250 2600 0,101 0,023 0 137500
Note : Les résultats des enquêtes comportant des poids bootstrap contiendront des renseignements supplémentaires sur les mesures de précision, à savoir les indicateurs de qualité, les erreurs types, les intervalles de confiance, etc.

Centiles L5SOT dans le cadre de l'ADTR

1. Il s'agit de la macro de procédure d'ADTR permettant la production de tableaux de centiles comprenant une statistique de niveau 5 séquentielle dans le temps (L5SOT) donnée. Un centile est la valeur d'une variable en dessous de laquelle est compris un certain pourcentage d'observations. Par exemple, la procédure d'ADTR permettant la production de tableaux de centiles peut être utilisée pour trouver le revenu médian des hommes et des femmes. Pour calculer les centiles, faites l'appel de procédure d'ADTR suivant :

%RTRAPercentileL5SOT(
InputDataset=,
OutputName=,
ClassVarList=,
AnalysisVar=,
Percentiles=,
L5Stat=,
L5YrVar=,
L5MonVar=,
L5QtrVar=,
UserWeight=);

2. Définition du paramètre %RTRAPercentileL5SOT :

InputDataset = détermine l'ensemble de données d'entrée de la zone WORK qui sera utilisé dans le cadre de la procédure.

OutputName = détermine le nom donné aux fichiers de sortie définitifs correspondant à cet appel de la procédure RTRAPercentileL5SOT. L'ensemble de données de paramètres de post-traitement définit la correspondance entre le nom généré à l'interne et le nom des fichiers de sortie définitifs.

ClassVarList = détermine un maximum de cinq variables pour établir les dimensions de la procédure de production de centiles. Ces variables doivent être séparées par des espaces ou des astérisques.

AnalysisVar = détermine une seule variable aux fins de la procédure de production de centiles. Cette variable doit être de type numérique.

Centiles = détermine jusqu'à trois centiles parmi les suivants : 1, 5, 10, 20, 25, 30, 40, 50, 60, 70, 75, 80, 90, 95 et 99. Les valeurs en centiles doivent être séparées par des espaces.

L5Stat = Les valeurs valides sont « LC », « PC » et « ST » (insensibles à la casse).

L5YrVar = détermine le nom de la variable utilisée comme variable relative à l'année de niveau 5.

L5MonVar = (facultatif) détermine la variable relative au mois de niveau 5. On peut omettre ce paramètre ou le laisser vide. Si L5MonVar est indiqué, L5QtrVar doit être laissé vide ou omis.

L5QtrVar = (facultatif) détermine la variable relative au quart de niveau 5. On peut omettre ce paramètre ou le laisser vide. Si L5QtrVar est indiqué, L5MonVar doit être laissé vide ou omis.

L5TimeInt = (facultatif) détermine l'intervalle de temps de niveau 5. La valeur indiquée doit être un entier supérieur à 0. On peut omettre ce paramètre, mais l'entier par défaut doit alors être « 1 ».

UserWeight = consultez le document de paramètres d'ADTR pour déterminer un poids de sondage. La variable de pondération déterminée sera intégrée à l'ensemble de données d'entrée au moyen de la variable « ID ».

3. Exemple : La procédure suivante peut être utilisée pour analyser la variation en pourcentage de la rémunération hebdomadaire selon le sexe tout au long de l'année.

%RTRAPercentileL5SOT(
InputDataset=work.LFS,
OutputName=Table3,
ClassVarList=Sex,
AnalysisVar=NUM_WKLYEARN,
Percentiles = 25 50 75,
L5Stat=PC,
L5YrVar=NUM_SYEAR,
L5MonVar=NUM_MONTH,
L5TimeInt=1,
UserWeight=FINALWT);

Le tableau suivant présente les résultats de l'exemple de procédure ci-dessus. Veuillez noter qu'il s'agit d'une partie des données de la documentation et que certaines valeurs de la sortie réelle ont été extraites dans le but de générer des sorties plus petites. Dans le cadre de cet exemple, nous utiliserons uniquement les résultats pour le premier tiers de l'année 2016, avec une variation de 25 %.

Tableau 3
Résultats de l'exemple de procédure
NUM_MONTH SEXE NUM_WKLYEARN_P25 NUM_WKLYEARN_P25_PCS NUM_WKLYEARN_COUNT
Janvier Masculin 1500 0 6750
Janvier Féminin 1730 0 12250
Février Masculin 2100 0,4 9750
Février Féminin 1900 0,101 15500
Mars Masculin 2000 -0,048 11750
Mars Féminin 1550 -0,184 14000
Avril Masculin 2000 0 8500
Avril Féminin 1200 -0,23 14750
Note : Les résultats des enquêtes comportant des poids bootstrap contiendront des renseignements supplémentaires sur les mesures de précision, à savoir les indicateurs de qualité, les erreurs types, les intervalles de confiance, etc.
Date de modification :

Moyenne pour l'ADTR

moyenne-adtr.pdf (PDF, 228.11 Ko)

Moyenne de base pour l'ADTR

1. La procédure de moyenne pour l'ADTR produit la moyenne pour une variable continue. Par exemple, cette procédure peut être utilisée pour calculer le revenu moyen de personnes ayant différents niveaux de scolarité par sexe. Pour produire des statistiques de moyenne, utilisez la procédure suivante de l'ADTR :

%RTRAMean(
InputDataset=,
OutputName=,
ClassVarList=,
AnalysisVarList=,
UserWeight=);

2. Définition des paramètres de %RTRAMean :

InputDataset = détermination de l'ensemble de données d'entrée de la librairie « WORK » de SAS à utiliser dans la procédure.

OutputName = détermination du nom des fichiers de sortie que vous voulez produire (maximum de 20 caractères, et le premier caractère doit être une lettre).

ClassVarList = détermination d'un maximum de cinq variables pour les dimensions de la moyenne. Ces variables doivent être délimitées par des espaces ou des astérisques. Chaque variable doit contenir plus d'une valeur unique, mais pas plus de 500.

AnalysisVarList = détermination d'un maximum de trois variables pour la moyenne. Ces variables doivent être numériques. Chacune de ces variables doit comprendre au moins quatre valeurs uniques. Ces variables doivent être délimitées par des espaces ou des astérisques.

UserWeight = renvoi au document des paramètres de l'ADTR pour déterminer un poids d'enquête. La variable de pondération déterminée sera intégrée à l'ensemble de données d'entrée au moyen de la variable d'identification.

3. Exemple : Cette procédure peut être utilisée pour calculer le revenu moyen. Supposons que vous exécutiez la procédure suivante de l'ADTR pour calculer la moyenne d'une variable appelée « Revenu » pour un tableau appelé « Tableau 1 ». Vous aimeriez calculer cette statistique pour différents niveaux de scolarité et selon le sexe à partir des variables appelées « Scolarité » et « Sexe ».

%RTRAMean(
InputDataset=work.LFS,
OutputName=Tableau1,
ClassVarList=Scolarite Sexe,
AnalysisVarList=Revenu,
UserWeight=Finalwt);

Le tableau suivant affiche les résultats pour l'exemple de la macro ci-dessus.

Tableau 1
Résultats pour l'exemple de la macro
Scolarité Sexe Revenu_mean Revenu_Count
  Femmes 30000 100
  Hommes 40000 100
Niveau supérieur à des études secondaires Femmes 35000 60
Niveau supérieur à des études secondaires Hommes 50000 55
Niveau inférieur à des études secondaires Femmes 25000 40
Niveau inférieur à des études secondaires Hommes 30000 45
Note : À noter que les produits des enquêtes comportant des poids bootstrap comprendront des renseignements additionnels sur des mesures de précision, par exemple, des indicateurs de qualité, des erreurs-types, des intervalles de confiance, etc.

Moyennes de niveau 5 dans le cadre de l'ADTR

1. Il s'agit de la macro de procédure d'accès à distance en temps réel (ADTR) permettant la production de tableaux de moyennes comprenant une statistique de niveau 5 donnée. RTRAMeanL5 est une macro enveloppante. Elle fait appel à la macro ProcessRequest, qui est la routine de traitement commune à toutes les macros de procédures d'ADTR. Pour générer une moyenne, faites l'appel de procédure d'ADTR suivant :

%RTRAMeanL5(
InputDataset=,
OutputName=,
ClassVarList=,
AnalysisVarList=,
L5Stat=,
L5Type=,
L5ByVar=,
L5BaseVal=,
UserWeight=);

2. Définition du paramètre %RTRAMeanL5 :

InputDataset = détermine l'ensemble de données d'entrée de la zone WORK qui sera utilisé dans le cadre de la procédure.

OutputName = détermine le nom donné aux fichiers de sortie définitifs correspondant à cet appel de la procédure RTRAFreqL5. Les résultats tabulés se voient attribuer un nom généré à l'interne plutôt que le nom indiqué dans ce paramètre. L'ensemble de données de paramètres de post-traitement définit la correspondance entre le nom généré à l'interne et le nom des fichiers de sortie définitifs. La création du nom des fichiers de sortie définitifs est ensuite effectuée lors du post-traitement.

ClassVarList = détermine un maximum de cinq variables pour établir les dimensions de la procédure de production de moyennes. Les variables de cette liste peuvent être séparées par un nombre quelconque d'espaces, d'astérisques ou de combinaisons d'espaces et d'astérisques.

AnalysisVarList = détermine un maximum de trois variables aux fins de la procédure de production de moyennes. Ces variables doivent être séparées par des espaces.

L5Stat = détermine le nom de la statistique de niveau 5. Les valeurs valides sont « LC », « PC » et « ST » (insensibles à la casse).

L5Type = détermine le type de statistique de niveau 5. Les valeurs valides sont « SEQUENTIAL », « BASE » et « GLOBAL » (insensibles à la casse).

L5ByVar = détermine la variable « BY » de niveau 5. La variable indiquée doit être comprise dans ClassVarList.

L5BaseVal = détermine la valeur de base de niveau 5. Ce paramètre est applicable uniquement si L5Type est « BASE », et il doit être laissé vide si L5Type est « SEQUENTIAL » ou « GLOBAL ». S'il y a lieu, la valeur indiquée doit être comprise dans la variable L5ByVar de l'ensemble de données d'entrée.

UserWeight = la variable de pondération de l'enquête (et les variables de pondération bootstrap s'il y en a) se trouve dans un ensemble de données de pondération de la bibliothèque de données d'ADTR. Le nom de l'ensemble de données de pondération est le même que celui de la variable de pondération de l'enquête qu'il contient.

3. Exemple : La procédure suivante peut être utilisée pour calculer les types de logements moyens. Supposons que vous exécutiez la procédure d'ADTR suivante pour calculer la moyenne d'une variable appelée « NUM_DWELCODE » dans un tableau nommé « Tableau2 ». Vous souhaitez calculer cette moyenne pour différents niveaux de scolarité et selon la province à l'aide de variables appelées « scolarité » et « province ».

%RTRAMeanL5(
InputDataset=work.LFS,
OutputName=Table2,
ClassVarList=Education Province,
AnalysisVarList=NUM_DWELCODE,
L5Stat=LC,
L5Type=global,
L5ByVar=education,
L5BaseVal=,
UserWeight=FINALWT);

Le tableau suivant présente les résultats de l'exemple de procédure de production de moyennes de niveau 5 ci-dessus. Veuillez noter qu'il s'agit d'une partie des données de la documentation et que certaines valeurs de la sortie réelle ont été extraites dans le but de générer des sorties plus petites.

Tableau 2
Résultats pour l'exemple de la macro
Scolarité Province NUM_DWELCODE Mean NUM_DWELCODE _MEAN_LCG NUM_DWELCODE Count
Collège Manitoba 1,82 -0,084 3319000
École secondaire Manitoba 1,94 0,042 3699000
Université Manitoba 1,93 0,035 2531500
Collège Ontario 2,1 -0,099 40139250
École secondaire Ontario 2,2 0,044 38821750
Université Ontario 2,3 0,164 35991000

Moyenne L5SOT dans le cadre de l'ADTR

1. Il s'agit de la macro de procédure d'accès à distance en temps réel (ADTR) permettant la production de tableaux de moyennes comprenant une statistique de niveau 5 séquentielle dans le temps (L5SOT) donnée. RTRAMeanL5SOT est une macro enveloppante. Elle fait appel à la macro ProcessRequest, qui est la routine de traitement commune à toutes les macros de procédures d'ADTR. Pour générer une moyenne, faites l'appel de procédure d'ADTR suivant :

%RTRAMeanL5SOT(
InputDataset=,
OutputName=,
ClassVarList=,
AnalysisVarList=,
L5Stat=,
L5YrVar=,
L5MonVar=,
L5QtrVar=,
UserWeight=);

2. Définition du paramètre %RTRAMeanL5SOT :

InputDataset = détermine l'ensemble de données d'entrée de la zone WORK qui sera utilisé dans le cadre de la procédure.

OutputName = détermine le nom des fichiers de sortie correspondant à cet appel de la procédure RTRAMeanL5SOT. Les résultats tabulés se voient attribuer un nom généré à l'interne plutôt que le nom indiqué dans ce paramètre. L'ensemble de données de paramètres de post-traitement définit la correspondance entre le nom généré à l'interne et le nom des fichiers de sortie définitifs. La création du nom des fichiers de sortie définitifs est ensuite effectuée lors du post-traitement.

ClassVarList = détermine un maximum de cinq variables pour établir les dimensions de la procédure de production de moyennes. Ces variables doivent être séparées par des espaces ou des astérisques. Chaque variable doit contenir plus d'une, mais pas plus de 500 valeurs uniques.

AnalysisVarList = détermine un maximum de trois variables aux fins de la procédure de production de moyennes. Ces variables doivent être de type numérique. Trois variables au maximum peuvent être indiquées et doivent être séparées par des espaces.

L5Stat = détermine le nom de la statistique de niveau 5. Les valeurs valides sont « LC », « PC » et « ST » (insensibles à la casse).

L5YrVar = détermine la variable relative à l'année de niveau 5. Si L5MonVar ou L5QtrVar ne sont pas indiquées, ce champ doit désigner une variable contenant plusieurs années pour illustrer le facteur « séquentiel dans le temps ».

L5MonVar = (facultatif) détermine la variable relative au mois de niveau 5. On peut omettre ce paramètre ou le laisser vide. Si L5MonVar est indiqué, L5QtrVar doit être laissé vide ou omis.

L5QtrVar = (facultatif) détermine la variable relative au quart de niveau 5. On peut omettre ce paramètre ou le laisser vide. Si L5QtrVar est indiqué, L5MonVar doit être laissé vide ou omis.

L5TimeInt = (facultatif) détermine l'intervalle de temps de niveau 5. La valeur indiquée doit être un entier supérieur à 0. On peut omettre ce paramètre, mais l'entier par défaut doit alors être « 1 ».

UserWeight = consultez le document de paramètres d'ADTR pour déterminer un poids de sondage. La variable de pondération déterminée sera intégrée à l'ensemble de données d'entrée au moyen de la variable « ID ».

3. Exemple : La procédure suivante peut être utilisée pour calculer les types de logements moyens. Supposons que vous exécutiez la procédure d'ADTR suivante pour calculer la moyenne d'une variable appelée « NUM_DWELCODE » dans un tableau nommé « Tableau3 ». Vous souhaitez calculer cette moyenne pour différents niveaux de scolarité et selon la province à l'aide de variables appelées « scolarité » et « province ».

%RTRAMeanL5SOT(
InputDataset=work.LFS,
OutputName=Table3,
ClassVarList=Education Province,
AnalysisVarList=NUM_DWELCODE,
L5Stat=LC,
L5YrVar=NUM_SYEAR,
L5MonVar=NUM_SMTH,
L5TimeInt=2,
UserWeight=FINALWT);

Le tableau suivant présente les résultats de l'exemple de procédure ci-dessus. Nous sommes notamment en mesure de déterminer le changement de moyenne « séquentiel dans le temps » d'un mois à l'autre selon divers niveaux de scolarité. Veuillez noter qu'il s'agit d'une partie des données de la documentation et que certaines valeurs de la sortie réelle ont été extraites dans le but de générer des sorties plus petites. Dans le cadre de cet exemple, nous obtiendrons uniquement des résultats pour les réponses « Université ».

Tableau 3
Résultats pour l'exemple de la macro
NUM_SYEAR NUM_SMTH Scolarité NUM_DWELCODE Mean NUM_DWELCODE _MEAN_LCS NUM_DWELCODE Count
2015 Janvier Université 2,4   6717000
  Février Université 2,4   6725500
  Mars Université 2,4 0,032 6731750
  Avril Université 2,4 0,0132 6770750
  Mai Université 2,4 -0,021 6796750
  Juin Université 2,4 -0,027 6905750
Date de modification :

Fréquence pour l'ADTR

frequence-adtr.pdf (PDF, 237 Ko)

Fréquence de base pour l'ADTR

1. La procédure de fréquence pour l'ADTR fournit des comptes pour une variable discrète. Par exemple, cette procédure peut être utilisée pour calculer le nombre de personnes dans la population, selon différents niveaux de scolarité et selon le sexe. Pour produire des totalisations de fréquence, utilisez la procédure suivante de l'ADTR :

%RTRAFreq(
InputDataset=,
OutputName=,
ClassVarList=,
UserWeight=);

2. Définition des paramètres de %RTRAFreq :

InputDataset = détermination de l'ensemble de données d'entrée de la librairie « WORK » de SAS à utiliser dans la procédure.

OutputName = détermination du nom des fichiers de sortie que vous voulez produire (maximum de 20 caractères, et le premier caractère doit être une lettre).

ClassVarList = détermination d'un maximum de cinq variables à inclure dans le tableau de fréquence. Ces variables doivent être délimitées par des espaces ou des astérisques. Chaque variable doit contenir plus d'une valeur unique, mais pas plus de 500.

UserWeight = renvoi au document des paramètres de l'ADTR pour déterminer un poids d'enquête. La variable de pondération déterminée sera intégrée à l'ensemble de données d'entrée au moyen de la variable d'identification.

3. Exemple : Supposons que vous exécutiez la procédure suivante de l'ADTR pour produire un tableau de fréquence appelé « Tableau 1 », à partir des variables « Scolarité » et « Sexe ».

Votre procédure de l'ADTR se présentera ainsi :

%RTRAFreq(
InputDataset=work.LFS,
OutputName=Table1,
ClassVarList=Education Sex,
UserWeight=Finalwt);

Le tableau suivant affiche les résultats pour l'exemple de la macro ci-dessus.

Tableau 1
Résultats pour l'exemple de la macro
Scolarité Sexe Count
  Femmes 100
  Hommes 100
Niveau supérieur à des études secondaires Femmes 60
Niveau supérieur à des études secondaires Hommes 55
Niveau inférieur à des études secondaires Femmes 40
Niveau inférieur à des études secondaires Hommes 45
Note : À noter que les produits des enquêtes comportant des poids bootstrap comprendront des renseignements additionnels sur des mesures de précision, par exemple, des indicateurs de qualité, des erreurs-types, des intervalles de confiance, etc.

Fréquences de niveau 5 dans le cadre de l'ADTR

1. Il s'agit de la macro de procédure d'accès à distance en temps réel (ADTR) permettant la production de tableaux de fréquences (somme des poids) comprenant une statistique de niveau 5 donnée. RTRAFreqL5 est une macro enveloppante. Elle fait appel à la macro ProcessRequest, qui est la routine de traitement commune à toutes les macros de procédures d'ADTR. Par exemple, cette procédure peut être utilisée pour calculer le niveau 5 précis (la variation de niveau) entre les divers niveaux de scolarité des personnes de chaque province. Pour générer les tableaux de fréquences annuels, faites l'appel de procédure d'ADTR suivant :

%RTRAFreqL5(
InputDataset=,
OutputName=,
ClassVarList=,
L5Stat=,
L5Type=,
L5ByVar=,
L5BaseVal=,
UserWeight=);

2. Définition du paramètre %RTRAFreqL5 :

InputDataset = détermine l'ensemble de données d'entrée de la zone WORK qui sera utilisé dans le cadre de la procédure.

OutputName = détermine le nom donné aux fichiers de sortie définitifs correspondant à cet appel de la procédure RTRAFreqL5. Les résultats tabulés se voient attribuer un nom généré à l'interne plutôt que le nom indiqué dans ce paramètre. L'ensemble de données de paramètres de post-traitement définit la correspondance entre le nom généré à l'interne et le nom des fichiers de sortie définitifs. La création du nom des fichiers de sortie définitifs est ensuite effectuée lors du post-traitement.

ClassVarList = détermine un maximum de cinq variables à inclure dans le tableau de fréquences. Les variables de cette liste peuvent être séparées par un nombre quelconque d'espaces, d'astérisques ou de combinaisons d'espaces et d'astérisques.

L5Stat = détermine le nom de la statistique de niveau 5. Les valeurs valides sont « LC », « PC » et « ST » (insensibles à la casse).

L5Type = détermine le type de statistique de niveau 5. Les valeurs valides sont « SEQUENTIAL », « BASE » et « GLOBAL » (insensibles à la casse).

L5ByVar = détermine la variable « BY » de niveau 5. La variable indiquée doit être comprise dans ClassVarList.

L5BaseVal = détermine la valeur de base de niveau 5. Ce paramètre est applicable uniquement si L5Type est « BASE », et il doit être laissé vide si L5Type est « SEQUENTIAL » ou « GLOBAL ». S'il y a lieu, la valeur indiquée doit être comprise dans la variable L5ByVar de l'ensemble de données d'entrée.

UserWeight = la variable de pondération de l'enquête (et les variables de pondération bootstrap s'il y en a) se trouve dans un ensemble de données de pondération de la bibliothèque de données d'ADTR. Le nom de l'ensemble de données de pondération est le même que celui de la variable de pondération de l'enquête qu'il contient.

3. Exemple : supposons que vous exécutiez la procédure d'ADTR suivante pour générer un tableau de fréquences de niveau 5 nommé « Tableau2 » avec les variables « scolarité » et « province » à l'aide de L5YrVar.

Votre appel de procédure d'ADTR ressemblera à ceci :

%RTRAFreqL5(
InputDataset=work.LFS,
OutputName=Tableau2,
ClassVarList=province scolarité,
L5Stat=LC,
L5Type=global,
L5ByVar=province,
L5BaseVal=,
UserWeight=FINALWT);

Le tableau suivant présente les résultats de l'exemple de procédure de fréquence de niveau 5 ci-dessus. Veuillez noter qu'il s'agit d'une partie des données de la documentation et que certaines valeurs de la sortie réelle ont été extraites dans le but de générer des sorties plus petites.

Tableau 2
Résultats pour l'exemple de la macro
SCOLARITÉ PROVINCE _COUNT_ COUNT_LCG
Collège Manitoba 3321500 -108137000
Collège Ontario 40167000 -71291500
Collège Autre 67970000 -43488500
École secondaire Manitoba 3702250 -92634500
École secondaire Ontario 38880000 -57456750
École secondaire Autre 53754500 -42582250
Université Manitoba 2531750 -81162500
Université Ontario 36012500 -47681750
Université Autre 45150000 -38544250
Note : Les résultats des enquêtes comportant des poids bootstrap contiendront des renseignements supplémentaires sur les mesures de précision, à savoir les indicateurs de qualité, les erreurs types, les intervalles de confiance, etc.

Fréquences L5SOT dans le cadre de l'ADTR

1. Il s'agit de la macro de procédure d'accès à distance en temps réel (ADTR) permettant la production de tableaux de fréquences (somme des poids) comprenant une statistique de niveau 5 séquentielle dans le temps (L5SOT) donnée. RTRAFreqL5SOT est une macro enveloppante. Elle fait appel à la macro ProcessRequest, qui est la routine de traitement commune à toutes les macros de procédures d'ADTR. Par exemple, cette procédure peut être utilisée pour calculer le niveau 5 précis (la variation de niveau) entre les divers niveaux de scolarité des personnes de chaque province. Pour générer les tableaux de fréquences annuels, faites l'appel de procédure d'ADTR suivant :

%RTRAFreqL5SOT(
InputDataset=,
OutputName=,
ClassVarList=,
L5Stat=,
L5YrVar=,
L5MonVar=,
L5QtrVar=,
L5TimeInt=,
UserWeight=);

2. Définition des paramètres de %RTRAFreqL5SOT :

InputDataset = détermine l'ensemble de données d'entrée de la zone WORK qui sera utilisé dans le cadre de la procédure.

OutputName = détermine le nom des fichiers de sortie correspondant à cet appel de la procédure RTRAFreqL5SOT. Les résultats tabulés se voient attribuer un nom généré à l'interne plutôt que le nom indiqué dans ce paramètre. L'ensemble de données de paramètres de post-traitement définit la correspondance entre le nom généré à l'interne et le nom des fichiers de sortie définitifs. La création du nom des fichiers de sortie définitifs est ensuite effectuée lors du post-traitement.

ClassVarList = détermine un maximum de cinq variables à inclure dans le tableau de fréquences. Les variables de cette liste peuvent être séparées par un nombre quelconque d'espaces, d'astérisques ou de combinaisons d'espaces et d'astérisques.

L5Stat = détermine le nom de la statistique de niveau 5. Les valeurs valides sont « LC », « PC » et « ST » (insensibles à la casse).

L5YrVar = détermine la variable relative à l'année de niveau 5. Si L5MonVar ou L5QtrVar ne sont pas indiquées, ce champ doit désigner une variable contenant plusieurs années pour illustrer le facteur « séquentiel dans le temps ».

L5MonVar = (facultatif) détermine la variable relative au mois de niveau 5. On peut omettre ce paramètre ou le laisser vide. Si L5MonVar est indiqué, L5QtrVar doit être laissé vide ou omis.

L5QtrVar = (facultatif) détermine la variable relative au quart de niveau 5. On peut omettre ce paramètre ou le laisser vide. Si L5QtrVar est indiqué, L5MonVar doit être laissé vide ou omis.

L5TimeInt = (facultatif) détermine l'intervalle de temps de niveau 5. La valeur indiquée doit être un entier supérieur à 0. On peut omettre ce paramètre, mais l'entier par défaut doit alors être « 1 ».

UserWeight = consultez le document de paramètres d'ADTR pour déterminer un poids de sondage. La variable de pondération déterminée sera intégrée à l'ensemble de données d'entrée au moyen de la variable « ID ».

3. Exemple : supposons que vous exécutiez la procédure d'ADTR suivante pour générer un tableau de fréquences de niveau 5 nommé « Tableau3 » avec les variables « scolarité » et « province » à l'aide de L5YrVar.

Votre appel de procédure d'ADTR ressemblera à ceci :

%RTRAFreqL5SOT(
InputDataset=work.LFS,
OutputName=Tableau3,
ClassVarList=Province Scolarité,
L5Stat=LC,
L5YrVar=NUM_SYEAR,
L5MonVar=NUM_SMTH,
L5TimeInt=1,
UserWeight=FINALWT);

Le tableau suivant présente les résultats de l'exemple de procédure ci-dessus. Nous sommes notamment en mesure de déterminer le changement de fréquence « séquentiel dans le temps » d'un mois à l'autre selon divers niveaux de scolarité et provinces. Veuillez noter qu'il s'agit d'une partie des données de la documentation et que certaines valeurs de la sortie réelle ont été extraites dans le but de générer des sorties plus petites.

Tableau 3
Résultats pour l'exemple de la macro
NUM_SYEAR NUM_SMTH SCOLARITÉ PROVINCE _COUNT_ COUNT_LCS
2015 Janvier Collège Manitoba 275000  
  Février Collège Manitoba 270500 -4500
  Mars École secondaire Ontario 3339750  
  Avril École secondaire Ontario 3316500 -23250
  Mai Université Autre 3680500  
  Juin Université Autre 3714750 34250
Note : Les résultats des enquêtes comportant des poids bootstrap contiendront des renseignements supplémentaires sur les mesures de précision, à savoir les indicateurs de qualité, les erreurs types, les intervalles de confiance, etc.
Date de modification :

Conseils de programmation SAS

Solution de remplacement pour le mot interdit PUT

Solution de remplacement pour le mot interdit PUT

Le mot PUT n'est pas autorisé dans le système d'accès à distance en temps réel (ADTR), car l'énoncé PUT permet à un utilisateur d'écrire des valeurs à partir des microdonnées dans le journal SAS. Toutefois, les utilisateurs pourraient vouloir utiliser la fonction PUT pour créer des valeurs de type caractère en appliquant un format (habituellement utilisé pour convertir des valeurs numériques en caractères). Comme le mot PUT n'est pas autorisé, les utilisateurs peuvent utiliser à la place les fonctions PUTC ou PUTN, qui sont semblables à la fonction PUT. PUTC permet de créer une valeur de type caractère en appliquant un format de type caractère. PUTN permet de créer une valeur de type caractère en appliquant un format numérique.

Note : Contrairement au format pour la fonction PUT, le format à appliquer (le deuxième argument) pour les fonctions PUTC et PUTN doit être entre guillemets. Par exemple :

AgeChar = PUTN(Age, "3.");

Conversion des valeurs de type caractère en valeurs numériques

Conversion des valeurs de type caractère en valeurs numériques

Dans certains cas, l'utilisateur peut vouloir convertir des valeurs de microdonnées de type caractère en valeurs numériques. Par exemple, la variable de microdonnées SP_WEARN de l'Enquête sur la population activeest une variable de type caractère. Pour cette raison, SP_WEARN ne peut pas être utilisée comme variable d'analyse statistique dans l'ADTR (dans RTRAMean, par exemple). Elle doit d'abord être convertie en variable numérique. Cette conversion peut être effectuée en utilisant la fonction INPUT.

Dans l'exemple ci-dessous illustrant l'étape des données , une nouvelle variable numérique SP_WEARN_NUM est créée en appliquant la fonction INPUT à SP_WEARN. On suppose que les valeurs dans SP_WEARN comportent deux décimales implicites.

data work.LFS;

   set RTRAData.LFS200005 ;

   length SP_WEARN_NUM 8;

   SP_WEARN_NUM = INPUT(SP_WEARN,7.2);

run;

La nouvelle variable SP_WEARN_NUM peut alors être utilisée comme variable d'analyse dans les procédures d'ADTR.

Application de l'option KEEP à l'ensemble de données RTRAData

Application de l'option KEEP à l'ensemble de données RTRAData

L'application de l'option KEEP à l'ensemble de données RTRAData peut rendre l'étape de données plus efficace, car SAS n'extraira que les variables figurant dans la liste KEEP. Cette option est utile lorsque seul un petit nombre de variables doivent être conservées. Veuillez prendre note que si l'option KEEP est précisée, la variable nommée ID doit être incluse dans la liste de variables.

Par exemple :

data work.CSDDis;

   set RTRAData.csd2012_disab(keep=DDIS_FL REF_AGE SEX DCLASS DLFS ID);

run;

Note : Même si l'option KEEP peut rendre l'étape des données plus efficace lorsque seul un petit nombre de variables sont nécessaires, elle n'est pas obligatoire. S'il est nécessaire de conserver un grand nombre de variables, il est plus facile d'omettre l'option KEEP. SAS conservera alors automatiquement toutes les variables (y compris la variable ID).

Définition de nouvelles variables au moyen d'un énoncé LENGTH

Définition de nouvelles variables au moyen d'un énoncé LENGTH

L'exemple ci-dessous montre la façon dontles valeurs d'une nouvelle variable de type caractère peuvent être tronquées par inadvertance lorsque la variable n'est pas définie au moyen d'un énoncé LENGTH.

data work.CSDDis;

    set RTRAData.csd2012_disab;

    if (REF_AGE < 10) then AgeGroup = "Under10";

    else if (10 <= REF_AGE <= 30) then AgeGroup = "Between10and30";

    else if (31 <= REF_AGE <= 90) then AgeGroup = "Between31and90";

    else if (REF_AGE > 90) then AgeGroup = "OlderThan90";

   else AgeGroup = "AgeUnknown";

run;

Comme la nouvelle variable AgeGroup n'est pas définie au moyen d'un énoncé LENGTH, SAS utilise la première occurrence de AgeGroup à l'étape des données pour déterminer la longueur de caractères à attribuer à la variable. La première occurrence est l'endroit où AgeGroup se voit attribuer la valeur « Under10 ». Par conséquent, SAS attribue une longueur de 7 à la variable AgeGroup. Le problème est alors que la longueur 7 n'est pas suffisante pour recevoir les valeurs de caractères attribuées à AgeGroup plus tard dans l'étape de données, telles que « Between10and30 » (entre 10 et 30).

Voici les valeurs de AgeGroup à l'étape des données de sortie pour les différents groupes d'âge. Veuillez prêter attention à la troncature qui a eu lieu :

Définition de nouvelles variables avec un énoncé LENGTH
REF_AGE AgeGroup [char(7)]
< 10 Under10
10 - 30 Between
31 - 90 Between
> 90 OlderTh
Any other value AgeUnkn

Si AgeGroup est une variable de classe les valeurs dans les résultats totalisés seront tronquées, comme il est indiqué ci-dessus. En outre, ce qui est encore pire, toutes les valeurs REF_AGE de 10 à 90 se retrouveront dans la même catégorie, à savoir « Between  ».

Pour éviter ce problème, utilisez un énoncé LENGTH pour attribuer une longueur suffisante à AgeGroup avant de lui attribuer une valeur :

data work.CSDDis;

   set RTRAData.csd2012_disab;

   length AgeGroup $ 15;

   if (REF_AGE < 10) then AgeGroup = "Under10";

   else if (10 <= REF_AGE <= 30) then AgeGroup = "Between10and30";

   else if (31 <= REF_AGE <= 90) then AgeGroup = "Between31and90";

   else if (REF_AGE > 90) then AgeGroup = "OlderThan90";

   else AgeGroup = "AgeUnknown";

run;

Définition de nouvelles variables avec un énoncé LENGTH
REF_AGE AgeGroup [char(15)]
< 10 Under10
10 - 30 Between10and30
31 - 90 Between31and90
> 90 OlderThan90
Any other value AgeUnknown
Énoncé ELSE manquant lors de la définition d'une variable dérivée

Énoncé ELSE manquant lors de la définition d'une variable dérivée

Lors de la définition d'une variable dérivée dans une étape de données, les énoncés IF/ELSE sont habituellement utilisés.

Par exemple :

data work.CSDDis;

   set RTRAData.csd2012_disab;

   length AgeGroup $ 15;

   if (0<= REF_AGE < 10) then AgeGroup = "Under10";

   else if (10 <= REF_AGE <= 30) then AgeGroup = "Between10and30";

   else if (31 <= REF_AGE <= 90) then AgeGroup = "Between31and90";

   else if (91 <= REF_AGE <= 120) then AgeGroup = "Between91and120";

run;

Le problème potentiel avec ce code est qu'il ignore toute valeur spéciale de REF_AGE qui peut exister dans les données. Par exemple, l'ensemble de données csd2012_disab peut contenir des valeurs manquantes REF_AGE (.) ou une valeur comme 999 peut représenter « Not Stated ». Pour les observations où REF_AGE n'est pas de 0 à 120, AgeGroup restera vide. Si AgeGroup est utilisé comme variable de classe dans l'ADTR, l'ADTR produira un message d'erreur puisqu'une variable de classe ne peut pas avoir de valeurs manquantes.

Pour éviter ce problème, un énoncé ELSE supplémentaire tel que « catch all » (qui permet d'englober toutes les valeurs) devrait être utilisé. Cela permet de s'assurer que AgeGroup ne sera pas vide dans les observations de l'ensemble de données de sortie.

data work.CSDDis;

   set RTRAData.csd2012_disab;

   length AgeGroup $ 15;

   if (0<= REF_AGE < 10) then AgeGroup = "Under10";

   else if (10 <= REF_AGE <= 30) then AgeGroup = "Between10and30";

   else if (31 <= REF_AGE <= 90) then AgeGroup = "Between31and90";

   else if (91 <= REF_AGE <= 120) then AgeGroup = "Between91and120";

   else AgeGroup = "Other";

run;

Dans l'exemple ci-dessus, pour toutes les observations où REF_AGE n'est pas de 0 à 120, une valeur « Other » sera attribuée à AgeGroup.

Date de modification :

Fichiers de sortie

Fichiers retournés

Fichiers retournés

Les utilisateurs recevront un avis par courriel une fois que des fichiers de sortie auront été placés dans leur boîte de réception du Service de transfert électronique de fichiers (TEF). Ils auront sept jours pour télécharger les fichiers, après quoi, les fichiers seront supprimés. Seuls les tableaux de données des macros de l'accès à distance en temps réel (ADTR) seront fournis; les données comportant des valeurs manquantes ne seront pas transmises.

Pour chaque programme du SAS soumis avec succès, quatre types de fichiers sont envoyés à l'utilisateur :

  1. un journal SAS personnalisé (.log) : renferme tous les éléments d'un journal SAS standard, à l'exception du nombre d'observations, lequel a été supprimé pour assurer la confidentialité;
  2. un journal d'accès en temps réel (ADTR) créé par le système d'ADTR (.txt) : informe les utilisateurs de l'étape du processus d'ADTR exécutée avec succès par le programme SAS;
  3. des ensembles de données SAS (.sas7bdat) : renferment les résultats sous forme de base de données SAS;
  4. un tableau (.csv) : présente les résultats sous forme de valeurs séparées par des virgules;
  5. des tableaux (.html) : présentent les résultats en format HTML (macro « RTRAFreq » uniquement).

Les utilisateurs peuvent recevoir le message suivant au moment d'accéder aux données de sortie dans le format d'ensemble de données SAS :

Note : Le fichier de données LIBA.RTRA961628_TABLE1.DATA est dans un format qui provient d'un autre système hôte; il est possible aussi que le chiffrement du fichier ne corresponde pas à celui de la session. L'accès aux données interenvironnementales sera utilisé, ce qui pourrait nécessiter des ressources d'unités centrales de traitement (UCT) supplémentaires et réduire le rendement.

Cette note signifie que le fichier a été créé dans un environnement de système d'exploitation différent du vôtre. Vous pouvez supprimer ce message en exécutant l'étape suivante pour convertir votre fichier SAS :

Data LIBA.RTRA961628_TABLE1;

Set LIBA.RTRA961628_TABLE1;

run;

Indicateurs de la qualité

Indicateurs de la qualité

Le système d'ADTR fournit aux utilisateurs des indicateurs de la qualité des données pour les enquêtes dont les fichiers sont associés à des poids bootstrap.

Les indicateurs de la qualité ou les mesures de précision ci-dessous peuvent être fournis (les produits obtenus peuvent varier en fonction des statistiques que l'on souhaite calculer et de l'enquête utilisée) :

BSWCNT : chiffre pondéré bootstrap (nombre de poids bootstrap utilisés aux fins de calcul)

COUNT : chiffre pondéré

S.E. : erreur-type (mesure de précision)

CILB : borne inférieure de l'intervalle de confiance (mesure de précision)

CIUB : borne supérieure de l'intervalle de confiance (mesure de précision)

QI : indicateur de la qualité

Les chercheurs ont la responsabilité de s'assurer de la qualité de leurs données de sortie. Des énoncés concernant la qualité des données et l'utilisation des ensembles de données sont accessibles à la page de microdonnées disponibles dans l'accès à distance en temps réel.

Définition de la qualité des données

Définition de la qualité des données

Indicateurs de Qualité (Q.I.)
  • Les valeurs des C.V. ne sont pas publiées
  • Des indicateurs de qualité (Q.I.) sont publiés et basés sur le tableau des C.V.1 suivant :
Valeur du C.V. Indicateur de qualité
1. Les valeurs des C.V. sont calculées à partir de l'erreur type originale ainsi que de l'estimation originale.
2. n réfère au nombre d'observations et X est confidentiel et peut varier par enquête.
3. C.V. non défini" réfère aux cas de division par zéro (lorsque l'estimation = 0).
C.V. ≤ 0.05 (a)
0.05 < C.V. ≤ 0.15 (b)
0.15 < C.V. ≤ 0.25 (c)
0.25 < C.V. ≤ 0.35 (d)
C.V. > 0.35 or n < X2 (e)
C.V. non défini3 (*)
Fréquence publiéee = 0 (.)
Statistique supprimée (.)
Date de modification :

Arrondissement contrôlé

L'arrondissement est effectué indépendamment d'une cellule à l'autre (y compris les sous-totaux et le grand total). Voir l'étape 3 ci-dessous. Voici un exemple simple d'arrondissement contrôlé:

Supposons que nous ayons une enquête de 10 individus représentant 1205 personnes dans la population et que la base d'ADTR soit de 100.

Microdonnées

Microdonnées

Tableau 1
Arrondi contrôlé en utilisant le sexe et l'état matrimonial
Unité Sexe État Matrimonial Poids
1 Hommes Marié 120,5
2 Hommes Veuve 120,5
3 Hommes Marié 120,5
4 Hommes Divorcé 120,5
5 Hommes Marié 120.5
6 Femmes Marié 120,5
7 Femmes Marié 120,5
8 Femmes Veuve 120,5
9 Femmes Veuve 120,5
10 Femmes Marié 120,5
Étape 1

Étape 1

La procédure SAS modifiée de l'ADTR crée le tableau suivant :

Tableau 2
Arrondi contrôlé en utilisant le sexe et l'état matrimonial
  Marié Divorcé Veuf Total
Hommes 361,5 120,5 120,5 602,5
Femmes 361,5 0,0 241,0 602,5
Total 723,0 120,5 361,5 1 205,0
Étape 2

Étape 2

Le système d'ADTR applique l'arrondissement classique aux cellules internes, puis calcule les totaux et les totaux partiels :

Ce tableau est un exemple de la façon dont cela fonctionnerait arrondissement contrôlé dans le ADTR en utilisant les données d'état matrimonial.

Tableau 3
Arrondi contrôlé en utilisant le sexe et l'état matrimonial
  Marié Divorcé Veuf Total
Hommes 362 121 121 603
Femmes 362 0 241 603
Total 724 121 362 1 207
Étape 3

Étape 3

Le système d'ADTR envoie ces comptes au programme d'arrondissement aléatoire contrôlé. Voici ce que nous obtenons :

Ce tableau est un exemple de la façon dont cela fonctionnerait arrondissement contrôlé dans le ADTR en utilisant les données d'état matrimonial.

Tableau 4
Arrondi contrôlé en utilisant le sexe et l'état matrimonial1
  Marié Divorcé Veuf Total
Hommes 400 100 100 600
Femmes 300 0 300 600
Total 700 100 400 1 200

Noter que les lignes et les colonnes sont des additifs. Ce dernier tableau est ensuite envoyée au chercheur.

Date de modification :

L’Enquête sur la dynamique du travail et du revenu (EDTR)

À propos de l'EDTR

À propos de l'EDTR

Le système RETrievel (SLIDRET) d'acquisition de données de l'Enquête sur la dynamique du travail et du revenu (EDTR) joue le rôle d'interface entre la base de données et l'utilisateur. SLIDRET offre aux utilisateurs la possibilité de créer un ensemble de données selon leurs propres spécifications. Les fichiers d'interrogation personnalisés (.qry) sont soumis au système d'accès à distance en temps réel (ADTR) en même temps que le programme du SAS. Ce logiciel est requis pour accéder à l'EDTR. Il peut être obtenu gratuitement auprès de la Sous-section des services aux clients.

Note concernant SLIDRET :

Le système d'ADTR ne traite que les extractions transversales de l'application SLIDRET. Les utilisateurs de l'ADTR doivent donc s'assurer de sélectionner « Transversale» sous la rubrique « Type d'analyse » de l'application SLIDRET.

SLIDRET définit automatiquement la variable de poids qui convient à l'unité d'analyse précisée à l'étape « 5. Lancement de requête ». Par conséquent, les utilisateurs de l'ADTR n'ont pas besoin d'indiquer de variable de poids (p. ex. ILBWT26 ou WTCSLD26) pour l'étape « 2. Sélection de variables » dans SLIDRET. Une erreur se produira si un utilisateur de l'ADTR transmet un fichier d'interrogation dans lequel figure plus d'une variable de poids.

Transmissions relatives

Transmissions relatives

Pour les transmissions relatives à l'EDTR, nous vous recommandons de convertir votre code SAS et vos fichiers d'interrogation en fichiers auto-décompressables (fichiers ZIP) dont l'ADTR permet la transmission. Cela permettra à l'ADTR d'apparier correctement les fichiers .sas et .qry. Si vous transmettez deux fichiers (.sas et .qry) au lieu d'un seul fichier ZIP, il se peut que l'ADTR ne parvienne pas à apparier les fichiers .sas et .qry.

  1. Créez un fichier ZIP comprenant les fichiers SLIDQRY_nom.sas et SLIDQRY_quelconque.qry. Le fichier ZIP peut porter n'importe quel nom.
  2. Placez le fichier ZIP dans la boîte de réception.
  3. L'ADTR va automatiquement extraire les fichiers compressés du fichier ZIP, les placer dans la boîte de réception et apposer à chacun un préfixe composé de la même date et de la même heure, afin que les fichiers puissent être appariés. Le traitement se déroulera ensuite comme d'habitude.
Date de modification :