Fréquence pour l'ADTR

frequence-adtr.pdf (PDF, 237 Ko)

Fréquence de base pour l'ADTR

1. La procédure de fréquence pour l'ADTR fournit des comptes pour une variable discrète. Par exemple, cette procédure peut être utilisée pour calculer le nombre de personnes dans la population, selon différents niveaux de scolarité et selon le sexe. Pour produire des totalisations de fréquence, utilisez la procédure suivante de l'ADTR :

%RTRAFreq(
InputDataset=,
OutputName=,
ClassVarList=,
UserWeight=);

2. Définition des paramètres de %RTRAFreq :

InputDataset = détermination de l'ensemble de données d'entrée de la librairie « WORK » de SAS à utiliser dans la procédure.

OutputName = détermination du nom des fichiers de sortie que vous voulez produire (maximum de 20 caractères, et le premier caractère doit être une lettre).

ClassVarList = détermination d'un maximum de cinq variables à inclure dans le tableau de fréquence. Ces variables doivent être délimitées par des espaces ou des astérisques. Chaque variable doit contenir plus d'une valeur unique, mais pas plus de 500.

UserWeight = renvoi au document des paramètres de l'ADTR pour déterminer un poids d'enquête. La variable de pondération déterminée sera intégrée à l'ensemble de données d'entrée au moyen de la variable d'identification.

3. Exemple : Supposons que vous exécutiez la procédure suivante de l'ADTR pour produire un tableau de fréquence appelé « Tableau 1 », à partir des variables « Scolarité » et « Sexe ».

Votre procédure de l'ADTR se présentera ainsi :

%RTRAFreq(
InputDataset=work.LFS,
OutputName=Table1,
ClassVarList=Education Sex,
UserWeight=Finalwt);

Le tableau suivant affiche les résultats pour l'exemple de la macro ci-dessus.

Tableau 1
Résultats pour l'exemple de la macro
Scolarité Sexe Count
  Femmes 100
  Hommes 100
Niveau supérieur à des études secondaires Femmes 60
Niveau supérieur à des études secondaires Hommes 55
Niveau inférieur à des études secondaires Femmes 40
Niveau inférieur à des études secondaires Hommes 45
Note : À noter que les produits des enquêtes comportant des poids bootstrap comprendront des renseignements additionnels sur des mesures de précision, par exemple, des indicateurs de qualité, des erreurs-types, des intervalles de confiance, etc.

Fréquences de niveau 5 dans le cadre de l'ADTR

1. Il s'agit de la macro de procédure d'accès à distance en temps réel (ADTR) permettant la production de tableaux de fréquences (somme des poids) comprenant une statistique de niveau 5 donnée. RTRAFreqL5 est une macro enveloppante. Elle fait appel à la macro ProcessRequest, qui est la routine de traitement commune à toutes les macros de procédures d'ADTR. Par exemple, cette procédure peut être utilisée pour calculer le niveau 5 précis (la variation de niveau) entre les divers niveaux de scolarité des personnes de chaque province. Pour générer les tableaux de fréquences annuels, faites l'appel de procédure d'ADTR suivant :

%RTRAFreqL5(
InputDataset=,
OutputName=,
ClassVarList=,
L5Stat=,
L5Type=,
L5ByVar=,
L5BaseVal=,
UserWeight=);

2. Définition du paramètre %RTRAFreqL5 :

InputDataset = détermine l'ensemble de données d'entrée de la zone WORK qui sera utilisé dans le cadre de la procédure.

OutputName = détermine le nom donné aux fichiers de sortie définitifs correspondant à cet appel de la procédure RTRAFreqL5. Les résultats tabulés se voient attribuer un nom généré à l'interne plutôt que le nom indiqué dans ce paramètre. L'ensemble de données de paramètres de post-traitement définit la correspondance entre le nom généré à l'interne et le nom des fichiers de sortie définitifs. La création du nom des fichiers de sortie définitifs est ensuite effectuée lors du post-traitement.

ClassVarList = détermine un maximum de cinq variables à inclure dans le tableau de fréquences. Les variables de cette liste peuvent être séparées par un nombre quelconque d'espaces, d'astérisques ou de combinaisons d'espaces et d'astérisques.

L5Stat = détermine le nom de la statistique de niveau 5. Les valeurs valides sont « LC », « PC » et « ST » (insensibles à la casse).

L5Type = détermine le type de statistique de niveau 5. Les valeurs valides sont « SEQUENTIAL », « BASE » et « GLOBAL » (insensibles à la casse).

L5ByVar = détermine la variable « BY » de niveau 5. La variable indiquée doit être comprise dans ClassVarList.

L5BaseVal = détermine la valeur de base de niveau 5. Ce paramètre est applicable uniquement si L5Type est « BASE », et il doit être laissé vide si L5Type est « SEQUENTIAL » ou « GLOBAL ». S'il y a lieu, la valeur indiquée doit être comprise dans la variable L5ByVar de l'ensemble de données d'entrée.

UserWeight = la variable de pondération de l'enquête (et les variables de pondération bootstrap s'il y en a) se trouve dans un ensemble de données de pondération de la bibliothèque de données d'ADTR. Le nom de l'ensemble de données de pondération est le même que celui de la variable de pondération de l'enquête qu'il contient.

3. Exemple : supposons que vous exécutiez la procédure d'ADTR suivante pour générer un tableau de fréquences de niveau 5 nommé « Tableau2 » avec les variables « scolarité » et « province » à l'aide de L5YrVar.

Votre appel de procédure d'ADTR ressemblera à ceci :

%RTRAFreqL5(
InputDataset=work.LFS,
OutputName=Tableau2,
ClassVarList=province scolarité,
L5Stat=LC,
L5Type=global,
L5ByVar=province,
L5BaseVal=,
UserWeight=FINALWT);

Le tableau suivant présente les résultats de l'exemple de procédure de fréquence de niveau 5 ci-dessus. Veuillez noter qu'il s'agit d'une partie des données de la documentation et que certaines valeurs de la sortie réelle ont été extraites dans le but de générer des sorties plus petites.

Tableau 2
Résultats pour l'exemple de la macro
SCOLARITÉ PROVINCE _COUNT_ COUNT_LCG
Collège Manitoba 3321500 -108137000
Collège Ontario 40167000 -71291500
Collège Autre 67970000 -43488500
École secondaire Manitoba 3702250 -92634500
École secondaire Ontario 38880000 -57456750
École secondaire Autre 53754500 -42582250
Université Manitoba 2531750 -81162500
Université Ontario 36012500 -47681750
Université Autre 45150000 -38544250
Note : Les résultats des enquêtes comportant des poids bootstrap contiendront des renseignements supplémentaires sur les mesures de précision, à savoir les indicateurs de qualité, les erreurs types, les intervalles de confiance, etc.

Fréquences L5SOT dans le cadre de l'ADTR

1. Il s'agit de la macro de procédure d'accès à distance en temps réel (ADTR) permettant la production de tableaux de fréquences (somme des poids) comprenant une statistique de niveau 5 séquentielle dans le temps (L5SOT) donnée. RTRAFreqL5SOT est une macro enveloppante. Elle fait appel à la macro ProcessRequest, qui est la routine de traitement commune à toutes les macros de procédures d'ADTR. Par exemple, cette procédure peut être utilisée pour calculer le niveau 5 précis (la variation de niveau) entre les divers niveaux de scolarité des personnes de chaque province. Pour générer les tableaux de fréquences annuels, faites l'appel de procédure d'ADTR suivant :

%RTRAFreqL5SOT(
InputDataset=,
OutputName=,
ClassVarList=,
L5Stat=,
L5YrVar=,
L5MonVar=,
L5QtrVar=,
L5TimeInt=,
UserWeight=);

2. Définition des paramètres de %RTRAFreqL5SOT :

InputDataset = détermine l'ensemble de données d'entrée de la zone WORK qui sera utilisé dans le cadre de la procédure.

OutputName = détermine le nom des fichiers de sortie correspondant à cet appel de la procédure RTRAFreqL5SOT. Les résultats tabulés se voient attribuer un nom généré à l'interne plutôt que le nom indiqué dans ce paramètre. L'ensemble de données de paramètres de post-traitement définit la correspondance entre le nom généré à l'interne et le nom des fichiers de sortie définitifs. La création du nom des fichiers de sortie définitifs est ensuite effectuée lors du post-traitement.

ClassVarList = détermine un maximum de cinq variables à inclure dans le tableau de fréquences. Les variables de cette liste peuvent être séparées par un nombre quelconque d'espaces, d'astérisques ou de combinaisons d'espaces et d'astérisques.

L5Stat = détermine le nom de la statistique de niveau 5. Les valeurs valides sont « LC », « PC » et « ST » (insensibles à la casse).

L5YrVar = détermine la variable relative à l'année de niveau 5. Si L5MonVar ou L5QtrVar ne sont pas indiquées, ce champ doit désigner une variable contenant plusieurs années pour illustrer le facteur « séquentiel dans le temps ».

L5MonVar = (facultatif) détermine la variable relative au mois de niveau 5. On peut omettre ce paramètre ou le laisser vide. Si L5MonVar est indiqué, L5QtrVar doit être laissé vide ou omis.

L5QtrVar = (facultatif) détermine la variable relative au quart de niveau 5. On peut omettre ce paramètre ou le laisser vide. Si L5QtrVar est indiqué, L5MonVar doit être laissé vide ou omis.

L5TimeInt = (facultatif) détermine l'intervalle de temps de niveau 5. La valeur indiquée doit être un entier supérieur à 0. On peut omettre ce paramètre, mais l'entier par défaut doit alors être « 1 ».

UserWeight = consultez le document de paramètres d'ADTR pour déterminer un poids de sondage. La variable de pondération déterminée sera intégrée à l'ensemble de données d'entrée au moyen de la variable « ID ».

3. Exemple : supposons que vous exécutiez la procédure d'ADTR suivante pour générer un tableau de fréquences de niveau 5 nommé « Tableau3 » avec les variables « scolarité » et « province » à l'aide de L5YrVar.

Votre appel de procédure d'ADTR ressemblera à ceci :

%RTRAFreqL5SOT(
InputDataset=work.LFS,
OutputName=Tableau3,
ClassVarList=Province Scolarité,
L5Stat=LC,
L5YrVar=NUM_SYEAR,
L5MonVar=NUM_SMTH,
L5TimeInt=1,
UserWeight=FINALWT);

Le tableau suivant présente les résultats de l'exemple de procédure ci-dessus. Nous sommes notamment en mesure de déterminer le changement de fréquence « séquentiel dans le temps » d'un mois à l'autre selon divers niveaux de scolarité et provinces. Veuillez noter qu'il s'agit d'une partie des données de la documentation et que certaines valeurs de la sortie réelle ont été extraites dans le but de générer des sorties plus petites.

Tableau 3
Résultats pour l'exemple de la macro
NUM_SYEAR NUM_SMTH SCOLARITÉ PROVINCE _COUNT_ COUNT_LCS
2015 Janvier Collège Manitoba 275000  
  Février Collège Manitoba 270500 -4500
  Mars École secondaire Ontario 3339750  
  Avril École secondaire Ontario 3316500 -23250
  Mai Université Autre 3680500  
  Juin Université Autre 3714750 34250
Note : Les résultats des enquêtes comportant des poids bootstrap contiendront des renseignements supplémentaires sur les mesures de précision, à savoir les indicateurs de qualité, les erreurs types, les intervalles de confiance, etc.
Date de modification :

Conseils de programmation SAS

Solution de remplacement pour le mot interdit PUT

Solution de remplacement pour le mot interdit PUT

Le mot PUT n'est pas autorisé dans le système d'accès à distance en temps réel (ADTR), car l'énoncé PUT permet à un utilisateur d'écrire des valeurs à partir des microdonnées dans le journal SAS. Toutefois, les utilisateurs pourraient vouloir utiliser la fonction PUT pour créer des valeurs de type caractère en appliquant un format (habituellement utilisé pour convertir des valeurs numériques en caractères). Comme le mot PUT n'est pas autorisé, les utilisateurs peuvent utiliser à la place les fonctions PUTC ou PUTN, qui sont semblables à la fonction PUT. PUTC permet de créer une valeur de type caractère en appliquant un format de type caractère. PUTN permet de créer une valeur de type caractère en appliquant un format numérique.

Note : Contrairement au format pour la fonction PUT, le format à appliquer (le deuxième argument) pour les fonctions PUTC et PUTN doit être entre guillemets. Par exemple :

AgeChar = PUTN(Age, "3.");

Conversion des valeurs de type caractère en valeurs numériques

Conversion des valeurs de type caractère en valeurs numériques

Dans certains cas, l'utilisateur peut vouloir convertir des valeurs de microdonnées de type caractère en valeurs numériques. Par exemple, la variable de microdonnées SP_WEARN de l'Enquête sur la population activeest une variable de type caractère. Pour cette raison, SP_WEARN ne peut pas être utilisée comme variable d'analyse statistique dans l'ADTR (dans RTRAMean, par exemple). Elle doit d'abord être convertie en variable numérique. Cette conversion peut être effectuée en utilisant la fonction INPUT.

Dans l'exemple ci-dessous illustrant l'étape des données , une nouvelle variable numérique SP_WEARN_NUM est créée en appliquant la fonction INPUT à SP_WEARN. On suppose que les valeurs dans SP_WEARN comportent deux décimales implicites.

data work.LFS;

   set RTRAData.LFS200005 ;

   length SP_WEARN_NUM 8;

   SP_WEARN_NUM = INPUT(SP_WEARN,7.2);

run;

La nouvelle variable SP_WEARN_NUM peut alors être utilisée comme variable d'analyse dans les procédures d'ADTR.

Application de l'option KEEP à l'ensemble de données RTRAData

Application de l'option KEEP à l'ensemble de données RTRAData

L'application de l'option KEEP à l'ensemble de données RTRAData peut rendre l'étape de données plus efficace, car SAS n'extraira que les variables figurant dans la liste KEEP. Cette option est utile lorsque seul un petit nombre de variables doivent être conservées. Veuillez prendre note que si l'option KEEP est précisée, la variable nommée ID doit être incluse dans la liste de variables.

Par exemple :

data work.CSDDis;

   set RTRAData.csd2012_disab(keep=DDIS_FL REF_AGE SEX DCLASS DLFS ID);

run;

Note : Même si l'option KEEP peut rendre l'étape des données plus efficace lorsque seul un petit nombre de variables sont nécessaires, elle n'est pas obligatoire. S'il est nécessaire de conserver un grand nombre de variables, il est plus facile d'omettre l'option KEEP. SAS conservera alors automatiquement toutes les variables (y compris la variable ID).

Définition de nouvelles variables au moyen d'un énoncé LENGTH

Définition de nouvelles variables au moyen d'un énoncé LENGTH

L'exemple ci-dessous montre la façon dontles valeurs d'une nouvelle variable de type caractère peuvent être tronquées par inadvertance lorsque la variable n'est pas définie au moyen d'un énoncé LENGTH.

data work.CSDDis;

    set RTRAData.csd2012_disab;

    if (REF_AGE < 10) then AgeGroup = "Under10";

    else if (10 <= REF_AGE <= 30) then AgeGroup = "Between10and30";

    else if (31 <= REF_AGE <= 90) then AgeGroup = "Between31and90";

    else if (REF_AGE > 90) then AgeGroup = "OlderThan90";

   else AgeGroup = "AgeUnknown";

run;

Comme la nouvelle variable AgeGroup n'est pas définie au moyen d'un énoncé LENGTH, SAS utilise la première occurrence de AgeGroup à l'étape des données pour déterminer la longueur de caractères à attribuer à la variable. La première occurrence est l'endroit où AgeGroup se voit attribuer la valeur « Under10 ». Par conséquent, SAS attribue une longueur de 7 à la variable AgeGroup. Le problème est alors que la longueur 7 n'est pas suffisante pour recevoir les valeurs de caractères attribuées à AgeGroup plus tard dans l'étape de données, telles que « Between10and30 » (entre 10 et 30).

Voici les valeurs de AgeGroup à l'étape des données de sortie pour les différents groupes d'âge. Veuillez prêter attention à la troncature qui a eu lieu :

Définition de nouvelles variables avec un énoncé LENGTH
REF_AGE AgeGroup [char(7)]
< 10 Under10
10 - 30 Between
31 - 90 Between
> 90 OlderTh
Any other value AgeUnkn

Si AgeGroup est une variable de classe les valeurs dans les résultats totalisés seront tronquées, comme il est indiqué ci-dessus. En outre, ce qui est encore pire, toutes les valeurs REF_AGE de 10 à 90 se retrouveront dans la même catégorie, à savoir « Between  ».

Pour éviter ce problème, utilisez un énoncé LENGTH pour attribuer une longueur suffisante à AgeGroup avant de lui attribuer une valeur :

data work.CSDDis;

   set RTRAData.csd2012_disab;

   length AgeGroup $ 15;

   if (REF_AGE < 10) then AgeGroup = "Under10";

   else if (10 <= REF_AGE <= 30) then AgeGroup = "Between10and30";

   else if (31 <= REF_AGE <= 90) then AgeGroup = "Between31and90";

   else if (REF_AGE > 90) then AgeGroup = "OlderThan90";

   else AgeGroup = "AgeUnknown";

run;

Définition de nouvelles variables avec un énoncé LENGTH
REF_AGE AgeGroup [char(15)]
< 10 Under10
10 - 30 Between10and30
31 - 90 Between31and90
> 90 OlderThan90
Any other value AgeUnknown
Énoncé ELSE manquant lors de la définition d'une variable dérivée

Énoncé ELSE manquant lors de la définition d'une variable dérivée

Lors de la définition d'une variable dérivée dans une étape de données, les énoncés IF/ELSE sont habituellement utilisés.

Par exemple :

data work.CSDDis;

   set RTRAData.csd2012_disab;

   length AgeGroup $ 15;

   if (0<= REF_AGE < 10) then AgeGroup = "Under10";

   else if (10 <= REF_AGE <= 30) then AgeGroup = "Between10and30";

   else if (31 <= REF_AGE <= 90) then AgeGroup = "Between31and90";

   else if (91 <= REF_AGE <= 120) then AgeGroup = "Between91and120";

run;

Le problème potentiel avec ce code est qu'il ignore toute valeur spéciale de REF_AGE qui peut exister dans les données. Par exemple, l'ensemble de données csd2012_disab peut contenir des valeurs manquantes REF_AGE (.) ou une valeur comme 999 peut représenter « Not Stated ». Pour les observations où REF_AGE n'est pas de 0 à 120, AgeGroup restera vide. Si AgeGroup est utilisé comme variable de classe dans l'ADTR, l'ADTR produira un message d'erreur puisqu'une variable de classe ne peut pas avoir de valeurs manquantes.

Pour éviter ce problème, un énoncé ELSE supplémentaire tel que « catch all » (qui permet d'englober toutes les valeurs) devrait être utilisé. Cela permet de s'assurer que AgeGroup ne sera pas vide dans les observations de l'ensemble de données de sortie.

data work.CSDDis;

   set RTRAData.csd2012_disab;

   length AgeGroup $ 15;

   if (0<= REF_AGE < 10) then AgeGroup = "Under10";

   else if (10 <= REF_AGE <= 30) then AgeGroup = "Between10and30";

   else if (31 <= REF_AGE <= 90) then AgeGroup = "Between31and90";

   else if (91 <= REF_AGE <= 120) then AgeGroup = "Between91and120";

   else AgeGroup = "Other";

run;

Dans l'exemple ci-dessus, pour toutes les observations où REF_AGE n'est pas de 0 à 120, une valeur « Other » sera attribuée à AgeGroup.

Date de modification :

Fichiers de sortie

Fichiers retournés

Fichiers retournés

Les utilisateurs recevront un avis par courriel une fois que des fichiers de sortie auront été placés dans leur boîte de réception du Service de transfert électronique de fichiers (TEF). Ils auront sept jours pour télécharger les fichiers, après quoi, les fichiers seront supprimés. Seuls les tableaux de données des macros de l'accès à distance en temps réel (ADTR) seront fournis; les données comportant des valeurs manquantes ne seront pas transmises.

Pour chaque programme du SAS soumis avec succès, quatre types de fichiers sont envoyés à l'utilisateur :

  1. un journal SAS personnalisé (.log) : renferme tous les éléments d'un journal SAS standard, à l'exception du nombre d'observations, lequel a été supprimé pour assurer la confidentialité;
  2. un journal d'accès en temps réel (ADTR) créé par le système d'ADTR (.txt) : informe les utilisateurs de l'étape du processus d'ADTR exécutée avec succès par le programme SAS;
  3. des ensembles de données SAS (.sas7bdat) : renferment les résultats sous forme de base de données SAS;
  4. un tableau (.csv) : présente les résultats sous forme de valeurs séparées par des virgules;
  5. des tableaux (.html) : présentent les résultats en format HTML (macro « RTRAFreq » uniquement).

Les utilisateurs peuvent recevoir le message suivant au moment d'accéder aux données de sortie dans le format d'ensemble de données SAS :

Note : Le fichier de données LIBA.RTRA961628_TABLE1.DATA est dans un format qui provient d'un autre système hôte; il est possible aussi que le chiffrement du fichier ne corresponde pas à celui de la session. L'accès aux données interenvironnementales sera utilisé, ce qui pourrait nécessiter des ressources d'unités centrales de traitement (UCT) supplémentaires et réduire le rendement.

Cette note signifie que le fichier a été créé dans un environnement de système d'exploitation différent du vôtre. Vous pouvez supprimer ce message en exécutant l'étape suivante pour convertir votre fichier SAS :

Data LIBA.RTRA961628_TABLE1;

Set LIBA.RTRA961628_TABLE1;

run;

Indicateurs de la qualité

Indicateurs de la qualité

Le système d'ADTR fournit aux utilisateurs des indicateurs de la qualité des données pour les enquêtes dont les fichiers sont associés à des poids bootstrap.

Les indicateurs de la qualité ou les mesures de précision ci-dessous peuvent être fournis (les produits obtenus peuvent varier en fonction des statistiques que l'on souhaite calculer et de l'enquête utilisée) :

BSWCNT : chiffre pondéré bootstrap (nombre de poids bootstrap utilisés aux fins de calcul)

COUNT : chiffre pondéré

S.E. : erreur-type (mesure de précision)

CILB : borne inférieure de l'intervalle de confiance (mesure de précision)

CIUB : borne supérieure de l'intervalle de confiance (mesure de précision)

QI : indicateur de la qualité

Les chercheurs ont la responsabilité de s'assurer de la qualité de leurs données de sortie. Des énoncés concernant la qualité des données et l'utilisation des ensembles de données sont accessibles à la page de microdonnées disponibles dans l'accès à distance en temps réel.

Définition de la qualité des données

Définition de la qualité des données

Indicateurs de Qualité (Q.I.)
  • Les valeurs des C.V. ne sont pas publiées
  • Des indicateurs de qualité (Q.I.) sont publiés et basés sur le tableau des C.V.1 suivant :
Valeur du C.V. Indicateur de qualité
1. Les valeurs des C.V. sont calculées à partir de l'erreur type originale ainsi que de l'estimation originale.
2. n réfère au nombre d'observations et X est confidentiel et peut varier par enquête.
3. C.V. non défini" réfère aux cas de division par zéro (lorsque l'estimation = 0).
C.V. ≤ 0.05 (a)
0.05 < C.V. ≤ 0.15 (b)
0.15 < C.V. ≤ 0.25 (c)
0.25 < C.V. ≤ 0.35 (d)
C.V. > 0.35 or n < X2 (e)
C.V. non défini3 (*)
Fréquence publiéee = 0 (.)
Statistique supprimée (.)
Date de modification :

Arrondissement contrôlé

L'arrondissement est effectué indépendamment d'une cellule à l'autre (y compris les sous-totaux et le grand total). Voir l'étape 3 ci-dessous. Voici un exemple simple d'arrondissement contrôlé:

Supposons que nous ayons une enquête de 10 individus représentant 1205 personnes dans la population et que la base d'ADTR soit de 100.

Microdonnées

Microdonnées

Tableau 1
Arrondi contrôlé en utilisant le sexe et l'état matrimonial
Unité Sexe État Matrimonial Poids
1 Hommes Marié 120,5
2 Hommes Veuve 120,5
3 Hommes Marié 120,5
4 Hommes Divorcé 120,5
5 Hommes Marié 120.5
6 Femmes Marié 120,5
7 Femmes Marié 120,5
8 Femmes Veuve 120,5
9 Femmes Veuve 120,5
10 Femmes Marié 120,5
Étape 1

Étape 1

La procédure SAS modifiée de l'ADTR crée le tableau suivant :

Tableau 2
Arrondi contrôlé en utilisant le sexe et l'état matrimonial
  Marié Divorcé Veuf Total
Hommes 361,5 120,5 120,5 602,5
Femmes 361,5 0,0 241,0 602,5
Total 723,0 120,5 361,5 1 205,0
Étape 2

Étape 2

Le système d'ADTR applique l'arrondissement classique aux cellules internes, puis calcule les totaux et les totaux partiels :

Ce tableau est un exemple de la façon dont cela fonctionnerait arrondissement contrôlé dans le ADTR en utilisant les données d'état matrimonial.

Tableau 3
Arrondi contrôlé en utilisant le sexe et l'état matrimonial
  Marié Divorcé Veuf Total
Hommes 362 121 121 603
Femmes 362 0 241 603
Total 724 121 362 1 207
Étape 3

Étape 3

Le système d'ADTR envoie ces comptes au programme d'arrondissement aléatoire contrôlé. Voici ce que nous obtenons :

Ce tableau est un exemple de la façon dont cela fonctionnerait arrondissement contrôlé dans le ADTR en utilisant les données d'état matrimonial.

Tableau 4
Arrondi contrôlé en utilisant le sexe et l'état matrimonial1
  Marié Divorcé Veuf Total
Hommes 400 100 100 600
Femmes 300 0 300 600
Total 700 100 400 1 200

Noter que les lignes et les colonnes sont des additifs. Ce dernier tableau est ensuite envoyée au chercheur.

Date de modification :

L’Enquête sur la dynamique du travail et du revenu (EDTR)

À propos de l'EDTR

À propos de l'EDTR

Le système RETrievel (SLIDRET) d'acquisition de données de l'Enquête sur la dynamique du travail et du revenu (EDTR) joue le rôle d'interface entre la base de données et l'utilisateur. SLIDRET offre aux utilisateurs la possibilité de créer un ensemble de données selon leurs propres spécifications. Les fichiers d'interrogation personnalisés (.qry) sont soumis au système d'accès à distance en temps réel (ADTR) en même temps que le programme du SAS. Ce logiciel est requis pour accéder à l'EDTR. Il peut être obtenu gratuitement auprès de la Sous-section des services aux clients.

Note concernant SLIDRET :

Le système d'ADTR ne traite que les extractions transversales de l'application SLIDRET. Les utilisateurs de l'ADTR doivent donc s'assurer de sélectionner « Transversale» sous la rubrique « Type d'analyse » de l'application SLIDRET.

SLIDRET définit automatiquement la variable de poids qui convient à l'unité d'analyse précisée à l'étape « 5. Lancement de requête ». Par conséquent, les utilisateurs de l'ADTR n'ont pas besoin d'indiquer de variable de poids (p. ex. ILBWT26 ou WTCSLD26) pour l'étape « 2. Sélection de variables » dans SLIDRET. Une erreur se produira si un utilisateur de l'ADTR transmet un fichier d'interrogation dans lequel figure plus d'une variable de poids.

Transmissions relatives

Transmissions relatives

Pour les transmissions relatives à l'EDTR, nous vous recommandons de convertir votre code SAS et vos fichiers d'interrogation en fichiers auto-décompressables (fichiers ZIP) dont l'ADTR permet la transmission. Cela permettra à l'ADTR d'apparier correctement les fichiers .sas et .qry. Si vous transmettez deux fichiers (.sas et .qry) au lieu d'un seul fichier ZIP, il se peut que l'ADTR ne parvienne pas à apparier les fichiers .sas et .qry.

  1. Créez un fichier ZIP comprenant les fichiers SLIDQRY_nom.sas et SLIDQRY_quelconque.qry. Le fichier ZIP peut porter n'importe quel nom.
  2. Placez le fichier ZIP dans la boîte de réception.
  3. L'ADTR va automatiquement extraire les fichiers compressés du fichier ZIP, les placer dans la boîte de réception et apposer à chacun un préfixe composé de la même date et de la même heure, afin que les fichiers puissent être appariés. Le traitement se déroulera ensuite comme d'habitude.
Date de modification :

Assistant SAS

L'Assistant SAS aidera les utilisateurs ayant peu d'expérience en SAS à générer des tableaux avec succès. Vous pourrez utiliser des boutons et des menus déroulants pour construire votre code SAS. Votre code sera créé selon les variables que vous sélectionnerez. Lorsque vous aurez terminé, vous pourrez télécharger votre code et le soumettre par l'intermédiaire de votre compte de TEF. Les requêtes infructueuses devraient être considérablement réduites, car tout ce qui sera créé par l'Assistant SAS sera compatible avec l’outil de tabulation. L'Assistant a été construit à partir de la documentation de chaque cycle d'enquête.

Date de modification :

Service de transfert électronique de fichiers

Les étapes suivantes permettent d'envoyer et de recevoir des fichiers par le biais du service de transfert électronique de fichiers (TEF). Suivez le lien pour accéder à la page d'accueil du service de transfert électronique de fichiers.

Étape 1

Étape 1

Un compte utilisateur est nécessaire pour accéder au site web du service de transfert électronique de fichiers. Saisissez votre nom d'utilisateur et votre mot de passe dans les champs appropriés.

Après votre première connexion, le mot de passe expirera et vous devrez en saisir un nouveau. Ne divulguez votre nom d'utilisateur et votre mot de passe à personne - vous serez tenu responsable de toutes les activités liées à votre compte.

Étape 2

Étape 2

Sélectionnez un coffre-fort dans la liste des "noms de coffre-fort". Choisissez d'envoyer des "Fichiers à Statcan" ou de recevoir des "Fichiers de Statcan".

Étape 3

Étape 3

Si vous avez choisi d'envoyer le fichier "à Statcan", l'option "Télécharger" s'affichera. En cliquant sur "Télécharger le fichier", vous serez invité à parcourir votre ordinateur pour sélectionner le programme SAS que vous voulez que Statcan exécute pour vous.

Note : Le nom de votre fichier SAS ne doit pas dépasser 70 caractères.

Étape 4

Étape 4

Une fois que vous avez sélectionné votre fichier SAS, celui-ci est automatiquement envoyé au système ADTR. Si votre fichier SAS a disparu du dossier, c'est qu'il a été téléchargé avec succès dans Statcan.

Étape 5

Étape 5

Vous pouvez continuer à télécharger d'autres fichiers SAS en utilisant le bouton "Télécharger" ou vous pouvez terminer cette session et cliquer sur le bouton "Déconnexion" dans le coin supérieur droit de la page, sous le menu déroulant.

Étape 6

Étape 6

Notification par courriel

Vous recevrez un courriel de Statistique Canada ayant pour objet "EFT - TEF Notification" qui contiendra des instructions sur la façon de télécharger vos fichiers de sortie.

Étape 7

Étape 7

Pour télécharger vos fichiers de sortie, vous devez d'abord vous connecter au système TEF. Si vous ne l'avez pas encore fait, veuillez répéter l'étape 1 avant de passer à l'étape 8.

Étape 8

Étape 8

Sélectionnez vos fichiers en cliquant sur l'hyperlien "De Statcan" pour afficher vos fichiers de sortie. Le numéro qui précède le nom de votre fichier est un identifiant unique à l'usage de StatCan.

Note: Vous avez 7 jours pour télécharger vos fichiers à partir du moment où vous avez reçu la notification par courriel avant qu'ils ne soient supprimés.

Date de modification :

Préparation d’un programme

Pour que le système d’accès à distance en temps réel (ADTR) puisse automatiser les processus nécessaires pour assurer la confidentialité, vos programmes doivent être rédigés dans un format normalisé. Pour rédiger un programme du SAS selon le format approprié, les utilisateurs doivent appliquer les renseignements tirés du document des paramètres de l’ADTR et créer des statistiques en utilisant les macros normalisées de l’ADTR.

Paramètres de l'ADTR

Paramètres de l'ADTR

Le document portant sur les paramètres de l’ADTR contient des renseignements essentiels dont les utilisateurs ont besoin pour mettre au point leurs programmes SAS.

Les termes figurant dans ce document sont expliqués ci-dessous.

Préfixe SAS – Terme de référence unique, propre à chaque bibliothèque d’enquête accessible au moyen de l’ADTR. Pour garantir l’accès à la bibliothèque d’enquête appropriée, le préfixe doit figurer dans le titre de votre programme SAS. Veuillez consulter la section nom du programme dans  le guide l’utilisateur de l’accès à distance en temps réel afin d’obtenir des instructions sur la manière de nommer votre programme SAS.

Ensemble de données SAS – Le nom de l’ensemble de données SAS doit être indiqué au moyen du nom standard de la bibliothèque (libname), appelé RTRAData. Pour vous assurer d’utiliser le bon ensemble de données d’enquête, veuillez consulter la liste complète des ensembles de données à la page de données de l’accès à distance en temps réel.

Base d'arrondissement – Les fréquences sont arrondies conformément à la base d’arrondissement déterminée pour chaque ensemble de données d’enquête. La base d’arrondissement est élaborée à partir de renseignements relatifs à la répartition du facteur de pondération, aux règles relatives au nombre minimal de répondants et à la pratique d’arrondissement en vigueur pour chaque ensemble de données d’enquête.

Variables renommées – Pour des raisons de compatibilité du système d’ADTR, certaines variables sont renommées.

Variables éliminées – Les variables sensibles qui présentent un risque de divulgation sont supprimées des fichiers de microdonnées.

Poids – Les variables de poids pour chaque ensemble de données d’enquête sont fournies dans ce document. Un nom standard pour « WEIGHT » doit être entré dans le système d’ADTR pour passer à la macro des fichiers de données administratives. Pour ces derniers, cette variable « WEIGHT » est égale à 1.

Temps limite d'exécution – Le temps limite d’exécution permet de préciser la durée maximale d’exécution de la soumission du programme. Ce temps limite empêche le programme SAS de fonctionner pendant une durée excessive et de consommer inutilement les ressources informatiques.

Nom du programme

Nom du programme

Pour garantir l’accès à la bibliothèque d’enquête appropriée, le préfixe doit figurer dans le titre de votre programme SAS. Veuillez consulter la page de données de l’accès à distance en temps réel pour obtenir la liste complète des préfixes.

Le nom de votre programme SAS doit respecter des règles standard d’affectation des noms. Selon ces règles, le nom de votre programme doit commencer par le « préfixe » approprié, suivi d’un trait de soulignement, puis d’un nom de votre choix. Par exemple, les chercheurs qui soumettent un programme dans le cadre de l’Enquête sociale générale de 2006 nommeraient leur programme comme suit : GSS2006_nomchoisi.sas. Veuillez prendre note que le nom du programme ne peut pas comprendre plus de 70 caractères ni inclure les caractères & et %.

Contenu du programme : statistiques

Contenu du programme : statistiques

Veillez à ce que votre programme SAS respecte la structure des sections mentionnées ci-dessous.

Partie 1 : éléments du programme

  • Les utilisateurs doivent indiquer un nom de bibliothèque (libname) standard, appelé RTRAData. La liste des noms d’ensembles de données correspondants peut être consultée à la page des Paramètres de l’ADTR. Par exemple, ensemble RTRAdata.GSS2007.
  • N’utilisez pas un nom standard SAS libref; inclure un énoncé de bibliothèque (libname) met fin à votre programme.
  • Dans cette section, vous pouvez manipuler les données en utilisant les commandes « proc sort  » et « data steps  ».
  • Si vous utilisez l’énoncé « keep » (pour définir les variables à inclure dans le produit) ou l’option d’ensemble de données « keep= » dans SAS, vous devez inclure la variable « ID ». Par exemple, ensemble RTRAdata.GSS2007 (keep = AGE SEX ID);.

Partie 2 : statistiques

Cette section permet de créer des tabulations en faisant appel aux macros de procédures d’ADTR personnalisées. Vous pouvez utiliser ces procédures 10 fois par programme tout au plus.

Il est possible de calculer trois types de statistiques dans l’ADTR :

  • 1. Statistiques de base : Ces statistiques ne calculent qu’une statistique à la fois. Les statistiques de base disponibles dans le système d’ADTR sont la fréquence, la moyenne, les centiles, la répartition en pourcentage, les proportions, le ratio et la part.
  • 2. Statistiques de niveau 5 (L5) : Aussi appelées statistiques d’ordre supérieur, ces statistiques calculent les différences entre les statistiques de base disponibles dans le système d’ADTR.
    • Il existe trois types de statistiques L5 :
      • 1. Variation de niveau (LC) : La variation de niveau désigne la différence entre les valeurs des statistiques calculées dans un tableau.
      • 2. Variation en pourcentage (PC) : La variation en pourcentage désigne la différence de pourcentage entre les valeurs des statistiques calculées dans un tableau. On la calcule en divisant la différence de deux valeurs dans un tableau par la valeur de départ.
      • 3. Test d’hypothèse (ST) : Les tests de signification permettent de calculer si deux valeurs d’un tableau présentent une différence significative sur le plan statistique.
    • Trois méthodes permettent de calculer des statistiques L5. Ces méthodes renvoient à la façon dont peuvent être comparées les valeurs des cellules du tableau :
      • 1. Global (global) : Dans le cas des statistiques L5 globales, chaque valeur de cellule est comparée à la valeur du domaine entier comprenant ces cellules.
      • 2. Valeur de base (base) : Des statistiques L5 de base permettent de comparer la valeur de chaque cellule à une autre cellule donnée (la valeur de base).
      • 3. Séquentielle (sequential) : Des statistiques L5 séquentielles permettent de comparer la valeur de chaque cellule à celle de la cellule se trouvant directement sous elle dans le tableau. Note : l’ordre des domaines dans un tableau importe lorsque l’on utilise des statistiques L5 séquentielles.
  • 3. Statistique de niveau 5 séquentielle dans le temps (L5SOT) : Aussi appelées statistiques d’ordre supérieur, ces statistiques permettent de calculer les différences entre les statistiques de base disponibles dans le système d’ADTR. Des statistiques L5SOT séquentielles permettent de comparer la valeur de chaque cellule à celle de la cellule se trouvant directement sous elle dans le tableau d’une façon séquentielle dans le temps. Il faut ainsi établir un intervalle de temps dans la macro afin de dégager la séquence. Ces intervalles de temps peuvent être annuels (L5YrVar), mensuels (L5MonVar), trimestriels (L5QtrVar) ou déterminés (L5TimeInt). Note : l’ordre des domaines dans un tableau importe lorsque l’on utilise des statistiques L5SOT.
    • Il existe trois types différents de statistiques L5SOT :
      • 1. Variation de niveau (LC) : La variation de niveau désigne la différence entre les valeurs des statistiques calculées dans un tableau.
      • 2. Variation en pourcentage (PC) : La variation en pourcentage désigne la différence de pourcentage entre les valeurs des statistiques calculées dans un tableau. On la calcule en divisant la différence de deux valeurs dans un tableau par la valeur de départ.
      • 3. Test d’hypothèse (ST) : Les tests de signification permettent de calculer si deux valeurs d’un tableau présentent une différence significative sur le plan statistique.

Avant de pouvoir être utilisées, des statistiques L5 et L5SOT exigent que des statistiques de base soient calculées. Par conséquent, les macros L5 et L5SOT contiennent un champ indiquant les statistiques de base.

Date de modification :

Limites du système

Compatibilité avec SAS

Compatibilité avec SAS

Le système d'accès à distance en temps réel (ADTR) utilise la version 9.4 de SAS. Les demandes de données doivent être soumises sous la forme de programmes SAS en format American Standard Code for Information Interchange (ASCII) simple. Statistique Canada ne fournit pas d'aide à la programmation et n'apporte pas de modifications aux programmes qui sont soumis. Si un programme ne fonctionne pas correctement, un journal sera envoyé accompagné d'une explication quant à la raison pour laquelle le programme a échoué.

Contraintes

Contraintes

  1. Limites du système
    • Aucune limite n'est imposée quant au nombre de programmes que vous pouvez soumettre, tant que vous êtes inscrit au système d'accès à distance en temps réel (ADTR). Cependant, le nombre de soumissions réussies par jour est limité à 10.
    • Pour chaque soumission de programme réussie, 10 appels de macros de procédure d'ADTR au maximum sont autorisés; en d'autres termes, 100 totalisations au plus peuvent être créées par jour.
    • Lors de l'exécution de vos programmes SAS, n'oubliez pas que l'espace temporaire maximal disponible aux fins de traitement SAS est de 100 Go.
    • Quatre ou cinq variables maximum peuvent être définies dans la liste de variables de classe, selon la macro de procédure d'ADTR appelée.
    • Les variables de classe ne peuvent pas contenir de valeurs manquantes.
    • Chaque variable de classe peut contenir au plus 500 valeurs distinctes.
    • Tous les nombres d'observations indiquées dans les journaux SAS qui sont retournés aux utilisateurs sont remplacés par xxxxxx.
  2. Restrictions relatives à SAS

Certains mots clés de SAS, ou énoncés, ne sont pas autorisés dans le cadre de l'ADTR. La liste suivante peut faire l'objet de modifications.

  • Certaines occurrences de % et de &.
  • Des commentaires sous la forme %*...;
  • L'écriture d'ensembles de données permanents sur l'espace disque du système d'ADTR.
  • _ERROR_
  • _N_
  • ABORT
  • CATNAME
  • DCREATE
  • DM
  • DOPEN
  • ENDRSUBMIT
  • ENDSAS
  • ERROR
  • EXECUTE
  • FDELETE
  • FILE
  • FILENAME
  • FIRST
  • FIRSTOBS
  • FOPEN
  • FTP
  • INFILE
  • LAST
  • LIBNAME
  • MAPS
  • MAPSGFK
  • MAPSSAS
  • MODULE
  • MODULEC
  • MODULEI
  • MODULEIC
  • MODULEIN
  • MODULEN
  • MOPEN
  • OBS
  • ODS
  • OPTION
  • OPTIONS
  • PATHNAME
  • PEEK
  • PEEKC
  • PEEKCLONG
  • PEEKLONG
  • POKE
  • POKELONG
  • PRINTTO
  • PTRLONGADD
  • PUT
  • PUTLOG
  • RSUBMIT
  • SASFILE
  • SASHELP
  • SASUSER
  • SIGNOFF
  • SIGNON
  • SYMGET
  • SYMPUT
  • SYMPUTX
  • SYSTASK
  • SYSTEM
Programmation shell (coquille) : testez votre code

Programmation shell (coquille) : testez votre code

Pour vous aider à vérifier votre code SAS, un programme shell (coquille) et un catalogue de macros SAS peuvent être téléchargés.

Veuillez ouvrir le programme shell et suivre les descriptions des différentes sections du programme :

Section 1

  • Cette section indique la façon dont le nom de bibliothèque standard libname que créera automatiquement le système d'ADTR doit être simulé.
  • Veillez à bien modifier le chemin d'accès au fichier vers l'emplacement où vous avez enregistré vos données d'essai.
  • N'utilisez pas d'autre nom de bibliothèque libname; celui-ci doit être RTRAData.

Section 2

  • Cette section n'est pas utile à la vérification, si vous avez créé votre propre ensemble de données d'essai.
  • Des ensembles de données d'enquête fictifs sont disponibles dans cette section.

Section 3

  • Cette section montre la façon dont la macro de la procédure d'ADTR doit être ciblée pour créer votre tableau.
  • Changez le nom du catalogue de macros SAS téléchargé en « sasmacr ».
  • Veillez à bien modifier le chemin d'accès au fichier vers l'emplacement où vous avez enregistré le catalogue SAS fourni (sasmacr.sas7bcat).

Section 4

  • Cette section montre la façon dont votre programme doit être inclus et exécuté.
  • Veillez à bien modifier le chemin d'accès au fichier vers l'emplacement où vous avez enregistré votre programme.
Date de modification :

Rapport du Conseil consultatif canadien de la statistique - Relever les défis auxquels est confronté le système statistique national

Le 9 novembre 2023 - Le Conseil consultatif canadien de la statistique (CCCS) a présenté aujourd'hui son quatrième rapport (Rapport du Conseil consultatif canadien de la statistique - Relever les défis auxquels est confronté le système statistique national) sur l'état du système statistique du pays au ministre de l'Innovation, des Sciences et de l'Industrie.

Le rapport souligne l'importance du système statistique national pour aider les Canadiens et les Canadiennes à suivre le rythme d'une société qui évolue rapidement. La modernisation des méthodes et des technologies statistiques permet de produire des informations statistiques pertinentes, qui sont essentielles pour permettre aux Canadiens de prendre des décisions éclairées, d'innover et de s'attaquer aux problèmes les plus urgents du pays. Les Canadiens et les Canadiennes ont besoin de données crédibles et fiables, en particulier dans le contexte actuel de mésinformation et de désinformation.

Le rapport de cette année inclut quatre recommandations :

  1. Mobiliser les Canadiens et Canadiennes et les décideurs en faveur d'un système statistique national moderne
  2. Investir dans la science des données et les compétences analytiques
  3. Élaborer des flux de données novateurs
  4. Reconnaître le rôle de l'intendance des données

"Pendant les périodes difficiles, les données deviennent encore plus cruciales pour comprendre et aborder les problèmes existants. Le coût des programmes et des décisions fondés sur des données de piètre qualité ou incomplètes peut être énorme. L'écosystème de données et les programmes statistiques du pays sont des infrastructures essentielles qui ne doivent pas être négligées. Il faut plutôt investir davantage dans le développement d'un système national de données cohérent, lequel est essentiel pour soutenir la reprise économique et assurer la prospérité et le bien-être de la population canadienne", a déclaré Howard Ramos, président du CCCS.

Le système statistique national du Canada repose sur des relations mutuelles et sur le partage d'informations et d'expertise. Il doit être un élément clé des stratégies de données des secteurs public et privé afin de soutenir la résolution de problèmes pressants auxquels le pays doit faire face aujourd'hui et dans les années à venir.

Contact info

Howard Ramos
Président du CCCS
Téléphone : 519-661-2111, ext. 85142
Courriel : howard.ramos@uwo.ca
Anglais / français