« Une variable est une caractéristique d'une unité statistique que l'on observe et pour laquelle une valeur numérique ou une catégorie d'une classification peut être attribuée. »
Dans la définition qui précède, les composantes clés sont :
Ces composantes sont les composantes standard utilisées dans la présente trousse d'information pour désigner et structurer les variables. Un organisme statistique qui publie des données doit adopter une façon uniforme pour désigner et structurer les variables auxquelles les données se rapportent. Pour ce qui est des utilisateurs, ils doivent être capables de reconnaître la même structure qui sous-tend le nom des variables, quelle que soit la subdivision de l'organisation qui produit les données et le sujet étudié. En ce qui a trait à la gestion des renseignements sur les données (appelés métadonnées) publiées par l'organisation, il faut adopter une convention et une structure de désignation uniformes pour les variables, afin de pouvoir conserver efficacement les métadonnées dans une base de données centrale, ainsi que de permettre une extraction efficace et une recherche utile par les utilisateurs.
La convention et la structure de désignation dont il est question précédemment sont adaptées de la norme de l'Organisation internationale de normalisation (ISO), Technologies de l'information - Registres de métadonnées, ou ISO 11179. Cette norme est adoptée par un nombre croissant d'organismes statistiques nationaux.
Lorsqu'il est décidé de produire des données dans le cadre d'un programme statistique, afin d'éclairer un certain domaine, les analystes responsables doivent déterminer :
Prenons un tableau de série chronologique s'appliquant au Canada, dans lequel les en-têtes des colonnes correspondent aux périodes de référence, et les titres des lignes, aux noms de la caractéristique générale mesurée pour l'unité statistique observée, par exemple, « Revenus totaux de tous les ménages ». La documentation des variables que vous consultez en ce moment définit la caractéristique mesurée et l'unité statistique observée. Les cellules comprises dans les lignes contiennent les valeurs numériques, selon l'unité de mesure indiquée dans la documentation des variables.
Dans la plupart des cas, les données du tableau seront ventilées selon la région géographique à l'intérieur du Canada, par exemple, provinces et territoires, ou régions métropolitaines, etc. La documentation des variables informe les utilisateurs de cette ventilation géographique. Dans la plupart des cas, la valeur de la caractéristique générale mesurée sera ventilée en sous-catégories de caractéristiques et/ou d'unités statistiques, i.e., en d'autres mots, ventilées en classes à l'intérieur de classifications; par exemple, les classes de sources de revenus ou les classes d'industries. La documentation des variables informe toujours les utilisateurs des différentes classes de la ou des classifications particulières utilisées pour présenter les données du tableau. Les noms de ces classes et groupes de classes apparaissent dans les titres des lignes du tableau.