Qu'attendons-nous du modèle de microsimulation RiskPaths?
Que peut ajouter la simulation à l'analyse statistique?
Caractéristiques souhaitées d'un modèle de microsimulation RiskPaths
Que peut ajouter la simulation à l'analyse statistique?
Avant de pouvoir répondre à la question de savoir ce que la simulation ajoute à l'analyse statistique, nous devons bien comprendre ce que les résultats statistiques présentés à la section précédente révèlent. Les résultats des estimations pour les deux pays et pour les deux cohortes nous permettent d'étudier les similarités et les différences entre ces pays, ainsi que l'évolution des paramètres au cours du temps séparément pour chaque processus individuel. Nous constatons une similarité remarquable des paramètres entre les deux pays, surtout pour les cohortes d'avant la transition. Fondamentalement, la Bulgarie ne diffère de la Russie qu'en ce qui concerne le risque trois fois plus faible de dissolution d'une union et la vitesse plus lente de formation d'une deuxième union. Par conséquent, si nous comparons les cohortes avant et après la transition, nous observons des changements spectaculaires dans la plupart des processus. Le risque d'une première naissance a été réduit de moitié durant les trois premières années de la première union, sans redressement ultérieur, quoique les paramètres aient changé relativement peu après trois années dans une union. En outre, dans les deuxièmes unions, la fécondité a baissé de plus de 50 %. La différence la plus importante entre les deux pays après la transition s'observe pour la formation d'une première union, les taux ayant été réduits de moitié en Bulgarie, mais étant demeurés stables en Russie. Pour la dissolution de la première union nous observons le tableau opposé - le risque de dissolution d'une union a augmenté d'environ 40 % en Russie, mais est resté presque le même en Bulgarie.
Il s'agit là d'exemples typiques des éclaircissements que peut fournir l'analyse d'un processus unique. Nous avons décomposé un système complexe en ses processus constitutifs et étudié les changements à l'intérieur de ces processus. Dans le cas de la fécondité, nous avons introduit des risques relatifs - nous avons étudié comment certains facteurs (ici différentes situations d'union) influencent un processus unique. Il s'agit d'une question analytique très typique et ce genre de recherche abonde dans la littérature scientifique.
La puissance de la microsimulation se dégage quand nous étudions divers processus simultanément. Même dans notre exemple démographique très simple, les résultats sont difficiles à interpréter quand nous nous intéressons à l'effet qu'ont sur les résultats agrégés les changements dans des processus uniques. Par exemple, quel est l'effet de l'accroissement de 40 % du risque de dissolution d'une union sur le fait de ne pas avoir d'enfants en Russie? Il dépendra de la fécondité en dehors des unions et dans les deuxièmes unions, ainsi que de la vitesse de formation d'une deuxième union. Le risque relatif de fécondité est plus élevé dans les deuxièmes unions qu'après trois années dans la première union, mais la formation de la deuxième union prend du temps (durant lequel la fécondité est très faible) et toutes les femmes ne forment pas une deuxième union. Ces effets s'annulentils les uns les autres ou la dissolution d'une union affectetelle la fécondité, et dans quelle direction? Ce genre de question nous invite à utiliser la microsimulation pour une analyse de sensibilité. Comment agrégeonsnous le changement de résultat en réponse à la variation d'un seul paramètre? Notons que nous sommes maintenant passés d'une analyse au niveau d'un processus unique à une analyse du comportement d'un système.
Une comparaison des deux cohortes suscite un type supplémentaire d'analyse de système - quelle est la contribution relative du changement dans les processus uniques aux résultats agrégés? Si nous comparons les deux cohortes simulées, nous voyons que l'absence d'enfants a augmenté considérablement dans les deux pays, mais encore plus en Bulgarie qu'en Russie. Nous pouvons utiliser la microsimulation pour décomposer les contributions des changements dans les divers processus au changement agrégé. Comment aurait évolué la prévalence de l'absence d'enfants si seuls les paramètres de fécondité avaient changé? Quelle est la contribution des changements concernant la formation d'une union? L'accroissement du risque de dissolution d'une union atil contribué à l'accroissement de l'absence d'enfants en Russie? Naturellement, le changement agrégé n'est pas égal à la simple somme arithmétique des effets partiels. Certains changements de processus pourraient avoir un effet plus prononcé ou plus faible en présence de changements dans les autres processus. Par exemple, l'effet du changement de fécondité dans les deuxièmes unions dépendra fortement de la probabilité d'être dans une deuxième union, laquelle est conditionnelle aux risques de formation et de dissolution d'une première union. La microsimulation peut nous aider à déceler et à mieux comprendre ce genre d'interaction.
Quand nous examinons la cohorte après la transition, nous sommes déjà entrés dans le domaine des prédictions. Comme les données ont été recueillies 14 ans après la transition, en réalité, aucune cohorte postérieure à la transition n'a vécu l'entièreté de sa période reproductive. Donc, pour des mesures de cohorte comme l'absence d'enfants, l'évaluation de la cohérence avec d'autres sources de données est limitée à une comparaison à d'autres projections. Toutefois, nous pouvons aussi utiliser notre modèle pour refaire des prédictions sous diverses hypothèses quant aux futurs changements dans les processus. Nous pourrions avoir conçu une théorie qui nous mène à l'hypothèse que seules des parties des changements observés sont de nature permanente (p. ex.causés par un changement culturel), tandis que d'autres sont transitoires (p. ex.résultant d'une crise économique, par conséquent réversibles avec la reprise économique). Que se passerait-il si les taux de fécondité revenaient à leur valeur initiale alors que la formation plus lente d'une union (ultérieure) persiste, ou inversement? Ce genre d'analyse peut produire des résultats surprenants, car ce n'est pas nécessairement le renversement du processus qui, initialement, a eu l'effet global le plus important qui produira l'effet opposé le plus grand.
Existe-t-il des incidences en ce qui concerne les politiques? Bien que notre modèle soit évidemment trop simple pour l'analyse des politiques, il ne faut pas beaucoup d'imagination pour voir comment la microsimulation peut appuyer l'élaboration des politiques.
- Dans de nombreux cas, les phénomènes étudiés ont un rapport direct avec les politiques. La baisse de la fécondité aura par exemple une incidence sur la viabilité des systèmes de sécurité sociale. Un bon modèle de projection démographique peut par conséquent produire des données d'entrée précieuses pour une planification subséquente de bonne qualité. La microsimulation est l'outil qui permet de combiner des modèles statistiques distincts en modèles de projection.
- Les événements simulés dans un modèle de microsimulation peuvent également être euxmêmes les cibles des politiques. Un gouvernement pourrait chercher à influer sur la fécondité, ce qui est possible s'il met en place des politiques capables d'influencer les processus modélisés. Cependant, nous devons d'abord arriver à comprendre la contribution individuelle de ces processus aux résultats agrégés que nous voulons modifier; donc, nous avons besoin de microsimulations. Si nous pouvons mettre un prix sur ces politiques, nous serons également capables d'utiliser la microsimulation pour trouver la combinaison de politiques la plus rentable, et donc d'étudier les effets secondaires possibles. (Sous le régime socialiste, la Russie et la Bulgarie avaient effectivement en place un ensemble de politiques puissantes, telles que l'impôt sur le célibat et l'accès privilégié au logement pour les jeunes couples mariés. Le prix de la régulation des choix de vie individuels s'est avéré être assez élevé.)
- La microsimulation nous permet de compléter les modèles résultant de l'analyse statistique par des scénarios stratégiques et des modèles de comptabilité économique détaillés. Elle offre un outil très naturel pour la simulation des politiques, car celles-ci sont définies au niveau individuel ou micro, ce qui aboutit à des applications qui intègrent la modélisation démographique et économique.
Caractéristiques souhaitées d'un modèle de microsimulation RiskPaths
Entrées : Tableaux des paramètres, scénarios et paramètres de la simulation
Même s'il est très simple, le modèle RiskPaths possède environ 130 valeurs de paramètre que les utilisateurs doivent être capables d'attribuer et de mémoriser comme il convient. Ces paramètres devraient être présentés de manière bien structurée dans l'application de microsimulation, sous forme de tableaux étiquetés, d'accès (ou de navigation) facile, qui peuvent être lus ou modifiés au besoin.
Quand nous utilisons un modèle, nous créons habituellement différents scénarios, c'estàdire différentes paramétrisations du modèle. Nous devons pouvoir sauvegarder ces scénarios afin que certaines simulations puissent être reproduites dans l'avenir. Les scénarios contiennent tous les tableaux des paramètres et, idéalement, des descriptions textuelles ou des notes supplémentaires qui décrivent les changements spécifiques intégrés dans chaque scénario. En outre, les scénarios doivent inclure les paramètres du scénario, tels que le nombre de cas simulés (étant donné que RiskPaths est un modèle orienté cas). Une grande taille d'échantillon réduira la variation Monte Carlo, mais au prix de l'exécution plus lente des simulations. Si nous nous intéressons uniquement aux agrégats généraux, des échantillons de plus petite taille pourraient suffire. Par ailleurs, l'analyse détaillée d'événements rares ou une ventilation détaillée des résultats (p. ex.selon le groupe d'âge) nécessitera de grands échantillons. En outre, l'utilisateur pourrait ne pas vouloir produire toutes les sorties disponibles. Limiter la sortie souhaitée peut de nouveau accélérer les simulations, mais aussi donner lieu à une présentation plus concise et focalisée des résultats, conformément aux besoins de l'utilisateur.
Tous les éléments susmentionnés (tableaux des paramètres, notes descriptives, nombre de cas, choix de la sortie à produire) font partie d'un scénario. Dans nos applications RiskPaths, toute cette information devrait être mémorisée ensemble pour un scénario particulier et elle devrait pouvoir être extraite, consultée et modifiée facilement.
Sortie et visualisation des sorties
Les modèles de microsimulation peuvent produire des sorties à deux niveaux, micro et macro. Une application de microsimulation pourrait en théorie écrire toutes les caractéristiques de niveau individuel et tous leurs changements au cours du temps dans un fichier et laisser à l'utilisateur la tâche d'analyser le fichier de données résultant au moyen d'un logiciel statistique. Dans le cas de RiskPaths, cela aboutirait à un fichier contenant les dates de tous les événements simulés qui surviennent au cours de la trajectoire de vie simulée de chaque individu. Six événements seulement peuvent avoir lieu dans une vie simulée, de sorte que chaque enregistrement de données contiendrait au plus six variables : quatre événements de formation/dissolution d'union, la grossesse et le décès. Toutefois, pour des applications plus complexes, la taille et la complexité du fichier pourraient être énormes.
En plus d'un fichier longitudinal de ce genre, nous pourrions aussi souhaiter une sortie transversale, dans laquelle sont enregistrés les états de tous les individus à un point particulier dans le temps. L'utilisation d'un tel fichier serait relativement limitée dans la simulation d'une seule cohorte, mais il ressemblerait à une enquête transversale ou à un recensement de population dans un modèle de population.
Habituellement, un utilisateur de modèle ne s'intéresse pas aux fichiers de microdonnées proprement dits, mais à leur analyse. Il agrégera généralement les données et produira des indicateurs et des tableaux sommaires. Si les développeurs d'un modèle savent comment les données simulées seront ou devraient être analysées, ces mesures et tableaux peuvent déjà être calculés et produits dans une exécution de l'application de microsimulation. Dans ce cas, les utilisateurs n'auront pas besoin d'exécuter des routines statistiques supplémentaires; ils pourront voir les résultats immédiatement après l'exécution d'une simulation. Dans notre modèle RiskPaths, la sortie ne comporte qu'un petit nombre de tableaux et d'indicateurs sommaires que nous nous attendons à être produits dans l'application. Nous nous intéressons au taux de fécondité par âge, à l'absence d'enfants, à l'âge moyen au moment de la première grossesse, à la première grossesse selon la situation d'union et à certaines mesures de mortalité.
Comme pour les tableaux de paramètres, la sortie agrégée du modèle requiert une structure. Nous pourrions souhaiter présenter certaines mesures sommaires d'un ou plusieurs comportements apparentés regroupés dans un tableau et nous voudrions certainement ordonner le contenu du tableau de manière significative. En outre, comme pour les paramètres, les résultats tabulaires devraient être étiquetés de manière qu'ils soient faciles à lire et à comprendre.
Comme tous les résultats de microsimulation sont sujets à la variation Monte Carlo, les chiffres agrégés ne sont qu'une visualisation des résultats. Nous pourrions aussi vouloir obtenir des renseignements sur la distribution de chaque valeur du tableau. Ce genre d'information nous aiderait à sélectionner une taille de population suffisante pour un niveau de précision souhaité des résultats.
L'affichage graphique des trajectoires individuelles est un type particulier de sortie de microdonnées. Il peut s'agir d'une fonction utile, car elle donne aux utilisateurs une vue des individus simulés, donc un moyen de voir le fonctionnement des modèles statistiques. Elle peut aussi être utile aux développeurs des modèles car elle facilite le débogage. Puisque RiskPaths est un outil de formation, nous souhaitons montrer comment les biographies individuelles résultent des processus statistiques. Donc, outre les événements qui surviennent au cours de la vie, nous pourrions aussi vouloir voir comment les risques des autres événements évoluent au cours du temps et des situations au cours de la vie.
Interface utilisateur et documentation
Jusqu'à présent, nous avons formulé des attentes concernant le contenu, l'affichage et la présentation des données d'entrée et de sortie du modèle. Du point de vue de l'utilisateur, devonsnous simplement ajouter un bouton de démarrage pour compléter l'application de microsimulation? Estce que toutes les applications logicielles contemporaines contiennent des fichiers d'aide. En tant qu'utilisateur de modèles de microsimulation, nous devrions nous attendre à avoir accès à une aide détaillée en ligne, non seulement concernant l'utilisation du logiciel de modélisation proprement dit, mais aussi au sujet des éléments particuliers du modèle et des interdépendances entre ces éléments.
- Date de modification :