Concepts de base de Modgen

Acteur : Un acteur est l'entité dont la vie est simulée dans un modèle Modgen. Il s'agit souvent d'une personne, bien que cela ne soit pas une exigence--d'autres modèles ont été développés pour simuler des logements ou des professions comme acteurs. Néanmoins, dans RiskPaths, l'acteur est une personne ou, plus précisément, une femme (puisqu'il s'agit d'un modèle conçu pour étudier le fait de ne pas avoir d'enfants).

État : Les états décrivent les caractéristiques des acteurs d'un modèle. Certains états peuvent être continus, comme l'âge, tandis que d'autres sont catégoriques, comme le sexe. Pour les états catégoriques, les catégories ou les niveaux réels sont définis à l'aide de la commande classification de Modgen.

Dans l'ensemble, il existe deux grands types d'états dans Modgen--les états simples et les états dérivés, qui sont tous deux utilisés dans RiskPaths et qui sont tous deux déclarés dans une déclaration d'acteur. Un état simple est un état dont la valeur peut être initialisée et modifiée par le code que crée un développeur de modèle. Les états simples sont modifiés par des événements explicitement déclarés. Un état dérivé, par ailleurs, est un état dont la valeur est donnée sous forme d'une expression qui est normalement dérivée d'après, ou basée sur, d'autres états. Les valeurs d'un état dérivé sont tenues à jour automatiquement par Modgen tout au long de l'exécution d'une simulation. Un autre concept utile de Modgen est l'état dérivé autoplanifié. Il s'agit d'un état qui change dans une séquence temporelle prédéfinie, tel que integer_age, un état de RiskPaths qui change à chaque anniversaire.

Événement : Dans Modgen, la simulation a lieu par l'exécution des événements. Un événement comprend deux fonctions : une fonction temporelle pour déterminer le moment de la prochaine occurrence de l'événement et une fonction d'exécution pour déterminer les conséquences de la survenue de l'événement. RiskPaths comprend plusieurs événements, y compris un événement de mortalité, des événements de formation et de dissolution d'une union et un événement de première grossesse.

Paramètre : Les paramètres sont utilisés pour donner à l'utilisateur du modèle un certain degré de contrôle sur les simulations qu'il exécute. La capacité de modifier divers risques ou probabilités qui ont une incidence sur divers aspects de la simulation permet d'étudier différents scénarios. Les paramètres peuvent posséder de nombreuses dimensions (telles que l'âge, le sexe et l'année) et sont sauvegardés dans des fichiers de données .dat. RiskPaths contient un fichier de paramètres, Base(RiskPaths).dat, qui contient les valeurs des paramètres telles que les probabilités de décès selon l'âge et les risques d'une première grossesse selon le groupe d'âge. Les modèles plus complexes contiennent habituellement plus d'un fichier .dat.

Tableau : Une fonction de totalisation croisée puissante est intégrée dans Modgen pour présenter les résultats agrégés sous la forme de tableaux. Une déclaration de tableau comprend deux éléments centraux, à savoir ses dimensions de capture (qui définissent quand un acteur entre dans une cellule et quand il en sort) et sa dimension d'analyse (qui enregistre ce qui se passe pendant que l'acteur est dans la cellule). Pendant l'exécution de simulations, les totalisations destinées à remplir un tableau sont produites à la volée, de sorte qu'il n'est pas nécessaire de créer de grands fichiers temporaires et d'y inscrire les données en vue de la production subséquente de rapports. Plusieurs exemples de déclaration de tableau sont présentés plus loin dans le document pour le modèle RiskPaths.

Date de modification :

Comment utiliser BioBrowser : les notions de base

Pour lancer une session du BioBrowser

Pour lancer une session du navigateur de biographie, choisissez la rubrique BioBrowser 4 qui figure dans le sous-menu Programmes du bouton Démarrer.

Ouverture d’un fichier de base de données existant : Commande Fichier/Ouvrir une base de données…

Le navigateur de biographie lance automatiquement cette commande au début d’une session.  Une base de données (créée par Modgen) doit être ouvert pour qu’on puisse créer une représentation graphique (enregistrée à titre de biographie).  Une seule base de données peut être ouvert à la fois, mais on peut visualiser plusieurs biographies simultanément.

Un exemple de base de données, appelée demo(trk).mdb,est fourni dans l’installation BioBrowser.  

Dialog pour ouvrir le base exemple de donnees, demo(trk).mdb

Ouverture d’une biographie enregistrée : Commande Fichier/Ouvrir

Une fois que la base de données a été ouverte suite au lancement de BioBrowser, le système vous demande de créer une nouvelle biographie ou d’ouvrir une biographie enregistrée.  Une biographie enregistrée, demo.bbr, est fournie lors de l’installation.  Choisissez le bouton Ouvrir.

Dialog d'information pour ouvrir des biographes

Le système vous invite ensuite à préciser le nom du fichier à ouvrir.  Choisissez demo.bbr

Dialog pour ourvir la biographie enregistree, demo.bbr

Création d’une nouvelle biographie : Commande Fichier/Nouvelle biographie

La création d’une nouvelle biographie exige la sélection des acteurs dont vous voulez mettre en graphique.  Ce choix comporte la sélection d’un acteur débutant ainsi qu’un filtre.  La façon dont la base de donnée a été crée dans le modèle Modgen va limiter les choix offerts.  L’acteur débutant représente le type d’acteur dont les états vont être mises en graphique.  Plus tard dans le processus du BioBrowser, d’autres acteurs qui sont liés à ces acteurs débutants (par exemple leurs conjoints ou leurs enfants)  peuvent être ajouté à la biographie.  Dans l’exemple qui est fourni avec le logiciel, il y a deux choix d’acteurs débutants: persons, dont les états sont inclues dans la base de données seulement si l’acteur est dominant ou s’il est marié ou remarié, et children, leurs enfants.

Le nombre d’acteurs choisi pour être mis en graphique qui résulte du choix d’un type d’acteur peut être très grand, selon la grandeur originale de la base de données.  Le critère du filtre vous permet de préciser la biographie. Sélectionnez un état, un opérateur pour cet état, puis une valeur.  Ainsi, une interrogation SQL est produite relativement à la base de données.  Le résultat de cette interrogation est un ensemble d’acteurs qui sont conformes aux critères du filtre précisé. Pour l’instant, deux états peuvent servir à déterminer le filtre. Lorsque vous choisissez deux états, vous devez déterminer si les critères seront réunis par une condition « Et » ou « Ou ». Si l’interrogation a produit un résultat, la nouvelle biographie est ouverte. Une fois la biographie ouverte, vous pouvez modifier les critères à l’aide du menu Filtre/Critères

L’état suivi représente les moments auxquels l’acteur ainsi que ses états sont inclus dans la base de données.  Si vous souhaitez parcourir tous les acteurs offerts, fixez le paramètre du filtre à Suivi = VRAI dans la section « Critères du filtre » du dialogue « Filtre de biographie ».

Dans la boîte Description du filtre, vous pouvez changer la description du filtre que vous avez choisi.  Cette description va apparaître au bas de l’écran.

Dans l’exemple ci-dessous, tous les acteurs personne dont l’état dominant est Vrai sont sélectionnés pour la consultation.  Il s’agit d’un état logique dont la valeur est Vrai ou Faux pour toute la durée de vie de l’acteur.  Puisque le fichier demo(trk).mdb ne comporte que 20 cas, 20 acteurs sont conformes aux critères.

Exemple d'un �cran filtre pour ne choisir que des acteurs dominants

La nouvelle biographie contient une seule bande d’affichage la bande de navigation dans laquelle est indiqué l’état du suivi de filtre.  Cet état correspondant aux moments que les caractéristiques d’état sont incluses dans le modèle (l’axe au bas de l’écran indique les dates du début et de la fin).  La bande d’affichage n’est pas nécessairement continue.  Le nombre d’acteurs satisfaisant au critère du filtre ainsi que le numéro de l’acteur qui est présentement affiché sur l’écran se retrouve au-dessus de cette bande d’affichage.  Dans l’exemple ci-dessous, le premier acteur des vingt qui ont satisfait au filtre, est affiché à l’écran.  La section « Selection d’états et navigation » vous expliquera comment ajouter d’autres états à la biographie.

Exemple d'un cran affichant une biographie

Enregistrement d’une biographie : Commandes Fichier/Enregistrer et Enregistrer sous...

Une fois que tous les états voulus ont été ajoutés (et que leur couleur et leur style ont été définis), vous pouvez enregistrer la biographie dans un fichier.  Les fichiers de ce type portent le suffixe “.bbr” et vous pouvez les récupérer à un autre moment pour une base de données compatible.  Aux fins de compatibilité, le filtre de l’interrogation ne doit pas être vide et toutes les paires acteur/état sélectionnées précédemment doivent figurer dans la base de données ouverte.  Tous les styles, toutes les couleurs et toutes les positions de navigation sont enregistrées.

Dialog pour enregistrer une biogrpahie

Si vous avez modifié les données d’état d’une biographie, un astérisque (*) figure en regard du nom de fichier dans la fenêtre de légende.  Les changements aux options de navigation ou à la biographie globale ne provoquent pas l’affichage de cet indicateur qui précise que la biographie a été modifiée depuis le dernier enregistrement.

Date de modification :

Approches de microsimulation

Version PDF (PDF, 72.06 Ko)

Introduction

Le présent document offre une analyse de diverses approches de microsimulation qui entrent en jeu quand nous simulons des sociétés au moyen d'un ordinateur. Ces approches peuvent, à leur tour, être comparées en fonction des objectifs, de la portée et des méthodes de simulation des populations.

En ce qui concerne l'objectif, nous faisons principalement la distinction entre la prédiction et l'explication, qui s'avère être également la distinction entre les objectifs de la microsimulation empirique guidée par les données, d'une part, et la simulation orientée agents, d'autre part. L'approche de prédiction est en outre examinée sous l'angle des projections par opposition aux prévisions.

En ce qui concerne la portée d'une simulation, la comparaison porte sur deux aspects — nous commençons par faire la distinction entre les modèles généraux et les modèles spécialisés, puis entre les modèles de population et les modèles de cohorte.

Enfin, en examinant les méthodes de simulation des populations, nous axons la discussion sur trois dimensions. La première est le genre de population que nous simulons, ce qui nous permet de faire la distinction entre les modèles de population ouverts par opposition à fermés, ainsi qu'entre les populations de départ transversales par opposition à synthétiques. La deuxième est le cadre temporel utilisé, qui peut être discret ou continu. La troisième est l'ordre dans lequel les vies sont simulées, ce qui donne lieu à un modèle axé sur les cas ou un modèle axé sur le temps.

Explication par opposition à prédiction

La modélisation est une abstraction, une réduction de la complexité grâce à l'isolement des forces qui dictent les phénomènes étudiés. La quête d'une formule décrivant le comportement humain, surtout en économie, est si intense que des hypothèses excessivement simplifiées sont souvent le prix accepté pour la beauté ou l'élégance des modèles. La notion selon laquelle la beauté réside dans la simplicité se dégage même de certains modèles orientés agents. Epstein établit une analogie particulièrement intéressante entre la simulation orientée agents et les tableaux des impressionnistes français, l'un de ces tableaux (une scène de rue) figurant sur la couverture de l'ouvrage intitulé « Generative Social Sciences » (Epstein 2006). Les individus dans toute leur diversité ne sont esquissés que par quelques points, mais en regardant le tableau d'une certaine distance, nous pouvons clairement reconnaître la scène.

Les modèles statistiques et comptables peuvent‑ils rivaliser en beauté avec la naissance de phénomènes sociaux à partir d'un ensemble de règles simples? À peine — ils sont complexes et requièrent une multitude de paramètres. Si les statisticiens voient encore de l'élégance dans les fonctions de régression, la beauté est difficile à préserver quand il s'agit de produire des déclarations de revenus ou de demander des prestations de retraite. La plupart d'entre nous trouvent la comptabilité ennuyeuse et les modèles fondés sur une multitude d'équations statistiques et de règles comptables peuvent devenir rapidement difficiles à comprendre. Alors, que peuvent offrir les modèles de simulation pour compenser leur manque de beauté? La réponse est simple : leur utilité. Essentiellement, un modèle de microsimulation est utile s'il possède un pouvoir prédictif ou explicatif.

Dans une simulation orientée agent, expliquer signifie générer les phénomènes sociaux de manière ascendante, la norme de génération de l'explication étant parfaitement illustrée par le slogan : Si vous ne l'avez pas cultivé, vous ne l'avez pas expliqué (qui est considéré comme une condition nécessaire, mais non suffisante pour l'explication). Ce slogan exprime la critique de l'école de modélisation orientée agents à l'égard de l'école économique dominante, qui met l'accent sur les équilibres sans accorder beaucoup d'attention à la façon dont ces équilibres peuvent être atteints ou s'ils peuvent jamais être atteints en réalité. De nouveau, les modèles orientés agents s'appuient sur une approche ascendante pour produire une société virtuelle. Leurs points de départ sont les théories du comportement individuel exprimées dans le code informatique. L'éventail de modélisations du comportement varie donc de l'application de règles simples à une approche fondée sur les concepts de l'intelligence artificielle répartie. Dans ce dernier cas, les acteurs simulés sont des agents « intelligents » qui sont dotés de récepteurs qui leur permettent de recevoir de l'information provenant de l'environnement. Ils possèdent des capacités cognitives, des croyances et des intentions. Ils ont des objectifs, des stratégies de développement et tirent des leçons de leurs propres expériences et de celles d'autres agents. À l'heure actuelle, ce type de simulation est exécuté presque exclusivement à des fins explicatives. Leurs auteurs espèrent que les phénomènes qui se dégagent des actions et des interactions des agents dans la simulation ont leurs pendants dans les sociétés réelles. De cette façon, la simulation appuie l'élaboration de la théorie.

Le contraste de l'explication réside dans la prédiction détaillée, qui représente le principal objectif de la microsimulation guidée par les données. Si la microsimulation est conçue et utilisée de manière opérationnelle pour faire des prévisions et des recommandations stratégiques, les modèles « doivent être ancrés fermement dans une réalité empirique et les relations qu'ils contiennent devraient avoir été estimées au moyen de données réelles et éprouvées minutieusement en utilisant des méthodes statistiques et économétriques bien établies. Dans ce cas, la faisabilité d'une inférence à une population ou un processus économique réel est d'une grande importance » (Klevmarken, 1997).

Afin de prédire l'état futur d'un système, il faut aussi faire la distinction entre les projections et les prévisions. Les projections sont des prédictions de type « et si? ». Elles sont toujours « correctes », en fonction des hypothèses qui sont énoncées (à condition qu'aucune erreur de programmation ne soit commise). Par contre, les prévisions sont des tentatives en vue de prédire l'avenir le plus probable et, puisqu'il ne peut y avoir qu'un seul résultat futur réel, la plupart des prévisions s'avèrent par conséquent fausses. Dans le cas des prévisions, nous n'essayons pas simplement de trouver « ce qui arrive si » (comme dans le cas des projections); nous essayons plutôt de déterminer quelles sont les hypothèses et les scénarios les plus plausibles, donc à obtenir la prévision résultante la plus plausible. (Il convient toutefois de souligner que des hypothèses non plausibles ne sont pas nécessairement sans valeur. Les hypothèses d'état stationnaire sont des exemples d'hypothèses qui sont conceptuellement séduisantes et par conséquent très courantes, mais habituellement non plausibles. Sous ce genre d'hypothèses, les individus sont vieillis dans un monde inchangé en ce qui concerne le contexte socioéconomique, tel que la croissance économique et les politiques, et le comportement individuel est « gelé » en ne permettant pas les effets de cohorte ou de période. Puisqu'une représentation transversale de la population d'aujourd'hui ne résulte pas d'un monde en état stationnaire, le « gel » du comportement individuel et du contexte socioéconomique permet d'isoler et d'étudier de futurs phénomènes et dynamiques résultant des changements antérieurs, tels qu'un mouvement de population.)

À quel point l'explication diffère‑t‑elle de la prédiction? Pourquoi ne pouvons‑nous pas reformuler le slogan mentionné plus haut en : Si vous ne l'avez pas prévu, vous ne l'avez pas expliqué? D'abord, être capable de produire de bonnes prédictions ne signifie pas nécessairement comprendre pleinement les opérations qui sous‑tendent les processus étudiés. Nous n'avons pas besoin d'une compréhension théorique totale pour prédire que le tonnerre suivra l'éclair ou que la fécondité est plus élevée à certaines étapes du cycle de vie qu'à d'autres. Les prédictions peuvent être fondées entièrement sur les régularités et les tendances observées. En fait, la théorie est souvent sacrifiée en faveur d'un modèle très détaillé qui offre un bon ajustement aux données. Mais ce sacrifice n'est évidemment pas sans danger. Si les comportements ne sont pas modélisés explicitement, les hypothèses correspondantes ne le sont pas non plus, ce qui peut rendre les modèles difficiles à comprendre et les transformer en boîte noire. Par ailleurs, s'ils sont capables de « cultiver » certains phénomènes sociaux, les modèles orientés agents le font de manière très stylisée. Jusqu'à présent, ces modèles n'ont pas atteint un pouvoir prédictif suffisant. Parmi les adeptes de la microsimulation guidée par les données, les modèles orientés agents sont donc souvent considérés comme des jouets.

Néanmoins, quelles que soient les raisons de développer un modèle de microsimulation, les modélisateurs tireront généralement un résultat positif de l'exercice : la clarification des concepts. La modélisation du comportement requiert un niveau de précision (éventuellement transféré dans le code informatique) que l'on ne trouve habituellement pas en sciences sociales où abondent les théories purement descriptives. Nous pouvons affirmer sans trop nous avancer que la modélisation proprement dite fournit des éclaircissements sur les processus qui sont modélisés (p. ex.Burch 1999). Si certains de ces avantages se dégagent de toute modélisation statistique, la simulation accroît les possibilités. En exécutant un modèle de simulation, nous obtenons toujours des éclaircissements sur la réalité que nous essayons de simuler ainsi que sur le fonctionnement de nos modèles et les conséquences de nos hypothèses de modélisation. En ce sens, les modèles de microsimulation sont toujours des outils exploratoires, que leur objectif principal soit l'explication ou la prédiction. Autrement dit, les modèles de microsimulation fournissent des plateformes expérimentales aux sociétés au sein desquelles, par nature, la possibilité d'expériences vraiment naturelles est limitée.

Modèles généraux par opposition à spécialisés

Le développement de modèles de microsimulation à grande échelle requiert habituellement un investissement initial considérable, surtout dans le cas de la simulation de politiques. Même si nous ne voulons simuler qu'une politique particulière, nous devons créer une population et modéliser les changements démographiques avant de pouvoir ajouter le comportement économique et les routines comptables nécessaires pour l'étude. Nous pouvons arriver ainsi à une situation où il devient plus logique de concevoir des modèles de microsimulation d'« usage général », et d'attirer ainsi des investisseurs prospectifs provenant de divers domaines. Un modèle capable de produire des projections détaillées des prestations de retraite pourrait facilement être étendu à d'autres domaines d'avantages fiscaux. Un modèle dans lequel sont incluses les structures familiales pourrait être étendu à la simulation de la prestation de soins non officiels. Une lutte pour survivre peut même aboutir à des applications assez exotiques — par exemple, l'un des plus grands modèles, le modèle CORSIM des États‑Unis, a survécu à des difficultés financières grâce à une subvention offerte par une association de dentistes qui s'intéressait à la projection des futures demandes de prothèses dentaires.

Par conséquent, il n'est pas étonnant de constater une tendance générale à planifier et à développer les applications de microsimulation sous forme de modèles polyvalents généraux dès le début. En fait, de grands modèles généraux existent à l'heure actuelle pour de nombreux pays, comme l'illustre le tableau qui suit.

Tableau modèle
Pays Modèle
Australie: APPSIM, DYNAMOD
Canada: DYNACAN, LifePaths
France: DESTINIE
Norvège: MOSART
Suède: SESIM, SVERIGE
Royaume-Uni: SAGEMOD
États-Unis: CORSIM

Durant la création de modèles généraux, le contrôle des ambitions et la modularité de la conception sont deux facteurs essentiels de réussite. Quelques‑uns seulement des grands modèles d'aujourd'hui ont effectivement atteint et retenu leur taille initiale prévue. Les approches excessivement ambitieuses ont dû être corrigées par des simplifications importantes, comme cela a été le cas de DYNAMOD, qui était prévu au départ comme un modèle micro‑macro intégré.

Les modèles de microsimulation spécialisés sont axés sur quelques comportements et (ou) segments de population particuliers. Le modèle de soins de longue durée du NCCSU en est un exemple (Hancock et coll., 2006). Ce modèle simule les revenus et les avoirs de futures cohortes de personnes âgées et leur capacité à participer aux frais de soins à domicile. Par conséquent, il porte sur la simulation de l'examen des ressources pour les politiques relatives aux soins de longue durée, dont les résultats sont entrés dans un macromodèle des demandes et coûts futurs.

Il est également arrivé que des modèles assez spécialisés au départ finissent par devenir plus généraux. Cela s'est produit dans le cas du SESIM et de LifePaths, qui ont tous deux été développés au départ pour l'étude des prêts aux étudiants. LifePaths est un exemple particulièrement intéressant, parce qu'il est non seulement devenu un grand modèle général, mais aussi parce qu'il a servi de fondement, dans une version simplifiée, à la création d'une famille distincte de modèles spécialisés de la santé (modèles Pohem de Statistique Canada).

Modèles de cohorte par opposition aux modèles de population

Comparativement aux modèles généraux de population, les modèles de cohorte sont spécialisés, puisqu'ils ne simulent qu'un seul segment de population, à savoir une cohorte de naissances. Cette simplification est utile si nous désirons étudier une seule cohorte ou comparer deux cohortes.

Les études économiques de cohorte unique portent habituellement sur le revenu et les effets de redistribution du régime d'avantages fiscaux au long de la trajectoire de vie. Les modèles HARDING et LIFEMOD développés en parallèle, le premier pour l'Australie et le second, pour la Grande‑Bretagne (Falkingham et Harding 1996) en sont des exemples. En général, ce genre de modèle repose sur l'hypothèse d'un univers en équilibre; autrement dit, la cohorte HARDING est née en 1960 et vit dans un univers qui ressemble à l'Australie en 1986.

Les modèles de population ont trait à l'ensemble de la population plutôt qu'à des cohortes particulières. Naturellement, la simulation de l'ensemble de la population élimine plusieurs limites des modèles de cohorte, y compris les problèmes d'évolution démographique et de distribution entre les cohortes (tel que l'équité intergénérationnelle).

Modèles de population ouvert par opposition à fermé

À l'échelle planétaire, la population humaine est fermée. Tout individu est né et mourra sur la planète, possède des parents biologiques nés sur la planète et interagit avec d'autres humains avec lesquels il partage ces mêmes traits. Par contre, il n'en est plus ainsi si l'on se concentre sur la population d'une région ou d'un pays particulier. Les gens migrent entre les régions, forment des partenariats avec des personnes provenant d'autres régions, etc. Dans de telles conditions, nous avons affaire à des populations ouvertes. Par conséquent, dans un modèle de simulation dans lequel nous ne sommes presque jamais intéressés par la modélisation de l'ensemble de la population mondiale, comment pouvons‑nous régler ce problème?

La solution requiert habituellement un certain degré de créativité. Ainsi, si nous permettons l'immigration, nous aurons toujours le problème de devoir trouver le moyen de modéliser un pays particulier sans modéliser le reste du monde. En ce qui concerne l'immigration, de nombreuses approches ont été adoptées, allant du clonage de « nouveaux immigrants » existants à l'échantillonnage à partir d'une population hôte, voire même à partir de divers « bassins » de populations hôtes représentant différentes régions

Un exercice conceptuellement plus exigeant est la simulation de l'appariement de partenaires. En microsimulation, les termes population fermée et population ouverte correspondent habituellement au fait que l'appariement des conjoints est limité aux personnes à l'intérieur de la population (fermée) ou que les conjoints sont « créés sur demande » (ouverte). Lorsque nous modélisons une population fermée, le problème est que nous ne simulons habituellement qu'un échantillon d'une population et non la population entière d'un pays. Si notre échantillon est trop petit, il est peu probable que nous trouverons des appariements raisonnables dans l'échantillon simulé. Il en est particulièrement ainsi si la géographie est également un facteur important dans notre modèle. Par exemple, si l'échantillon ne contient pas beaucoup d'individus représentant la population d'une petite ville, très peu d'entre eux trouveront un partenaire vivant à une distance raisonnable.

Les principaux avantages des modèles fermés tiennent au fait qu'ils permettent de suivre les réseaux de parenté et qu'ils donnent lieu à une plus grande cohérence (en supposant que la population est suffisamment grande pour trouver des appariements appropriés). En revanche, les principaux inconvénients des modèles fermés sont les problèmes d'échantillonnage et l'intensité des calculs associés à l'appariement des partenaires. Dans une population de départ tirée d'un échantillon, le modèle n'est pas nécessairement équilibré en ce qui concerne les liens de parenté autres que ceux entre conjoints, puisque les parents et la fratrie d'une personne ne sont pas inclus dans la population de base s'ils ne vivent pas dans le même ménage (Toder et coll. 2000).

La modélisation de populations ouvertes nécessite une certaine abstraction. Ici, les partenaires sont créés sur demande — avec des caractéristiques produites synthétiquement ou échantillonnées à partir d'une population hôte — et sont traités davantage comme des attributs d'un individu « dominant » que comme des individus « à part entière ». Bien que leurs trajectoires de vie (ou certains aspects présentant un intérêt pour la simulation de l'individu dominant) soient simulées, ils ne sont pas personnellement pris en compte comme des individus dans une sortie de données agrégées.

Populations de départ transversales par opposition à populations synthétiques

Chaque modèle de microsimulation doit commencer à un certain point dans le temps, si bien qu'il est nécessaire d'obtenir une population de départ. Dans les modèles de population, nous pouvons distinguer deux types : transversale et synthétique. Dans le premier cas, nous tirons une population de départ d'un ensemble de données transversales, puis nous vieillissons tous les individus à partir de ce moment‑là jusqu'à leur décès (en ajoutant évidemment de nouveaux individus aux événements de naissance). Dans le second cas, nous suivons une approche habituellement adoptée également dans les modèles de cohorte — tous les individus sont modélisés de leur naissance jusqu'à la fin de leur vie.

Si nous ne nous intéressons qu'à l'avenir, pourquoi partirions‑nous d'une population synthétique qui nous obligerait à simuler le passer également? Certes, partir d'un ensemble de données transversales peut être plus simple. Quand nous partons de « données réelles » représentatives, nous ne devons pas produire rétrospectivement une population, ce qui signifie que nous n'avons pas besoin de données historiques pour modéliser le comportement passé. Nous ne devons pas non plus nous préoccuper de problèmes de cohérence, puisque les simulations à partir de populations synthétiques manquent habituellement de cohérence transversale complète.

Malheureusement, de nombreuses applications de microsimulation nécessitent au moins une certaine information biographique qui n'est pas disponible dans les ensembles de données transversaux. Par exemple, les antécédents d'emploi et de cotisations déterminent les futures pensions. Par conséquent, une certaine modélisation rétrospective ou historique sera généralement nécessaire dans la plupart des applications de microsimulation.

Un moyen d'éviter d'utiliser une population de départ synthétique quand une simulation historique est, en fait, nécessaire pourrait consister à partir d'une ancienne enquête. Cette idée a été suivie dans le modèle CORSIM qui a utilisé une population de départ provenant d'une enquête réalisée en 1960 (ce qui fait également de ce modèle un sujet d'étude intéressant en soi). Bien que la possibilité qui s'ensuit de créer des prévisions rétrospectives peut faciliter l'évaluation de la qualité du modèle comparativement à la réalité, ce genre d'approche pose néanmoins des problèmes. CORSIM fait un usage intensif de méthodes d'alignement pour rajuster ses prévisions rétrospectives d'après les données publiées. Même si de nombreux résultats par groupe et de résultats agrégés peuvent être alignés exactement avec les données récentes, il n'existe aucun moyen de s'assurer que les distributions conjointes fondées sur les données de 1960 sont encore exactes après plusieurs décennies.

Dans le cas de la création d'une population de départ synthétique, toutes les données sont imputées. Nous avons donc besoin de modèles de comportement individuels remontant à un siècle complet. Bien que cette approche soit exigeante, elle a des avantages. Premièrement, la taille de la population n'est pas limitée par une enquête; nous pouvons créer des populations plus grandes, donc réduire la variabilité Monte Carlo. Deuxièmement, le fait que la population est synthétique permet d'éviter les conflits relatifs à la confidentialité. (Statistique Canada suit cette approche dans son modèle LifePaths.) Dans l'ensemble, plus la quantité d'information passée qui doit être imputée est grande et plus l'information passée joue un rôle important dans ce que l'application essaye de prédire ou d'expliquer, plus l'approche d'une population de départ synthétique devient attrayante. Par exemple, Wachter (Wachter 1995) a simulé les réseaux de parenté de la population américaine selon une approche fondée sur une population de départ synthétique remontant jusqu'au début du XIXe siècle. Ce genre d'information détaillée sur les liens de parenté ne se trouve dans aucune enquête et ne peut donc être construite qu'au moyen d'une microsimulation.

Temps continu par opposition à discret

La distinction entre les modèles peut se fonder sur le cadre temporel, qui peut être continu ou discret. Un cadre de temps continu est habituellement associé aux modèles statistiques de durée d'un événement, selon une approche fondée sur les risques concurrents. À partir d'un point de départ fixe, un processus aléatoire produit les durées de tous les événements pris en considération, l'événement dont la survenue est la plus rapprochée du point de départ étant celui qui est exécuté, tandis que les autres sont censurés. Ensuite, la procédure complète est répétée en prenant cet événement comme nouveau point de départ et le cycle se poursuit jusqu'à ce qu'ait lieu l'événement de « décès » de l'individu simulé.

La figure 1 illustre l'évolution d'une trajectoire de vie simulée dans un modèle en temps continu. Au départ, il existe trois événements (E1, E2, E3) possédant chacun une durée générée aléatoirement. Dans l'exemple, E1 survient le premier, de sorte qu'il devient l'événement qui est exécuté; après cela, les durées pour les trois événements sont « redéterminées ». Cependant, comme E3 n'est pas défini comme étant conditionnel à la survenue de E1 dans l'exemple, sa durée ne change pas, tandis que de nouvelles durées sont produites pour E1 et E2. E3 finit par avoir la durée la plus courte suivante, de sorte qu'il est le suivant à être exécuté. Ensuite les durées sont de nouveau générées pour les trois éléments et le cycle continue.

Figure 1 : Évolution d'une trajectoire de vie simulée

Figure 1 : Évolution d'une trajectoire de vie simulée

Techniquement, les modèles en temps continu sont très commodes, parce qu'ils permettent d'ajouter de nouveaux processus sans changer les modèles des processus existants à condition que les exigences statistiques pour les modèles à risques concurrents soient satisfaites (voir Galler 1997 pour une description des problèmes connexes).

Néanmoins, la modélisation en temps continu n'implique pas automatiquement qu'il n'existe pas d'événements en temps discret (horloge). Des événements en temps discret peuvent survenir en cas d'introduction de covariables variant en fonction du temps, tels que les indices économiques mis à jour périodiquement (p. ex.chômage) ou les variables de flux (p. ex.revenu personnel). La mise à jour périodique des indices censure alors tous les autres processus à chaque étape temporelle périodique. Si les périodes d'interruption sont si brèves (p. ex.un jour) que le nombre maximal d'autres événements durant une période devient presque égal à un, le modèle a convergé vers un modèle en temps discret.

Les modèles en temps discret déterminent les états et les transitions pour chaque période, sans tenir compte des points temporels exacts dans l'intervalle. L'hypothèse est que les événements ne surviennent qu'une fois durant une période. Comme plusieurs événements peuvent avoir lieu durant une période de temps discret, il faut soit utiliser des périodes courtes pour éviter la survenue de multiples événements ou modéliser toutes les combinaisons possibles d'événements uniques en tant qu'événements proprement dit. Les cadres de temps discret sont utilisés dans la plupart des modèles dynamiques des avantages fiscaux, les plus anciens utilisant habituellement un cadre annuel, principalement à cause de contraintes informatiques. Toutefois, étant donné l'accroissement de la puissance informatique et la réduction de son coût au cours du temps, nous pouvons nous attendre à ce que des étapes de temps plus courtes prédominent dans les futurs modèles. Quand les périodes deviennent si courtes que nous pouvons presque exclure la possibilité d'événements multiples, nous avons atteint une « pseudo‑continuité ». Le cas échéant, nous pouvons même utiliser des modèles de durée statistique. Le modèle australien DYNAMOD est un exemple de combinaison des deux approches.

Modèles orientés cas et modèles orientés temps

La distinction entre les modèles orientés cas et ceux orientés temps tient à l'ordre dans lequel les vies des individus sont simulées. Dans les premiers, un cas est simulé de la naissance au décès avant que la simulation du cas suivant débute. Les cas peuvent être des personnes individuelles ou une personne ainsi que toutes les personnes « non dominantes » qui ont été créées sur demande pour cette personne. Dans les seconds, toutes les vies ayant trait à un cas particulier sont simulées simultanément au cours du temps.

La modélisation orientée cas n'est possible que s'il n'y a pas d'interaction entre les cas. Les interactions sont limitées aux personnes appartenant à un cas, ce qui restreint considérablement ce qui peut être modélisé. L'avantage de ce genre de modèle est de nature technique — puisque chaque cas est simulé indépendamment des autres, il est plus facile de répartir la tâche globale de simulation entre plusieurs ordinateurs. En outre, la mémoire peut être libérée après que chaque cas a été simulé, puisque l'information sous‑jacente ne doit pas être sauvegardée en prévision d'une utilisation future. (Les modèles orientés cas peuvent être utilisés avec des modèles de populations ouvertes, mais non des modèles de populations fermées.)

Dans les modèles orientés temps, tous les individus sont simulés simultanément au cours d'une période prédéfinie. Comme tous les individus vieillissent simultanément (par opposition aux individus d'un cas seulement), la demande de ressources informatiques augmente définitivement. Dans un cadre en temps continu, l'événement suivant qui a lieu est le premier événement planifié au sein de la population entière. Donc, la puissance informatique peut encore être un goulet d'étranglement dans ce genre de simulation — les modèles utilisés à l'heure actuelle ont habituellement des tailles de population inférieures à un million.

Date de modification :

RiskPaths : Les modèles statistiques sous-jacents

Description générale
Événements et estimations des paramètres

Description générale

Le modèle RiskPaths étant conçu pour étudier l'absence d'enfants, le principal événement est la première grossesse (qui est toujours supposé aboutir à une naissance). La grossesse peut survenir n'importe quand après le 15e anniversaire, le risque évoluant en fonction de l'âge ainsi que de la situation d'union. Les modèles statistiques sous-jacents sont des régressions à risque constant par morceaux. En ce qui concerne la fécondité, cela implique l'hypothèse d'un risque de grossesse constant pour un groupe d'âge (p. ex.15 à 17,5 ans) et une situation d'union (p. ex.célibataire sans aucune union antérieure) donnés.

Pour les unions, nous distinguons quatre niveaux d'état possibles :

  • célibataire;
  • les trois premières années d'une première union;
  • les années suivantes d'une première union;
  • toutes les années d'une deuxième union.

(Après la dissolution d'une deuxième union, il est supposé que les femmes restent célibataires.) Par conséquent, nous modélisons cinq événements d'union distincts :

  • formation de la première union;
  • dissolution de la première union;
  • formation de la deuxième union;
  • dissolution de la deuxième union;
  • le changement de phase d'union qui survient après trois ans dans la première union.

Le dernier événement (changement de phase de l'union) est un événement horloge, qui diffère des autres événements en ce sens que le moment où il survient n'est pas stochastique mais prédéfini. (Un autre événement horloge dans le modèle est le changement de l'indice d'âge, tous les 2,5 ans.) Outre les unions et la fécondité, nous modélisons la mortalité - une femme peut mourir à n'importe quel point dans le temps. Nous arrêtons la simulation de la grossesse et des événements d'union quand une femme est décédée ou qu'elle est enceinte (car nous cherchons seulement à étudier l'absence d'enfants) ou à son 40e anniversaire, parce que les premières grossesses après cet âge sont très rares en Russie et en Bulgarie et ne sont donc pas prises en compte dans le présent modèle.

À 15 ans, une femme devient exposée à la fois au risque de grossesse et de formation d'une union. Il s'agit de risques concurrents. Nous tirons des durées aléatoires jusqu'à la première grossesse et jusqu'à la formation de la première union. À ce stade il existe deux autres événements concurrents - la mortalité et le changement de groupe d'âge. (Comme nous supposons que les risques de grossesse et de formation d'une union évoluent avec l'âge, les risques qui sous-tendent les durées aléatoires ne s'appliquent qu'à une période donnée - 2,5 ans dans notre modèle - et doivent être recalculés à chaque point dans le temps.)

Autrement dit, le 15e anniversaire sera suivi par l'un des quatre événements possibles suivants :

  • la femme décède;
  • elle devient enceinte;
  • elle entre dans une union;
  • elle entre dans un nouveau groupe d'âge à 17,5 ans, parce qu'aucun des trois événements qui précèdent n'a eu lieu avant qu'elle n'atteigne 17,5 ans.

Le décès ou la grossesse mettent fin à la simulation. Un indice de changement d'âge requiert que les temps d'attente pour les événements concurrents de formation d'une union et de grossesse soient mis à jour. L'événement de formation d'une union modifie le risque d'une première grossesse (le rendant beaucoup plus élevé) et change l'ensemble de risques concurrents. La femme n'est désormais plus exposée au risque de formation d'une première union, mais devient exposée au risque de dissolution de l'union.

Événements et estimations des paramètres

Première grossesse

Comme nous l'avons décrit plus haut, la première grossesse est modélisée au moyen d'un risque à un âge de référence et des risques relatifs dépendant de la situation d'union et de la durée. Le tableau 1 qui suit donne les estimations des paramètres pour la Bulgarie et la Russie avant et après la transition politique et économique.

Tableau 1
  Bulgarie Russie
15 à 17,5 ans 0.2869 0.2120
17,5 à 20 ans 0.7591 0.7606
20 à 22,5 ans 0.8458 0.8295
22,5 à 25 ans 0.8167 0.6505
25 à 27,5 ans 0.6727 0.5423
27,5 à 30 ans 0.5105 0.5787
30 à 32,5 ans 0.4882 0.4884
32,5 à 35 ans 0.2562 0.3237
35 à 37,5 ans 0.2597 0.3089
37,5 à 40 ans 0.1542 0.0909

 

Tableau 1 Estimations des paramètres pour la Bulgarie et la Russie avant et après la transition politique et économique
  Avant la transition de 1989 Dix ans après la transition : 1999+
Bulgarie Russie Bulgarie Russie
Pas dans une union 0.0648 0.0893 0.0316 0.0664
Trois premières années de la première union 1.0000 1.0000 0.4890 0.5067
Première union après trois ans 0.2523 0.2767 0.2652 0.2746
Deuxième union 0.8048 0.5250 0.2285 0.2698

Les données du tableau 1 sont interprétées de la façon suivante dans le modèle. Aussi longtemps qu'une femme n'a pas formé une union, nous devons multiplier son risque de base variant en fonction de l'âge d'une première grossesse par le risque relatif de  « ne pas être dans une union  ». Par exemple, nous pouvons calculer le risque de grossesse d'une femme célibataire de 20 ans de la cohorte bulgare avant la transition comme étant 0,8458*0,0648 = 0,05481. À ce taux de ?=0,05481 :

  • le temps d'attente moyen prévu de l'événement de grossesse est 1/? = 1/0,05481 = 18,25 ans;
  • la probabilité qu'une femme ne devienne pas enceinte dans les 2,5 ans qui suivent (étant donné qu'elle demeure célibataire) est exp(-?t) = exp(–0,05481*2,5) = 87,2 %.

Donc, à son 20e anniversaire, nous pouvons tirer une durée aléatoire jusqu'à la première grossesse sous forme d'un nombre aléatoire suivant une loi uniforme (un nombre qui peut prendre n'importe quelle valeur entre 0 et 1 avec la même probabilité) en utilisant la formule :

Durée aléatoire = -ln(RandomUniform) / (.

Comme nous l'avons calculé plus haut, dans 87,2 % des cas, aucune conception n'aura lieu au cours des 2,5 années qui suivent. Par conséquent, si nous tirons un nombre aléatoire suivant une loi uniforme plus petit que 0,872, le temps d'attente correspondant sera plus long que 2,5 ans, puisque –ln(RandomUniform) / ( = -ln(0,872)/0,05481 = 2,5 ans. Un tirage aléatoire supérieur à 0,872 résultera en un temps d'attente plus faible que 2,5 ans - dans cette situation, si la femme n'entre pas dans une union avant l'événement de grossesse, la grossesse a lieu dans notre simulation.

Afin de poursuivre cet exemple, supposons que le premier événement qui se produit dans notre simulation est la formation d'une union à l'âge de 20,5 ans. Nous devons maintenant mettre à jour le risque de grossesse. Tandis que le risque de base reste le même pour les deux années qui suivent (c.-à-d. 0,8458), le risque relatif est maintenant égal à 1,0000 (conformément à la catégorie de référence du tableau 1) parce que la femme se trouve dans les trois premières années d'une union. Le nouveau taux de risque de grossesse (applicable aux deux années suivantes, jusqu'à l'âge de 22,5 ans) est maintenant considérablement plus élevé, soit 0,8458*1,0000 = 0,8458. Le temps d'attente moyen à ce taux n'est donc que de 1/0,8458 = 1,18 an et, pour tout nombre aléatoire supérieur à exp(–0,8458*2)=0,1842, le temps d'attente simulé sera inférieur à deux ans. Autrement dit, 81,6 % (1  0,1842) de femmes connaêtront une première grossesse dans les deux premières années d'une première union ou d'un premier partenariat qui a débuté à l'âge de 20,5 ans.

Formation de la première union

Les risques sont donnés sous forme de taux constants par morceaux évoluant avec l'âge. De nouveau, nous modélisons des intervalles d'âge de 2,5 ans. Voici les taux pour les femmes avant toute conception, puisqu'un tel événement mettrait fin à notre simulation.

Tableau 2 Formation de la première union
  Avant la transition de 1989 Dix ans après la transition : 1999+
Bulgarie Russie Bulgarie Russie
15 à 17,5 ans 0.0309 0.0297 0.0173 0.0303
17,5 à 20 ans 0.1341 0.1342 0.0751 0.1369
20 à 22,5 ans 0.1672 0.1889 0.0936 0.1926
22,5 à 25 ans 0.1656 0.1724 0.0927 0.1758
25 à 27,5 ans 0.1474 0.1208 0.0825 0.1232
27,5 à 30 ans 0.1085 0.1086 0.0607 0.1108
30 à 32,5 ans 0.0804 0.0838 0.0450 0.0855
32,5 à 35 ans 0.0339 0.0862 0.0190 0.0879
35 à 37,5 ans 0.0455 0.0388 0.0255 0.0396
37,5 à 40 ans 0.0400 0.0324 0.0224 0.0330

L'exemple de paramétrisation donné au tableau 2 s'interprète de la façon suivante : le risque de formation d'une première union des femmes bulgares de la première cohorte est nul jusqu'au 15e anniversaire; après cela, il évolue par intervalle de 2,5 ans de 0,0309 à 0,1341, puis de 0,1341 à 0,1672, et ainsi de suite. Le risque le plus élevé s'observe pour le groupe des 20 à 22,5 ans - au taux de 0,1672, la durée prévue jusqu'à la formation d'une union est de 1/0,1672=6 ans. Une femme qui est célibataire à son 20e anniversaire a une probabilité de 34 % de former une première union au cours des 2,5 années suivantes (p=1–exp(–0,1672*2,5)).

Formation de la deuxième union

Une femme devient exposée au risque de formation d'une deuxième union si et quand sa première réunion est dissoute. Contrairement à la formation de la première union qui est fondée sur l'âge, ce processus ne démarque pas à un point fixe dans le temps, mais est déclenché par un autre événement (dissolution de la première union). Par conséquent, les intervalles de temps des taux de risque constants par morceaux estimés ont trait au temps écoulé depuis la dissolution de la première union.

Tableau Formation de la deuxième union
  Avant la transition de 1989 Dix ans après la transition : 1999+
Bulgarie Russie Bulgarie Russie
<2 ans après la dissolution 0.1996 0.2554 0.1457 0.2247
2 à 6 ans après la dissolution 0.1353 0.1695 0.0988 0.1492
6 à 10 ans après la dissolution 0.1099 0.1354 0.0802 0.1191
10 à 15 ans après la dissolution 0.0261 0.1126 0.0191 0.0991
>15 ans après la dissolution 0.0457 0.0217 0.0334 0.0191

Dissolution d'une union

La première ainsi que la deuxième union peut être dissoute, le processus débutant au moment de la formation de la première et de la deuxième union, respectivement. Comme la taille de l'échantillon est très faible pour la modélisation de l'événement de dissolution de la deuxième union, nous ne faisons pas la distinction entre les cohortes avant et après la transition pour cet événement.

Tableau Dissolution d'une union
  Avant la transition de 1989 Dix ans après la transition : 1999+
Bulgarie Russie Bulgarie Russie
Première année de l'union 0.0096 0.0380 0.0121 0.0601
Durée de l'union de 1 à 5 ans 0.0200 0.0601 0.0252 0.0949
Durée de l'union de 5 à 9 ans 0.0213 0.0476 0.0269 0.0752
Durée de l'union de 9 à 13 ans 0.0151 0.0408 0.0190 0.0645
Durée de l'union >13 ans 0.0111 0.0282 0.0140 0.0445
Table
  Bulgarie Russie
Trois premières années de l'union 0.0371 0.0810
Durée de l'union de 3 à 9 ans 0.0128 0.0744
Durée de l'union de 9 ans et plus 0.0661 0.0632

Mortalité

Dans ce modèle échantillon, nous laissons à l'utilisateur le soin de préciser les probabilités de décès selon l'âge ou de  « désactiver  » la mortalité, ce qui permet d'étudier la fécondité sans l'interférence de la mortalité. Dans ce deuxième cas, toutes les femmes atteignent l'âge maximal de 100 ans. Si l'utilisateur choisit de simuler la mortalité, les probabilités spécifiées sont converties par le modèle en taux de risque constants par morceaux (en se basant sur la formule –ln(1-p) pour p<1) de sorte que le décès peut survenir à n'importe quel moment durant une année. Si la probabilité est fixée à 1 (comme cela est le cas quand âge = 100), il est supposé que le décès survient immédiatement.

Date de modification :

L'environnement de programmation Modgen

Lorsqu'il est installé sur un ordinateur, Modgen s'intègre dans l'environnement Microsoft Visual Studio C++ (requis). Les composantes visuelles de Modgen sont des barres d'outils distinctes, ainsi que des éléments supplémentaires sous les menus  « Tools » et  « Help » de Visual Studio. Modgen figure aussi comme une option dans la boête de dialogue des fichiers pour créer un nouveau projet, ainsi que dans celle pour ajouter un fichier à un projet existant.

La Figure 1 représente une vue d'écran de l'interface de programmation telle qu'elle apparaêt après l'ouverture de l'application  « RiskPaths.sln » de Modgen. La barre d'outils Modgen comprend des icônes pour l'exécution de Modgen, l'accès aux fichiers d'aide, l'ouverture de l'outil BioBrowser et le changement de la langue (de l'anglais au français et inversement).

Figure 1 : Interface de programmation

Figure 1 : Interface de programmation

Le code de Modgen est réparti dans plusieurs fichiers, portant chacun l'extension .mpp. Comme le montre la fenêtre Solution Explorer (Figure 1), RiskPaths comprend huit fichiers .mpp groupés dans le répertoire  « Models (mpp) ». Ces fichiers sont ceux qui sont essentiels à l'exécution de RiskPaths, c'estàdire les fichiers contenant tout le code Modgen écrit par le développeur du modèle.

Lorsque l'outil Modgen (auquel on peut avoir accès à partir de la barre d'outils ou à partir du premier élément du menu  « Tools ») est appelé, ces fichiers .mpp sont traduits en code C++. Donc, Modgen agit comme un précompilateur qui crée un fichier de code source .cpp pour chaque fichier .mpp et plaçe les fichiers .cpp résultant dans le répertoire  « C++ Files ». L'outil Modgen ajoute aussi des composantes de code C++ indépendantes du modèle au répertoire  « C++ Files »; ces fichiers supplémentairesFootnote 1 ne doivent pas être modifiés par le développeur du modèle et sont essentiels à l'utilisation du compilateur C++ pour construire l'application Modgen.

Les paramètres du modèle sont contenus dans un ou plusieurs fichiers .dat classés dans un répertoire étiqueté  « Scenarios ». Ces fichiers sont chargés au moment de l'exécution et contiennent les valeurs réelles attribuées aux paramètres.

Durant l'exécution de l'outil Modgen, celui-ci, comme le compilateur C++, produit un journal qui est affiché dans la fenêtre Output. Tout message d'erreur est également affiché dans cette fenêtre et en cliquant sur un message d'erreur particulier, vous arrivez directement au code Modgen correspondant qui a produit l'erreur.

Deux étapes sont nécessaires pour créer une application Modgen dans l'environnement Visual Studio. Premièrement, Modgen doit traduire le code Modgen qui figure dans les fichiers .mpp; il faut pour cela appeler l'outil Modgen. Deuxièmement, l'application C++ résultante doit être construite et démarrée. Cela peut se faire en une étape en sélectionnant  « Start Debugging » dans le menu  « Debug » ou en cliquant sur l'icône correspondant de la barre d'outils.

Notes

Footnotes

Footnote 1

ACTORS.CPP, ACTORS.H, app.ico, model.h, model.RC, PARSE.INF, TABINIT.CPP, TABINT.H.

Return to footnote 1 referrer

Date de modification :

Pour bien démarrer

Introduction

BioBrowser, le navigateur de biographie Modgen, est un logiciel autonome qui augmente le langage de modélisation longitudinal dynamique Modgen.  BioBrowser permet à l’analyste de mettre en graphique les microdonnées provenant du modèle.  Son but est d’aider à découvrir les erreurs possibles des algorithmes du modèle, ou encore d’étudier des cas particulièrement intéressants du modèle précisé.

Les modèles de microsimulation conçus en langage Modgen génèrent des durées de vie synthétiques de différents acteurs.  Chaque acteur est défini par un ensemble d’états qui décrivent ses caractéristiques.  Par exemple, un acteur peut être un homme dont les attributs sont décrits à l’aide des états suivantes : âge, sexe, état civil et état de santé.  Les valeurs de ces états changent  au cours de la vie de l’acteur.  Dans notre exemple, l’âge de la personne change à la date de son anniversaire de naissance, et son état matrimonial est modifié lorsque la personne se marie, divorce, etc.

BioBrowser est un outil à l’aide duquel l’analyste peut examiner graphiquement les caractéristiques et les attributs d’un acteur sur toute la durée de sa vie. BioBrowser peut présenter graphiquement une ou plusieurs états pour une ou plusieurs durées de vie simulées.   Ainsi, le navigateur vient s’ajouter aux autres fonctions de rapport de Modgen qui visent à offrir des renseignements transversaux détaillés sur un ensemble d’acteurs à un moment précis ou pour un état donné.

Le navigateur produit les représentations graphiques à partir d’un fichier spécial de données qui est généré par une simulation de modèle Modgen.  Une fois que ce fichier a été créé, l’analyste peut produire toute une gamme de graphiques à l’aide du navigateur.  Les utilisateurs peuvent définir les caractéristiques de ces graphiques par l’entremise de menus déroulants et d’options.  Ainsi, un analyste qui est un novice de l’environnement de modélisation Modgen est en mesure de créer un remarquable ensemble de graphiques longitudinaux qui présentent les caractéristiques des acteurs à différents moments de leur vie. Il est possible d’enregistrer toutes ces représentations graphiques afin de les modifier à un autre moment ou encore pour lancer leur impression ou les ranger dans le presse-papiers.

Pour préciser le contenu du fichier de base de données, l’analyste doit connaître les rouages de l‘environnement de simulation Modgen.  Plus loin, une section décrit les composantes du système Modgen qu’on doit connaître pour pouvoir créer une base de données.  Pour plus de détails, reportez-vous au Guide du concepteur Modgen.

Les éléments du navigateur de biographie

L’installation de BioBrowser comprend un exemple de base de données demo(trk).mdb ainsi qu’un exemple de fichier de biographie demo.bbr.  On fait constamment référence à ces fichiers afin d’utiliser les exemples détaillés qu’ils contiennent.  Ces fichiers sont décrits dans la section « Comment utiliser BioBrowser : les notions de base » 

Configuration exigée et soutien à l’utilisateur

BioBrowser a été testé avec le système d’exploitation Windows XP et n’a aucun besoin particulier en UCT, espace disque ou mémoire.

Si vous avez des questions ou si vous faites face à des problèmes concernant un des aspects du logiciel, n’hésitez pas à communiquer avec l’équipe de développement, à microsimulation@statcan.gc.ca

Date de modification :