Données de panel d'enquête dans le contexte d'un processus de renouvellement alterné tronqué et censuré par intervalle

Tian, Patrick-Hervé (2023). « Données de panel d'enquête dans le contexte d'un processus de renouvellement alterné tronqué et censuré par intervalle » Mémoire. Montréal (Québec), Université du Québec à Montréal, Maîtrise en mathématiques.

Fichier(s) associé(s) à ce document :
[img]
Prévisualisation
PDF
Télécharger (1MB)

Résumé

Modèles statistiques décrivant différents états d’un processus ainsi que les différentes transitions possibles entre ces états, les modèles multi-états sont utiles, par exemple, pour les mesures répétées dans le temps et les données longitudinales. Un cas particulier est le processus de renouvellement alterné dans lequel l’individu pivote entre deux états (0 et 1, Sain et Malade, ou Chômage et Emploi comme dans notre cas de figure). Le sujet de la présente recherche est motivée par des données d’enquête par panel telles que l’Enquête sur la dynamique du travail et du revenu (EDTR), une enquête de Statistique Canada, qui suit les individus du début du panel à la fin de celui-ci. Enquête longitudinale à participation volontaire, l’EDTR est composée de deux panels dont les individus transitent entre chômage et emploi et sont suivis sur une durée de six ans consécutifs avec pour objectif de comprendre le bien-être économique des Canadiens et les changements ayant des incidences dans le temps sur leurs conditions de vie. Les données, parfois collectées rétroactivement avant le début du panel, emmènent des défis quant aux dates de début et de fin des périodes de temps. Dans un processus de renouvellement alterné censuré par intervalle PRACI (window censored alternating renewal process WCARP), les bornes supérieure et inférieure interceptent la première durée de séjour observée ainsi que la dernière durée de séjour observée respectivement. Motivé par différentes approches vues dans la littérature, dans ce mémoire nous développons trois fonctions de vraisemblance dans les situations suivantes : 1. lorsqu’aucune donnée de temps de début de la période n’est collectée avant l’entrée dans le panel : la première durée de séjour est incomplète. Dans cette approche, elle est supprimée. La dernière durée de séjour observée est traitée en utilisant la censure à droite ; 2. lorsque les dates de début des périodes de temps sont collectées avant introduction dans le panel : de ce fait, nous connaissons la valeur complète de la première durée de séjour observée dans le panel. Une approche conditionnelle est utilisée pour ces premiers temps de séjour ; et à nouveau une censure à droite est utilisée pour les dernières périodes incomplètes de l’intervalle ; 3. lorsqu’aucune donnée n’est collectée avant le début du panel, au lieu de « jeter » les premières périodes (comme dans la première approche), en supposant la stationnarité, nous incluons ces périodes incomplètes dans notre approche ; puis traitons à nouveau la dernière période incomplète en utilisant encore une censure à droite. L’EDTR produit un ensemble de données très complexe qui comprend une pondération pour différents échantillons. Une description en détail et une présentation de quelques données tabulaires non pondérées de l’EDTR (tout en mettant l’accent sur les temps de transition manquants) ainsi que la description de bon nombre de difficultés provenant de l’ensemble de données lors de l’analyse des périodes de chômage et d’emploi est faite. Dans une étude de simulation, nous générons un jeu de données semblables à celles de l’EDTR puis nous estimons, dans chacune des trois méthodes décrites plus haut, les paramètres des lois ayant permis de générer cet échantillon. Dans cette étude, nous faisons varier différents paramètres tels que la largeur de la fenêtre d’observation et la taille de l’échantillon. D’autres paramètres comme le taux de chômage et les paramètres des fonctions permettant la génération des durées ont été fixés. Une réplication de 100 fois chaque situation a permis d’obtenir les résultats qui sont présentés dans le Chapitre 4. Dans ce mémoire est apporté un traitement à l’une parmi les nombreuses complexités présentées par les données de panel d’enquête en général et par l’EDTR en particulier qui a motivé ce travail. _____________________________________________________________________________ MOTS-CLÉS DE L’AUTEUR : modèles multi-états, processus de renouvellement alterné, enquêtes longitudinales, panel, EDTR, vraisemblances, EMV, chaîne continue de Markov homogène, stationnarité, optimisation, simulation Monte Carlo

Type: Mémoire accepté
Informations complémentaires: Fichier numérique reçu et enrichi en format PDF/A.
Directeur de thèse: Atherton, Juli
Mots-clés ou Sujets: Modèles multi-états (Statistique) / Fonctions de vraisemblance / Emploi / Chômage / Études longitudinales / Enquête sur la dynamique du travail et du revenu (Canada)
Unité d'appartenance: Faculté des sciences > Département de mathématiques
Déposé par: Service des bibliothèques
Date de dépôt: 31 août 2023 08:37
Dernière modification: 31 août 2023 08:37
Adresse URL : http://archipel.uqam.ca/id/eprint/16855

Statistiques

Voir les statistiques sur cinq ans...