Causal Inference with a view towards Longitudinal Data Analysis
Authors
Nissen, Jacob ; Olsen, Tóra Oluffa Stenberg
Term
4. term
Education
Publication year
2022
Submitted on
2022-06-02
Pages
66
Abstract
Dette kandidatspeciale undersøger, hvordan man kan drage kausale konklusioner ud fra observationsdata, især longitudinale data. Vi gennemgår teorien for kausal inferens og praktiske metoder til at estimere kausale effekter. Først definerer vi den (gennemsnitlige) kausale effekt og diskuterer de antagelser, der kræves for at identificere den i observationsstudier. Vi introducerer to grundlæggende tilgange—inverse sandsynlighedsvægtning og standardisering—og viser, hvordan kausale rettede acykliske grafer kan tydeliggøre relationer mellem kovariater, behandling (eksponering) og udfald. Med strukturelle kausale modeller specificerer vi målparameteren præcist. Derpå præsenterer vi målrettet maksimum-likelihood-estimering (TMLE) og den krydsvaliderede variant (CV-TMLE), og vi viser, at CV-TMLE-estimatoren har asymptotisk linearitet. Endelig udvider vi rammeværket til longitudinale sammenhænge, beskriver de tilsvarende identifikationsbetingelser og introducerer den longitudinale TMLE (L-TMLE). For at illustrere metoderne analyserer vi et udsnit af Framingham Heart Study for at undersøge, om rygning har en kausal effekt på slagtilfælde inden for 24 år, ved hjælp af både en ikke-longitudinel (én-tidspunkt) analyse og en longitudinel analyse samt anvendelse af TMLE, CV-TMLE og L-TMLE.
This master’s thesis examines how to draw causal conclusions from observational, especially longitudinal, data. We review the theory of causal inference and practical methods for estimating causal effects. We first define the (average) causal effect and discuss the assumptions required to identify it in observational studies. We introduce two foundational approaches—inverse probability weighting and standardization—and show how causal directed acyclic graphs can clarify relationships among covariates, treatment (exposure), and outcome. Using structural causal models, we specify the target parameter precisely. We then present targeted maximum likelihood estimation (TMLE) and its cross-validated variant (CV-TMLE), and we show that the CV-TMLE estimator has asymptotic linearity. Finally, we extend the framework to longitudinal settings, describe the corresponding identifiability conditions, and introduce longitudinal TMLE (L-TMLE). To illustrate the methods, we analyze a subset of the Framingham Heart Study to examine whether smoking has a causal effect on stroke within 24 years, using both a non-longitudinal (single-time-point) analysis and a longitudinal analysis, and applying TMLE, CV-TMLE, and L-TMLE.
[This summary has been rewritten with the help of AI based on the project's original abstract]
Documents
