Increasing the power in randomised clinical trials using digital twins
Authors
Jensen, Rasmus Kuhr ; Højbjerre-Frandsen, Emilie ; Jeppesen, Mathias Lerbech
Term
4. term
Education
Publication year
2022
Submitted on
2022-06-02
Pages
151
Abstract
This thesis examines how historical data can be used to increase statistical power in randomized clinical trials (RCTs) with a continuously measured efficacy outcome. Existing methods that populate the control arm with a synthetic control arm (SCA) do not strictly control the type I error rate (false positive rate). We therefore focus on a novel approach that uses digital twins—artificially generated patients on control treatment—incorporated into an ANCOVA model as a predicted control outcome. We show analytically that, under certain assumptions, adjusting for the digital twin’s predicted outcome in ANCOVA yields an average treatment effect estimator that achieves asymptotic efficiency within a broad class of estimators. This efficiency gain can be used to reduce the sample size of a trial while maintaining the same power and strictly controlling the type I error rate. In a simulation study, we compare an SCA approach with the digital twins approach in terms of power and type I error control. Across several scenarios, the SCA approach offers at best modest power gains and is unreliable for controlling type I error. In contrast, the digital twins approach provides strict type I error control and a substantial increase in power, even when assumptions underlying the analytical results are violated. Finally, we evaluate digital twins on real-world data from previously conducted RCTs at Novo Nordisk A/S and find that the required sample size can be reduced from 83 to 72, with potential for further improvement through fine-tuning.
Dette speciale undersøger, hvordan historiske data kan udnyttes til at øge den statistiske styrke (power) i randomiserede kliniske forsøg med et kontinuerligt effektmål. Eksisterende metoder, der udfylder kontrolarmen med en syntetisk kontrolarm (SCA), formår ikke at kontrollere type I-fejl (falsk positiv-rate) strengt. Derfor fokuserer vi på en ny tilgang, hvor digitale tvillinger—kunstigt genererede patienter på kontrolbehandling—anvendes i en ANCOVA-model som en forudsagt kontrol-udkomst. Vi viser analytisk, at under visse antagelser giver justering for den digitale tvillings forudsagte udfald i ANCOVA en estimator for den gennemsnitlige behandlingseffekt, der opnår asymptotisk effektivitet i en bred klasse af estimatore. Denne effektivitetsgevinst kan omsættes til færre deltagere i et forsøg, samtidig med at man bevarer samme power og stramt kontrollerer type I-fejl. I en simuleringsundersøgelse sammenligner vi en SCA-tilgang med digitale tvillinger med hensyn til power og kontrol af type I-fejl. På tværs af flere scenarier giver SCA højst beskedne powergevinster og er upålidelig i forhold til at kontrollere type I-fejl. Omvendt giver digitale tvillinger streng type I-fejlkontrol og en markant stigning i power, selv når antagelserne bag de analytiske resultater ikke er helt opfyldt. Til sidst evaluerer vi digitale tvillinger på virkelige data fra tidligere randomiserede forsøg hos Novo Nordisk A/S og finder, at det krævede deltagerantal kan reduceres fra 83 til 72, med mulighed for yderligere forbedringer ved finjustering af metoden.
[This apstract has been rewritten with the help of AI based on the project's original abstract]
Keywords
digital twins ; machine learning ; rct ; psm ; historical data ; synthetic data ; sample size ; power
