AAU Student Projects - visit Aalborg University's student projects portal
A master's thesis from Aalborg University
Book cover


Prediction of Adherence to Basal Insulin in People with Type 2 Diabetes Initiating Telemonitoring Development of a Multivariable Machine Learning Prediction Model

Authors

; ;

Term

4. term

Publication year

2024

Submitted on

Pages

45

Abstract

Type 2 diabetes is a major global health challenge with rising costs. When people do not take insulin as prescribed, outcomes worsen and hospital use increases. Our aim was to build a machine-learning model that can predict early on whether a patient will adhere to basal insulin and to highlight the most informative features, so health professionals can identify those who may need extra support. We used data from the DiaMonT trial, where insulin doses were automatically captured with a connected smart insulin pen. Baseline information, questionnaire responses, and blood samples from 149 Danish patients with type 2 diabetes were considered as candidate features. To capture early adherence, we analyzed days 1–21. We applied logistic regression with stepwise feature selection. Model performance was estimated with four-fold cross-validation and reported using the area under the ROC curve (AUC) and accuracy at different sensitivity settings. The model predicted adherence using nine selected features and achieved a mean AUC of 0.69 ± 0.003, indicating moderate discrimination. The highest accuracy was 63.10% at a decision threshold of 52.10%, with a positive predictive value of 62.78%. This shows it is feasible to build an early adherence prediction model and identify contributing features. The decision threshold for clinical use should reflect the desired balance between sensitivity (finding as many cases as possible) and specificity (avoiding false alarms) for the specific setting.

Type 2-diabetes er en stor global sundhedsudfordring med stigende omkostninger. Når patienter ikke tager insulin som ordineret, forværres sygdomsforløbet, og hospitalsforbruget stiger. Vores mål var at udvikle en maskinlæringsmodel, der tidligt kan forudsige, om en patient vil følge behandling med basalinsulin, og at pege på de vigtigste oplysninger, så sundhedsprofessionelle lettere kan identificere patienter, der har brug for ekstra støtte. Vi brugte data fra DiaMonT-studiet, hvor insulindoser blev registreret automatisk med en forbundet smart insulinpen. Baselineoplysninger, spørgeskemaer og blodprøver fra 149 danske patienter med type 2-diabetes indgik som mulige variabler. For at beskrive tidlig efterlevelse analyserede vi dage 1–21. Vi anvendte logistisk regression med trinvis udvælgelse af de mest informative variabler (feature selection). Modellens ydeevne blev estimeret med fire-delt krydsvalidering og rapporteret som areal under ROC-kurven (AUC) samt nøjagtighed ved forskellige niveauer af sensitivitet. Modellen forudsagde efterlevelse ud fra ni udvalgte variabler og opnåede en gennemsnitlig AUC på 0,69 ± 0,003, hvilket svarer til moderat skelneevne. Den højeste nøjagtighed var 63,10% ved en beslutningstærskel på 52,10%, med en positiv prædiktiv værdi på 62,78%. Det er dermed muligt at udvikle en model, der tidligt forudsiger efterlevelse af basalinsulin og viser, hvilke variabler der bidrager mest. Hvilken tærskel der bør bruges i klinisk praksis, afhænger af, om man vægter høj sensitivitet (at fange så mange som muligt) eller høj specificitet (at undgå falske alarmer) i den konkrete anvendelse.

[This apstract has been rewritten with the help of AI based on the project's original abstract]