Prædiktionsalgoritme til borgere med KOL
Oversat titel
Predictive algorithm for citizens with COPD
Forfattere
Derby, Hannah Møldrup ; Andersen, Mille ; Holm, Rasmus Steengaard
Semester
4. semester
Udgivelsesår
2021
Afleveret
2021-05-31
Antal sider
42
Resumé
Baggrund: KOL medfører store sundhedsudgifter, især fra hospitalsindlæggelser. Derfor tilbydes telemedicin til alle med KOL for at forebygge indlæggelser. Tidligere studier tyder dog på, at det ikke sparer penge på samfundsniveau. En foreslået løsning er at bruge prædiktionsalgoritmer til at udpege de borgere, der kan have størst effekt af telemedicin. Metode: Vi udviklede forudsigelsesmodeller i én samlet gruppe og i syv undergrupper ved hjælp af to metoder: Multipel Lineær Regression (MLR) og Random Forest Regression (RFR). Målet var at forudsige, hvilke borgere der risikerer flest indlæggelsesdage, fordi omkostningerne stiger med indlæggelsestiden. Data blev forbehandlet og delt i trænings- og testsæt. Modellerne blev vurderet med determinationskoefficienten (R^2) og visualiseret i scatterplots. Resultater: Ingen af modellerne præsterede tilfredsstillende. Den højeste R^2 var 0,228 for MLR og 0,288 for RFR. Konklusion: Med de tilgængelige data kan de udviklede modeller ikke bruges til at forudsige, hvilke borgere med KOL der får flest indlæggelsesdage, hverken i den samlede gruppe eller i de stratificerede grupper.
Background: COPD leads to high healthcare costs, with hospitalizations being the largest driver. Telemedicine is therefore offered to all people with COPD to prevent admissions. However, previous studies indicate this does not save money at the societal level. One proposed approach is to use prediction algorithms to identify who might benefit most. Methods: We built prediction models in one overall cohort and seven stratified subgroups using two techniques: Multiple Linear Regression (MLR) and Random Forest Regression (RFR). The goal was to predict who is at greatest risk of accumulating many hospital days, since costs rise with length of stay. Data were preprocessed and split into training and test sets. Performance was assessed with the coefficient of determination (R^2) and illustrated with scatter plots. Results: Model performance was inadequate. The highest R^2 was 0.228 for MLR and 0.288 for RFR. Conclusion: With the available data, these models cannot be used to predict which people with COPD will have the most hospital days, in either the overall group or the stratified groups.
[Dette resumé er omskrevet med hjælp fra AI baseret på projektets originale resumé]
Emneord
