AAU Studenterprojekter - besøg Aalborg Universitets studenterprojektportal
Et kandidatspeciale fra Aalborg Universitet
Book cover


Machine Learning til brug i policyevaluering

Oversat titel

Machine Learning for use in policy evaluation

Forfatter

Semester

4. semester

Udgivelsesår

2025

Afleveret

Antal sider

30

Abstract

Specialet undersøger, hvordan avancerede maskinlæringsmetoder kan bruges i statskundskab og i offentlige organisationer til at styrke policyevaluering og nye former for governance. Med afsæt i den danske AI-strategi og kommunale signaturprojekter (140+ AI-projekter siden 2020, hvoraf omtrent halvdelen ophørte efter forsøgsperioder) placerer studiet sig i debatten om værdi, forudsætninger og anvendelighed. Empirisk anvendes tweets med hashtagget #dkpol fra 2019–2021 som et udsnit af den digitale offentlige debat i en periode præget af folketingsvalg og COVID-19. Data embeddes og klassificeres i sentiment med en dansk BERT-model, hvorefter emner identificeres med BERTopic baseret på en fintunet dansk BERT. Dernæst afprøves tre modeller til prædiktiv klassificering (LSTM, XGBoost og TextCNN), og deres performance vurderes. Endelig kobles analysegrebene til Wayne Parsons’ seks trin i policycyklussen for at vurdere, hvor i processen metoderne er anvendelige. Resultaterne peger på generelt høj præcision i klassifikationerne, med LSTM som den bedst præsterende model, og at de anvendte metoder kan bringes i spil på tværs af policycyklussens trin. Specialet diskuterer også etiske, datamæssige og juridiske rammer samt tekniske begrænsninger.

This thesis examines how advanced machine learning methods can be used in political science and in public organizations to strengthen policy evaluation and emerging governance models. Anchored in Denmark’s national AI strategy and municipal signature projects (140+ AI projects since 2020, about half discontinued after trial periods), the study situates itself in the debate on value, prerequisites, and practicality. Empirically, it uses tweets tagged #dkpol from 2019–2021 as a window into digital public debate during a period marked by a general election and COVID-19. The data are embedded and sentiment-classified with a Danish BERT model, and topics are then identified using BERTopic built on a fine-tuned Danish BERT. Next, three models for predictive classification (LSTM, XGBoost, and TextCNN) are tested and their performance assessed. Finally, the analytical steps are mapped to Wayne Parsons’ six-stage policy cycle to evaluate where the methods add value. The results indicate generally high precision in classifications, with LSTM performing best, and that the methods can be applied across the stages of the policy cycle. The thesis also discusses ethical, data, and legal considerations as well as technical limitations.

[Dette resumé er genereret ved hjælp af AI]