AAU Student Projects - visit Aalborg University's student projects portal
A master's thesis from Aalborg University
Book cover


Classification of Information Types in Decision Analysis

Translated title

Klassifikation af Informationstyper i Beslutningsanalyse

Author

Term

4. term

Publication year

2023

Submitted on

Pages

65

Abstract

This thesis explores how a supervised classification method, that is, an algorithm trained on labeled examples, can be embedded in a decision-making framework and how to quantify its expected utility, including the consequences of Type I (false positive) and Type II (false negative) errors. As a testbed, we use a simple physical pendulum whose time-varying behavior depends on system parameters. Although basic, a pendulum can be tuned to emulate patterns seen in socio-ecological phenomena such as climate variability, traffic fluctuations, and structural or mechanical responses. We build a probabilistic model to represent different information states, meaning distinct conditions that summarize the system’s behavior. An existing database of parameter realizations and observed behaviors is expanded with observations consistent with this model and labeled by their information state. These data support a machine-learning classifier that assigns new observations to states. The classifier is calibrated so that its trade-off between false positives and false negatives reflects the decision maker’s preferences. Using the Value of Information concept, we make the choices in this process explicit and compute a Value of Classification: the expected gain from using the classifier within the decision framework.

Dette projekt undersøger, hvordan en overvåget klassifikationsmetode, dvs. en algoritme trænet på mærkede eksempler, kan indlejres i en beslutningsramme, og hvordan dens forventede nytte kan kvantificeres, herunder konsekvenserne af Type I-fejl (falske positive) og Type II-fejl (falske negative). Som forsøgsplatform anvendes et simpelt fysisk pendul, hvis tidslige adfærd afhænger af systemparametre. Selvom det er enkelt, kan et pendul indstilles til at efterligne mønstre i socioøkologiske fænomener som klimavariationer, trafikudsving samt strukturelle og mekaniske responser. Vi opstiller en sandsynlighedsmodel til at repræsentere forskellige informationstilstande, dvs. særskilte tilstande, der sammenfatter systemets adfærd. En eksisterende database med realiseringer af systemparametre og observerede adfærdsmønstre udvides med observationer i overensstemmelse med modellen og mærkes med deres informationstilstand. Disse data bruges til en maskinlæringsbaseret klassifikation, der tildeler nye observationer til tilstande. Klassifikatoren kalibreres, så afvejningen mellem falske positive og falske negative afspejler beslutningstagerens præferencer. Med begrebet Værdien af information tydeliggør vi valgene i processen og beregner Værdien af klassifikation, som er den forventede gevinst ved at anvende klassifikationen i beslutningsrammen.

[This apstract has been rewritten with the help of AI based on the project's original abstract]