Forfatter(e)
Semester
4. semester
Uddannelse
Udgivelsesår
2008
Afleveret
2008-06-02
Antal sider
119 pages
Abstract
I 2007 blev der i Danmark indrapporteret 23.521 utilsigtede hændelser. Formålet med rapportering af utilsigtede hændelser er, at få udarbejdet retningslinier for hvorledes disse forebygges, hvorved der er potentiale for at redde menneskeliv. Rapporterne indrapporteres i fritekst, hvilket på nuværende tidspunkt kræver gennemlæsning af en risikomanager for, at kortlægge hvad der er årsag til den utilsigtede hændelse. I dette projekt er det undersøgt, om de utilsigtede hændelser automatisk kan årsagsklassificeres ved brug af statistisk natural language processing. Dette er gjort ved at udvikle et system som 'proof-of-concept'. Systemet består af en brugergrænseflade og en klassifikationsmodel. Klassifikationsmodellen er trænet og testet på i alt 132 utilsigtede hændelsesrapporter, der alle indeholder søgeordet 'EPM', og har til formål at klassificere om EPM er årsag til den utilsigtede hændelse eller ej. Dette er gjort ved konstruktion af en model baseret på en kombination af a priori viden fra eksperter og statistisk viden.\\ Resultat af klassifikationen viser et F-mål på 0,946 for de rapporter, der klassificeres som ikke årsag og et F-mål på 0,667 for de rapporter, der klassificeres som årsag. Disse resultater kan forbedres ved træning af modellen på flere utilsigtet hændelses rapporter. Det konkluderes, at statistisk natural language processing kan anvendes til klassifikation af utilsigtede hændelser, hvis der er integreret a priori viden i forhold til det konkrete søgeord.
In year 2007, 23.521 adverse events were reported in Denmark. The purpose of reporting adverse events is to create guidelines for how to prevent future events, and hence save lives. The reports are written in natural language. It is time consuming for the risk manager to read through all of the reports carefully, to locate the reason for the adverse event. This project examines if it is possible to classify the adverse events, based on the reason for the event by using statistical natural language processing. This is done by developing a system as a proof of concept. The system consists of a user interface and a classification model. The classification model is trained and tested on 132 adverse event reports, all containing the keyword 'EPM', where the purpose of the model is to classify whether EPM is the reason for the adverse event or not. This is done by creating a model based on a combination of a prior knowledge from domain experts and statistical knowledge. The classification results in an F-measure at 0.946 for the reports, where EPM is not the reason, and an F-measure at 0.667 for the reports, where EPM is the reason for the adverse event. These results can be improved by training the model on more adverse event reports. It can be concluded that statistical natural language processing can be used in classifying adverse events if a prior knowledge is included in relation to the specific keyword.
Kolofon: Denne side er en del af AAU Studenterprojekter — Aalborg Universitets studenterprojektportal. Her kan du finde og downloade offentligt tilgængelige kandidatspecialer og masterprojekter fra hele universitetet fra 2008 og frem. Studenterprojekter fra før 2008 kan findes i trykt form på Aalborg Universitetsbibliotek.
Har du spørgsmål til AAU Studenterprojekter eller Aalborg Universitets forskningsregistrering, formidling og analyse, er du altid velkommen til at kontakte VBN-teamet. Du kan også læse mere i AAU Studenterprojekter FAQ.