Author(s)
Term
4. term
Publication year
2017
Submitted on
2017-06-04
Pages
64 pages
Abstract
Over 17.5 milioner af mennesker dør hvert år pga kardiovaskulære problemer hvoraf størstedelen af tilfældene er mulige at forhindre. Forskellige metoder kan bruges til at detektere hjerteproblemer og hjertesygedomme men den mest brugte metode er det 12-ledet EKG. Egenskaber fra et EKG kan udtrækkes og bruges i Machine Learning. Det viser sig dog at det ikke nødvendigvis er en god ide at anvende såkaldte eksperter til at udtrække disse egenskaber fra EKGet. I EKG forskninger der lavet en masse forskning i at forsøge at forstå disse egenskaber og den underlæggende grammatik af EKGet, ikke kun til diagnostisk brug men også til at identificere en person eller deres humør. I en litteratursøgning om Machine learning blev det fundet at Hierarchical Temporal Memory virker til at kunne identificere de underliggende egenskaber og grammatik i EKG’et på en automatisk og robust måde. Det var derfor evalueret hvor godt at en implementing af Hierarchical Temporal Memory kunne identificere og bruge den underliggende grammatik af EKG’et til at klassificere hvilken person et hjerteslag tilhørte baseret på et hjerteslag afledt fra ufiltreret EKG. Flere del-sæt hvert indeholdende et forskelligt antal personer var generet fra en EKG database med over 25,000 personer. To sessioner blev inkluderet fra hver person hvor hver enkelt session indeholdet 10 sekunders data og var optaget med 500 Hz. Denne data indeholdte flere led men kun II-ledet var brugt. Det samlede datasæt indeholdte både sunde og raske personer men også personer der led af forskellige sygdomme der havde betydning for deres hjertefunktion. Hvert enkelt del-sæt blev splittet i træning og test data hvor der var fire gange så meget trænings data som test data. En implementering af Hierarchical Temporal Memory blev fortaget ved at bruge software fra Numenta kaldet NuPic. Hvert eneste del-sæt der indeholdte træningsdata blev anvendt i denne implementering. Disse datasæt blev vist med et forskelligt antal iterationer hvor kun en enkelt iteration blev fortaget for noget data og op til 1,000 iterationer for andet data. Den største nøjagtighed blev opnået ved kun at bruge 10 personer hvor at denne nøjagtighed blev målt til at være op til 31.3 $\%$ og mindst for 1,250 patienter hvor den var under et procent. I del-sæt hvor flere iterationer var brugt var der ikke fundet bedre resultater. Ved at kombienere forskellige del-sæt sås der heller ikke en forbedring af resultater. Det var muligt at identificere hjerteslag med op til en nøjagtighed på 31.3 $\%$ men ved at forøge antal af personer inkluderet i klassifikationen faldt denne nøjagtighed. Slev ved at forøge antal af iterationer hvormed data blev brugt i systemet var der ingen forbedring af resultaterne. Resultaterne af dette studie er stadigvæk dog forholdsvis nye og interessante ide at Hierarchical Temporal Memory ikke har været brugt i en biometrisk applikation før. Derudover er antal af personer høje i forhold til mængden af data per person når man sammenligner med andre studier fundet under litteratursøgningen i dette projekt. Det var ikke muligt at finde ud af om den fundne nøjagtighed var begrænset pga variabiliteten mellem personer i datasættet eller fordi at konfigurationen af Hierarchical Temporal Memory ikke var god nok. Fabrikanten af det software der blev brugt i dette studie er udkommet med et nyt værktøj kaldet “swarming” til at hjælpe med at forbedre konfigurationer af Hierarchical Temporal Memory. Det virker derfor som et logisk valg at bruge dette værktøj til vider undersøgelser i forbedring af nøjagtigheden med Hierarchical Temporal Memory.
Over 17.5 million people die ev- ery year due to cardiovascular disease. The most widespread used to detect heart disease is the 12- Lead ECG. In ECG research there has been a lot of research in understanding its features and the underlying grammar of the ECG not only for diag- nostics but also for identification of a specific per- son or even mood. Hierarchical Temporal Mem- ory (HTM) seemed to be able to identify the underlying grammar automatically in a robust matter. It was therefore evaluated to which extent HTM could identify and use biometric grammar of the ECG in the context of identifying subjects based on their heartbeat from unfiltered ECG. Data subsets with different number of subjects were created from an ECG database with 25,000 subjects. Two sessions were included from each subject of 500 Hz 10 seconds ECG. Lead II was used from these ECGs and the dataset contained healthy and unhealthy subjects. A HTM model was configured and built using Numenta NuPic software and exposed to the different subsets. Subsets were applied with different number of iterations spanning from 1 to 1,000. The maximum accuracy was achieved from using only 10 subjects where the accuracy was found to be 31.3 % and down to 0.07 % for 1,250 subjects. The number of subjects decreased this accuracy and the number of iterations had no effect. It was not possible to determine if the accuracy found was due to limitation of intersubject variability of the ECG or to the configuration of HTM. The authors of the software used in this current study now provide tools that might be a logical next step in improving the results.
Keywords
ECG ; HTM ; Machine learning ; AI ; EKG ; Hierarchical temporal memory ; memory
Documents
Colophon: This page is part of the AAU Student Projects portal, which is run by Aalborg University. Here, you can find and download publicly available bachelor's theses and master's projects from across the university dating from 2008 onwards. Student projects from before 2008 are available in printed form at Aalborg University Library.
If you have any questions about AAU Student Projects or the research registration, dissemination and analysis at Aalborg University, please feel free to contact the VBN team. You can also find more information in the AAU Student Projects FAQs.