AAU Studenterprojekter - besøg Aalborg Universitets studenterprojektportal
A master thesis from Aalborg University

Identificering af kemiske biomarkører til detektering af kolorektal kræft ved hjælp af eksisterende data: Et projekt om anvendelse af et dimensionelt datavarehus i sundhedssektoren

[Identification of chemical biomarkers for detection of colorectal cancer using existing data: A project about the use of a dimensional data warehouse in healthcare]

Forfatter(e)

Semester

4. semester

Uddannelse

Udgivelsesår

2013

Afleveret

2013-06-03

Antal sider

110 pages

Abstract

I Danmark diagnosticeres ca. 4.500 med kolorektal kræft (KRC) hvert år. Den 5-årige overlevelse er observeret til ca. 50%, da KRC ofte diagnosticeres sent. Derfor oprettes et screeningsprogram i Danmark i 2014. Dog kritiseres nuværende screeningsmetoder, hvorfor der er fokus på identificering af kemiske biomarkører. Der er endnu ikke identificeret brugbare biomarkører til detektering af KRC. Region Nordjyllands datavarehus, der indeholder laboratorie- og patientadministrative data, kan give mulighed for data mining efter nye, potentielle kemiske biomarkører for KRC. 15 biokemiske analysetyper blev undersøgt med lineær regression, middelværdi og standardafvigelse vha. mønstergenkendelse i perioden, før KRC diagnosticeres hos patienterne. Lineær og kvadratisk diskriminant analyse blev brugt til at adskille 125 patienter med KRC fra 6.149 patienter uden kræft. Data blev normaliseret for at opnå uafhængighed af laboratoriernes normalværdier. Den simpleste klassifikator ift. højeste sensitivitet og specificitet var en 3-dimensionel kvadratisk klassifikator, som udnyttede lineær regression af P-Albumin, middelværdi af B-Thrombocytter og P-Bilirubiner. Sensitiviteten var 92,0% og specificteten var 79,5%. Dataanalysen er retrospektiv, så kompletheden og fordelingen af data i datavarehuset, er de største begrænsninger i projektet, da det nedsætter antallet af samples og kan skævride resultaterne. Trods begrænsningerne har klassifikatoren højere sensitivitet men lavere specificitet end fækal okkult blodtest, hvilket betyder at klassifikatoren har potentiale til at detekterer en større procentdel af de patienter, der har KRC, end fækal okkult blodtest. Dermed har datavarehuset med mønstergenkendelse identificeret mulige kemiske biomarkører for KRC.

Every year approx. 4.500 people are diagnosed with colorectal cancer (CRC) in Denmark. The 5-year survival rate has been observed to be approx. 50% as CRC is often diagnosed at a late stage. In 2014 a screening program will be established in Denmark. However, current screening methods are being criticized, making chemical biomarkers the center of attention. At present no useful biomarkers for detecting CRC have been identified. Data mining in The North Denmark Region’s data warehouse, that contains laboratory and patient administrative data, should allow for detection of new, possible chemical biomarkers for CRC. Using pattern recognition, 15 biochemical tests were investigated with linear regression, mean and standard deviation, in the period before patients were diagnosed with CRC. Linear and quadratic discriminant analyses were used to separate 125 patients with CRC from 6,149 patients without cancer. Data were normalized to obtain independence of the laboratories’ normal values. The simplest classifier in relation to the highest sensitivity and specificity was a 3-dimensional quadratic clas- sifier based on the linear regression of P-Albumin including the mean value of B-Thrombocytes and P-Bilirubin. Sensitivity was 92% and specificity was 79.5%. Completeness and distribution of the data in the data warehouse are major limitations in this project, due to the retrospective nature, as it reduces the number of samples and may skew the results. Despite the limitations, the classifier has a higher sensitivity but a lower specificity compared to fecal occult blood test, meaning that the classifier could detect a greater percentage of patients with CRC compared to the fecal occult blood tests. Thus, possible chemical biomarkers for CRC have been identified with the data warehouse through pattern recognition.

Emneord

Dokumenter


Kolofon: Denne side er en del af AAU Studenterprojekter — Aalborg Universitets studenterprojektportal. Her kan du finde og downloade offentligt tilgængelige kandidatspecialer og masterprojekter fra hele universitetet fra 2008 og frem. Studenterprojekter fra før 2008 kan findes i trykt form på Aalborg Universitetsbibliotek.

Har du spørgsmål til AAU Studenterprojekter eller Aalborg Universitets forskningsregistrering, formidling og analyse, er du altid velkommen til at kontakte VBN-teamet. Du kan også læse mere i AAU Studenterprojekter FAQ.