Bevaring af kontekstuel information fra ustrukturerede fritekstdokumenter ved brug af NLP, SNOMED CT og HL7 FHIR for at opnå semantisk interoperabilitet
Studenteropgave: Kandidatspeciale og HD afgangsprojekt
- Johanne Krogsgaard Jensen
- Thea Mentz Sørensen
4. semester , Sundhedsteknologi (cand.polyt.), Kandidat (Kandidatuddannelse)
Introduktion: Anvendelsen af fritekstdokumentation understøtter kliniske praksis, men der opstår udfordringer ved genanvendelse af fritekstdokumenter. Da det ikke er muligt at genanvende alt information, bør fokus være på bevarelse af den situationelle kontekst ved håndteringen af udfordringerne. Derfor vil dette studie udforske, hvordan den situationelle kontekst kan bevares når relevant information udtrækkes og struktureres fra fritekstdokumenter, for at opnå semantisk interoperabilitet. Metode: Udskrivningsepikriser fra N2C2 2010 konkurrencen blev anvendt som datagrundlag, som sammen med en implementeringskontekst satte dette rammen for udviklingen. HL7 FHIR ressourcer, SNOMED CT udtryk og NLP systemet, cTAKES, blev anvendt til at strukturere, kode og udtrække information fra udskrivningsepikriserne. cTAKES blev justeret vha. en agil udviklingstilgang. Fokus for justeringerne var at inkludere mere kontekstuel information ved brug af post-koordinerede udtryk fra SNOMED CT. Dette var testet op imod en gold standard. Resultat: De 21 validerede FHIR profiler indeholdte 95,5% af information fra udskrivningsepikriserne. Det justerede cTAKES havde en F-score på 0,120. Konklusion: Den situationelle kontekstuelle information fra fritekstdokumenter kan bevares ved brug af HL7 FHIR og SNOMED CT. Derimod er automatiseret dataudtræk ved brug af cTAKES endnu ikke moden til klinisk anvendelse.
Sprog | Engelsk |
---|---|
Udgivelsesdato | jun. 2021 |
Antal sider | 85 |