Predicting the Ancestry of Individuals using Ancestry Informative Markers

Student thesis: Master thesis (including HD thesis)

  • Martin Nørskov
4. term, Mathematics, Master (Master Programme)
I dette speciale undersøges individers afstamning ved brug af Ancestry Informative Markers (AIMs). Der opstilles et hypotesetest, som vurderer, om en specifik profil stammer fra en given population. I analysen er der brugt klassifikationstræer, random forest og lasso-regression til at udvælge en delmængde af markørerne, som bedst skelner mellem populationerne. Derudover er der undersøgt markørernes sensitivitet samt markørernes coverage og tilbøjelighed til at give et dropout. Analysen viste, at klassifikationstræer med en filtrering for de mindst sigende markører er de bedste modeller. Det førte til to modeller, CART20 og CART50, som har henholdsvis 21 og 7 markører. Med hensyn til markørernes sensitivitet er rs671, rs3811801, rs1800414, rs4821004, rs2125345 og rs2899826 de mest sensitive, og i forhold til markørernes dropout er rs1296819, rs12439433 og rs4833103 de mest tilbøjelige til at give et dropout.
LanguageDanish
Publication date2019
Number of pages63
ID: 305013189