AAU Studenterprojekter - besøg Aalborg Universitets studenterprojektportal
Et kandidatspeciale fra Aalborg Universitet
Book cover


Modellering af bakteriesammensætningen i et biogasanlæg

Oversat titel

Modeling the bacteria composition in a biogas system

Forfatter

Semester

2. Semester (Kandidat)

Udgivelsesår

2019

Afleveret

Resumé

Dette speciale undersøger den tidsafhængige sammensætning af mikroorganismer i et biogasanlæg ved at modellere abundansen af OTU’er (operationelle taksonomiske enheder) som en tidsserie. Formålet er at belyse den mikrobielle dynamik, som er central for stabil og effektiv biogasproduktion. Datagrundlaget stammer fra ét af Maabjergs biogasanlæg og omfatter prøver udtaget tre steder i anlægget over 27 ikke-ækvidistante tidspunkter; der blev indledningsvis taget triplikater, som senere blev afbrudt af økonomiske årsager. Dækning og variation vurderes med rarefaction-kurver, principal komponent analyse (PCA) og heatmaps, hvorefter en repræsentativ prøve vælges per triplikat. For at muliggøre tidsrækkeanalyse interpoleres til ækvidistante tidspunkter ved hjælp af splines. Den efterfølgende modellering omfatter en sparse VAR(1)-model, hvor Lasso-straffen bestemmes ved krydsvalidering; baseret på denne struktur estimeres en VARX(1) uden straf, og resultaterne bruges til at udlede en Lotka–Volterra-model som økologisk fortolkning af interaktionerne. Samlet peger de estimerede modeller på, at dynamikken mellem mikroorganismerne i anlægget er kompleks; arbejdet giver et statistisk rammeværk til at beskrive og tolke disse interaktioner på tværs af tid og procestrin.

This thesis examines the time-dependent composition of microorganisms in a biogas plant by modeling the abundance of OTUs (operational taxonomic units) as a time series. The aim is to shed light on microbial dynamics that are critical for stable and efficient biogas production. The dataset comes from one of the Maabjerg biogas plants and includes samples collected at three locations over 27 non-equidistant time points; triplicate sampling was used initially but discontinued for economic reasons. Coverage and variation are assessed using rarefaction curves, principal component analysis (PCA), and heatmaps, after which a representative sample is chosen for each triplicate. To enable time series analysis, splines are used to interpolate to equidistant time points. The modeling pipeline includes a sparse VAR(1) model with a Lasso penalty selected by cross-validation; based on its structure, a VARX(1) model without penalty is estimated, and its estimates are used to derive a Lotka–Volterra model as an ecological interpretation of interactions. Overall, the fitted models indicate that microbial dynamics in the plant are complex, and the study provides a statistical framework for describing and interpreting these interactions across time and process steps.

[Dette resumé er genereret med hjælp fra AI direkte fra projektet (PDF)]