Predicting Phosphorus Concentrations in WWTPs Using Data-Driven Methods
Author
Hansen, Laura Debel
Term
4. semester
Education
Publication year
2021
Submitted on
2021-05-28
Pages
77
Abstract
Modeling the processes in wastewater treatment is important for improving and optimizing performance. This remains challenging because the processes are highly nonlinear, coupled, and time-varying, with both physical and biochemical reactions and long time delays. As a result, data-driven system identification is increasingly used, with artificial neural networks serving as predictive models. This study develops and compares several data-driven methods to predict phosphorus concentration at a wastewater treatment plant in Agtrup, Denmark, which combines chemical precipitation and biological phosphorus removal. We examined both linear and nonlinear models. Dynamic Mode Decomposition with Control (DMDc) was used to build a linear model, but it generalized poorly and was inadequate for the inherently nonlinear process. To capture the nonlinearities, we tested two neural-network models: a NARX network (which uses past inputs and outputs) and a long short-term memory (LSTM) network (a recurrent network for time series). We tuned the model setup using Bayesian optimization, an automated method for selecting hyperparameters. Models were evaluated using several statistical measures, including temporal assessments, to check that model dynamics reflect the real system. The best model was an LSTM with 25 inputs, two hidden LSTM layers with 93 units each, and a single-unit output layer. When validated on new data, this model estimated phosphorus concentration with a low MSE of 0.0848 and R^2 = 0.42.
Modellering af processerne i et spildevandsrensningsanlæg er vigtig for at forbedre og optimere rensningen. Det er dog vanskeligt, fordi processerne er stærkt ikke-lineære, koblede og ændrer sig over tid, med både fysiske og biokemiske reaktioner og lange tidsforsinkelser. Derfor vinder datadrevet systemidentifikation frem, hvor kunstige neurale netværk bruges som forudsigelsesmodeller. Denne undersøgelse udvikler og sammenligner flere datadrevne metoder til at forudsige fosforkoncentrationen på et renseanlæg i Agtrup, Danmark, som kombinerer kemisk fældning og biologisk fosforfjernelse. Vi undersøgte både lineære og ikke-lineære modeller. Dynamic Mode Decomposition with Control (DMDc) blev brugt til at lave en lineær model, men den generaliserede dårligt og var utilstrækkelig til at beskrive den iboende ikke-linearitet i processen. For bedre at fange ikke-lineariteterne blev to neurale netværk afprøvet: et NARX-netværk (som bruger tidligere input og output) og et long short-term memory (LSTM) netværk (en rekurrent netværkstype til tidsserier). Modelopsætningen blev finjusteret med Bayesiansk optimering, en automatiseret metode til at vælge hyperparametre. Modellerne blev vurderet med flere statistiske mål, herunder tidsmæssige evalueringer, for at sikre at modellens dynamik afspejler det virkelige anlæg. Den bedste model var en LSTM med 25 input, to skjulte LSTM-lag med 93 enheder i hvert og et outputlag med én enhed. Valideret på nye data estimerede denne model fosforkoncentrationen med en lav MSE på 0,0848 og R^2 = 0,42.
[This apstract has been rewritten with the help of AI based on the project's original abstract]
