Condition Monitoring with Machine Learning: A Data-Driven Framework for Quantifying Wind Turbine Energy Loss
Authors
Nielsen, Kent Vugs ; Buchberg, Emil Marcus
Term
4. semester
Education
Publication year
2025
Submitted on
2025-06-06
Pages
24
Abstract
Wind energy is central to the shift toward renewables, but operational issues such as leading-edge erosion on turbine blades can reduce electricity output. This study presents a scalable machine-learning framework for condition monitoring of wind turbines that improves anomaly detection using SCADA data (turbine control and sensor data). The approach isolates normal behavior through careful preprocessing that combines domain rules with anomaly filters, including Gaussian Mixture Models and a predictive power score. Data cleaning and feature selection enable detection of deviations that signal performance degradation and support estimates of annual energy production losses. Preprocessing greatly reduced the dataset, retaining on average 31% of the original SCADA data per wind farm. Using a power-curve feature set based on wind speed and ambient temperature, 24 of 35 turbines showed clear performance declines, seven improved, and four showed no significant change. Models such as Random Forest, XGBoost, and KNN consistently captured subtle but persistent declines in performance. By isolating normal operating data and estimating annual energy loss, the framework offers a new approach to condition monitoring that can help reduce maintenance costs and the economic impact of downtime.
Vindenergi er central for overgangen til vedvarende energi, men driftsproblemer som forkanterosion på rotorblade kan sænke elproduktionen. Denne undersøgelse præsenterer en skalerbar maskinlæringsramme til tilstandsovervågning af vindmøller, der forbedrer detektion af afvigelser ved hjælp af SCADA-data (overvågnings- og styringsdata fra turbinerne). Tilgangen isolerer normal drift gennem grundig forbehandling, der kombinerer domænespecifikke regler og anomalifiltre, herunder Gaussian Mixture Models (statistiske blandingsmodeller) og en prediktiv effekt-score. Datarensning og udvælgelse af de mest informative variabler gør det muligt at identificere afvigelser, der peger på ydelsesforringelser, og at anslå årlige energitab. Forbehandlingen reducerede datamængden betydeligt og beholdt i gennemsnit 31% af de oprindelige SCADA-data per vindpark. Med et feature-sæt baseret på effektkurven – bestående af vindhastighed og omgivelsestemperatur – viste 24 ud af 35 møller tydelige ydelsesfald, syv forbedredes, og fire viste ingen væsentlige ændringer. Modeller som Random Forest, XGBoost og KNN fangede konsekvent små, men vedvarende tilbagegange i ydeevnen. Ved at isolere normal driftsadfærd og estimere årligt energitab tilbyder rammen en ny tilgang til tilstandsovervågning, som kan bidrage til lavere vedligeholdelsesomkostninger og mindre økonomisk tab ved stilstand.
[This apstract has been rewritten with the help of AI based on the project's original abstract]
Keywords
