Variable selection in crude oil forecasting
Author
Qazizada, Jacob
Term
4. term
Education
Publication year
2026
Submitted on
2026-05-26
Pages
93
Abstract
This thesis compares penalised regression methods (LASSO, Elastic Net) with greedy variable selection algorithms (OCMT, BMT) for out-of-sample forecasting of crude oil returns and realised volatility. Motivated by the abundance of correlated predictors and the risk of overfitting, the study emphasises sparse models and systematic variable selection. Methodologically, LASSO and Elastic Net are benchmarked against OCMT (sequential significance testing) and BMT (a more conservative stepwise approach adding at most one variable per stage) on monthly returns and on realised volatility using a comprehensive set of uncertainty indices. Models are estimated with recursive expanding windows, hyperparameters are tuned via cross-validation and information criteria, and forecasts are evaluated using out-of-sample R2 and directional accuracy tests; a simple economic assessment is also conducted. Results indicate that sparse models generally improve forecast accuracy relative to a historical benchmark, particularly for volatility. Momentum variables drive return forecasts, while uncertainty indicators are important for volatility. No single method dominates across all criteria, but penalised regression achieves a favourable balance between precision and stability. Despite improved statistical performance, economic gains are limited by transaction costs and model uncertainty, highlighting the challenges of implementing statistical forecasts in oil markets.
Dette speciale sammenligner straffede regressionsmetoder (LASSO, Elastic Net) med grådige variabeludvælgelsesalgoritmer (OCMT, BMT) til out-of-sample prognoser af råolieafkast og realiseret volatilitet. Arbejdet er motiveret af mange korrelerede forklaringsvariable og risikoen for overfitting og fokuserer derfor på sparsomme modeller. Metodisk benchmarkes LASSO og Elastic Net mod OCMT (sekventiel signifikansafprøvning) og BMT (en mere konservativ trinvis tilgang, der maksimalt tilføjer én variabel pr. stadie) på månedlige afkast og på realiseret volatilitet baseret på et omfattende sæt usikkerhedsindeks. Modellerne estimeres i rekursivt ekspanderende vinduer, hyperparametre tunes med krydsvalidering og informationskriterier, og prognoser vurderes med out-of-sample R2 og retningstests; der gennemføres desuden en enkel økonomisk vurdering. Resultaterne viser, at sparsomme modeller generelt forbedrer prognosen i forhold til en historisk benchmark, især for volatilitet. Momentumvariable driver afkastprognoser, mens usikkerhedsindikatorer er centrale for volatilitet. Ingen metode dominerer på tværs af alle kriterier, men straffede regressionsmetoder opnår en gunstig balance mellem præcision og stabilitet. På trods af bedre statistiske prognoser er de økonomiske gevinster begrænsede af transaktionsomkostninger og modelusikkerhed, hvilket understreger udfordringerne ved praktisk implementering i oliemarkeder.
[This apstract has been generated with the help of AI directly from the project full text]
