FROM SIGNALS TO WEIGHTS: Comparing One-Step and Two-Step Machine Learning Portfolios in U.S. Equities
Authors
Thuesen, Rasmus Mohr ; Houmann, Frederik Bager Bach
Term
4. semester
Publication year
2026
Submitted on
2026-06-01
Abstract
This thesis examines whether a direct, one-step portfolio learning approach translates technical, volume, and macro-state signals into more economically meaningful portfolios than traditional two-step return-prediction methods once turnover and transaction costs are taken into account. The study covers the 500 largest U.S. firms over a 25-year out-of-sample period from December 1999 to December 2024, using a deliberately compact set of core predictors. Three model classes are compared under a common data, training, and evaluation setup: Elastic Net and Random Forest as two-step pipelines that map return forecasts to weights via a constrained mean-variance allocation, and a one-step Torch policy that learns weights directly from features under an objective combining expected return, variance, and a turnover penalty. All strategies are long-only with a 10% per-stock cap and are evaluated within a common cost-accounting framework using risk-adjusted return metrics, factor exposure analysis, formal Sharpe ratio difference tests, and sensitivity to one-way transaction costs of 10, 25, and 50 basis points. Results show weak stock-level predictability for both two-step models (negative out-of-sample R-squared), yet realized portfolio outcomes differ materially. The one-step Torch model delivers the strongest point-estimate performance, with an annualized return of 13.48%, a Sharpe ratio of 0.663, and the lowest average turnover, and it retains the highest risk-adjusted return at every tested transaction-cost level. While the Sharpe ratio gap versus Random Forest does not reach conventional significance, Elastic Net is statistically weaker than both alternatives. Overall, the evidence indicates that in weak-signal environments, aligning the training objective directly with the investment objective and implementation frictions can materially improve realized portfolio performance even when stock-level forecast accuracy is low.
Denne afhandling undersøger, om en direkte éttrins-tilgang til porteføljelæring mere effektivt kan omsætte tekniske, volumen- og makrotilstands-signaler til økonomisk meningsfulde porteføljer end traditionelle to-trins afkastprognosebaserede metoder, når omsætning og transaktionsomkostninger medregnes. Analysen omfatter de 500 største amerikanske selskaber over en 25-årig out-of-sample-periode fra december 1999 til december 2024 og anvender et kompakt sæt kerneprediktorer. Tre modelklasser sammenlignes under en fælles dataramme, træningsplan og porteføljevurdering: Elastic Net og Random Forest som to-trins pipelines, hvor afkastprognoser mappes til vægte via en begrænset mean-variance-allokering, samt en éttrins Torch-politik, der lærer vægte direkte ud fra features under et samlet mål for forventet afkast, varians og en omsætningsstraf. Alle strategier er lange med et 10% loft pr. aktie og evalueres under et fælles omkostningsregnskab ved hjælp af risikojusterede afkastmål, faktoreksponeringsanalyse, formelle Sharpe-ratio-forskelle og følsomhed over for én-vejs transaktionsomkostninger på 10, 25 og 50 basispoint. Resultaterne viser svag forudsigelighed på aktieniveau for begge to-trins modeller (negative out-of-sample R-kvadrat), men markante forskelle i realiserede porteføljeudfald. Éttrins Torch-modellen leverer den stærkeste punktestimerede performance med et annualiseret afkast på 13,48%, en Sharpe-ratio på 0,663 og lavest gennemsnitlig omsætning, og den bevarer den højeste risikojusterede performance ved alle testede omkostningsniveauer. Forskellen i Sharpe-ratio i forhold til Random Forest når ikke konventionel statistisk signifikans, mens Elastic Net er statistisk svagere end begge alternativer. Samlet tyder evidensen på, at i svagsignal-miljøer kan en træningsmålsætning, der er direkte afstemt med investeringsmålet og implementeringsfriktioner, væsentligt forbedre realiseret porteføljeperformance, selv når aktiespecifik forudsigelsesnøjagtighed er lav.
[This apstract has been generated with the help of AI directly from the project full text]
Keywords
ML ; Machine Learning ; Equity
