On Machine Learning Based Cryptocurrency Trading
Authors
Nielsen, Kasper Lindblad ; Bach, William Geneser
Term
4. term
Education
Publication year
2018
Pages
121
Abstract
Dette speciale undersøger, hvor effektivt forskellige maskinlæringsalgoritmer kan anvendes til automatiseret handel med kryptovalutaer på Binance. Vi udvikler en handelsramme, der henter pris- og volumendata via Binances API og forbereder dem ved at aggregere over flere tidsintervaller, tilføje faktorer og tekniske indikatorer samt mærke historiske observationer som ‘køb’ eller ‘vent’. Data transformeres yderligere med differenser og lag og opdeles i trænings-, validerings- og testsæt, så problemet kan behandles som en overvåget klassifikation. Vi afprøver fire algoritmer – logistisk regression, neurale netværk, gradient boosting og random forest – og optimerer både dataparametrisering og modelkonfiguration gennem en systematisk søgning. Efter en indledende analyse på BTC-USDT finjusterer vi ramme og modeller (bl.a. rullende prædiktioner og træningsmængdens størrelse) og evaluerer derefter de optimerede modeller på seks USDT-par (Bitcoin, Ethereum, Binance Coin, NEO, Litecoin og Bitcoin Cash) under ensartede indstillinger på tværs af par. I denne opsætning klarer de træbaserede metoder sig markant bedre end logistisk regression og neurale netværk, og på test af usete data opnås profit på fem ud af seks par. Specialet diskuterer også begrænsninger ved data og parametre samt betydningen af handelsgebyrer og afsluttes med forslag til videreudvikling af rammen. Beregningerne er gennemført i R.
This thesis examines how effectively different machine learning algorithms can be used for automated cryptocurrency trading on Binance. We build a trading framework that retrieves price and volume data via the Binance API and prepares it by aggregating across multiple time intervals, adding factors and technical analysis indicators, and labeling historical observations as ‘buy’ or ‘hold’. The data are further transformed with differencing and lags and split into training, validation, and test sets to pose a supervised classification problem. We evaluate four algorithms—logistic regression, neural networks, gradient boosting, and random forests—and optimize both data parametrizations and model configurations through a systematic search. Following an initial study on BTC-USDT, we refine the setup (including rolling predictions and training set size) and then assess the optimized models on six USDT pairs (Bitcoin, Ethereum, Binance Coin, NEO, Litecoin, and Bitcoin Cash) under consistent settings across pairs. In this setup, tree-based methods outperform logistic regression and neural networks, and out-of-sample tests yield profits on five of the six pairs. The thesis also discusses data and parameter limitations and the impact of exchange fees, and concludes with directions for improving the framework. All computations are conducted in R.
[This summary has been generated with the help of AI directly from the project (PDF)]
Keywords
Binance ; Crypto ; currency ; cryptocurrency ; profit ; money ; lambo ; HODL ; ML ; machine ; learning ; machine learning ; trading ; automated ; bot ; classification ; supervised
Documents
