Development of a pricing tool for the real estate agencies in Copenhagen
Authors
Bugajski, Wojciech Tomasz ; Hansen, Thor Gabriel Svitzer
Term
4. term
Publication year
2017
Submitted on
2017-06-02
Pages
86
Abstract
This thesis develops a prototype pricing tool for real estate agencies in Greater Copenhagen aimed at identifying potentially overpriced apartments. Motivated by rapid population growth and the need for data‑driven valuations, the study web‑scrapes historical apartment sales from Boliga.dk for the Greater Copenhagen area (2006–2017). The dataset, comprising 11 core variables, is cleaned and prepared following a structured CRISP‑DM process, then analyzed with a multivariable linear regression model (SPSS) to estimate expected market prices; deviations from predicted values are used to flag overpriced units, and results are visualized using Google Maps API and Excel Power Map. The theoretical section reviews housing market fundamentals and key drivers to contextualize the model. Empirical findings indicate the approach is largely successful and can provide valuable pricing insights to agencies. The work also acknowledges limitations such as missing features (e.g., transport access, renovations, traffic exposure), data quality issues, and geocoding limits, which are proposed for future improvement.
Denne afhandling udvikler en prototype på et prissætningsværktøj for ejendomsmæglere i Storkøbenhavn med fokus på at identificere potentielt overprisede ejerlejligheder. Projektet tager udgangspunkt i den stærkt voksende hovedstadsregion og behovet for datadrevne prisvurderinger. Data er indsamlet ved webscraping af Boliga.dk, som leverer historiske salgsoplysninger for lejligheder i Storkøbenhavn (2006–2017). Datasættet, der omfatter 11 grundlæggende variabler, renses og forberedes til en kvantitativ analyse gennem en struktureret CRISP-DM-proces. En multivariat lineær regressionsmodel (SPSS) estimerer forventede markedspriser, hvorefter afvigelser bruges til at pege på boliger, der kan være overprisede; resultaterne visualiseres bl.a. med Google Maps API og Excel Power Map. Teoridelen skitserer boligmarkedets fundamentale drivkræfter og giver kontekst til modelvalget. De empiriske resultater peger på, at tilgangen i vidt omfang er succesfuld og kan give værdifulde prisindikatorer for mæglere. Samtidig anerkendes begrænsninger, herunder manglende oplysninger om fx transport, renovering og trafiknærhed, datarensningsbehov og grænser for geokodning, som foreslås adresseret i fremtidigt arbejde.
[This apstract has been generated with the help of AI directly from the project full text]
