Enhancing Convolutional Neural Network Classification Performance through Dataset Enrichment: A Comparative Study
Authors
Guber, Mate ; Carlsen, Magnus Just Sund ; Svenningsen, Jonas Buchart
Term
4. term
Education
Publication year
2024
Submitted on
2024-06-07
Pages
21
Abstract
Machine learning for image recognition often needs large amounts of data. This study compares three simple ways to expand a small image dataset: (1) duplicating existing images, (2) creating augmented versions of the originals (for example by rotating or adding noise), and (3) generating synthetic images with a separate Deep Convolutional Generative Neural Network (DCGAN), a neural network that learns to produce new, realistic-looking images. Several image classifiers were trained on datasets expanded with each technique. Models trained on enriched datasets—including data made by a DCGAN—achieved performance that matched or exceeded models trained only on the original baseline dataset. These findings suggest that artificially adding training data can strengthen image classification when real data are scarce. Further work is needed to understand the limits and best uses of these methods across different contexts and dataset characteristics.
Maskinlæring til billedgenkendelse kræver ofte store mængder data. Dette studie sammenligner tre måder at udvide et lille billeddatasæt: (1) at duplikere eksisterende billeder, (2) at lave ændrede versioner af de oprindelige billeder (for eksempel rotation eller støj), og (3) at generere syntetiske billeder med en separat Deep Convolutional Generative Neural Network (DCGAN)-model, et neuralt netværk der lærer at skabe nye, realistisk udseende billeder. Flere billedklassifikatorer blev trænet på datasæt, der var udvidet med hver teknik. Modeller trænet på berigede datasæt—herunder datasæt genereret med et DCGAN—opnåede resultater, der matchede eller overgik modeller trænet på det oprindelige baseline-datasæt. Det peger på, at tilføjelse af kunstigt skabte træningseksempler kan forbedre klassificeringen, når der er få virkelige data. Der er dog behov for yderligere forskning for at forstå begrænsninger og muligheder på tværs af forskellige sammenhænge og datasæts egenskaber.
[This apstract has been rewritten with the help of AI based on the project's original abstract]
Keywords
ai ; gan ; cnn ; computer vision ; archaeology
