AAU Student Projects - visit Aalborg University's student projects portal
A master's thesis from Aalborg University
Book cover


A user-centric approach to dataset augmentation for anomaly detection using Unity

Authors

; ; ;

Term

4. term

Education

Publication year

2023

Submitted on

Pages

11

Abstract

Anomaly detection helps surveillance systems automatically spot unusual events, especially when monitoring many cameras or large areas. Training these systems typically requires large datasets with carefully labeled examples, which are expensive and time-consuming to collect. One way to reduce this effort is to create synthetic data with 3D software, which can quickly generate many new images. However, producing such data usually demands specialized 3D skills, so many users still depend on external partners. We present an application that uses 3D models to synthesize datasets by simulating anomalies on top of real backgrounds in the Unity Engine. The tool includes a user-friendly interface and a highly customizable simulation, enabling non-experts to generate synthetic, labeled data without experience in 3D animation. In our tests, augmenting datasets with synthetic samples produced by the application improved model performance, with increases in two standard evaluation measures—AUC and F1 score—across all cases. These results indicate that synthetic data generation is a viable approach for low-expertise users. We recommend future work to maximize variation in the data and to use photorealistic 3D models and lighting.

Anomalidetektion hjælper overvågningssystemer med automatisk at opdage usædvanlige hændelser, især ved monitorering af mange kameraer eller store områder. Sådanne systemer kræver typisk store datasæt med nøje annoterede eksempler, hvilket er dyrt og tidskrævende at indsamle. En måde at reducere denne indsats på er at skabe syntetiske data med 3D-software, som hurtigt kan generere mange nye billeder. Det kræver dog ofte specialiserede 3D-kompetencer, og derfor er mange brugere fortsat afhængige af eksterne partnere. Vi præsenterer en applikation, der bruger 3D-modeller til at syntetisere datasæt ved at simulere anomalier oven på virkelige baggrunde i Unity Engine. Værktøjet har en brugervenlig grænseflade og en stærkt konfigurerbar simulering, så ikke-eksperter kan generere syntetiske, annoterede data uden erfaring med 3D-animation. I vores test forbedrede udvidelse af datasæt med syntetiske eksempler fra applikationen modellernes præstation, med stigninger i to standardmål—AUC og F1-score—i alle tilfælde. Resultaterne tyder på, at syntetisk datagenerering er en levedygtig løsning for brugere med lav ekspertise. Vi anbefaler, at fremtidigt arbejde sigter mod høj variation i data og brug af fotorealistiske 3D-modeller og belysning.

[This apstract has been rewritten with the help of AI based on the project's original abstract]