Interaktivt Computer Vision System: Genkendelse af Dyr på Aalborg Zoos Savanne
Oversat titel
Interactive Computer Vision System: Recognizing Animals on the Savannah in Aalborg Zoo
Forfatter
Valsby-Koch, Daniel
Semester
4. semester
Udgivelsesår
2014
Afleveret
2014-06-04
Antal sider
52
Resumé
Dette kandidatspeciale udvikler og afprøver et interaktivt computer vision-system, der hjælper besøgende på Aalborg Zoos savanne med at genkende dyr ved at tage et foto. Systemet er designet som en samlet løsning med brugergrænseflade og omfatter både hardware- og softwarekomponenter. Genkendelsen bygger på simple, pixelbaserede features såsom farvetone (hue), mætning (saturation), kanter og varians, kombineret med segmentering og klassificering via k-nærmeste nabo (kNN). Projektet beskriver opbygning af træningsdata, kommunikation mellem kamera og computer samt en analyse af brugergrænsefladen. En 2-gange krydsvalidering af genkendelsesmodulet opnår en genkendelsesrate på 86,78%, men ved test af den samlede prototype i Aalborg Zoo falder genkendelsen til 34,91%. Analysen peger bl.a. på misforståelser i, hvordan systemet skal bruges, som en medvirkende årsag, og rapporten diskuterer krav og mulige forbedringer af både brugergrænseflade og genkendelsesdel.
This master’s thesis develops and evaluates an interactive computer vision system that helps visitors on Aalborg Zoo’s savannah identify animals by taking a photo. The system is delivered as a complete solution with a user interface and integrates both hardware and software. Recognition relies on simple pixel-based features—hue, saturation, edges, and variance—combined with segmentation and k-nearest neighbors (kNN) classification. The work covers training data preparation, camera–computer communication, and a user interface analysis. While a 2-fold cross-validation of the recognition module achieves an accuracy of 86.78%, a field test of the full prototype in Aalborg Zoo yields 34.91%. The analysis indicates that misunderstandings about how to use the system contributed to the performance drop, and the thesis discusses requirements and potential improvements to both the interface and the recognition pipeline.
[Dette resumé er genereret med hjælp fra AI direkte fra projektet (PDF)]
Emneord
