Object Detection For Thermal Images Across Time and Season: Using Day and Night ExpertModels and Background Image-AssistedModel
Translated title
Object Detection For Thermal Images Across Time and Season
Author
Jensen, Jesper Soelberg
Term
4. semester
Publication year
2026
Submitted on
2026-06-04
Pages
55
Abstract
Detecting objects in long-term thermal camera footage is challenging, and even state-of-the-art detectors such as YOLO often have limited accuracy measured by mAP@0.5. Prior work suggests that specialized expert models can raise mAP@0.5, while feeding weather metadata directly into detectors usually brings no benefit. In surveillance, frameworks that use a background reference image have shown promise. This thesis tests two ways to improve YOLOv8-n on thermal data. (1) We use sun radiation metadata to split the data into day and night and train two expert models. Their outputs are evaluated by combining the experts and by applying Weighted Box Fusion (a method that merges overlapping detections). Both approaches improve mAP@0.5 over a single YOLOv8-n. (2) We apply a background image-assisted framework (BGI-YOLO) that leverages a reference background image to suppress static regions, which also outperforms the baseline. Combining the two strategies did not yield additional gains.
At finde objekter i termiske kameraoptagelser over lange perioder er svært, og selv avancerede detektorer som YOLO har begrænset nøjagtighed målt ved mAP@0.5. Tidligere arbejde har vist, at specialiserede ekspertmodeller kan løfte mAP@0.5, mens det at føde vejrinformation direkte ind i detektorer typisk ikke hjælper. I overvågningsscenarier har rammer, der bruger et referencebillede af baggrunden, vist lovende resultater. Dette speciale undersøger to måder at forbedre YOLOv8-n på termiske data. (1) Vi bruger metadata om solindstråling til at opdele data i dag og nat og træner to ekspertmodeller. Deres resultater vurderes ved at kombinere eksperternes output og ved at anvende Weighted Box Fusion (en metode til at flette overlappende detekteringer). Begge tilgange giver højere mAP@0.5 end en enkelt YOLOv8-n. (2) Vi anvender et baggrundsbillede-assisteret setup (BGI-YOLO), som udnytter et referencebillede af baggrunden til at undertrykke statiske områder; også dette overgår grundmodellen. At kombinere de to strategier gav derimod ikke yderligere forbedringer.
[This apstract has been rewritten with the help of AI based on the project's original abstract]
