Deep Object Descriptions for MOT
Author
Poulsen, Mathias Østergaard
Term
4. semester
Education
Publication year
2020
Pages
54
Abstract
This thesis investigates deep object descriptions for multi-object tracking (MOT), comparing two approaches and their combination. The first approach masks the background of detections and extracts deep features from the full frame to embed spatial position; it achieves µHOTA = 46.0% on MOT17 training sequences. The second approach describes detections with SuperPoint and matches them using SuperGlue; it achieves µHOTA = 49.2% on MOT17 training sequences. Combining both into a single tracker leverages spatial cues from the first method and the robustness of SuperPoint from the second, reaching µHOTA = 51.8% on MOT17 training sequences and µHOTA = 32.5% on MOT17 test sequences submitted to MOTChallenge. The findings indicate that the first approach does not incorporate sufficient spatial information, while SuperPoint offers a robust description that could benefit from improved spatial representation. The work is situated within contemporary MOT methods and evaluates performance using standard benchmarks.
Afhandlingen undersøger dybe objektsbeskrivelser til multi-object tracking (MOT) og sammenligner to metoder samt deres kombination. Den første metode maskerer baggrunden i detektioner og udtrækker dybe features fra hele billedet for at indarbejde rumlig position; den opnår µHOTA = 46,0 % på MOT17-træningssekvenser. Den anden metode beskriver detektioner med SuperPoint og matcher dem med SuperGlue; den opnår µHOTA = 49,2 % på MOT17-træningssekvenser. Ved at kombinere begge til én tracker udnyttes både rumlige spor fra den første metode og den robuste SuperPoint-beskrivelse fra den anden, hvilket giver µHOTA = 51,8 % på MOT17-træningssekvenser og µHOTA = 32,5 % på MOT17-testsekvenser indsendt til MOTChallenge. Resultaterne peger på, at den første metode ikke indarbejder tilstrækkelig rumlig information, mens SuperPoint er en robust beskrivelse, der kan styrkes med en bedre rumlig repræsentation. Arbejdet placerer sig i aktuelle MOT-tilgange og evaluerer performance med standardbenchmarks.
[This apstract has been generated with the help of AI directly from the project full text]
