Traffic sign detection using computer vision: Explorations for a driver support system
Translated title
Trafikskiltedetektion med computer vision
Author
Møgelmose, Andreas
Term
4. term
Publication year
2012
Pages
129
Abstract
Dette speciale inden for Vision, Graphics, and Interactive Systems blev gennemført over to semestre på UC San Diego og fokuserer på, hvordan computere kan genkende amerikanske trafikskilte og fodgængere i billeder og video. Arbejdet er forskningsorienteret og er organiseret i fem selvstændige kapitler frem for et traditionelt forløb med ét produktforløb. Først gennemføres en omfattende kortlægning af eksisterende systemer til detektering af trafikskilte. Den viser, at der er få studier om amerikanske skilte og mangel på offentligt tilgængelige datasæt. For at afhjælpe dette er der skabt et offentligt datasæt med næsten 8.000 manuelt mærkede skilte. Datasættet er særligt, fordi det både omfatter amerikanske skilte og indeholder videooptagelser. Rapporten undersøger også, om syntetiske (computergenererede) træningsbilleder kan bruges til at lære skiltdetektorer at genkende skilte. Konklusionen er, at syntetiske billeder ikke kan måle sig med virkelige træningsbilleder. Der præsenteres desuden en rent modelbaseret detektor, der kun bruger geometriske former som byggeklods til et fuldt detektionssystem. Endelig er der udviklet og dokumenteret et to-trins system til fodgængerdetektion, som bygger videre på et tidligere system og giver bedre detektion med færre falske alarmer. Arbejdet har ført til indsendelse af fire artikler: én til ITS Transactions, én til ICPR og to til ITSC. Ved skrivningstidspunktet var tidsskriftsartiklen i anden bedømmelsesrunde.
This master’s thesis in Vision, Graphics, and Interactive Systems was completed over two semesters at UC San Diego and focuses on how computers can recognize U.S. traffic signs and pedestrians in images and video. The work is research-oriented and organized into five standalone chapters rather than a single product development flow. It begins with a comprehensive survey of traffic sign detection systems, which highlights two gaps: few studies address U.S. signs, and there are very few publicly available datasets for them. To address this, a public dataset with nearly 8,000 manually labeled signs has been created. The dataset is notable not only for focusing on U.S. signs but also for including video sequences. The thesis also investigates whether synthetic (computer-generated) training images can effectively train traffic sign detectors, concluding that synthetic images do not match the performance achieved with real-world training images. In addition, it presents a purely model-based detector that relies only on geometric shapes, intended as a building block for a full detection system. Finally, a two-stage pedestrian detection system was developed and documented. It extends a previous system and achieves better detection with fewer false positives. The work resulted in four paper submissions: one to ITS Transactions, one to ICPR, and two to ITSC. At the time of writing, the journal paper was in the second review stage.
[This abstract was generated with the help of AI]
Documents
