Learning Action Primitives From 3D Stereo Vision Measurements

Author

Arango Slingsby, Ricardo

Term

4. term

Education

Kandidatuddannelse, Computer Vision and Graphics (Ballerup)

Publication year

2010

Abstract

In computer vision, understanding how objects move in images is important. Many approaches describe each motion trajectory separately, even when different trajectories share common segments. This leads to redundant, uncorrelated data. We refer to these shared segments as action primitives—basic building blocks of motion—and we need models that can link them. This thesis presents a framework that visually tracks objects using color segmentation (grouping pixels by color) and Hidden Markov Models (probabilistic models for sequences). It records motion trajectories, identifies action primitives, and builds a single, compact model that jointly represents multiple trajectories through their shared primitives. The action-primitive model can be used for robot learning, providing a higher-level description of the actions performed. The framework is implemented as a C++ programming library with a complete system for object detection, tracking, motion recording, and model construction.

I computer vision er det vigtigt at forstå, hvordan objekter bevæger sig i billeder. Mange eksisterende metoder beskriver hver bevægelsesbane for sig, selv når forskellige baner deler fælles delstræk. Det skaber redundant og ukorrelerede data. Vi kalder disse delte delstræk for handlingsprimitiver—grundlæggende byggeklodser for bevægelse—og der er brug for modeller, der kan forbinde dem. Denne afhandling præsenterer en ramme, der visuelt sporer objekter ved hjælp af farvesegmentering (gruppering af pixels efter farve) og Hidden Markov Models (sandsynlighedsmodeller for sekvenser). Rammen registrerer bevægelsesbaner, identificerer handlingsprimitiver og bygger en samlet, kompakt model, der fælles repræsenterer flere baner via deres delte primitiver. Modellen over handlingsprimitiver kan bruges til robotlæring og giver en højere-niveau beskrivelse af udførte handlinger. Rammen er implementeret som et C++‑programmeringsbibliotek med en komplet løsning til objektdetektion, sporing, bevægelsesregistrering og modelopbygning.

[This abstract has been rewritten with the help of AI based on the project's original abstract]

Keywords

Action Primitives ; Color Segmentation ; Blob Filtering ; Hidden Markov Models ; Imitation Learning ; Stereo Tracking ; Motion Trajectories

Documents

Download PDF
View record in AAU Student Projects

A master's thesis from Aalborg University

Learning Action Primitives From 3D Stereo Vision Measurements